Có thể là bất kỳ nghề nào trong khoa học dữ liệu ngoài việc làm sạch dữ liệu thường xuyên và xây dựng mô hình đường ống, một cá nhân cũng được yêu cầu tạo ra kết quả theo cách mà doanh nghiệp có thể dễ dàng hiểu được. Trong hướng dẫn này, chúng ta sẽ khám phá bốn kịch bản trong đó bạn có thể áp dụng đồng thời các phép biến đổi khác nhau cho tất cả các cột Khung dữ liệu
Trước khi đi sâu vào các kịch bản, hãy nhập thư viện gấu trúc và tạo Khung dữ liệu có tên df với các tên cột sau
- tuần_một_điểm danh
- tuần_hai_điểm danh
- tuần_ba_tham dự
- tuần_bốn_điểm danh
Mã số
import pandas as pd df = pd.DataFrame [data = [[0.10,0.20,0.70,0.80],[0.80,0.50,0.40,0.20],[0.50,0.10,0.20,0.10],[0.30,0.45,0.97,0.65]], columns = ["week_one_attendance","week_two_attendance","week_three_attendance","week_four_attendance"]] df
đầu ra
HÃY BẮT ĐẦU VỚI CÁC KỊCH BẢN
cảnh 1
Trong mã bên dưới, vòng lặp for được sử dụng để lặp lại tất cả các cột của Khung dữ liệu, trong mỗi lần lặp lại, mỗi cột được chuyển đổi thành chữ hoa bằng cách sử dụng phương thức đổi tên
Mã số
for i in df.columns: df.rename[columns = {i:i.upper[]},inplace = True] df.columns
Đầu ra.
Kịch bản2
Trong đoạn mã dưới đây, chúng tôi sẽ khai báo một từ điển trống có tên là tên cột và sau đó khai báo một biến khác có tên là đếm thành 0
Sau đó, chúng tôi sẽ sử dụng vòng lặp for để lặp qua tất cả các cột của Khung dữ liệu, trong mỗi lần lặp, biến đếm sẽ được tăng thêm 1. Giá trị gia tăng sau đó sẽ được sử dụng bên trong fstring để tạo tên cột mới. Tên cột ban đầu và mới sẽ được thêm vào từ điển dưới dạng các cặp khóa, giá trị trong mỗi lần lặp lại
Sau khi xây dựng tên cột từ điển với tên cột gốc và tên cột mới, chúng tôi sẽ chuyển từ điển sang phương thức đổi tên
Mã số
columnnames = {} count = 0 for i in df.columns: count += 1 columnnames[i] = f"WEEK_{count}_ATTENDANCE" columnnames
đầu ra
Mã số
df.rename[columns = columnnames ,inplace = True] df.columns
Đầu ra.
Trong đoạn mã dưới đây, chúng tôi sẽ khai báo một từ điển trống có tên là columnnames
Sau đó, chúng tôi sẽ sử dụng vòng lặp for để lặp lại trên tất cả các cột của Khung dữ liệu, trong mỗi lần lặp lại, lần xuất hiện đầu tiên của dấu gạch dưới sẽ được thay thế bằng dấu cách. Tên cột ban đầu và mới sẽ được thêm vào từ điển dưới dạng các cặp khóa, giá trị trong mỗi lần lặp lại
Sau khi xây dựng tên cột từ điển với tên cột gốc và tên cột mới, chúng tôi sẽ chuyển từ điển sang phương thức đổi tên
Mã số
columnnames = {} for i in df.columns: x = i.replace['_','',1] columnnames[i] = x columnnames
Đầu ra.
Mã số
df.rename[columns = columnnames ,inplace = True] df.columns
đầu ra
Tình huống 4
Trong đoạn mã dưới đây, chúng tôi sẽ khai báo một từ điển trống có tên là tên cột và sau đó khai báo một biến khác có tên là đếm thành 0
Sau đó, chúng tôi sẽ sử dụng vòng lặp for để lặp qua tất cả các cột của Khung dữ liệu, trong mỗi lần lặp, biến đếm sẽ được tăng thêm 1. Giá trị gia tăng sau đó sẽ được sử dụng bên trong fstring để tạo tên cột mới có vị trí của từ đầu tiên và từ cuối cùng được hoán đổi. Tên cột ban đầu và mới sẽ được thêm vào từ điển dưới dạng các cặp khóa, giá trị trong mỗi lần lặp lại
Sau khi xây dựng tên cột từ điển với tên cột gốc và tên cột mới, chúng tôi sẽ chuyển từ điển sang phương thức đổi tên
Mã số
columnnames = {} count = 0 for i in df.columns: count += 1 columnnames[i] = f"ATTENDANCE_WEEK{count}" columnnames
Đầu ra.
Mã số
df.rename[columns = columnnames ,inplace = True] df.columns
Đầu ra.
Phần kết luận
Thay vì cập nhật từng tên cột theo cách thủ công, bằng cách sử dụng các vòng lặp for và các phương thức khác nhau có sẵn với Chuỗi Python, chúng tôi có thể cập nhật đồng thời các giá trị của tất cả các cột của Khung dữ liệu, do đó tiết kiệm được nhiều thời gian