Làm cách nào để bạn thay thế tất cả các giá trị null trong DataFrame?
Bạn có thể thay thế giá trị còn thiếu ( 5) trong 6 và 7 bằng bất kỳ giá trị nào bằng cách sử dụng phương pháp 8 Show
Bài viết này mô tả các nội dung sau
Sử dụng 3 nếu bạn muốn điền các giá trị còn thiếu bằng phép nội suy tuyến tính hoặc spline
Để biết thêm thông tin về cách xóa hoặc đếm các giá trị bị thiếu, hãy xem các bài viết sau
Lưu ý rằng không chỉ 5 (Không phải là số) mà cả 5 cũng được coi là giá trị bị thiếu trong pandas
Ví dụ: đọc tệp CSV có giá trị bị thiếu với 6
2nguồn. Liên kết được tài trợ Thay thế tất cả các giá trị bị thiếu bằng cùng một giá trịBằng cách chỉ định giá trị vô hướng làm đối số đầu tiên 7 của 8, tất cả các giá trị bị thiếu sẽ được thay thế bằng giá trị
nguồn. Lưu ý rằng kiểu dữ liệu 9 của một cột số bao gồm 5 là 81, vì vậy ngay cả khi bạn thay thế 5 bằng một số nguyên, kiểu dữ liệu vẫn là 81. Nếu bạn muốn chuyển đổi nó thành 84, hãy sử dụng 85
Thay thế các giá trị bị thiếu bằng các giá trị khác nhau cho mỗi cộtBằng cách chỉ định một từ điển 86 làm đối số đầu tiên 7 của 8, bạn có thể gán các giá trị khác nhau cho mỗi cộtChỉ định một từ điển của 89. Nếu tên cột không được chỉ định, các giá trị bị thiếu trong cột của nó sẽ được giữ lại (= không được thay thế). Nếu 70 không khớp với tên cột, nó sẽ bị bỏ qua
nguồn. Bạn cũng có thể chỉ định 2. Các nhãn của 2 tương ứng với khóa của 86 8nguồn. Thay thế các giá trị bị thiếu bằng giá trị trung bình, trung bình, chế độ, v.v. cho mỗi cộtGiá trị trung bình của mỗi cột có thể được tính bằng phương pháp 74. 2 được trả lại. ________ 05 bị loại trừ, nhưng kết quả cho một cột có tất cả các phần tử là ________ 05 là ________ 05
7nguồn. Nếu bạn chỉ định 2 này làm đối số đầu tiên 7 của 8, các giá trị còn thiếu của cột tương ứng sẽ được thay thế bằng giá trị trung bình 2nguồn. Tương tự, nếu bạn muốn thay thế các giá trị còn thiếu bằng trung vị, hãy sử dụng phương thức 22. Nếu số lượng phần tử là số chẵn, giá trị trung bình của hai giá trị trung bình được trả về
4nguồn. Chế độ có thể thu được bằng phương pháp 23. Vì 23 trả về 6, hàng đầu tiên được truy xuất là 2 bởi 27 trong ví dụ này
0nguồn. Trong các ví dụ này, không có vấn đề gì, nhưng các phương thức như 74 có thể trả về các giá trị không mong muốn vì chúng cố gắng vận hành không chỉ các cột số mà cả các loại cột khác theo mặc địnhTrong 74, v.v., nếu đối số 40 được đặt thành 41, thì chỉ các cột số được xử lý. Lưu ý rằng các cột loại 42 được coi là 43 và 44 ngay cả khi 45Liên kết được tài trợ Thay thế các giá trị bị thiếu bằng các giá trị hợp lệ trước đó/tiếp theo. print(df.fillna(0)) # name age state point other # 0 Alice 24.0 NY 0.0 0.0 # 1 0 0.0 0 0.0 0.0 # 2 Charlie 0.0 CA 0.0 0.0 # 3 Dave 68.0 TX 70.0 0.0 # 4 Ellen 0.0 CA 88.0 0.0 # 5 Frank 30.0 0 0.0 0.0 9, print(df.fillna({'name': 'XXX', 'age': 20, 'ZZZ': 100})) # name age state point other # 0 Alice 24.0 NY NaN NaN # 1 XXX 20.0 NaN NaN NaN # 2 Charlie 20.0 CA NaN NaN # 3 Dave 68.0 TX 70.0 NaN # 4 Ellen 20.0 CA 88.0 NaN # 5 Frank 30.0 NaN NaN NaN 0Đối số 9 của 8 có thể được sử dụng để thay thế các giá trị bị thiếu bằng các giá trị hợp lệ trước đó/tiếp theoNếu 9 được đặt thành 01 hoặc 02, các giá trị bị thiếu sẽ được thay thế bằng các giá trị hợp lệ trước đó (= điền về phía trước) và nếu 03 hoặc 04, được thay thế bằng các giá trị hợp lệ tiếp theo (= điền vào phía sau) 8nguồn. Nếu chỉ định 9, thì có thể sử dụng 0 để chỉ định số lần thay thế liên tiếp tối đa 1nguồn. Nó có thể không được sử dụng thường xuyên, nhưng nếu đối số 07 được đặt thành 08 hoặc 09, các giá trị bị thiếu sẽ được thay thế bằng các giá trị bên trái và bên phải 0nguồn. Các phương thức tương ứng với đối số 9 được cung cấp riêng
81 và 82 tương đương với ________ 683, n ________ 684 và ________ 685 tương đương với 86. Bạn có thể chỉ định 0 1nguồn. vận hành tại chỗ. print(df.fillna({'name': 'XXX', 'age': 20, 'ZZZ': 100})) # name age state point other # 0 Alice 24.0 NY NaN NaN # 1 XXX 20.0 NaN NaN NaN # 2 Charlie 20.0 CA NaN NaN # 3 Dave 68.0 TX 70.0 NaN # 4 Ellen 20.0 CA 88.0 NaN # 5 Frank 30.0 NaN NaN NaN 1Như trong các ví dụ trên, theo mặc định, một đối tượng mới được trả về và đối tượng ban đầu không bị thay đổi, nhưng nếu 89, đối tượng ban đầu sẽ được cập nhật
Làm cách nào để thay thế tất cả các giá trị NaN trong DataFrame của gấu trúc?Sử dụng DataFrame. Bạn cũng có thể sử dụng df. thay(np. nan,0) để thay thế tất cả các giá trị NaN bằng 0. Điều này thay thế tất cả các cột của DataFrame bằng 0 cho các giá trị Nan.
Thay thế giá trị null bằng cái gì?Các giá trị null có thể được thay thế trong SQL bằng cách sử dụng UPDATE, SET và WHERE để tìm kiếm một cột trong bảng để tìm các giá trị null và thay thế chúng. Trong ví dụ trên, nó thay thế chúng bằng 0. Làm sạch dữ liệu rất quan trọng đối với phân tích vì dữ liệu lộn xộn có thể dẫn đến phân tích không chính xác.
Làm cách nào để thay thế giá trị null trong gấu trúc bằng giá trị trung bình?Bạn có thể sử dụng hàm fillna() để thay thế các giá trị NaN trong DataFrame của gấu trúc.
Làm cách nào để thay thế null bằng NaN trong gấu trúc?Sử dụng gấu trúc. Khung dữ liệu. fillna() để thay thế các giá trị NaN/Null bằng một chuỗi rỗng. Điều này thay thế từng NaN trong DataFrame của gấu trúc bằng một chuỗi trống. |