Pandas kiểm tra xem cột có ô trống không

Gấu trúc coi Không và NaN về cơ bản có thể hoán đổi cho nhau để chỉ ra các giá trị bị thiếu hoặc null. Để tạo thuận lợi cho quy ước này, có một số chức năng hữu ích để phát hiện, xóa và thay thế các giá trị null trong Pandas DataFrame

  • isnull[]
  • có giá trị[]
  • dropna[]
  • điền []
  • thay thế[]
  • nội suy[]

Trong bài viết này, chúng tôi đang sử dụng tệp CSV, để tải xuống tệp CSV đã sử dụng, hãy nhấp vào đây

Kiểm tra các giá trị bị thiếu bằng isnull[] và notnull[]

Để kiểm tra các giá trị còn thiếu trong Pandas DataFrame, chúng tôi sử dụng hàm isnull[] và notnull[]. Cả hai chức năng đều giúp kiểm tra xem một giá trị có phải là NaN hay không. Các chức năng này cũng có thể được sử dụng trong Pandas Series để tìm các giá trị null trong một chuỗi

Kiểm tra các giá trị bị thiếu bằng cách sử dụng isnull[]

Để kiểm tra các giá trị null trong Pandas DataFrame, chúng tôi sử dụng hàm isnull[] hàm này trả về khung dữ liệu của các giá trị Boolean là True cho các giá trị NaN. Mã số 1.  

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1_______0_______2# importing pandas as pd3# importing pandas as pd4# importing pandas as pd5# importing pandas as pd6# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______4import4# importing pandas as pd4import6import7

# importing pandas as pd9import9pandas as pd0_______2_______1# importing pandas as pd4pandas as pd3# importing pandas as pd4pandas as pd5pandas as pd6

 

pandas as pd7

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

 

# importing numpy as np3

# importing numpy as np4

Đầu ra.

  Mã #2.

con trăn




# importing numpy as np5

import pandas as pd

# importing numpy as np8

# importing numpy as np9

import0= import2

# importing numpy as np8

import4

import5_______8_______ import7

# importing numpy as np8

import9

numpy as np0

numpy as np1

Đầu ra. Như thể hiện trong hình ảnh đầu ra, chỉ những hàng có Giới tính = NULL được hiển thị.

 

Kiểm tra các giá trị bị thiếu bằng cách sử dụng notnull[]

Để kiểm tra các giá trị null trong Pandas Dataframe, chúng tôi sử dụng hàm notnull[] hàm này trả về khung dữ liệu của các giá trị Boolean là Sai đối với các giá trị NaN. Mã số 3.  

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1_______0_______2# importing pandas as pd3# importing pandas as pd4# importing pandas as pd5# importing pandas as pd6# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______4import4# importing pandas as pd4import6import7

# importing pandas as pd9import9pandas as pd0_______2_______1# importing pandas as pd4pandas as pd3# importing pandas as pd4pandas as pd5pandas as pd6

 

=8

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

 

# importing pandas as pd04

# importing pandas as pd05

Đầu ra.

  Mã #4.

con trăn




# importing numpy as np5

import pandas as pd

# importing numpy as np8

# importing numpy as np9

import0= import2

# importing numpy as np8

import4

import5_______8_______ # importing pandas as pd18

# importing numpy as np8

import9

# importing pandas as pd21

numpy as np1

Đầu ra. Như thể hiện trong hình ảnh đầu ra, chỉ những hàng có Giới tính = KHÔNG NULL được hiển thị.

 

Điền các giá trị còn thiếu bằng cách sử dụng fillna[], thay thế[] và nội suy[]

Để điền các giá trị null vào bộ dữ liệu, chúng tôi sử dụng hàm fillna[], replace[] và interpolate[], các hàm này thay thế các giá trị NaN bằng một số giá trị của riêng chúng. Tất cả các chức năng này giúp điền vào các giá trị null trong bộ dữ liệu của DataFrame. Hàm nội suy [] về cơ bản được sử dụng để điền các giá trị NA vào khung dữ liệu nhưng nó sử dụng nhiều kỹ thuật nội suy khác nhau để điền các giá trị còn thiếu thay vì mã hóa cứng giá trị. Mã số 1. Điền giá trị null với một giá trị duy nhất

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1_______0_______2# importing pandas as pd3# importing pandas as pd4# importing pandas as pd5# importing pandas as pd6# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______4import4# importing pandas as pd4import6import7

# importing pandas as pd9import9pandas as pd0_______2_______1# importing pandas as pd4pandas as pd3# importing pandas as pd4pandas as pd5pandas as pd6

 

# importing pandas as pd59

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

 

# importing pandas as pd65

# importing pandas as pd66# importing pandas as pd67# importing numpy as np2

Đầu ra.

  Mã #2. Điền các giá trị null bằng các giá trị trước đó 

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1_______0_______2# importing pandas as pd3# importing pandas as pd4# importing pandas as pd5# importing pandas as pd6# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______4import4# importing pandas as pd4import6import7

# importing pandas as pd9import9pandas as pd0_______2_______1# importing pandas as pd4pandas as pd3# importing pandas as pd4pandas as pd5pandas as pd6

 

# importing pandas as pd59

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

 

import11

import12

import13=import15# importing numpy as np2

Đầu ra.

  Mã #3. Điền giá trị null với giá trị tiếp theo 

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1_______0_______2# importing pandas as pd3# importing pandas as pd4# importing pandas as pd5# importing pandas as pd6# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______4import4# importing pandas as pd4import6import7

# importing pandas as pd9import9pandas as pd0_______2_______1# importing pandas as pd4pandas as pd3# importing pandas as pd4pandas as pd5pandas as pd6

 

# importing pandas as pd59

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

 

import59

import13_______8_______import62# importing numpy as np2

Đầu ra.

  Mã #4. Điền các giá trị null vào Tệp CSV 

con trăn




# importing numpy as np5

import pandas as pd

# importing numpy as np8

# importing numpy as np9

import0= import2

 

import72

import73

import74_______1_______75import76import77import78

Bây giờ chúng ta sẽ điền vào tất cả các giá trị null trong cột Giới tính bằng “Không có giới tính”

con trăn




# importing numpy as np5

import pandas as pd

# importing numpy as np8

# importing numpy as np9

import0= import2

 

import87

import88= import90# importing numpy as np2

 

import0

Đầu ra.

Mã số 5. Điền giá trị null bằng phương thức replace[] 

con trăn




# importing numpy as np5

import pandas as pd

# importing numpy as np8

# importing numpy as np9

import0= import2

 

import72

import73

import74_______1_______75import76import77import78

Đầu ra.

Bây giờ chúng ta sẽ thay thế tất cả giá trị Nan trong khung dữ liệu bằng giá trị -99.

con trăn




# importing numpy as np5

import pandas as pd

# importing numpy as np8

# importing numpy as np9

import0= import2

# importing numpy as np8

pandas as pd17

pandas as pd18= pandas as pd20_______8_______ pandas as pd22pandas as pd23# importing numpy as np2

Đầu ra.

  Mã #6. Sử dụng hàm interpolate[] để điền vào các giá trị còn thiếu bằng phương pháp tuyến tính.

con trăn




# importing pandas as pd

import pandas as pd

# importing numpy as np8

pandas as pd29

pandas as pd8= pandas as pd32_______2_______33_______0_______4pandas as pd35# importing pandas as pd4pandas as pd37# importing pandas as pd4pandas as pd39# importing pandas as pd4pandas as pd41# importing pandas as pd8

pandas as pd43pandas as pd44pandas as pd39# importing pandas as pd4pandas as pd47# importing pandas as pd4pandas as pd49# importing pandas as pd4pandas as pd51# importing pandas as pd4pandas as pd39# importing pandas as pd8

pandas as pd43pandas as pd56pandas as pd57# importing pandas as pd4pandas as pd59# importing pandas as pd4pandas as pd39# importing pandas as pd4pandas as pd51# importing pandas as pd4pandas as pd65# importing pandas as pd8

pandas as pd43pandas as pd68pandas as pd69# importing pandas as pd4pandas as pd51# importing pandas as pd4pandas as pd39# importing pandas as pd4pandas as pd39# importing pandas as pd4pandas as pd77pandas as pd78

# importing numpy as np8

pandas as pd80

pandas as pd8

Hãy nội suy các giá trị còn thiếu bằng phương pháp Tuyến tính. Lưu ý rằng phương pháp Tuyến tính bỏ qua chỉ mục và coi các giá trị cách đều nhau.  

con trăn




pandas as pd82

pandas as pd83=___pandas as pd85_______2_______86_______8_______2_______88# importing numpy as np2

Đầu ra.

Như chúng ta có thể thấy đầu ra, các giá trị trong hàng đầu tiên không thể được điền vì hướng điền các giá trị là về phía trước và không có giá trị nào trước đó có thể được sử dụng trong phép nội suy.

Loại bỏ các giá trị bị thiếu bằng cách sử dụng dropna[]

Để loại bỏ các giá trị null khỏi khung dữ liệu, chúng tôi đã sử dụng hàm dropna[] hàm này loại bỏ các Hàng/Cột của bộ dữ liệu có giá trị Null theo các cách khác nhau. Mã số 1. Xoá hàng có ít nhất 1 giá trị null.  

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1_______0_______2# importing pandas as pd3# importing pandas as pd4# importing pandas as pd5# importing pandas as pd6# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______6import4# importing pandas as pd4import6# importing pandas as pd8

# importing pandas as pd9import9# importing pandas as pd2_______3_______20_______0_______4pandas as pd1# importing pandas as pd4pandas as pd3_______0_______4pandas as pd5# importing pandas as pd8

# importing pandas as pd9# importing numpy as np29# importing numpy as np30# importing numpy as np31pandas as pd6

 

# importing pandas as pd59

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

# importing numpy as np8

pandas as pd8

Bây giờ chúng tôi loại bỏ các hàng có ít nhất một giá trị Nan [giá trị Null]

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1_______0_______2# importing pandas as pd3# importing pandas as pd4# importing pandas as pd5# importing pandas as pd6# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______6import4# importing pandas as pd4import6# importing pandas as pd8

# importing pandas as pd9import9# importing pandas as pd2_______3_______20_______0_______4pandas as pd1# importing pandas as pd4pandas as pd3_______0_______4pandas as pd5# importing pandas as pd8

# importing pandas as pd9# importing numpy as np29# importing numpy as np30# importing numpy as np31pandas as pd6

 

# importing pandas as pd59

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

 

# importing numpy as np90

# importing numpy as np91

Đầu ra.

Mã số 2. Xoá hàng nếu thiếu tất cả các giá trị trong hàng đó.

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1# importing pandas as pd2# importing pandas as pd3import05# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______6import4# importing pandas as pd4import6# importing pandas as pd8

# importing pandas as pd9import9# importing pandas as pd2_______3_______20_______0_______6pandas as pd3# importing pandas as pd4pandas as pd5_______0_______8

# importing pandas as pd9# importing numpy as np29# importing numpy as np30# importing numpy as np31pandas as pd6

 

# importing pandas as pd59

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

# importing numpy as np8

pandas as pd8

Bây giờ chúng tôi thả một hàng có tất cả dữ liệu bị thiếu hoặc chứa giá trị null [NaN]

con trăn




# importing pandas as pd

import pandas as pd

 

# importing numpy as np

import numpy as np

 

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1# importing pandas as pd2# importing pandas as pd3import05# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______6import4# importing pandas as pd4import6# importing pandas as pd8

# importing pandas as pd9import9# importing pandas as pd2_______3_______20_______0_______6pandas as pd3# importing pandas as pd4pandas as pd5_______0_______8

# importing pandas as pd9# importing numpy as np29# importing numpy as np30# importing numpy as np31pandas as pd6

 

pandas as pd8= # importing numpy as np0dict# importing numpy as np2

 

import83

import84= import86# importing numpy as np2

Đầu ra.

Mã số 3. Bỏ các cột có ít nhất 1 giá trị null.

con trăn




# importing pandas as pd

import pandas as pd

import91

# importing numpy as np

import numpy as np

import91

# dictionary of lists

dict = # importing pandas as pd0# importing pandas as pd1# importing pandas as pd2# importing pandas as pd3import05# importing pandas as pd7# importing pandas as pd8

# importing pandas as pd9import0import1_______1_______2_______0_______6import4# importing pandas as pd4import6# importing pandas as pd8

# importing pandas as pd9import9# importing pandas as pd2_______3_______20_______0_______6pandas as pd3# importing pandas as pd4pandas as pd5_______0_______8

# importing pandas as pd9# importing numpy as np29# importing pandas as pd2_______5_______27# importing pandas as pd4numpy as np29# importing pandas as pd4numpy as np31# importing pandas as pd4# importing numpy as np31pandas as pd6

Làm cách nào để kiểm tra xem cột có trống trong gấu trúc không?

thuộc tính trống kiểm tra xem khung dữ liệu có trống hay không. Nó trả về True nếu khung dữ liệu trống, nếu không, nó trả về Sai trong Python.

Làm cách nào để tìm các ô trống trong DataFrame của gấu trúc?

Kiểm tra xem một ô DataFrame cụ thể có trống không . isna[test_df. loc[2,'office']] là Sai. print["Ô của bạn trống. "] khác. print["Ô của bạn không trống. "] Điều này sẽ trả lại như sau. Ô của bạn trống.

Làm cách nào để kiểm tra xem ô có phải là gấu trúc không?

Sử dụng DataFrame. isnull[] kiểm tra xem một giá trị có tồn tại trong một ô hay không, nếu nó tìm thấy các giá trị NaN/None thì nó trả về True nếu không nó trả về False cho từng ô.

Làm cách nào để tìm giá trị null trong cột gấu trúc?

Các phương thức pandas isnull[] và notnull[] được sử dụng để kiểm tra và quản lý các giá trị NULL trong khung dữ liệu.

Chủ Đề