Làm cách nào để bạn tìm thấy số lượng tần suất của các mục duy nhất của một chuỗi trong python?

Chúng tôi cần xác định tần suất đếm dữ liệu/giá trị hoặc mục trong một hoặc nhiều cột của Khung dữ liệu Pandas. Có một số cách để thực hiện điều này. Chúng tôi sẽ thảo luận về một số phương pháp để đếm số lần xuất hiện hoặc tần suất của các mục hoặc giá trị trong cột của Khung dữ liệu

ví dụ 1. Đếm tần suất của cột bằng hàm Value_Counts[]

Phương thức value_counts[] trong Pandas trả về một Chuỗi có tần suất xuất hiện các giá trị duy nhất. Sê-ri kết quả theo thứ tự giảm dần theo mặc định và không có bất kỳ giá trị NA nào. “gấu trúc. Đối tượng sê-ri” phù hợp để sử dụng với chức năng này [value_counts[]]. Có thể thu được số lượng tần suất của các giá trị trong một cột bằng phương pháp này vì các đối tượng Pandas DataFrame là nhóm các đối tượng Sê-ri. Trước tiên chúng ta phải tạo một DataFrame để minh họa ví dụ này. “gấu trúc. DataFrame[]” được sử dụng để tạo DataFrame. Vì vậy, trước tiên chúng ta phải nhập gói Pandas


trong pd. DataFrame[], chúng tôi đã sử dụng từ điển Python để tạo DataFrame của mình. Chúng tôi đã chỉ định các cột trong DataFrame của mình với các nhãn “X” và “Y”. Chúng tôi hiển thị Khung dữ liệu “df” của mình bằng phương thức print[]


Trong Khung dữ liệu “df” mới được tạo, có hai cột - cột “X” lưu trữ các giá trị số nguyên [1, 1, 4, 3, 5, 1, 4, 3, 5, 4] và cột “Y” lưu trữ . Bạn có thể quan sát thấy có sự lặp lại trong dữ liệu của cả hai cột. Chúng ta có thể sử dụng hàm value_counts[] để tính tần suất xuất hiện của dữ liệu trong một cột cụ thể. Hãy đếm tần suất xuất hiện của dữ liệu trong cột “Y”


Hàm trả về một chuỗi có số lượng giá trị riêng biệt. Giá trị “q” xuất hiện 4 lần và giá trị “r” và “t” xuất hiện 3 lần trong cột “y”. Hãy cũng đếm các giá trị duy nhất trong cột X


Có thể thấy giá trị “1” và “4” xuất hiện 3 lần ở cột “X”, trong khi giá trị “3” và “5” xuất hiện 2 lần

ví dụ 2. Đếm tần số của cột bằng cách sử dụng GroupBy. Hàm đếm []

Trong ví dụ này, chúng tôi nhóm các hàng theo cột bằng Pandas DataFrame. groupby[] và sử dụng phương thức count[] để xác định số lượng giá trị riêng biệt cho mỗi nhóm, bỏ qua các giá trị Không có và NaN. Trước tiên, hãy tạo một DataFrame nơi chúng tôi áp dụng nhóm. hàm đếm[]


Chúng tôi đã sử dụng từ điển Pandas để tạo DataFrame sau khi nhập mô-đun Pandas. Tên cột của chúng tôi được chỉ định là “col1” và “col2”


Trong cột “col1”, chúng ta có dữ liệu số nguyên [8, 6, 5, 8, 8, 7, 7, 9, 5, 7]. Trong cột “col2”, chúng ta có dữ liệu chuỗi [“boy”, “boy”, “girl”, “boy”, “boy”, “girl”, “girl”, “girl”, “boy”, “ . Bây giờ, chúng tôi áp dụng groupby. Counts[] để tính tần suất của các giá trị trong mỗi cột


Để tính toán, chúng tôi chia dữ liệu thành nhiều nhóm khác nhau bằng cách sử dụng hàm groupby[]. Sau đó, hàm đếm [] được áp dụng để đếm tần số của các giá trị riêng biệt trong cột được chỉ định của Khung dữ liệu. Giá trị “5” xảy ra 2 lần. Các giá trị “6” và “9” xảy ra một lần. Trong khi giá trị “7” và “8” xuất hiện 2 lần trong cột “col1”. Bây giờ, hãy áp dụng groupby. hàm đếm[] trên cột “col2”


Hàm xác định tần số của các giá trị “trai” và “gái” lần lượt là 6 và 4 lần

ví dụ 3. Đếm tần số của cột bằng cách sử dụng GroupBy. Kích thước [] Chức năng

Tần suất của các mục trong các cột đơn có thể được tính bằng phương pháp này. Để có được một đối tượng DataFrame với tần suất đếm, chúng ta có thể áp dụng phương thức count[] cho một đối tượng DataFrame được nhóm theo một cột. Đầu tiên, một Khung dữ liệu chứa ít nhất một cột lặp lại được tạo để chúng ta có thể sử dụng hàm đếm [] để xác định tần suất của các giá trị. Trước tiên, chúng tôi nhập mô-đun Pandas trước khi tạo DataFrame. Sau đó, sử dụng pd. DataFrame[], chúng tôi tạo DataFrame của chúng tôi


Trong DataFrame trước, chúng tôi có hai cột - cột "tên" với các giá trị ["Alex", "Jack", "Alex", "Ali", "Jack", "Jack", "Alex", "Alex", . Bây giờ, để tìm số lượng tần suất của các cột này, chúng tôi sử dụng nhóm. kích thước[] chức năng. Một int đại diện cho số lượng mục trong đối tượng này có thể được lấy bằng thuộc tính kích thước. Nếu chuỗi đưa ra số hàng và nếu DataFrame trả về tổng số hàng nhân với số cột


Nó cho thấy rằng có hai lần xuất hiện trong đó “Alex” có giá trị cấp là “A”. Ngoài ra còn có hai lần xuất hiện trong đó “Alex” có giá trị cấp độ là “B” và “C”. “Ali” xảy ra 1 lần với điểm “A” và “B”, trong khi 2 lần với giá trị điểm “C”. “Jack” xảy ra hai lần với điểm “A” và “B”

Ví dụ 4. Đếm tần suất của cột bằng cách tạo bảng tần suất cho một hàng cụ thể

Chúng ta có thể áp dụng phương thức crosstab[] để xác định tần số trong Khung dữ liệu Pandas

Bây giờ, giả sử chúng ta phải tạo một DataFrame với các chi tiết về giới tính, tuổi tác và điểm chữ cái của mười học sinh khác nhau


Chúng tôi đã tạo DataFrame cần thiết với ba cột - cột cấp độ [“A”, “B”, “A”, “B”, “C”, “B”, “B”, “C”, “A”, “ . Bây giờ, chúng ta sử dụng hàm crosstab[] để tạo bảng tần số. Có thể sử dụng bảng lập bảng chéo được tạo bởi phương thức crosstab[] để hiển thị tần suất xuất hiện của các nhóm dữ liệu khác nhau


Bên trong pd. crosstab[], chúng tôi đã chỉ định cột “grade” trong tham số chỉ mục để tính toán tần suất của dữ liệu trong cột và chỉ định tham số cột là “tần số” để lưu trữ các giá trị/tần suất trả về của dữ liệu nhóm

Phần kết luận

Trong hướng dẫn Pandas này, chúng ta đã thảo luận cách đếm số lần xuất hiện của dữ liệu hoặc giá trị trong một cột của Pandas DataFrame. Chúng tôi đã cố gắng hướng dẫn cách sử dụng các hàm “value_counts[]” và “groupby[]” cùng với các thuộc tính “size[]” và “count[]” để đếm tần suất dữ liệu trong cột được chỉ định. Chúng ta cũng đã thấy cách đếm tần suất của một cột bằng cách tạo bảng tần số bằng hàm crosstab[]

Chủ Đề