Làm cách nào để đếm số lần xuất hiện của một ký tự trong python?

Trong bài viết này, chúng ta sẽ học cách đếm số lần xuất hiện của một ký tự trong một chuỗi cho trước bằng Python

Mục lục

Chuỗi là gì?

Chuỗi là một mảng byte, đại diện cho các ký tự Unicode được đặt trong dấu nháy đơn, kép hoặc ba. Các ký tự kèm theo có thể là bất kỳ chữ số, bảng chữ cái hoặc ký hiệu đặc biệt nào. Chuỗi chỉ là một văn bản bình thường và con người có thể đọc được. Chuỗi trong Python là bất biến, có nghĩa là không thể thay đổi

Bây giờ chúng ta sẽ xem xét các phương thức khác nhau mà qua đó chúng ta có thể đếm số lần xuất hiện của một ký tự trong một chuỗi

Đếm số lần xuất hiện của một ký tự trong chuỗi bằng cách sử dụng hàm đếm[]

Phương thức đầu tiên chúng ta sẽ học là phương thức count[] của lớp string. Nó nhận một ký tự làm đối số và trả về số lần xuất hiện của ký tự đã cho trong đối tượng chuỗi đang gọi

quảng cáo

Đây là phương pháp đơn giản nhất, nhưng nhược điểm của nó là nó tính chữ hoa và chữ thường là các ký tự khác nhau

Ví dụ. Nếu chuỗi là “Anh ấy đang đứng dưới gốc cây”. Có hai chữ “t”, một chữ viết hoa và chữ còn lại viết thường. Hãy xem đầu ra là gì

MÃ SỐ

string_var = 'He is Standing below a Tree'

print[ string_var.count['t'] ]

ĐẦU RA

1

Bạn có thể thấy trong đoạn mã trên, số lần xuất hiện của ký tự ‘t’ là 1, nhưng số lượng của ‘t’ [cả chữ thường và chữ hoa] là 2. Vì vậy, phương pháp này có thể được sử dụng để đếm sự xuất hiện của ký tự trong một chuỗi nhưng nó đếm riêng chữ hoa và chữ thường

Đếm số lần xuất hiện của một ký tự trong chuỗi bằng cách sử dụng các bộ sưu tập. phản đối[]

Phương pháp tiếp theo mà chúng ta có thể hoàn thành công việc của mình là sử dụng phương thức counter[] của mô-đun Bộ sưu tập

Mô-đun Bộ sưu tập của python, cung cấp các loại vùng chứa khác nhau. Cung cấp một cách khác để chứa các đối tượng và lặp lại chúng. Nó cung cấp cho chúng tôi các loại container khác nhau như. Bộ đếm, ChainMap, Bản đồ mặc định, v.v.

Chúng tôi sẽ sử dụng bộ đếm []. Nó là một lớp con từ điển chứa các phần tử dưới dạng khóa từ điển và sự xuất hiện của chúng được lưu trữ dưới dạng giá trị của chúng. Nó trả về 0 cho các mục không có mặt. Hãy xem một ví dụ

MÃ SỐ

from collections import Counter

string_var = 'He is Standing below a Tree'

count = Counter[string_var] 

# this will print dict count
print[count]  

# this will print number of occurrence of char e
print['occurrence of alphabet e',count['t']]

ĐẦU RA

Counter[{' ': 5, 'e': 4, 'i': 2, 'a': 2, 'n': 2, 'H': 1, 's': 1, 'S': 1, 't': 1, 'd': 1, 'g': 1, 'b': 1, 'l': 1, 'o': 1, 'w': 1, 'T': 1, 'r': 1}]
occurrence of alphabet e 1

Trong đoạn mã trên, mục tiêu là tìm số lần xuất hiện của char e trong biến str_var. Trong biến đếm, phương thức Counter[] của mô-đun Bộ sưu tập đã được khởi tạo và bây giờ biến đếm lưu trữ một từ điển có bảng chữ cái làm khóa và số lần xuất hiện của chúng được tính là giá trị. Nó cũng tính riêng các chữ cái viết hoa và viết thường

Đếm số lần xuất hiện của một ký tự trong chuỗi bằng re. tìm tất cả []

Phương thức tiếp theo mà chúng ta sẽ sử dụng để tìm sự xuất hiện của một ký tự đã cho là phương thức findall[] của re module. Chữ viết tắt của Biểu thức chính quy, đi kèm với thư viện python sử dụng ký tự dấu gạch chéo ngược ['\'] để biểu thị các biểu mẫu đặc biệt. Ở đó. findall[] quét chuỗi đã cho từ trái sang phải và kiểm tra xem chuỗi đã cho có mẫu được chỉ định có thể ở dạng chữ số hoặc bất kỳ loại dữ liệu nào khác không. Ở đây chúng ta sẽ sử dụng phương thức findall[] và len[] để in sự xuất hiện của chuỗi đã cho.
Xem ví dụ bên dưới.

VÍ DỤ

import re 

string_var = 'He is Standing below a Tree'

occurrence = re.findall['e',string_var] 

# this will print list occurrence with all e chars
print[occurrence] 

# this will print the count of occurrences
print[len[occurrence]] 

ĐẦU RA

['e', 'e', 'e', 'e']
4

Trong ví dụ trên, phương thức findall[] của re module đã được sử dụng để đếm số lần xuất hiện của char t trong var string_var. Đây, lại. findall[] trả về các chuỗi trong danh sách và phương thức len[] đếm độ dài của danh sách. Bằng cách này, chúng ta có thể tìm thấy số lần char đã cho trong chuỗi. Phương pháp này cũng tính riêng chữ hoa và chữ thường

Đếm số lần xuất hiện của một ký tự trong chuỗi bằng defaultdict[]

Phương thức defaultdict[] đi kèm với mô-đun bộ sưu tập trong Python. Chức năng của nó tương tự như lớp từ điển và nó lưu trữ các ký tự dưới dạng khóa và số lần xuất hiện của chúng được tính là giá trị. Nó cũng cung cấp một giá trị mặc định cho khóa không bao giờ tồn tại. Hãy xem một ví dụ

MÃ SỐ

from collections import defaultdict

string_var = 'He is Standing below a Tree'

occurrence = defaultdict[int]

for i in string_var:
    occurrence[i] += 1

print[occurrence['e']]

ĐẦU RA

4

Trong đoạn mã trên, bạn có thể thấy phương thức defaultdict[] đã được sử dụng để đếm số lần xuất hiện của ký tự 'e' trong biến string_var. Nó cũng tính riêng chữ hoa và chữ thường

Sử dụng gấu trúc. loạt

Trong phương pháp này, chúng tôi sẽ sử dụng chuỗi. value_count[] của gói Pandas để đếm số lần xuất hiện của một ký tự trong một chuỗi đã cho. Pandas là một công cụ phân tích dữ liệu được sử dụng rộng rãi. Ở đây chúng ta sẽ sử dụng pandas series, là một ndarray 1-D với các nhãn trục

gấu trúc. loạt. value_counts[] trả về một chuỗi có số lượng giá trị duy nhất theo thứ tự giảm dần và phần tử đầu tiên luôn là phần tử xuất hiện nhiều nhất

CÚ PHÁP. pd. Loạt. value_counts[bình thường hóa, sắp xếp, tăng dần, thùng, dropna]

THAM SỐ. Nó nhận được năm tham số

  • bình thường hóa. Nếu đúng, điều này trả về tần suất của các giá trị duy nhất. Giá trị mặc định là Sai
  • loại. Sắp xếp theo các giá trị đã cho. Giá trị mặc định là True
  • tăng dần. Sắp xếp theo thứ tự tăng dần. Giá trị mặc định là Sai
  • thùng. Giá trị mặc định là Không có/
  • dropna. Không bao gồm số lượng NaN

Hãy xem một ví dụ về phương pháp này

MÃ SỐ

________số 8

ĐẦU RA

     5
e    4
i    2
n    2
a    2
l    1
T    1
S    1
s    1
r    1
o    1
H    1
g    1
b    1
t    1
d    1
w    1
dtype: int64

Trong mã và Đầu ra ở trên, bạn có thể thấy loạt. Phương thức value_count[] của gói pandas đã được sử dụng để đếm số lần xuất hiện của một ký tự đã cho trong một chuỗi. Phương thức này đã trả về tất cả các lần xuất hiện của tất cả các ký tự trong đối tượng Sê-ri

Tóm lược

Như vậy bạn đã thấy năm phương pháp khác nhau mà qua đó chúng ta có thể đếm số lần xuất hiện của một ký tự trong một chuỗi. Tất cả các phương thức trên đều tính riêng các phương thức viết hoa và viết thường. Phương thức đơn giản nhất là phương thức count[] vì nó nhận một chuỗi làm tham số và trả về số lần xuất hiện. Để biết số lượng và giá trị chi tiết nhất, bạn có thể sử dụng chuỗi. phương thức count_values[] của gói gấu trúc được sử dụng rộng rãi để phân tích dữ liệu

Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python

 
  • Hướng dẫn Pandas Phần #1 - Giới thiệu về Phân tích dữ liệu với Python
  • Hướng dẫn Pandas Phần #2 - Khái niệm cơ bản về Pandas Series
  • Hướng dẫn Pandas Phần #3 - Nhận & Đặt giá trị Chuỗi
  • Pandas Tutorial Part #4 - Thuộc tính & phương thức của Pandas Series
  • Hướng dẫn về Pandas Phần #5 - Thêm hoặc xóa các thành phần của Pandas Series
  • Hướng dẫn về Pandas Phần #6 - Giới thiệu về DataFrame
  • Hướng dẫn về Pandas Phần #7 - DataFrame. loc[] - Chọn Hàng/Cột theo Lập chỉ mục
  • Hướng dẫn về Pandas Phần #8 - DataFrame. iloc[] - Chọn Hàng/Cột theo Tên nhãn
  • Hướng dẫn về gấu trúc Phần #9 - Lọc các hàng trong khung dữ liệu
  • Hướng dẫn Pandas Phần #10 - Thêm/Xóa Hàng & Cột DataFrame
  • Hướng dẫn về Pandas Phần #11 - Các thuộc tính & phương thức DataFrame
  • Hướng dẫn Pandas Phần #12 - Xử lý dữ liệu bị thiếu hoặc giá trị NaN
  • Hướng dẫn về Pandas Phần #13 - Lặp lại các Hàng & Cột của DataFrame
  • Hướng dẫn Pandas Phần #14 - Sắp xếp DataFrame theo Hàng hoặc Cột
  • Hướng dẫn về gấu trúc Phần #15 - Hợp nhất hoặc ghép các khung dữ liệu
  • Hướng dẫn về Pandas Phần #16 - DataFrame GroupBy được giải thích bằng các ví dụ
 

Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?

Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học

Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python

Hãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay

Làm cách nào để đếm số lần xuất hiện của một ký tự trong chuỗi bằng Python?

phương thức đếm[] trả về số lần xuất hiện của chuỗi con trong chuỗi đã cho.

Làm cách nào để đếm ký tự trong Python?

Trong Python, bạn có thể lấy độ dài của chuỗi str [= số ký tự] bằng hàm có sẵn len[] .

Chủ Đề