Làm cách nào để đếm số lần xuất hiện của một ký tự trong python?
Trong bài viết này, chúng ta sẽ học cách đếm số lần xuất hiện của một ký tự trong một chuỗi cho trước bằng Python Show
Mục lục Chuỗi là gì?Chuỗi là một mảng byte, đại diện cho các ký tự Unicode được đặt trong dấu nháy đơn, kép hoặc ba. Các ký tự kèm theo có thể là bất kỳ chữ số, bảng chữ cái hoặc ký hiệu đặc biệt nào. Chuỗi chỉ là một văn bản bình thường và con người có thể đọc được. Chuỗi trong Python là bất biến, có nghĩa là không thể thay đổi Bây giờ chúng ta sẽ xem xét các phương thức khác nhau mà qua đó chúng ta có thể đếm số lần xuất hiện của một ký tự trong một chuỗi Đếm số lần xuất hiện của một ký tự trong chuỗi bằng cách sử dụng hàm đếm()Phương thức đầu tiên chúng ta sẽ học là phương thức count() của lớp string. Nó nhận một ký tự làm đối số và trả về số lần xuất hiện của ký tự đã cho trong đối tượng chuỗi đang gọi quảng cáo Đây là phương pháp đơn giản nhất, nhưng nhược điểm của nó là nó tính chữ hoa và chữ thường là các ký tự khác nhau Ví dụ. Nếu chuỗi là “Anh ấy đang đứng dưới gốc cây”. Có hai chữ “t”, một chữ viết hoa và chữ còn lại viết thường. Hãy xem đầu ra là gì MÃ SỐ string_var = 'He is Standing below a Tree' print( string_var.count('t') ) ĐẦU RA 1 Bạn có thể thấy trong đoạn mã trên, số lần xuất hiện của ký tự ‘t’ là 1, nhưng số lượng của ‘t’ (cả chữ thường và chữ hoa) là 2. Vì vậy, phương pháp này có thể được sử dụng để đếm sự xuất hiện của ký tự trong một chuỗi nhưng nó đếm riêng chữ hoa và chữ thường Đếm số lần xuất hiện của một ký tự trong chuỗi bằng cách sử dụng các bộ sưu tập. phản đối()Phương pháp tiếp theo mà chúng ta có thể hoàn thành công việc của mình là sử dụng phương thức counter() của mô-đun Bộ sưu tập Mô-đun Bộ sưu tập của python, cung cấp các loại vùng chứa khác nhau. Cung cấp một cách khác để chứa các đối tượng và lặp lại chúng. Nó cung cấp cho chúng tôi các loại container khác nhau như. Bộ đếm, ChainMap, Bản đồ mặc định, v.v. Chúng tôi sẽ sử dụng bộ đếm (). Nó là một lớp con từ điển chứa các phần tử dưới dạng khóa từ điển và sự xuất hiện của chúng được lưu trữ dưới dạng giá trị của chúng. Nó trả về 0 cho các mục không có mặt. Hãy xem một ví dụ MÃ SỐ from collections import Counter string_var = 'He is Standing below a Tree' count = Counter(string_var) # this will print dict count print(count) # this will print number of occurrence of char e print('occurrence of alphabet e',count['t']) ĐẦU RA Counter({' ': 5, 'e': 4, 'i': 2, 'a': 2, 'n': 2, 'H': 1, 's': 1, 'S': 1, 't': 1, 'd': 1, 'g': 1, 'b': 1, 'l': 1, 'o': 1, 'w': 1, 'T': 1, 'r': 1}) occurrence of alphabet e 1 Trong đoạn mã trên, mục tiêu là tìm số lần xuất hiện của char e trong biến str_var. Trong biến đếm, phương thức Counter() của mô-đun Bộ sưu tập đã được khởi tạo và bây giờ biến đếm lưu trữ một từ điển có bảng chữ cái làm khóa và số lần xuất hiện của chúng được tính là giá trị. Nó cũng tính riêng các chữ cái viết hoa và viết thường Đếm số lần xuất hiện của một ký tự trong chuỗi bằng re. tìm tất cả ()Phương thức tiếp theo mà chúng ta sẽ sử dụng để tìm sự xuất hiện của một ký tự đã cho là phương thức findall() của re module. Chữ viết tắt của Biểu thức chính quy, đi kèm với thư viện python sử dụng ký tự dấu gạch chéo ngược ('\') để biểu thị các biểu mẫu đặc biệt. Ở đó. findall() quét chuỗi đã cho từ trái sang phải và kiểm tra xem chuỗi đã cho có mẫu được chỉ định có thể ở dạng chữ số hoặc bất kỳ loại dữ liệu nào khác không. Ở đây chúng ta sẽ sử dụng phương thức findall() và len() để in sự xuất hiện của chuỗi đã cho. VÍ DỤ import re string_var = 'He is Standing below a Tree' occurrence = re.findall('e',string_var) # this will print list occurrence with all e chars print(occurrence) # this will print the count of occurrences print(len(occurrence)) ĐẦU RA ['e', 'e', 'e', 'e'] 4 Trong ví dụ trên, phương thức findall() của re module đã được sử dụng để đếm số lần xuất hiện của char t trong var string_var. Đây, lại. findall() trả về các chuỗi trong danh sách và phương thức len() đếm độ dài của danh sách. Bằng cách này, chúng ta có thể tìm thấy số lần char đã cho trong chuỗi. Phương pháp này cũng tính riêng chữ hoa và chữ thường Đếm số lần xuất hiện của một ký tự trong chuỗi bằng defaultdict()Phương thức defaultdict() đi kèm với mô-đun bộ sưu tập trong Python. Chức năng của nó tương tự như lớp từ điển và nó lưu trữ các ký tự dưới dạng khóa và số lần xuất hiện của chúng được tính là giá trị. Nó cũng cung cấp một giá trị mặc định cho khóa không bao giờ tồn tại. Hãy xem một ví dụ MÃ SỐ from collections import defaultdict string_var = 'He is Standing below a Tree' occurrence = defaultdict(int) for i in string_var: occurrence[i] += 1 print(occurrence['e']) ĐẦU RA 4 Trong đoạn mã trên, bạn có thể thấy phương thức defaultdict() đã được sử dụng để đếm số lần xuất hiện của ký tự 'e' trong biến string_var. Nó cũng tính riêng chữ hoa và chữ thường Sử dụng gấu trúc. loạtTrong phương pháp này, chúng tôi sẽ sử dụng chuỗi. value_count() của gói Pandas để đếm số lần xuất hiện của một ký tự trong một chuỗi đã cho. Pandas là một công cụ phân tích dữ liệu được sử dụng rộng rãi. Ở đây chúng ta sẽ sử dụng pandas series, là một ndarray 1-D với các nhãn trục gấu trúc. loạt. value_counts() trả về một chuỗi có số lượng giá trị duy nhất theo thứ tự giảm dần và phần tử đầu tiên luôn là phần tử xuất hiện nhiều nhất CÚ PHÁP. pd. Loạt. value_counts(bình thường hóa, sắp xếp, tăng dần, thùng, dropna) THAM SỐ. Nó nhận được năm tham số
Hãy xem một ví dụ về phương pháp này MÃ SỐ ________số 8ĐẦU RA 5 e 4 i 2 n 2 a 2 l 1 T 1 S 1 s 1 r 1 o 1 H 1 g 1 b 1 t 1 d 1 w 1 dtype: int64 Trong mã và Đầu ra ở trên, bạn có thể thấy loạt. Phương thức value_count() của gói pandas đã được sử dụng để đếm số lần xuất hiện của một ký tự đã cho trong một chuỗi. Phương thức này đã trả về tất cả các lần xuất hiện của tất cả các ký tự trong đối tượng Sê-ri Tóm lượcNhư vậy bạn đã thấy năm phương pháp khác nhau mà qua đó chúng ta có thể đếm số lần xuất hiện của một ký tự trong một chuỗi. Tất cả các phương thức trên đều tính riêng các phương thức viết hoa và viết thường. Phương thức đơn giản nhất là phương thức count() vì nó nhận một chuỗi làm tham số và trả về số lần xuất hiện. Để biết số lượng và giá trị chi tiết nhất, bạn có thể sử dụng chuỗi. phương thức count_values() của gói gấu trúc được sử dụng rộng rãi để phân tích dữ liệu Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python
Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với PythonHãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay Làm cách nào để đếm số lần xuất hiện của một ký tự trong chuỗi bằng Python?phương thức đếm() trả về số lần xuất hiện của chuỗi con trong chuỗi đã cho.
Làm cách nào để đếm ký tự trong Python?Trong Python, bạn có thể lấy độ dài của chuỗi str (= số ký tự) bằng hàm có sẵn len() . |