Trong bài viết này, chúng ta sẽ học cách đếm số lần xuất hiện của một ký tự trong một chuỗi cho trước bằng Python
Mục lục
Chuỗi là gì?
Chuỗi là một mảng byte, đại diện cho các ký tự Unicode được đặt trong dấu nháy đơn, kép hoặc ba. Các ký tự kèm theo có thể là bất kỳ chữ số, bảng chữ cái hoặc ký hiệu đặc biệt nào. Chuỗi chỉ là một văn bản bình thường và con người có thể đọc được. Chuỗi trong Python là bất biến, có nghĩa là không thể thay đổi
Bây giờ chúng ta sẽ xem xét các phương thức khác nhau mà qua đó chúng ta có thể đếm số lần xuất hiện của một ký tự trong một chuỗi
Đếm số lần xuất hiện của một ký tự trong chuỗi bằng cách sử dụng hàm đếm[]
Phương thức đầu tiên chúng ta sẽ học là phương thức count[] của lớp string. Nó nhận một ký tự làm đối số và trả về số lần xuất hiện của ký tự đã cho trong đối tượng chuỗi đang gọi
quảng cáo
Đây là phương pháp đơn giản nhất, nhưng nhược điểm của nó là nó tính chữ hoa và chữ thường là các ký tự khác nhau
Ví dụ. Nếu chuỗi là “Anh ấy đang đứng dưới gốc cây”. Có hai chữ “t”, một chữ viết hoa và chữ còn lại viết thường. Hãy xem đầu ra là gì
MÃ SỐ
string_var = 'He is Standing below a Tree' print[ string_var.count['t'] ]
ĐẦU RA
1
Bạn có thể thấy trong đoạn mã trên, số lần xuất hiện của ký tự ‘t’ là 1, nhưng số lượng của ‘t’ [cả chữ thường và chữ hoa] là 2. Vì vậy, phương pháp này có thể được sử dụng để đếm sự xuất hiện của ký tự trong một chuỗi nhưng nó đếm riêng chữ hoa và chữ thường
Đếm số lần xuất hiện của một ký tự trong chuỗi bằng cách sử dụng các bộ sưu tập. phản đối[]
Phương pháp tiếp theo mà chúng ta có thể hoàn thành công việc của mình là sử dụng phương thức counter[] của mô-đun Bộ sưu tập
Mô-đun Bộ sưu tập của python, cung cấp các loại vùng chứa khác nhau. Cung cấp một cách khác để chứa các đối tượng và lặp lại chúng. Nó cung cấp cho chúng tôi các loại container khác nhau như. Bộ đếm, ChainMap, Bản đồ mặc định, v.v.
Chúng tôi sẽ sử dụng bộ đếm []. Nó là một lớp con từ điển chứa các phần tử dưới dạng khóa từ điển và sự xuất hiện của chúng được lưu trữ dưới dạng giá trị của chúng. Nó trả về 0 cho các mục không có mặt. Hãy xem một ví dụ
MÃ SỐ
from collections import Counter string_var = 'He is Standing below a Tree' count = Counter[string_var] # this will print dict count print[count] # this will print number of occurrence of char e print['occurrence of alphabet e',count['t']]
ĐẦU RA
Counter[{' ': 5, 'e': 4, 'i': 2, 'a': 2, 'n': 2, 'H': 1, 's': 1, 'S': 1, 't': 1, 'd': 1, 'g': 1, 'b': 1, 'l': 1, 'o': 1, 'w': 1, 'T': 1, 'r': 1}] occurrence of alphabet e 1
Trong đoạn mã trên, mục tiêu là tìm số lần xuất hiện của char e trong biến str_var. Trong biến đếm, phương thức Counter[] của mô-đun Bộ sưu tập đã được khởi tạo và bây giờ biến đếm lưu trữ một từ điển có bảng chữ cái làm khóa và số lần xuất hiện của chúng được tính là giá trị. Nó cũng tính riêng các chữ cái viết hoa và viết thường
Đếm số lần xuất hiện của một ký tự trong chuỗi bằng re. tìm tất cả []
Phương thức tiếp theo mà chúng ta sẽ sử dụng để tìm sự xuất hiện của một ký tự đã cho là phương thức findall[] của re module. Chữ viết tắt của Biểu thức chính quy, đi kèm với thư viện python sử dụng ký tự dấu gạch chéo ngược ['\'] để biểu thị các biểu mẫu đặc biệt. Ở đó. findall[] quét chuỗi đã cho từ trái sang phải và kiểm tra xem chuỗi đã cho có mẫu được chỉ định có thể ở dạng chữ số hoặc bất kỳ loại dữ liệu nào khác không. Ở đây chúng ta sẽ sử dụng phương thức findall[] và len[] để in sự xuất hiện của chuỗi đã cho.
Xem ví dụ bên dưới.
VÍ DỤ
import re string_var = 'He is Standing below a Tree' occurrence = re.findall['e',string_var] # this will print list occurrence with all e chars print[occurrence] # this will print the count of occurrences print[len[occurrence]]
ĐẦU RA
['e', 'e', 'e', 'e'] 4
Trong ví dụ trên, phương thức findall[] của re module đã được sử dụng để đếm số lần xuất hiện của char t trong var string_var. Đây, lại. findall[] trả về các chuỗi trong danh sách và phương thức len[] đếm độ dài của danh sách. Bằng cách này, chúng ta có thể tìm thấy số lần char đã cho trong chuỗi. Phương pháp này cũng tính riêng chữ hoa và chữ thường
Đếm số lần xuất hiện của một ký tự trong chuỗi bằng defaultdict[]
Phương thức defaultdict[] đi kèm với mô-đun bộ sưu tập trong Python. Chức năng của nó tương tự như lớp từ điển và nó lưu trữ các ký tự dưới dạng khóa và số lần xuất hiện của chúng được tính là giá trị. Nó cũng cung cấp một giá trị mặc định cho khóa không bao giờ tồn tại. Hãy xem một ví dụ
MÃ SỐ
from collections import defaultdict string_var = 'He is Standing below a Tree' occurrence = defaultdict[int] for i in string_var: occurrence[i] += 1 print[occurrence['e']]
ĐẦU RA
4
Trong đoạn mã trên, bạn có thể thấy phương thức defaultdict[] đã được sử dụng để đếm số lần xuất hiện của ký tự 'e' trong biến string_var. Nó cũng tính riêng chữ hoa và chữ thường
Sử dụng gấu trúc. loạt
Trong phương pháp này, chúng tôi sẽ sử dụng chuỗi. value_count[] của gói Pandas để đếm số lần xuất hiện của một ký tự trong một chuỗi đã cho. Pandas là một công cụ phân tích dữ liệu được sử dụng rộng rãi. Ở đây chúng ta sẽ sử dụng pandas series, là một ndarray 1-D với các nhãn trục
gấu trúc. loạt. value_counts[] trả về một chuỗi có số lượng giá trị duy nhất theo thứ tự giảm dần và phần tử đầu tiên luôn là phần tử xuất hiện nhiều nhất
CÚ PHÁP. pd. Loạt. value_counts[bình thường hóa, sắp xếp, tăng dần, thùng, dropna]
THAM SỐ. Nó nhận được năm tham số
- bình thường hóa. Nếu đúng, điều này trả về tần suất của các giá trị duy nhất. Giá trị mặc định là Sai
- loại. Sắp xếp theo các giá trị đã cho. Giá trị mặc định là True
- tăng dần. Sắp xếp theo thứ tự tăng dần. Giá trị mặc định là Sai
- thùng. Giá trị mặc định là Không có/
- dropna. Không bao gồm số lượng NaN
Hãy xem một ví dụ về phương pháp này
MÃ SỐ
________số 8ĐẦU RA
5 e 4 i 2 n 2 a 2 l 1 T 1 S 1 s 1 r 1 o 1 H 1 g 1 b 1 t 1 d 1 w 1 dtype: int64
Trong mã và Đầu ra ở trên, bạn có thể thấy loạt. Phương thức value_count[] của gói pandas đã được sử dụng để đếm số lần xuất hiện của một ký tự đã cho trong một chuỗi. Phương thức này đã trả về tất cả các lần xuất hiện của tất cả các ký tự trong đối tượng Sê-ri
Tóm lược
Như vậy bạn đã thấy năm phương pháp khác nhau mà qua đó chúng ta có thể đếm số lần xuất hiện của một ký tự trong một chuỗi. Tất cả các phương thức trên đều tính riêng các phương thức viết hoa và viết thường. Phương thức đơn giản nhất là phương thức count[] vì nó nhận một chuỗi làm tham số và trả về số lần xuất hiện. Để biết số lượng và giá trị chi tiết nhất, bạn có thể sử dụng chuỗi. phương thức count_values[] của gói gấu trúc được sử dụng rộng rãi để phân tích dữ liệu
Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python
- Hướng dẫn Pandas Phần #1 - Giới thiệu về Phân tích dữ liệu với Python
- Hướng dẫn Pandas Phần #2 - Khái niệm cơ bản về Pandas Series
- Hướng dẫn Pandas Phần #3 - Nhận & Đặt giá trị Chuỗi
- Pandas Tutorial Part #4 - Thuộc tính & phương thức của Pandas Series
- Hướng dẫn về Pandas Phần #5 - Thêm hoặc xóa các thành phần của Pandas Series
- Hướng dẫn về Pandas Phần #6 - Giới thiệu về DataFrame
- Hướng dẫn về Pandas Phần #7 - DataFrame. loc[] - Chọn Hàng/Cột theo Lập chỉ mục
- Hướng dẫn về Pandas Phần #8 - DataFrame. iloc[] - Chọn Hàng/Cột theo Tên nhãn
- Hướng dẫn về gấu trúc Phần #9 - Lọc các hàng trong khung dữ liệu
- Hướng dẫn Pandas Phần #10 - Thêm/Xóa Hàng & Cột DataFrame
- Hướng dẫn về Pandas Phần #11 - Các thuộc tính & phương thức DataFrame
- Hướng dẫn Pandas Phần #12 - Xử lý dữ liệu bị thiếu hoặc giá trị NaN
- Hướng dẫn về Pandas Phần #13 - Lặp lại các Hàng & Cột của DataFrame
- Hướng dẫn Pandas Phần #14 - Sắp xếp DataFrame theo Hàng hoặc Cột
- Hướng dẫn về gấu trúc Phần #15 - Hợp nhất hoặc ghép các khung dữ liệu
- Hướng dẫn về Pandas Phần #16 - DataFrame GroupBy được giải thích bằng các ví dụ
Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?
Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học
Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với PythonHãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay