Python thay các ký tự đặc biệt bằng dấu gạch dưới
Mục tiêu là thay thế ký tự gạch dưới (“_”) bằng dấu gạch ngang (“. ”) dưới cột ‘first_set‘ Show
Để đạt được mục tiêu này, bạn cần thêm cú pháp sau vào mã df['first_set'] = df['first_set'].str.replace('_','|') Vì vậy, mã Python hoàn chỉnh để thực hiện thay thế như sau import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df['first_set'] = df['first_set'].str.replace('_','|') print (df) Như bạn có thể thấy, ký tự gạch dưới đã được thay thế bằng ký tự ống trong cột 'first_set'
Thay thế một ký tự cụ thể trong Toàn bộ khung dữ liệuNếu bạn muốn thay thế một ký tự cụ thể trong toàn bộ DataFrame thì sao? Ví dụ: hãy thay thế ký tự gạch dưới bằng ký tự ống trong toàn bộ DataFrame Trong trường hợp đó, bạn sẽ cần áp dụng cú pháp sau import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df) Bây giờ, bạn sẽ thấy rằng ký tự gạch dưới đã được thay thế bằng ký tự ống trong toàn bộ Khung dữ liệu (trong cả cột 'first_set' và 'second_set')
Thay thế một dãy ký tựGiả sử bạn muốn thay thế một chuỗi ký tự trong Pandas DataFrame Chẳng hạn, giả sử bạn đã tạo một DataFrame mới nơi bạn muốn thay thế chuỗi “_xyz_” bằng hai đường ống “. ” Đây là cú pháp để tạo DataFrame mới import pandas as pd colors = {'first_set': ['aa_xyz_bb','cc_xyz_dd','ee_xyz_ff','gg_xyz_hh'], 'second_set': ['ii_xyz_jj','kk_xyz_ll','mm_xyz_nn','oo_xyz_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) print (df) Và đây là cách DataFrame mới trông như thế nào df = df.replace('old character','new character', regex=True)0 Sau đó, bạn có thể sử dụng đoạn mã sau để thay thế chuỗi “_xyz_” bằng “. ” dưới cột ‘first_set’ Nếu bạn đang tìm cách xóa hoặc thay thế tất cả hoặc một phần của chuỗi trong Python, thì hướng dẫn này là dành cho bạn. Bạn sẽ lấy một bản ghi phòng trò chuyện hư cấu và làm sạch nó bằng cả phương pháp 7 và chức năng 8Trong Python, phương thức 7 và hàm 8 thường được sử dụng để dọn sạch văn bản bằng cách loại bỏ chuỗi hoặc chuỗi con hoặc thay thế chúng. Trong hướng dẫn này, bạn sẽ đóng vai trò là nhà phát triển cho một công ty cung cấp hỗ trợ kỹ thuật thông qua trò chuyện văn bản trực tiếp. Bạn được giao nhiệm vụ tạo một tập lệnh sẽ làm sạch cuộc trò chuyện, xóa mọi dữ liệu cá nhân và thay thế mọi từ chửi thề bằng biểu tượng cảm xúcBạn chỉ được cung cấp một bản ghi cuộc trò chuyện rất ngắn import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df['first_set'] = df['first_set'].str.replace('_','|') print (df)1 Mặc dù bản ghi này ngắn, nhưng đây là kiểu trò chuyện điển hình mà các đại lý luôn có. Nó có số nhận dạng người dùng, dấu thời gian ISO và thông báo Trong trường hợp này, khách hàng import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df['first_set'] = df['first_set'].str.replace('_','|') print (df)21 đã gửi đơn khiếu nại và chính sách của công ty là làm sạch và đơn giản hóa bảng điểm, sau đó chuyển nó cho cơ quan đánh giá độc lập. Vệ sinh tin nhắn là công việc của bạn Mã mẫu. Nhấp vào đây để tải xuống mã mẫu miễn phí mà bạn sẽ sử dụng để thay thế các chuỗi trong Python Điều đầu tiên bạn muốn làm là quan tâm đến bất kỳ lời chửi thề nào Cách xóa hoặc thay thế chuỗi Python hoặc chuỗi conCách cơ bản nhất để thay thế một chuỗi trong Python là sử dụng phương thức chuỗi 7>>>
Như bạn có thể thấy, bạn có thể xâu chuỗi 7 vào bất kỳ chuỗi nào và cung cấp phương thức với hai đối số. Đầu tiên là chuỗi mà bạn muốn thay thế và thứ hai là chuỗi thay thếGhi chú. Mặc dù trình bao Python hiển thị kết quả của 7, nhưng bản thân chuỗi vẫn không thay đổi. Bạn có thể thấy điều này rõ ràng hơn bằng cách gán chuỗi của bạn cho một biến>>> import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df['first_set'] = df['first_set'].str.replace('_','|') print (df)2 Lưu ý rằng khi bạn chỉ gọi 7, giá trị của import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df['first_set'] = df['first_set'].str.replace('_','|') print (df)26 không thay đổi. Nhưng khi bạn gán kết quả của import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df['first_set'] = df['first_set'].str.replace('_','|') print (df)27 cho biến import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df['first_set'] = df['first_set'].str.replace('_','|') print (df)26, thì import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df['first_set'] = df['first_set'].str.replace('_','|') print (df)29 sẽ trở thành 30Bây giờ là lúc để áp dụng kiến thức này vào bảng điểm >>> 3Tải bảng điểm dưới dạng a và sau đó sử dụng phương pháp 7 trên một trong những từ chửi thề hoạt động tốt. Nhưng có một từ chửi thề khác không được thay thế vì trong Python, chuỗi cần khớp chính xác>>> 6Như bạn có thể thấy, ngay cả khi cách viết hoa của một chữ cái không khớp, nó sẽ ngăn mọi sự thay thế. Điều này có nghĩa là nếu bạn đang sử dụng phương thức 7, bạn sẽ cần gọi nó nhiều lần với các biến thể. Trong trường hợp này, bạn chỉ có thể thực hiện một cuộc gọi khác tới 7>>> 9Thành công. Nhưng có lẽ bạn đang nghĩ rằng đây không phải là cách tốt nhất để làm điều này cho một thứ gì đó giống như công cụ sao chép đa năng. Bạn sẽ muốn tiến tới một số cách để có một danh sách thay thế, thay vì phải gõ 7 mỗi lầnLoại bỏ các quảng cáoThiết lập nhiều quy tắc thay thếCó một số thay thế khác mà bạn cần thực hiện đối với bảng điểm để chuyển nó sang định dạng được chấp nhận để đánh giá độc lập
Bây giờ bạn bắt đầu có nhiều chuỗi hơn để thay thế, chuỗi trên 7 sẽ lặp đi lặp lại. Một ý tưởng có thể là giữ một danh sách các bộ dữ liệu, với hai mục trong mỗi bộ dữ liệu. Hai mục sẽ tương ứng với các đối số mà bạn cần chuyển vào phương thức 7—chuỗi cần thay thế và chuỗi thay thếimport pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)3 Trong phiên bản này của tập lệnh làm sạch bản ghi, bạn đã tạo một danh sách các bộ thay thế, cung cấp cho bạn một cách nhanh chóng để thêm các bộ thay thế. Bạn thậm chí có thể tạo danh sách các bộ này từ tệp CSV bên ngoài nếu bạn có nhiều bộ thay thế Sau đó, bạn lặp lại danh sách các bộ dữ liệu thay thế. Trong mỗi lần lặp lại, bạn gọi 7 trên chuỗi, đưa vào các đối số các biến 38 và 39 đã được giải nén từ mỗi bộ thay thế trong các đối sốGhi chú. Việc giải nén trong vòng lặp 60 trong trường hợp này có chức năng giống như sử dụng lập chỉ mụcimport pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)8 Nếu bạn cảm thấy bối rối khi giải nén, thì hãy xem phần hướng dẫn về danh sách và bộ dữ liệu Python Với điều này, bạn đã tạo ra một cải tiến lớn về khả năng đọc tổng thể của bảng điểm. Nó cũng dễ dàng hơn để thêm thay thế nếu bạn cần. Chạy tập lệnh này sẽ hiển thị bảng điểm rõ ràng hơn nhiều import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)9 Đó là một bảng điểm khá rõ ràng. Có lẽ đó là tất cả những gì bạn cần. Nhưng nếu cỗ máy tự động bên trong bạn không hài lòng, có thể là do vẫn còn một số thứ có thể đang làm bạn khó chịu.
Nếu đây là những mối quan tâm của bạn, thì bạn có thể muốn chuyển sự chú ý của mình sang các biểu thức thông thường Tận dụng >>> "Fake Python".replace("Fake", "Real") 'Real Python' 8 để tạo ra các quy tắc phức tạpBất cứ khi nào bạn muốn thực hiện bất kỳ thay thế nào phức tạp hơn một chút hoặc cần một số ký tự đại diện, bạn sẽ thường muốn chuyển sự chú ý của mình sang các biểu thức chính quy, còn được gọi là biểu thức chính quy Regex là một loại ngôn ngữ nhỏ được tạo thành từ các ký tự xác định mẫu. Các mẫu hoặc biểu thức chính quy này thường được sử dụng để tìm kiếm các chuỗi trong các hoạt động tìm và tìm và thay thế. Nhiều ngôn ngữ lập trình hỗ trợ regex và nó được sử dụng rộng rãi. Regex thậm chí sẽ cung cấp cho bạn siêu năng lực Trong Python, tận dụng biểu thức chính quy có nghĩa là sử dụng mô-đun 62 và xây dựng các mẫu biểu thức chính quy của riêng bạn 2Mặc dù bạn có thể trộn và kết hợp hàm 63 với phương thức 7, nhưng ví dụ này chỉ sử dụng 63, vì vậy bạn có thể xem cách nó được sử dụng. Bạn sẽ lưu ý rằng bạn có thể thay thế tất cả các biến thể của từ chửi thề bằng cách chỉ sử dụng một bộ từ thay thế ngay bây giờ. Tương tự, bạn chỉ sử dụng một biểu thức chính quy cho dấu toàn thời gian 0Bây giờ bảng điểm của bạn đã được khử trùng hoàn toàn, loại bỏ tất cả tiếng ồn. Làm thế nào điều đó xảy ra? Mẫu biểu thức chính quy đầu tiên, 67, sử dụng ký tự đặc biệt 68, ký tự này sẽ khớp với các ký tự chữ và số và dấu gạch dưới. Thêm bộ định lượng 69 ngay sau nó sẽ khớp với 0 hoặc nhiều ký tự của 68Một phần quan trọng khác của mẫu đầu tiên là cờ 91 làm cho nó trở thành một mẫu không phân biệt chữ hoa chữ thường. Vì vậy, bây giờ, bất kỳ chuỗi con nào chứa 92, bất kể viết hoa, sẽ được so khớp và thay thếGhi chú. Mẫu 67 khá rộng và cũng sẽ sửa đổi 94 thành 95. Nó cũng không thể xác định cách sử dụng lịch sự của từ này. Nó chỉ khớp với các ký tự. Điều đó nói rằng, những từ chửi thề điển hình mà bạn muốn kiểm duyệt không thực sự có nghĩa thay thế lịch sựMẫu biểu thức chính quy thứ hai sử dụng bộ ký tự và bộ định lượng để thay thế dấu thời gian. Bạn thường sử dụng bộ ký tự và bộ định lượng cùng nhau. Ví dụ, một mẫu biểu thức chính quy của 96 sẽ khớp với một ký tự của 97, 98 hoặc 99. Đặt một 69 ngay sau nó sẽ khớp với 0 hoặc nhiều ký tự của 97, 98 hoặc 99Có nhiều định lượng hơn, mặc dù. Nếu bạn đã sử dụng import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)34, nó sẽ khớp chính xác mười ký tự của 97, 98 hoặc 99 theo bất kỳ thứ tự nào và bất kỳ kết hợp nào. Cũng lưu ý rằng các ký tự lặp lại là dư thừa, vì vậy import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)38 tương đương với import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)39 Đối với dấu thời gian, bạn sử dụng bộ ký tự mở rộng là import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)80 để khớp với tất cả các ký tự có thể có mà bạn có thể tìm thấy trong dấu thời gian. Được ghép nối với bộ định lượng import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)81, điều này sẽ khớp với bất kỳ dấu thời gian nào có thể, ít nhất là cho đến năm 10.000 Ghi chú. Ký tự đặc biệt, import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)82, khớp với bất kỳ ký tự chữ số nào Mẫu regex dấu thời gian cho phép bạn chọn bất kỳ ngày nào có thể ở định dạng dấu thời gian. Vì thời gian không quan trọng đối với người đánh giá độc lập các bảng điểm này, bạn thay thế chúng bằng một chuỗi trống. Có thể viết một biểu thức chính quy nâng cao hơn để lưu giữ thông tin thời gian trong khi xóa ngày Mẫu biểu thức chính quy thứ ba được sử dụng để chọn bất kỳ chuỗi người dùng nào bắt đầu bằng từ khóa import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)83. Lưu ý rằng bạn thoát khỏi ( import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)84) dấu ngoặc vuông ( import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)85) vì nếu không từ khóa sẽ được hiểu là một bộ ký tự Cuối cùng, mẫu biểu thức chính quy cuối cùng chọn chuỗi tên người dùng của khách hàng và thay thế nó bằng import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)86 Ghi chú. Mặc dù sẽ rất thú vị nếu đi vào chi tiết hơn về các mẫu biểu thức chính quy này, nhưng hướng dẫn này không phải về biểu thức chính quy. Làm việc thông qua hướng dẫn regex Python để có kiến thức cơ bản về chủ đề này. Ngoài ra, bạn có thể sử dụng trang web RegExr tuyệt vời, bởi vì regex rất phức tạp và trình hướng dẫn regex ở mọi cấp độ dựa vào các công cụ tiện dụng như RegExr RegExr đặc biệt tốt vì bạn có thể sao chép và dán các mẫu biểu thức chính quy và nó sẽ chia nhỏ chúng cho bạn bằng các giải thích Với regex, bạn có thể cắt giảm đáng kể số lượng thay thế mà bạn phải viết ra. Điều đó nói rằng, bạn vẫn có thể phải nghĩ ra nhiều mẫu. Vì regex không phải là ngôn ngữ dễ đọc nhất nên việc có nhiều mẫu có thể nhanh chóng trở nên khó bảo trì Rất may, có một mẹo nhỏ với 8 cho phép bạn kiểm soát nhiều hơn một chút về cách hoạt động của thay thế và nó cung cấp một kiến trúc dễ bảo trì hơn nhiềuLoại bỏ các quảng cáoSử dụng Gọi lại với >>> "Fake Python".replace("Fake", "Real") 'Real Python' 8 để kiểm soát nhiều hơnMột mẹo mà Python và 63 có sẵn là bạn có thể chuyển vào hàm gọi lại thay vì chuỗi thay thế. Điều này cung cấp cho bạn toàn quyền kiểm soát cách khớp và thay thếĐể bắt đầu xây dựng phiên bản tập lệnh làm sạch bản ghi này, bạn sẽ sử dụng mẫu biểu thức chính quy cơ bản để xem cách sử dụng lệnh gọi lại với 63 hoạt động 1Mẫu biểu thức chính quy mà bạn đang sử dụng sẽ khớp với dấu thời gian và thay vì cung cấp chuỗi thay thế, bạn đang chuyển tham chiếu đến hàm import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)91. Bây giờ, khi 63 tìm thấy kết quả khớp, nó sẽ gọi import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)91 với đối tượng khớp làm đối số Vì import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)91 chỉ in đối tượng mà nó nhận được dưới dạng đối số, nên khi chạy chương trình này, bạn sẽ thấy các đối tượng khớp được in ra bảng điều khiển 2A là một trong những khối xây dựng của mô-đun 62. Hàm import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)96 cơ bản hơn trả về một đối tượng khớp. 63 không trả lại bất kỳ đối tượng khớp nào mà sử dụng chúng ở hậu trườngBởi vì bạn nhận được đối tượng khớp này trong cuộc gọi lại, bạn có thể sử dụng bất kỳ thông tin nào có trong nó để tạo chuỗi thay thế. Sau khi nó được tạo, bạn trả về chuỗi mới và 63 sẽ thay thế kết quả khớp bằng chuỗi được trả vềÁp dụng Gọi lại cho Tập lệnhTrong tập lệnh làm sạch bản chép lời của bạn, bạn sẽ sử dụng phương pháp import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)99 của đối tượng khớp để trả về nội dung của hai nhóm chụp và sau đó bạn có thể làm sạch từng phần theo chức năng riêng của nó hoặc loại bỏ nó 3Thay vì có nhiều biểu thức chính quy khác nhau, bạn có thể có một biểu thức chính quy cấp cao nhất có thể khớp với toàn bộ dòng, chia nó thành các nhóm chụp có dấu ngoặc ( 20). Các nhóm chụp không ảnh hưởng đến quá trình so khớp thực tế, nhưng chúng ảnh hưởng đến đối tượng so khớp là kết quả của quy trình so khớp
Nội dung của các nhóm chụp sẽ có sẵn dưới dạng các mục riêng biệt trong đối tượng khớp bằng cách gọi phương thức import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)99, phương thức này trả về một bộ gồm các chuỗi khớp Ghi chú. Định nghĩa regex mục nhập sử dụng nối chuỗi ẩn của Python 4Về mặt chức năng, điều này giống như viết tất cả ra thành một chuỗi. 27. Sắp xếp các mẫu biểu thức chính quy dài hơn của bạn trên các dòng riêng biệt cho phép bạn chia nó thành nhiều phần, điều này không chỉ giúp nó dễ đọc hơn mà còn cho phép bạn chèn nhận xét nữaHai nhóm là chuỗi người dùng và thông báo. Phương thức import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)99 trả về chúng dưới dạng một bộ chuỗi. Trong hàm import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)91, trước tiên bạn sử dụng tính năng giải nén để gán hai chuỗi cho các biến 5Lưu ý cách kiến trúc này cho phép một biểu thức chính quy rất rộng và bao hàm ở cấp cao nhất, sau đó cho phép bạn bổ sung nó bằng các biểu thức chính xác hơn trong lệnh gọi lại thay thế Hàm import pandas as pd colors = {'first_set': ['aa_bb','cc_dd','ee_ff','gg_hh'], 'second_set': ['ii_jj','kk_ll','mm_nn','oo_pp'] } df = pd.DataFrame(colors, columns= ['first_set','second_set']) df = df.replace('_','|', regex=True) print (df)91 sử dụng hai hàm để xóa tên người dùng và từ xấu. Nó cũng sử dụng chuỗi f để biện minh cho các thông báo. Lưu ý cách 01 sử dụng biểu thức chính quy được tạo động trong khi 02 dựa vào xử lý chuỗi cơ bản hơnĐiều này bây giờ trông giống như một nguyên mẫu đầu tiên tốt cho tập lệnh làm sạch bản ghi. Đầu ra sạch sẽ 6Tốt đẹp. Sử dụng 63 với một cuộc gọi lại giúp bạn linh hoạt hơn rất nhiều để kết hợp và kết hợp các phương thức khác nhau và xây dựng các biểu thức chính một cách linh hoạt. Cấu trúc này cũng mang lại cho bạn nhiều cơ hội nhất để phát triển khi sếp hoặc khách hàng của bạn chắc chắn thay đổi yêu cầu của họ đối với bạn.Loại bỏ các quảng cáoSự kết luậnTrong hướng dẫn này, bạn đã học cách thay thế chuỗi trong Python. Trong quá trình thực hiện, bạn đã chuyển từ sử dụng phương thức chuỗi 7 cơ bản của Python sang sử dụng hàm gọi lại với 8 để kiểm soát tuyệt đối. Bạn cũng đã khám phá một số mẫu biểu thức chính quy và giải cấu trúc chúng thành một kiến trúc tốt hơn để quản lý tập lệnh thay thếVới tất cả những kiến thức đó, bạn đã xóa thành công bản ghi cuộc trò chuyện, hiện đã sẵn sàng để xem xét độc lập. Không chỉ vậy, tập lệnh làm sạch bảng điểm của bạn còn nhiều chỗ để phát triển Mã mẫu. Nhấp vào đây để tải xuống mã mẫu miễn phí mà bạn sẽ sử dụng để thay thế các chuỗi trong Python Đánh dấu là đã hoàn thành 🐍 Thủ thuật Python 💌 Nhận một Thủ thuật Python ngắn và hấp dẫn được gửi đến hộp thư đến của bạn vài ngày một lần. Không có thư rác bao giờ. Hủy đăng ký bất cứ lúc nào. Được quản lý bởi nhóm Real Python Gửi cho tôi thủ thuật Python » Giới thiệu về Ian Currie Ian là một mọt sách Python, người sử dụng nó cho mọi thứ, từ mày mò đến giúp mọi người và công ty quản lý công việc hàng ngày và phát triển doanh nghiệp của họ » Thông tin thêm về IanMỗi hướng dẫn tại Real Python được tạo bởi một nhóm các nhà phát triển để nó đáp ứng các tiêu chuẩn chất lượng cao của chúng tôi. Các thành viên trong nhóm đã làm việc trong hướng dẫn này là Aldren Geir Arne kate Philipp Bậc thầy Kỹ năng Python trong thế giới thực Với quyền truy cập không giới hạn vào Python thực Tham gia với chúng tôi và có quyền truy cập vào hàng nghìn hướng dẫn, khóa học video thực hành và cộng đồng các Pythonistas chuyên gia Nâng cao kỹ năng Python của bạn » Bậc thầy Kỹ năng Python trong thế giới thực Tham gia với chúng tôi và có quyền truy cập vào hàng ngàn hướng dẫn, khóa học video thực hành và cộng đồng Pythonistas chuyên gia Nâng cao kỹ năng Python của bạn » Bạn nghĩ sao? Đánh giá bài viết này Tweet Chia sẻ Chia sẻ EmailBài học số 1 hoặc điều yêu thích mà bạn đã học được là gì? Mẹo bình luận. Những nhận xét hữu ích nhất là những nhận xét được viết với mục đích học hỏi hoặc giúp đỡ các sinh viên khác. và nhận câu trả lời cho các câu hỏi phổ biến trong cổng thông tin hỗ trợ của chúng tôi |