Không gian hàng đầu Python
“Chúng ta có thể có dữ liệu mà không có thông tin, nhưng chúng ta không thể có thông tin nếu không có dữ liệu. ” Câu trích dẫn này thật đẹp làm sao. Dữ liệu là xương sống của Nhà khoa học dữ liệu và theo một cuộc khảo sát, nhà khoa học dữ liệu dành khoảng 60% thời gian để làm sạch và sắp xếp dữ liệu, vì vậy chúng tôi có trách nhiệm làm quen với các kỹ thuật khác nhau để sắp xếp dữ liệu theo cách tốt hơn. Trong bài viết này, chúng ta sẽ tìm hiểu về các phương pháp khác nhau để xóa khoảng trắng dải thừa khỏi toàn bộ DataFrame. Bộ dữ liệu được sử dụng ở đây được đưa ra dưới đây Show Trong hình trên, chúng tôi đang quan sát thấy rằng bên trong các cột Tên, Tuổi, Nhóm máu và Giới tính, dữ liệu không đều. Trong hầu hết các ô của một cột cụ thể, khoảng trắng thừa xuất hiện ở phần đầu của các giá trị. Vì vậy, mục đích của chúng tôi là loại bỏ tất cả các khoảng trắng thừa và sắp xếp nó một cách có hệ thống. Chúng tôi sẽ sử dụng các phương pháp khác nhau sẽ giúp chúng tôi xóa tất cả khoảng trống thừa khỏi ô. phương pháp khác nhau là. Using Strip() function Using Skipinitialspace Using replace function Using Converters Các phương pháp khác nhau để loại bỏ khoảng trắng thừaPhương pháp 1. Sử dụng hàm Strip(). Pandas cung cấp phương thức xác định trước “pandas. Loạt. str. strip()” để xóa khoảng trắng khỏi chuỗi. Sử dụng chức năng dải, chúng ta có thể dễ dàng loại bỏ khoảng trắng thừa khỏi khoảng trắng ở đầu và cuối từ đầu. Nó trả về một chuỗi hoặc chỉ mục của một đối tượng. Nó lấy tập hợp các ký tự mà chúng ta muốn xóa khỏi đầu và đuôi của chuỗi (ký tự đầu và cuối). Theo mặc định, nó là none và nếu chúng ta không truyền bất kỳ ký tự nào thì nó sẽ xóa khoảng trắng ở đầu và cuối khỏi chuỗi. Nó trả về một chuỗi hoặc chỉ mục của một đối tượng
Thí dụ. Python3
Syntax : pandas.Series.str.replace(' ', '')0 Syntax : pandas.Series.str.replace(' ', '')1 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')3 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')5 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')7 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')9 Syntax : pandas.Series.str.replace(' ', '')2 # importing library 1# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 # importing library 6Syntax : pandas.Series.str.replace(' ', '')2 # importing library 8Syntax : pandas.Series.str.replace(' ', '')2 # importing library 6Syntax : pandas.Series.str.replace(' ', '')2 import 2Syntax : pandas.Series.str.replace(' ', '')2 import 4Syntax : pandas.Series.str.replace(' ', '')2 import 6# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 pandas as pd 1Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 3Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 5Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 7Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 9Syntax : pandas.Series.str.replace(' ', '')2 # Creating dataframe 1# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 # Creating dataframe 6Syntax : pandas.Series.str.replace(' ', '')2 # Creating dataframe 6Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 6df 7
đầu ra. Phương pháp 2. Sử dụng Skipinitialspace. Nó không phải là bất kỳ phương thức nào nhưng nó là một trong những tham số có trong phương thức read_csv() có trong Pandas. Bên trong gấu trúc. phương thức read_csv() có tham số skipinitialspace bằng cách sử dụng mà chúng ta có thể bỏ qua không gian ban đầu có trong toàn bộ khung dữ liệu của mình. Theo mặc định, giá trị này là Sai, hãy đặt giá trị này thành Đúng để loại bỏ khoảng trống thừa.
Thí dụ. Python3
Syntax : pandas.Series.str.replace(' ', '')00
Syntax : pandas.Series.str.replace(' ', '')01
Phương pháp 3. Sử dụng chức năng thay thế. Sử dụng chức năng thay thế(), chúng tôi cũng có thể xóa khoảng trắng thừa khỏi khung dữ liệu. Pandas cung cấp phương thức xác định trước “pandas. Loạt. str. replace()” để xóa khoảng trắng. Chương trình của nó sẽ giống như chương trình phương thức strip() chỉ có một điểm khác biệt là ở đây chúng ta sẽ sử dụng hàm thay thế tại vị trí của strip() Syntax : pandas.Series.str.replace(' ', '') Thí dụ. Python3
Syntax : pandas.Series.str.replace(' ', '')0 Syntax : pandas.Series.str.replace(' ', '')1 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')3 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')5 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')7 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')9 Syntax : pandas.Series.str.replace(' ', '')2 # importing library 1# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 # importing library 6Syntax : pandas.Series.str.replace(' ', '')2 # importing library 8Syntax : pandas.Series.str.replace(' ', '')2 # importing library 6Syntax : pandas.Series.str.replace(' ', '')2 import 2Syntax : pandas.Series.str.replace(' ', '')2 import 4Syntax : pandas.Series.str.replace(' ', '')2 import 6# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 pandas as pd 1Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 3Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 5Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 7Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 9Syntax : pandas.Series.str.replace(' ', '')2 # Creating dataframe 1# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 # Creating dataframe 6Syntax : pandas.Series.str.replace(' ', '')2 # Creating dataframe 6Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 6df 7
Syntax : pandas.Series.str.replace(' ', '')77 Syntax : pandas.Series.str.replace(' ', '')78 Syntax : pandas.Series.str.replace(' ', '')79
Syntax : pandas.Series.str.replace(' ', '')77 Syntax : pandas.Series.str.replace(' ', '')78 Syntax : pandas.Series.str.replace(' ', '')79
Syntax : pandas.Series.str.replace(' ', '')77 Syntax : pandas.Series.str.replace(' ', '')78 Syntax : pandas.Series.str.replace(' ', '')79
đầu ra. Phương pháp 4. Sử dụng bộ chuyển đổi Nó tương tự như skipinitialspace, nó là một trong những tham số có trong pandas predefine tên phương thức “read_csv”. Nó được sử dụng để áp dụng các chức năng khác nhau trên các cột cụ thể. Chúng ta phải chuyển các chức năng trong từ điển. Ở đây chúng ta sẽ truyền trực tiếp hàm strip() để loại bỏ khoảng trống thừa trong khi đọc tệp csv
Thí dụ. Python3
Syntax : pandas.Series.str.replace(' ', '')11_______103_______09 = 4# importing library 11
Syntax : pandas.Series.str.replace(' ', '')01
đầu ra. Xóa khoảng trắng bổ sung khỏi toàn bộ khung dữ liệu bằng cách tạo một số mã. Python3
Syntax : pandas.Series.str.replace(' ', '')0 Syntax : pandas.Series.str.replace(' ', '')1 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')3 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')5 Syntax : pandas.Series.str.replace(' ', '')2
Syntax : pandas.Series.str.replace(' ', '')7 Syntax : pandas.Series.str.replace(' ', '')2 Syntax : pandas.Series.str.replace(' ', '')9 Syntax : pandas.Series.str.replace(' ', '')2 # importing library 1# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 # importing library 6Syntax : pandas.Series.str.replace(' ', '')2 # importing library 8Syntax : pandas.Series.str.replace(' ', '')2 # importing library 6Syntax : pandas.Series.str.replace(' ', '')2 import 2Syntax : pandas.Series.str.replace(' ', '')2 import 4Syntax : pandas.Series.str.replace(' ', '')2 import 6# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 pandas as pd 1Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 3Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 5Syntax : pandas.Series.str.replace(' ', '')2 pandas as pd 7Syntax : pandas.Series.str.replace(' ', '')2
Syntax : pandas.Series.str.replace(' ', '')2 # Creating dataframe 1# importing library 2
Syntax : pandas.Series.str.replace(' ', '')0 # Creating dataframe 6Syntax : pandas.Series.str.replace(' ', '')2 # Creating dataframe 6Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 0Syntax : pandas.Series.str.replace(' ', '')2 df 6df 7
Trong đoạn mã trên, ở dòng đầu tiên, chúng tôi nhập các thư viện bắt buộc, ở đây gấu trúc được sử dụng để thực hiện đọc, ghi và nhiều thao tác khác trên dữ liệu, sau đó chúng tôi tạo một DataFrame bằng cách sử dụng gấu trúc có 4 cột 'Tên', 'Tuổi', 'Nhóm máu' . Hầu như tất cả các cột có dữ liệu bất thường. Bây giờ, phần chính bắt đầu từ đây, chúng tôi đã tạo một hàm sẽ loại bỏ khoảng trắng ở đầu và cuối khỏi dữ liệu. Hàm này lấy khung dữ liệu làm tham số và kiểm tra kiểu dữ liệu của từng cột và nếu kiểu dữ liệu của cột là 'Đối tượng' thì áp dụng hàm dải được xác định trước trong thư viện gấu trúc trên cột đó, nếu không thì nó sẽ không làm gì cả. Sau đó, ở dòng tiếp theo, chúng tôi áp dụng hàm whitespace_remover() trên khung dữ liệu để loại bỏ thành công khoảng trắng thừa khỏi các cột Dấu cách trong Python là gì?Khoảng trắng ở cuối. Sự miêu tả. Được sử dụng khi có khoảng trắng giữa cuối dòng và xuống dòng .
Dẫn đầu và theo sau trong Python là gì?L'string' - chuỗi đầu xuất hiện ở đầu ký tự hoặc cột dữ liệu số. T'string' - một chuỗi ở cuối xuất hiện ở cuối ký tự hoặc cột dữ liệu số . |