Không gian hàng đầu Python

“Chúng ta có thể có dữ liệu mà không có thông tin, nhưng chúng ta không thể có thông tin nếu không có dữ liệu. ”  Câu trích dẫn này thật đẹp làm sao. Dữ liệu là xương sống của Nhà khoa học dữ liệu và theo một cuộc khảo sát, nhà khoa học dữ liệu dành khoảng 60% thời gian để làm sạch và sắp xếp dữ liệu, vì vậy chúng tôi có trách nhiệm làm quen với các kỹ thuật khác nhau để sắp xếp dữ liệu theo cách tốt hơn. Trong bài viết này, chúng ta sẽ tìm hiểu về các phương pháp khác nhau để xóa khoảng trắng dải thừa khỏi toàn bộ DataFrame. Bộ dữ liệu được sử dụng ở đây được đưa ra dưới đây

Trong hình trên, chúng tôi đang quan sát thấy rằng bên trong các cột Tên, Tuổi, Nhóm máu và Giới tính, dữ liệu không đều. Trong hầu hết các ô của một cột cụ thể, khoảng trắng thừa xuất hiện ở phần đầu của các giá trị. Vì vậy, mục đích của chúng tôi là loại bỏ tất cả các khoảng trắng thừa và sắp xếp nó một cách có hệ thống. Chúng tôi sẽ sử dụng các phương pháp khác nhau sẽ giúp chúng tôi xóa tất cả khoảng trống thừa khỏi ô. phương pháp khác nhau là.  

Using Strip[] function
Using Skipinitialspace 
Using replace function 
Using Converters

Các phương pháp khác nhau để loại bỏ khoảng trắng thừa

Phương pháp 1. Sử dụng hàm Strip[].  

Pandas cung cấp phương thức xác định trước “pandas. Loạt. str. strip[]” để xóa khoảng trắng khỏi chuỗi. Sử dụng chức năng dải, chúng ta có thể dễ dàng loại bỏ khoảng trắng thừa khỏi khoảng trắng ở đầu và cuối từ đầu. Nó trả về một chuỗi hoặc chỉ mục của một đối tượng. Nó lấy tập hợp các ký tự mà chúng ta muốn xóa khỏi đầu và đuôi của chuỗi [ký tự đầu và cuối]. Theo mặc định, nó là none và nếu chúng ta không truyền bất kỳ ký tự nào thì nó sẽ xóa khoảng trắng ở đầu và cuối khỏi chuỗi. Nó trả về một chuỗi hoặc chỉ mục của một đối tượng

cú pháp. gấu trúc. Loạt. str. dải [to_strip = Không có]

Giải trình. Nó lấy tập hợp các ký tự mà chúng ta muốn xóa khỏi đầu và đuôi của chuỗi [ký tự đầu và cuối]

Tham số. Theo mặc định, nó là không và nếu chúng ta không chuyển bất kỳ ký tự nào thì nó sẽ xóa khoảng trắng ở đầu và cuối khỏi chuỗi. Nó trả về chuỗi hoặc chỉ mục của đối tượng.  

Thí dụ.  

Python3




# importing library

import pandas as pd

 

# Creating dataframe

df= pd.DataFrame[{110_______

Syntax : pandas.Series.str.replace[' ', '']
0
Syntax : pandas.Series.str.replace[' ', '']
1
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
3
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
5
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
7
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
9
Syntax : pandas.Series.str.replace[' ', '']
2# importing library1# importing library2

# importing library3# importing library4

Syntax : pandas.Series.str.replace[' ', '']
0# importing library6
Syntax : pandas.Series.str.replace[' ', '']
2# importing library8
Syntax : pandas.Series.str.replace[' ', '']
2# importing library6
Syntax : pandas.Series.str.replace[' ', '']
2import2
Syntax : pandas.Series.str.replace[' ', '']
2import4
Syntax : pandas.Series.str.replace[' ', '']
2import6# importing library2

# importing library3import9

Syntax : pandas.Series.str.replace[' ', '']
0pandas as pd1
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd3
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd5
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd7
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd9
Syntax : pandas.Series.str.replace[' ', '']
2# Creating dataframe1# importing library2

# Creating dataframe3_______106_______4

Syntax : pandas.Series.str.replace[' ', '']
0# Creating dataframe6
Syntax : pandas.Series.str.replace[' ', '']
2# Creating dataframe6
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df6df7

df8df9

 

=0

=1_______110_______108_______3=4=5

=1_______104_______9=3=4=5

=1_______106_______4=3=4=5

 

pd.DataFrame[{6

pd.DataFrame[{7pd.DataFrame[{8

đầu ra.  

Phương pháp 2. Sử dụng Skipinitialspace.   

Nó không phải là bất kỳ phương thức nào nhưng nó là một trong những tham số có trong phương thức read_csv[] có trong Pandas. Bên trong gấu trúc. phương thức read_csv[] có tham số skipinitialspace bằng cách sử dụng mà chúng ta có thể bỏ qua không gian ban đầu có trong toàn bộ khung dữ liệu của mình. Theo mặc định, giá trị này là Sai, hãy đặt giá trị này thành Đúng để loại bỏ khoảng trống thừa.  

cú pháp. gấu trúc. read_csv[‘path_of_csv_file’, skipinitialspace = True]

# Theo giá trị mặc định của Skiinitialspace là Sai, hãy đặt nó thành True để sử dụng tham số này.  

Thí dụ.  

Python3




# importing library

import pandas as pd

 

'Names'2

df108_______ 'Names'5'Names'6'Names'7= 'Names'9

Syntax : pandas.Series.str.replace[' ', '']
00

 

Syntax : pandas.Series.str.replace[' ', '']
01

pd.DataFrame[{7pd.DataFrame[{8

 
đầu ra.  

Phương pháp 3. Sử dụng chức năng thay thế.  

Sử dụng chức năng thay thế[], chúng tôi cũng có thể xóa khoảng trắng thừa khỏi khung dữ liệu. Pandas cung cấp phương thức xác định trước “pandas. Loạt. str. replace[]” để xóa khoảng trắng. Chương trình của nó sẽ giống như chương trình phương thức strip[] chỉ có một điểm khác biệt là ở đây chúng ta sẽ sử dụng hàm thay thế tại vị trí của strip[]

Syntax : pandas.Series.str.replace[' ', '']

Thí dụ.  

Python3




# importing library

import pandas as pd

 

# Creating dataframe

df108_______ pd.DataFrame[{1_______11

Syntax : pandas.Series.str.replace[' ', '']
0
Syntax : pandas.Series.str.replace[' ', '']
1
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
3
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
5
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
7
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
9
Syntax : pandas.Series.str.replace[' ', '']
2# importing library1# importing library2

# importing library3# importing library4

Syntax : pandas.Series.str.replace[' ', '']
0# importing library6
Syntax : pandas.Series.str.replace[' ', '']
2# importing library8
Syntax : pandas.Series.str.replace[' ', '']
2# importing library6
Syntax : pandas.Series.str.replace[' ', '']
2import2
Syntax : pandas.Series.str.replace[' ', '']
2import4
Syntax : pandas.Series.str.replace[' ', '']
2import6# importing library2

# importing library3import9

Syntax : pandas.Series.str.replace[' ', '']
0pandas as pd1
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd3
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd5
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd7
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd9
Syntax : pandas.Series.str.replace[' ', '']
2# Creating dataframe1# importing library2

# Creating dataframe3_______106_______4

Syntax : pandas.Series.str.replace[' ', '']
0# Creating dataframe6
Syntax : pandas.Series.str.replace[' ', '']
2# Creating dataframe6
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df6df7

df8df9

 

=0

=1_______110_______108_______3=4

Syntax : pandas.Series.str.replace[' ', '']
77
Syntax : pandas.Series.str.replace[' ', '']
78
Syntax : pandas.Series.str.replace[' ', '']
79

=1_______104_______9=3=4

Syntax : pandas.Series.str.replace[' ', '']
77
Syntax : pandas.Series.str.replace[' ', '']
78
Syntax : pandas.Series.str.replace[' ', '']
79

=1_______106_______4=3=4

Syntax : pandas.Series.str.replace[' ', '']
77
Syntax : pandas.Series.str.replace[' ', '']
78
Syntax : pandas.Series.str.replace[' ', '']
79

 

pd.DataFrame[{6

pd.DataFrame[{7pd.DataFrame[{8

đầu ra.  

Phương pháp 4. Sử dụng bộ chuyển đổi

Nó tương tự như skipinitialspace, nó là một trong những tham số có trong pandas predefine tên phương thức “read_csv”. Nó được sử dụng để áp dụng các chức năng khác nhau trên các cột cụ thể. Chúng ta phải chuyển các chức năng trong từ điển. Ở đây chúng ta sẽ truyền trực tiếp hàm strip[] để loại bỏ khoảng trống thừa trong khi đọc tệp csv

cú pháp. pd. read_csv[“path_of_file”, bộ chuyển đổi={‘column_names’. Tên chức năng}]

# Truyền lệnh của hàm và tên cột, trong đó tên cột đóng vai trò là khóa duy nhất và hoạt động như giá trị.    

Thí dụ.  

Python3




# importing library

import pandas as pd

 

# importing library00

df108_______ 'Names'5'Names'6# importing library05=103_______07

Syntax : pandas.Series.str.replace[' ', '']
11_______103_______09=4# importing library11

# importing library12import9 # importing library09=4# importing library11

# importing library12# Creating dataframe4 # importing library09=4# importing library21

 

Syntax : pandas.Series.str.replace[' ', '']
01

pd.DataFrame[{7pd.DataFrame[{8

đầu ra.  

Xóa khoảng trắng bổ sung khỏi toàn bộ khung dữ liệu bằng cách tạo một số mã.  

Python3




# importing library25

import pandas as pd

 

# importing library28

# importing library29

df= pd.DataFrame[{'Names'

Syntax : pandas.Series.str.replace[' ', '']
0
Syntax : pandas.Series.str.replace[' ', '']
1
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
3
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
5
Syntax : pandas.Series.str.replace[' ', '']
2

# importing library41

Syntax : pandas.Series.str.replace[' ', '']
7
Syntax : pandas.Series.str.replace[' ', '']
2
Syntax : pandas.Series.str.replace[' ', '']
9
Syntax : pandas.Series.str.replace[' ', '']
2# importing library1# importing library2

# Creating dataframe3

# Creating dataframe3_______103_______4

Syntax : pandas.Series.str.replace[' ', '']
0# importing library6
Syntax : pandas.Series.str.replace[' ', '']
2# importing library8
Syntax : pandas.Series.str.replace[' ', '']
2# importing library6
Syntax : pandas.Series.str.replace[' ', '']
2import2
Syntax : pandas.Series.str.replace[' ', '']
2import4
Syntax : pandas.Series.str.replace[' ', '']
2import6# importing library2

# Creating dataframe3

# Creating dataframe3_______103_______66

Syntax : pandas.Series.str.replace[' ', '']
0pandas as pd1
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd3
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd5
Syntax : pandas.Series.str.replace[' ', '']
2pandas as pd7
Syntax : pandas.Series.str.replace[' ', '']
2

# importing library76_______105_______9

Syntax : pandas.Series.str.replace[' ', '']
2# Creating dataframe1# importing library2

# Creating dataframe3

# Creating dataframe3_______106_______4

Syntax : pandas.Series.str.replace[' ', '']
0# Creating dataframe6
Syntax : pandas.Series.str.replace[' ', '']
2# Creating dataframe6
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df0
Syntax : pandas.Series.str.replace[' ', '']
2df6df7

# Creating dataframe3_______107_______9

 

 

# importing library99

import00

import01

import02 import03

import04

import05_______104_______06

import05_______104_______08 import09import10 import11

import12

import12import14

import12import16 import17== import20# importing library09

import22

import22import24

import22import26= import28import29import30=4import32

import12____104_______34# importing library09

import22

import22import38

import22import40

 

import41

import42

 

import43

pd.DataFrame[{7pd.DataFrame[{8

Trong đoạn mã trên, ở dòng đầu tiên, chúng tôi nhập các thư viện bắt buộc, ở đây gấu trúc được sử dụng để thực hiện đọc, ghi và nhiều thao tác khác trên dữ liệu, sau đó chúng tôi tạo một DataFrame bằng cách sử dụng gấu trúc có 4 cột 'Tên', 'Tuổi', 'Nhóm máu' . Hầu như tất cả các cột có dữ liệu bất thường. Bây giờ, phần chính bắt đầu từ đây, chúng tôi đã tạo một hàm sẽ loại bỏ khoảng trắng ở đầu và cuối khỏi dữ liệu. Hàm này lấy khung dữ liệu làm tham số và kiểm tra kiểu dữ liệu của từng cột và nếu kiểu dữ liệu của cột là 'Đối tượng' thì áp dụng hàm dải được xác định trước trong thư viện gấu trúc trên cột đó, nếu không thì nó sẽ không làm gì cả. Sau đó, ở dòng tiếp theo, chúng tôi áp dụng hàm whitespace_remover[] trên khung dữ liệu để loại bỏ thành công khoảng trắng thừa khỏi các cột

Dấu cách trong Python là gì?

Khoảng trắng ở cuối. Sự miêu tả. Được sử dụng khi có khoảng trắng giữa cuối dòng và xuống dòng .

Dẫn đầu và theo sau trong Python là gì?

L'string' - chuỗi đầu xuất hiện ở đầu ký tự hoặc cột dữ liệu số. T'string' - một chuỗi ở cuối xuất hiện ở cuối ký tự hoặc cột dữ liệu số .

Chủ Đề