Hướng dẫn dùng standardscaler python python

Khi dữ liệu của bạn có các giá trị khác nhau và thậm chí các đơn vị đo khác nhau, có thể khó so sánh chúng. Kilogram là gì so với mét? Hoặc độ cao so với thời gian?

Nội dung chính Show

Câu trả lời cho vấn đề này là mở rộng quy mô. Chúng ta có thể mở rộng dữ liệu thành các giá trị mới dễ so sánh hơn.

Hãy xem bảng bên dưới, đó là cùng một tập dữ liệu mà chúng ta đã sử dụng trong chương hồi quy bội, nhưng lần này cột âm lượng chứa các giá trị trong lít thay vì CM3 [1.0 thay vì 1000].volume column contains values in liters instead of cm3 [1.0 instead of 1000].

Xe hơiNgười mẫuÂm lượngTrọng lượngCO2ToyotaAygo1.079099MitsubishiNgôi sao không gian1.2116095SkodaCitigo1.092995Fiat5000.986590MINICooper1.51140105VwLên!1.0929105SkodaCitigo1.4110990FiatMINI1.5136592CooperVw1.5111298Lên!Fabia1.6115099MercedesMột lớp học1.198099FordFiesta1.3990101CooperVw1.0111299Lên!Fabia1.6125294MercedesMột lớp học1.6132697FordFiesta1.6133097Audi11.6136599A132.21280104SkodaCitigo1.61119104CooperVw2.01328105CooperVw1.6158494FordFiesta2.0142899FiatMINI2.1136599SkodaCitigo1.6141599FiatMINI2.0141599FiatMINI1.51465102Lên!Fabia2.01490104Lên!Fabia2.01725114FiatMINI1.61523109Audi52.01705114FiatMINI2.11605115FiatMINI2.01746117CooperVw1.61235104Audi21.61390108FordFiesta1.61405109FiatMINI2.51395120

Cooper

Vw

Lên!

z = [x - u] / s

Fabia

Mercedesweight column from the data set above, the first value is 790, and the scaled value will be:

[790 - 1292.23] / 238.74 = -2.1

Một lớp họcvolume column from the data set above, the first value is 1.0, and the scaled value will be:

[1.0 - 1.61] / 0.38 = -1.59

Ford

Fiesta

Audi

A1

Hyundai
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler
scale = StandardScaler[]

I20

Suzuki

Nhanh

Honda

Result:

Công dân

[[-2.10389253 -1.59336644]
 [-0.55407235 -1.07190106]
 [-1.52166278 -1.59336644]
 [-1.78973979 -1.85409913]
 [-0.63784641 -0.28970299]
 [-1.52166278 -1.59336644]
 [-0.76769621 -0.55043568]
 [ 0.3046118  -0.28970299]
 [-0.7551301  -0.28970299]
 [-0.59595938 -0.0289703 ]
 [-1.30803892 -1.33263375]
 [-1.26615189 -0.81116837]
 [-0.7551301  -1.59336644]
 [-0.16871166 -0.0289703 ]
 [ 0.14125238 -0.0289703 ]
 [ 0.15800719 -0.0289703 ]
 [ 0.3046118  -0.0289703 ]
 [-0.05142797  1.53542584]
 [-0.72580918 -0.0289703 ]
 [ 0.14962979  1.01396046]
 [ 1.2219378  -0.0289703 ]
 [ 0.5685001   1.01396046]
 [ 0.3046118   1.27469315]
 [ 0.51404696 -0.0289703 ]
 [ 0.51404696  1.01396046]
 [ 0.72348212 -0.28970299]
 [ 0.8281997   1.01396046]
 [ 1.81254495  1.01396046]
 [ 0.96642691 -0.0289703 ]
 [ 1.72877089  1.01396046]
 [ 1.30990057  1.27469315]
 [ 1.90050772  1.01396046]
 [-0.23991961 -0.0289703 ]
 [ 0.40932938 -0.0289703 ]
 [ 0.47215993 -0.0289703 ]
 [ 0.4302729   2.31762392]]

Hundai

I30

Opel

Astra

Audi

A1

Hyundai
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler
scale = StandardScaler[]

I20

Suzuki
y = df['CO2']

Nhanh

Honda
regr.fit[scaledX, y]

Công dân

Hundai
print[predictedCO2]

Result:

Hundai


Làm thế nào để bạn mở rộng dữ liệu trong Python?

Có nhiều phương pháp khác nhau để mở rộng dữ liệu, trong hướng dẫn này, chúng tôi sẽ sử dụng một phương thức gọi là tiêu chuẩn hóa.Trong đó z là giá trị mới, x là giá trị ban đầu, u là giá trị trung bình và s là độ lệch chuẩn.Bây giờ bạn có thể so sánh -2.1 với -1,59 thay vì so sánh 790 với 1.0.use a method called standardization. Where z is the new value, x is the original value, u is the mean and s is the standard deviation. Now you can compare -2.1 with -1.59 instead of comparing 790 with 1.0.

Làm thế nào để tôi định cư dữ liệu từ 0 đến 1 trong Python?

Bạn có thể bình thường hóa dữ liệu trong khoảng từ 0 đến 1 bằng cách sử dụng công thức [dữ liệu - np.min [dữ liệu]] / [np.max [dữ liệu] - np.[data – np. min[data]] / [np. max[data] – np.

Scale [] làm gì trong Python?

Hàm scale [] là một hàm sẵn có trong thư viện hình ảnh đũa python được sử dụng để thay đổi kích thước hình ảnh bằng cách chia tỷ lệ mỗi giá trị pixel bằng các cột và hàng đã cho.change the image size by scaling each pixel value by given columns and rows.

Làm thế nào để bạn bình thường hóa và mở rộng dữ liệu trong Python?

Sử dụng MinMaxScaler [] để bình thường hóa dữ liệu trong Python Đây là một lựa chọn phổ biến hơn để bình thường hóa các bộ dữ liệu.Bạn có thể thấy rằng các giá trị trong đầu ra nằm giữa [0 và 1].MinMaxScaler cũng cung cấp cho bạn tùy chọn để chọn phạm vi tính năng.Theo mặc định, phạm vi được đặt thành [0,1].

Chủ Đề