Tạo một ma trận tính năng mới bao gồm tất cả các tổ hợp đa thức của các tính năng có bậc nhỏ hơn hoặc bằng bậc đã chỉ định. Ví dụ: nếu một mẫu đầu vào là hai chiều và có dạng [a, b], thì các đặc trưng đa thức bậc 2 là [1, a, b, a^2, ab, b^2]
Đọc thêm trong Hướng dẫn sử dụng .
Thông số . độ int hoặc tuple [min_độ, max_độ], mặc định=2Nếu một int duy nhất được đưa ra, nó chỉ định mức độ tối đa của các tính năng đa thức. Nếu bộ dữ liệu [min_degree, max_degree]
được thông qua, thì min_degree
là giá trị nhỏ nhất và max_degree
là giá trị đa thức tối đa của các đặc trưng được tạo. Lưu ý rằng min_degree=0
và min_degree=1
là tương đương khi xuất ra số hạng 0 được xác định bởi include_bias
Nếu True
, chỉ các tính năng tương tác được tạo. các tính năng là sản phẩm của tối đa 8 tính năng đầu vào riêng biệt, tôi. e. các thuật ngữ có lũy thừa từ 2 trở lên của cùng một tính năng đầu vào bị loại trừ
include_bias bool, mặc định=True
bao gồm.
sklearn.preprocessing
0,sklearn.preprocessing
1,sklearn.preprocessing
2, v.v.loại trừ.
sklearn.preprocessing
3,sklearn.preprocessing
4, v.v.
Nếu True
[mặc định], thì bao gồm cột thiên vị, tính năng trong đó tất cả các lũy thừa đa thức đều bằng 0 [i. e. một cột của những cái - hoạt động như một thuật ngữ chặn trong mô hình tuyến tính]
Thứ tự của mảng đầu ra trong trường hợp dày đặc. Thứ tự sklearn.preprocessing
6 được tính toán nhanh hơn, nhưng có thể làm chậm các công cụ ước tính tiếp theo
Mới trong phiên bản 0. 21
Thuộc tính .sklearn.preprocessing
7 ndarray của hình dạng [sklearn.preprocessing
8, sklearn.preprocessing
9]Số mũ cho mỗi đầu vào trong đầu ra
n_features_in_ intSố lượng đối tượng địa lý được xem trong thời gian phù hợp .
Mới trong phiên bản 0. 24
feature_names_in_ ndarray của hình dạng [______99,]Tên của các tính năng đã thấy trong thời gian fit . Chỉ được xác định khi [min_degree, max_degree]
1 có tên đối tượng là tất cả các chuỗi.
Mới trong phiên bản 1. 0
n_output_features_ intTổng số tính năng đầu ra đa thức. Số lượng tính năng đầu ra được tính bằng cách lặp lại trên tất cả các kết hợp tính năng đầu vào có kích thước phù hợp
Xem thêm
[min_degree, max_degree]
2Máy biến áp tạo cơ sở B-spline đơn biến cho các tính năng
ghi chú
Xin lưu ý rằng số lượng tính năng trong mảng đầu ra tỷ lệ đa thức theo số lượng tính năng của mảng đầu vào và theo cấp số nhân. Mức độ cao có thể gây ra quá mức
Xem examples/linear_model/plot_polynomial_interpolation. p
ví dụ
>>> import numpy as np >>> from sklearn.preprocessing import PolynomialFeatures >>> X = np.arange[6].reshape[3, 2] >>> X array[[[0, 1], [2, 3], [4, 5]]] >>> poly = PolynomialFeatures[2] >>> poly.fit_transform[X] array[[[ 1., 0., 1., 0., 0., 1.], [ 1., 2., 3., 4., 6., 9.], [ 1., 4., 5., 16., 20., 25.]]] >>> poly = PolynomialFeatures[interaction_only=True] >>> poly.fit_transform[X] array[[[ 1., 0., 1., 0.], [ 1., 2., 3., 6.], [ 1., 4., 5., 20.]]]
phương pháp
[min_degree, max_degree]
3[X[, y]]
Tính toán số lượng các tính năng đầu ra
[min_degree, max_degree]
4[X[, y]]
Phù hợp với dữ liệu, sau đó biến đổi nó
[min_degree, max_degree]
5[[tính_năng_đầu_vào]]
Nhận tên tính năng đầu ra để chuyển đổi
[min_degree, max_degree]
6[[sâu]]
Nhận thông số cho công cụ ước tính này
[min_degree, max_degree]
7[*[, biến đổi]]
Đặt vùng chứa đầu ra
[min_degree, max_degree]
8[**thông số]
Đặt các tham số của công cụ ước tính này
[min_degree, max_degree]
9[X]
Chuyển đổi dữ liệu thành các tính năng đa thức
phù hợp[X , y=Không có][source]¶Tính toán số lượng các tính năng đầu ra
Thông số . X {dạng mảng, ma trận thưa thớt} của hình dạng [n_samples, n_features]Dữ liệu
y Làm ngơKhông được sử dụng, trình bày ở đây để thống nhất API theo quy ước
Trả về . bản thân vậtbiến áp lắp
fit_transform[X , y=Không có , **fit_params][source]¶Phù hợp với dữ liệu, sau đó biến đổi nó
Khớp máy biến áp với [min_degree, max_degree]
1 và min_degree
1 với các tham số tùy chọn min_degree
2 và trả về phiên bản đã biến đổi của [min_degree, max_degree]
1
mẫu đầu vào
y hình dạng giống như mảng [n_samples,] hoặc [n_samples, n_outputs], default=NoneGiá trị mục tiêu [Không có đối với các phép biến đổi không giám sát]
**fit_params mệnh lệnhThông số phù hợp bổ sung
Trả về . X_new mảng hình ndarray [n_samples, n_features_new]mảng chuyển đổi
get_feature_names_out[input_features=Không có][source]¶Nhận tên tính năng đầu ra để chuyển đổi
Thông số . input_features giống như mảng của str hoặc Không, mặc định = Khôngtính năng đầu vào
Nếu
min_degree
4, thìmin_degree
5 được sử dụng làm tên đối tượng địa lý trong. Nếumin_degree
5 không được xác định, thì các tên tính năng đầu vào sau đây sẽ được tạo.min_degree
7Nếu
min_degree
8 giống như một mảng, thìmin_degree
8 phải khớp vớimin_degree
5 nếumin_degree
5 được xác định
Tên tính năng được chuyển đổi
get_params[deep=True][source]¶Nhận thông số cho công cụ ước tính này
Thông số . deep bool, mặc định=TrueNếu Đúng, sẽ trả về các tham số cho công cụ ước tính này và chứa các đối tượng con là công cụ ước tính
Trả về . params mệnh lệnhTên tham số được ánh xạ tới giá trị của chúng
thuộc tính quyền hạn_¶Số mũ cho mỗi đầu vào trong đầu ra
set_output[* , chuyển đổi=Không có][source]¶Đặt vùng chứa đầu ra
Xem Giới thiệu API set_output để biết ví dụ về cách sử dụng API.
Thông số . biến đổi {"mặc định", "gấu trúc"}, mặc định=Không cóĐịnh cấu hình đầu ra của [min_degree, max_degree]
9 và [min_degree, max_degree]
4
max_degree
4. Định dạng đầu ra mặc định của máy biến ápmax_degree
5. Đầu ra khung dữ liệumax_degree
6. Cấu hình chuyển đổi không thay đổi
ví dụ ước tính
set_params[**params][source]¶Đặt các tham số của công cụ ước tính này
Phương pháp này hoạt động trên các công cụ ước tính đơn giản cũng như trên các đối tượng lồng nhau [chẳng hạn như max_degree
7]. Cái sau có các tham số dạng max_degree
8 để có thể cập nhật từng thành phần của một đối tượng lồng nhau
Tham số ước lượng
Trả về . self trường hợp ước tínhví dụ ước tính
biến đổi[X][source]¶Chuyển đổi dữ liệu thành các tính năng đa thức
Thông số . X {dạng mảng, ma trận thưa thớt} của hình dạng [n_samples, n_features]Dữ liệu cần chuyển đổi, theo từng hàng
Thích CSR hơn CSC cho đầu vào thưa thớt [đối với tốc độ], nhưng CSC là bắt buộc nếu mức độ là 4 hoặc cao hơn. Nếu độ nhỏ hơn 4 và định dạng đầu vào là CSC, thì nó sẽ được chuyển đổi thành CSR, có các tính năng đa thức được tạo, sau đó được chuyển đổi trở lại thành CSC
Nếu độ là 2 hoặc 3, phương pháp được mô tả trong “Tận dụng độ thưa thớt để tăng tốc độ mở rộng tính năng đa thức của ma trận CSR bằng cách sử dụng số K-Simplex” của Andrew Nystrom và John Hughes được sử dụng, phương pháp này nhanh hơn nhiều so với phương pháp được sử dụng trên đầu vào CSC. Vì lý do này, đầu vào CSC sẽ được chuyển đổi thành CSR và đầu ra sẽ được chuyển đổi trở lại thành CSC trước khi được trả lại, do đó ưu tiên của CSR
Trả về . XP {ndarray, ma trận thưa thớt} của hình dạng [n_samples, NP]Ma trận các tính năng, trong đó max_degree
9 là số lượng các tính năng đa thức được tạo từ sự kết hợp của các yếu tố đầu vào. Nếu một ma trận thưa thớt được cung cấp, nó sẽ được chuyển đổi thành một min_degree=0
0 thưa thớt