Cây quyết định chỉ mục Gini Python GitHub

Cam kết này không thuộc về bất kỳ nhánh nào trên kho lưu trữ này và có thể thuộc về một nhánh bên ngoài kho lưu trữ

Bạn không thể thực hiện hành động đó vào lúc này

Bạn đã đăng nhập bằng tab hoặc cửa sổ khác. Tải lại để làm mới phiên của bạn. Bạn đã đăng xuất trong một tab hoặc cửa sổ khác. Tải lại để làm mới phiên của bạn

Việc triển khai cây quyết định bằng python 3 thường được sử dụng trong các bài toán phân loại học máy. Hiện tại, chỉ có thể học các tập dữ liệu rời rạc. [Thuật toán coi các thuộc tính có giá trị liên tục là các thuộc tính có giá trị rời rạc]

Đặc trưng

Bạn có thể điều chỉnh trình phân loại trên dữ liệu đào tạo [sử dụng tỷ lệ khuếch đại hoặc chỉ số gini làm chỉ số], đưa ra dự đoán và nhận điểm [độ chính xác trung bình] cho dữ liệu thử nghiệm. Mô hình cây quyết định học máy sau khi khớp dữ liệu đào tạo có thể được xuất thành PDF. Khi so sánh cây quyết định của sklearn có sẵn với mô hình của chúng tôi trên cùng một dữ liệu đào tạo, kết quả tương tự nhau

Cây quyết định là một biểu diễn đồ họa của các giải pháp khả thi cho một quyết định dựa trên các điều kiện nhất định. Nó được gọi là cây quyết định bởi vì nó bắt đầu với một hộp duy nhất, sau đó phân nhánh thành một số giải pháp, giống như một cái cây

Có 3 bộ phận chính của cây

  • Nút gốc. Điểm quyết định đầu tiên hoặc gốc của cây
  • Nút nội bộ. Nút là thứ có sự phân chia, nó có thể chia thành các nút hoặc các lá
  • Lá cây. Lá là điểm quyết định cuối cùng tôi. e. chúng ta không thể phá vỡ các quy tắc hơn nữa

Gini tạp chất

Chỉ số Gini hoặc tạp chất Gini đo mức độ hoặc xác suất của một biến cụ thể bị phân loại sai khi nó được chọn ngẫu nhiên. Nhưng ý nghĩa thực sự của 'tạp chất' là gì? . Mức độ của chỉ số Gini thay đổi trong khoảng từ 0 đến 1, trong đó 0 biểu thị rằng tất cả các phần tử thuộc về một lớp nhất định hoặc nếu chỉ tồn tại một lớp và 1 biểu thị rằng các phần tử được phân phối ngẫu nhiên trên các lớp khác nhau. Chỉ số Gini bằng 0. 5 biểu thị các phần tử được phân bổ đều vào một số lớp

Công thức cho chỉ số Gini =

Các bước tiếp theo là cây quyết định để phân loại

Bước 1. Tính chỉ số gini cho tất cả các biến có trong tập dữ liệu

Bước 2. Lần phân chia đầu tiên sẽ theo biến có chỉ số gini tối thiểu

Bước 3. Bây giờ, đối với mỗi nút, hãy tính lại chỉ số gini cho tất cả các biến cũng như lá độc lập

Bước 4. Nếu điểm gini của chính nút đó là điểm thấp nhất, thì chúng ta không cần chia nhỏ hơn nữa và nó có thể trở thành nút lá nếu không hãy chọn biến có giá trị tạp chất tối thiểu/thấp nhất

Bước5. Quá trình tiếp tục cho đến khi chúng tôi đạt được tiêu chí kết thúc hoặc mẫu tối thiểu trên mỗi lá hoặc độ sâu tối đa, v.v.

Kho lưu trữ này chứa việc triển khai các công thức đã biết trong lĩnh vực Khai thác dữ liệu / Học máy / Thống kê bằng Python và thư viện Numpy

entropy numpy khai thác dữ liệu thuật toán chuẩn hóa gini đo khoảng cách khoảng cách không giống nhau đo khoảng cách đo độ tạp chất

  • Cập nhậtNgày 25 tháng 5 năm 2021
  • con trăn

mô-đun ds / ISF-189

Sao 2

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Mô-đun Giới thiệu về Phương pháp Nghiên cứu Liên ngành

ses kinh tế khoa học xã hội bất bình đẳng gini

  • Cập nhật ngày 9 tháng 8 năm 2018
  • Máy tính xách tay Jupyter

sorooshsorkhani / RankLib-Gini

Sao 2

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Tầm quan trọng của tính năng Gini đối với các khu rừng ngẫu nhiên RankLib

học cách xếp hạng gini rừng ngẫu nhiên ranklib ranklib-gini gini-tầm quan trọng

  • Cập nhậtNgày 19 tháng 5 năm 2021
  • con trăn

jiunbae / ITE4005

Nhà tài trợ

Sao 1

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Khoa học dữ liệu @ Đại học Hanyang

cây quyết định khoa học dữ liệu thuật toán tiên nghiệm gini hanyang

  • Cập nhậtJun 14, 2018
  • con trăn

vaitybharati / Cây quyết định

Sao 1

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

cây quyết định

python mô hình entropy dự đoán cây quyết định phân loại cây quyết định gini cây quyết định cây hồi quy

  • Cập nhật ngày 9 tháng 11 năm 2020
  • Máy tính xách tay Jupyter

nsdea / cidx

Sao 1

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

CountryIndex [CIDX] là bảng điều khiển web được sử dụng để so sánh các quốc gia

gdp gini hdi thế giới

  • Cập nhật ngày 8 tháng 9 năm 2022
  • con trăn

miashken / Thuật toán cây quyết định

Sao 0

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Thuật toán cây quyết định trong Python - điểm gini/entropy - bộ dữ liệu ung thư vú

python entropy thuật toán máy học cây quyết định gini wdbc gini-index

  • Cập nhật12/10/2021
  • con trăn

atthijs98 / bản đồ

Sao 1

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

javascript jquery phpstorm điều khiển màn hình cảm ứng afas materializecss-framework gini numeraljs googlemaps-api world-happiness-report chỉ số phát triển con người

  • Cập nhật ngày 7 tháng 8 năm 2018

demcortillas / Giáo dục-Gini

Sao 1

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

tính toán gini giáo dục cho từng quận hành chính của Chile dựa trên Census2017 thông qua gói 'DescTools'

xã hội học địa lý điều tra dân số-dữ liệu điều tra dân số chile r-programming gini desctools

  • Cập nhật11/10/2020
  • R

mirsahib / Dự án-Uranus

Sao 1

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

IUB CSE 425 [Trí tuệ nhân tạo]

raspberry-pi imu tiêu chí cây quyết định gini thu thập thông tin theo dõi thủ công

  • Cập nhật 14/11/2019
  • Máy tính xách tay Jupyter

pinarersoy / hw3

Sao 0

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

cây quyết định

cây quyết định knn gini

  • Cập nhật ngày 8 tháng 3 năm 2017
  • Máy tính xách tay Jupyter

AlexP11223 / cây quyết định

Sao 0

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Trình diễn cảm ứng cây quyết định. ID3, chỉ số Gini

máy học id3 cây quyết định cây quyết định phân loại gini

  • Cập nhật ngày 10 tháng 2 năm 2018
  • C#

genielab / h1b_data_analysis

Sao 0

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Nơi này lưu trữ mã hỗ trợ cho nội dung được xuất bản trong bài viết blog này

thăm dò-phân tích dữ liệu gini h1b nhà ở-khả năng chi trả h1b-dữ liệu phân tích tiền lương

  • Cập nhật05/04/2019
  • Máy tính xách tay Jupyter

ayseceyda / đức-tín dụng-gini-phân tích

Sao 0

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Tính toán Gini trên "Bộ dữ liệu tín dụng của Đức" của Kaggle bằng R

r kaggle sqldf gini tiếng Đức-bộ dữ liệu tín dụng gini-tính toán mlmetrics

  • Cập nhật ngày 16 tháng 2 năm 2021
  • R

rachhshruti / thuật toán phân loại cây tham lam

Sao 0

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Thuật toán tham lam cho cây phân loại

python tham lam thuật toán gini thu thập thông tin cây phân loại

  • Cập nhật ngày 3 tháng 12 năm 2017
  • con trăn

bhuvaneswari gnanasekar / Lượng mưa-dự đoán

Sao 0

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

cây quyết định entropy gini dự báo thời tiết

  • Cập nhật22 tháng 3 năm 2022
  • Máy tính xách tay Jupyter

mmalinova / Excel_projects_at_Statistic

Sao 0

  • Mã số
  • Vấn đề
  • Yêu cầu kéo

Dưới đây là một số dự án dựa trên các phương pháp xử lý thông tin tĩnh. Có nhiều phương pháp khác nhau mà bạn có thể sử dụng để xử lý thông tin của mình, tùy thuộc vào nhu cầu của bạn

dữ liệu-khoa học dữ liệu hồi quy tuyến tính ngẫu nhiên phân tích dữ liệu khóa học-toán học rời rạc-dự án phân tích dữ liệu khóa học poisson anova ý định nghĩa gini slovenia phân phối chuẩn poisson-hồi quy gini-index covid-19 covid19

Chủ Đề