Phân phối Chi-square Python

Trong bài viết này, tôi sẽ giới thiệu kiến ​​thức cơ bản về kiểm định chi-square [χ2], một phương pháp thống kê để đưa ra suy luận về phân phối của một biến hoặc để quyết định liệu có tồn tại mối quan hệ giữa hai biến của tổng thể hay không. Suy luận dựa trên đường cong phân phối χ2, phụ thuộc vào số bậc tự do d. f

Hình 1. Phân phối Chi bình phương với bậc tự do khác nhau [1]

Đường cong phân phối χ2 bị lệch phải và khi số bậc tự do càng lớn, đường cong χ2 sẽ giống với phân phối chuẩn hơn

A. χ2 kiểm định tính độc lập

Nó được sử dụng để quyết định liệu có tồn tại mối quan hệ giữa hai biến của tổng thể hay không. Hữu ích khi phân tích kết quả khảo sát 2 biến phân loại

  • H₀. Hai biến phân loại không có mối quan hệ
    H₁. Có một mối quan hệ giữa hai biến phân loại
  • Số bậc tự do của thống kê kiểm tra tính độc lập χ2.
    d. f. = [# hàng -1] *[#cột-1]

Bảng 1. rxc Bảng dự phòng cho 2 biến phân loại
  • Nếu H₀ là đúng, thì mỗi ô của giá trị trong bảng dự phòng ở trên sẽ chứa tần số lý thuyết hoặc dự kiến ​​Eᵢⱼ, trái ngược với giá trị quan sát được Oᵢⱼ cho mỗi ô

Hình 2. Nguồn gốc của tần số dự kiến
  • Thống kê thử nghiệm. So sánh sự khác biệt giữa Oᵢⱼ & Eᵢⱼ dẫn đến thống kê χ2, với bậc tự do [[r-1] x [c-1]], trong đó

trên TẤT CẢ các ô trong bảng dự phòng rxc

Bảng bên dưới là một cuộc thăm dò kết quả hiển thị các phản hồi chung cho 2 biến phân loại. những người trong các danh mục được xem xét từ 18–29, 30–44, 45–64 và >65 tuổi, và đảng phái chính trị của họ, đó là “Bảo thủ”, “Xã hội chủ nghĩa” và “Khác”. Có bằng chứng nào về mối quan hệ giữa nhóm tuổi và đảng phái chính trị của họ, ở mức ý nghĩa 5% không?

ban 2. Thoát khảo sát thăm dò ý kiến ​​[2]

Theo quy trình năm bước kiểm tra giả thuyết.
H₀. liệu nhóm tuổi và đảng phái chính trị của họ có độc lập hay không, tôi. e. không có mối quan hệ
H₁. liệu nhóm tuổi và liên kết chính trị của họ có phụ thuộc vào nhau hay không, tôi. e. ∃ một mối quan hệ
α = 0. 05
Theo thống kê kiểm tra tính độc lập χ2.

Sự kết luận. Chúng tôi có đủ bằng chứng cho thấy có mối liên hệ giữa nhóm tuổi và đảng phái chính trị của họ, ở mức ý nghĩa 5%

B. χ2 Kiểm tra mức độ phù hợp

Nó được sử dụng để suy luận về phân phối của một biến

  • H₀. Biến có phân phối xác định, chuẩn
    H₁. Biến không có phân phối xác định, không bình thường
  • Số bậc tự do của thống kê kiểm tra Mức độ phù hợp χ2.
    d. f. = [# danh mục -1]
  • Nó so sánh tần số quan sát được O của một mẫu với tần số dự kiến ​​E.
    E = xác suất của sự kiện * tổng cỡ mẫu

Bảng dưới đây hiển thị kết quả bỏ phiếu của hơn 44 triệu người cho Cuộc bầu cử Liên bang Đức năm 2013. 41. 5% cử tri Đức bỏ phiếu cho Liên minh Dân chủ Cơ đốc giáo [CDU], 25. 7% cho Đảng Dân chủ Xã hội [SPD] và 32 người còn lại. 8% như những người khác

Giả sử nhà nghiên cứu lấy một mẫu ngẫu nhiên và chọn 123 sinh viên của FU Berlin về đảng phái của họ. Trong số đó, 57 phiếu bầu cho CDU, 26 phiếu bầu cho SPD và 40 phiếu bầu cho những người khác. Những con số này tương ứng với các tần số quan sát được

bàn số 3. Bầu cử Liên bang Đức năm 2013 [3]

Theo quy trình năm bước kiểm tra giả thuyết.
H₀. Biến có phân phối xác định, i. e. tần suất quan sát được và dự kiến ​​gần bằng nhau
H₁. Biến không có phân phối xác định, không chuẩn
α = 0. 05
Theo χ2 thống kê kiểm tra Mức độ phù hợp.

Sự kết luận. Chúng tôi không có đủ bằng chứng cho thấy tần suất quan sát được và tần suất mong đợi không bằng nhau, ở mức ý nghĩa 5%

đề xuất đọc

Thử nghiệm ANOVA, với Python

Hướng dẫn hoàn chỉnh cho người mới bắt đầu để thực hiện Kiểm tra ANOVA [có mã. ]

hướng tới khoa học dữ liệu. com

Thử nghiệm của McNemar, với Python

Hướng dẫn hoàn chỉnh cho người mới bắt đầu để thực hiện bài kiểm tra McNemar [có mã. ]

hướng tới khoa học dữ liệu. com

Kiểm tra giả thuyết một mẫu, với Python

Hướng dẫn hoàn chỉnh cho người mới bắt đầu để thực hiện Kiểm tra giả thuyết một mẫu [có mã. ]

lên cấp. gitconnected. com

Thử nghiệm giả thuyết hai mẫu với Python

Hướng dẫn hoàn chỉnh cho người mới bắt đầu để thực hiện Kiểm tra giả thuyết hai mẫu [có mã. ]

lên cấp. gitconnected. com

Người giới thiệu

[1] “Kiểm tra Chi-Square • SOGA • Khoa Khoa học Trái đất. " [Trực tuyến]. Có sẵn. https. //www. địa lý. fu-berlin. de/en/v/soga/Basics-of-statistics/Hypothesis-Tests/Chi-Square-Tests/index. html

[2] “Thử nghiệm Độc lập Chi-Square • SOGA • Khoa Khoa học Trái đất. " [Trực tuyến]. Có sẵn. https. //www. địa lý. fu-berlin. de/vi/v/soga/Basics-of-statistic/Hypothesis-Tests/Chi-Square-Tests/Chi-Square-Independence-Test/index. html

[3] “Kiểm tra mức độ phù hợp của Chi-Square • SOGA • Khoa Khoa học Trái đất. " [Trực tuyến]. Có sẵn. https. //www. địa lý. fu-berlin. de/en/v/soga/Basics-of-statistic/Hypothesis-Tests/Chi-Square-Tests/Chi-Square-Goodness-of-Fit-Test/index. html

Chủ Đề