5
Chương 5
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
1. Khái Niệm Tổng Quát
Giả sử ta đi tiếp nhận một lô hàng [rất nhiều] và ta chỉ bằng lòng nhận lô hàng nếu tỷ lệ sản
phẩm hỏng
và từ chối nếu
. Xét các giả thuyết thống kê, 0
và
A
. Bằng cách kiểm tra một mẫu ngẫu nhiên lấy từ lô hàng, ta quyết định nhận [chấp
nhận
đúng] hay từ chối tiếp nhận [bác bỏ
] lô hàng.
Mô hình tổng quát của bài toán kiểm định là : ta nêu lên hai mệnh đề khác nhau, một mệnh đề
được gọi là giả thuyết
và mệnh đề còn lại được gọi là đối thuyết
. Giải quyết một bài toán
kiểm định là nêu lên một quy tắc hành động [chấp nhận giả thuyết
hoặc bác bỏ giả thuyết
]
bằng cách dựa vào số liệu thống kê thu thập trên một mẫu ngẫu nhiên lấy từ tổng thể.
Ta nói rằng : chấp nhận giả thuyết
, có nghĩa là ta tin rằng
đúng; từ chối
có nghĩa
là ta tin rằng
sai.
1.1. Các loại sai lầm
Quan sát ngẫu nhiên một số trường hợp rồi suy rộng ra cho tổng thể, sự suy rộng này có khi
đúng, có khi không đúng. Thống kê học phân biệt hai loại sai lầm :
- Sai lầm loại 1 : từ chối
, khi
đúng,
- Sai lầm loại 2 : chấp nhận
, khi
sai.
Quyết định
Thực tế Chấp nhận
Từ chối
đúng Đúng Sai lầm loại 1
sai Sai lầm loại 2 Đúng
Đặt
P[Sai lầm loại 1],
P[Sai lầm loại 2]. Ta muốn các cơ hội sai lầm xảy ra càng ít
càng tốt. Tuy nhiên, nếu hạ thấp
thì
sẽ tăng và ngược lại. Do đó, trên thực tế thì ta xem giữa
hai loại sai lầm này, sai lầm nào tác hại nhiều hơn thì cần tránh. Trong thống kê, ta quy ước rằng sai
lầm loại 1 tác hại hơn và cần tránh hơn. Do đó, ta chỉ xét các phép kiểm định có cơ hội sai lầm loại
1 [
] không vượt quá một giá trị ấn định trước, thông thường là 1%; 5% hoặc 10%. Giá trị
còn
được gọi là mức ý nghĩa của kiểm định.
1.2. Thống kê kiểm định
Xét một giả thuyết
theo một biến số ngẫu nhiên X xác định trên một tổng thể. Tương tự
như trong lý thuyết về ước lượng khoảng, ta thu thập số liệu của X trên một mẫu ngẫu nhiên
lấy từ tổng thể và thành lập một thống kê T. Ta có
1.2.1. Định nghĩa. Thống kê T xác định trên mẫu
được gọi là một thống kê kiểm
định cho giả thuyết
khi
“Nếu
đúng thì phân phối xác suất cho
được hoàn toàn xác định”.