Phân phối siêu bội (Hypergeometric Distribution)
Phân phối siêu bội thường được sử dụng trong các trường hợp mà việc lấy mẫu không có thay thế. Một số ứng dụng thực tế bao gồm:
- Kiểm định chất lượng: Khi lấy mẫu từ một lô hàng để kiểm tra chất lượng mà không trả lại các mẫu đã kiểm tra vào lô hàng.
- Sinh học: Xác định số lượng cá thể mang một đặc tính di truyền nhất định trong một quần thể.
- Thống kê học: Kiểm tra giả thuyết trong các bài toán thống kê mà không thay thế mẫu.
- Cờ bạc và trò chơi: Xác suất rút được một tập hợp các quân bài nhất định từ một bộ bài không thay thế.
Cho N, M (M < N) và một số n < min(M, N - M)
Biến ngẫu nhiên X phân phối siêu bội hay siêu hình học nếu bảng phân phối có dạng:
| X | 0 | 1 | ... | k | ... | n |
| P | p0 | p1 | ... | pk | ... | pn |
Pk = k = (4.5)
Kỳ vọng: M(X) = n. (4.6)
Phương sai: var(X) = n... (4.7)
Cho một hộp đựng N bi trong đó có M bi trắng, N - M bi đen. Lấy ngẫu nhiên một lúc hoặc lấy lần lượt không hoàn lại một nhóm n bi. Số bi trắng X trong nhóm phân phôi siêu bội.
Phân phối siêu bội thường kí hiệu là M(N, n).
Nếu không có điều kiện n <min(M, N -M ) thì các giá trị có thể của biến X không phải từ 0 đến n mà ít hơn (bớt một số giá trị đầu hay bớt một số giá trị cuối), nhưng các xác suất vẫn tính theo (4.5) và vẫn gọi là phân phôi siêu bội. Kì vọng và phương sai vẫn tính theo (4.6) và (4.7).
Gọi tỉ số bi trẳng trong hộp là p = .
Nếu lấy có hoàn lại n lần (tức là lấy một bi, xem xong hoàn trả vào hộp, trộn đéu sau đó lấy ngẫu nhiên ra một bi khác) thì số bi trắng X phân phối nhị thức B(n, p). Như vậy siêu bội và phân phối nhị thức có những nét giống nhau chỉ khác ở chỗ nếu lấy n bi không hoàn lại thì số bi trắng X phân phối siêu bội còn nếu có hoàn lại thì X phân phối nhị thức. Sự khác nhau trở nên không đáng kể nếu tổng số bi N và số bi trắng M là các số rất lớn.
Thí dụ 1
Chọn một uỷ ban gồm 3 người trong số 3 nữ và 5 nam. Gọi X là số nữ trong uỷ ban, X có phân phối siêu bội:
| X | 0 | 1 | 2 | 3 |
| P |
M X = 9/8
DX = 225/448
Thí dụ 2
Hộp có 15 quả cam trong đó có 5 quả hỏng, lấy 2 quả, gọi X là số cam hỏng trong 2 quả đó ta có:
| X | 0 | 1 | 2 |
| P |
MX = 2/3
DX = 26/63