Bạn sẽ sử dụng phần trăm nào cho khoảng tin cậy bootstrap 95%?

Biến thể thứ hai của phương pháp bootstrap-t, mang lại cái gọi là khoảng tin cậy đối xứng, sử dụng

T∗=n. X¯∗−X¯. s∗

Cho c = (1 − α)B, làm tròn đến số nguyên gần nhất. Bây giờ khoảng tin cậy 1 − α cho μ là

X¯±T(c)∗sn

Kết quả tiệm cận ( Hall, 1988a, 1988bHall, 1988aHall, 1988b) suggest that it tends to have more accurate probability coverage than the equal-tailed confidence interval, but some small-sample exceptions are noted later.

Một thuộc tính lý thuyết thú vị của phương pháp bootstrap-t là nó đúng bậc hai. Đại khái, khi sử dụng T, khi kích thước mẫu tăng lên, sự khác biệt giữa phạm vi xác suất thực tế và mức danh nghĩa sẽ bằng không với tỷ lệ 1/n . Nhưng khi sử dụng phương pháp bootstrap-t, sự khác biệt về 0 với tốc độ 1/n. Nghĩa là, sự khác biệt tiến về 0 nhanh hơn so với các phương pháp dựa trên định lý giới hạn trung tâm.

Một lần nữa, có một vấn đề thực tế là chọn B, số lượng mẫu bootstrap. Các lựa chọn mặc định cho B được sử dụng bởi các chức năng R trong cuốn sách này dựa trên mục tiêu đạt được sự kiểm soát hợp lý tốt đối với xác suất xảy ra lỗi loại I. Nhưng các lập luận có thể được đưa ra rằng có lẽ giá trị lớn hơn cho B có giá trị thực tế, mối quan tâm là nếu không thì có thể mất điện. Racine và MacKinnon (2007a) thảo luận chi tiết về vấn đề này và đề xuất phương pháp chọn số lượng mẫu bootstrap. (Xem thêm Jöckel, 1986) . Davidson và MacKinnon (2000) đã đề xuất một quy trình thử nghiệm trước để chọn B. Kết quả lý thuyết thu được bởi Olive (2010) đề xuất sử dụng B ≥ [n log(n)].

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780123869838000044

Suy luận trong trường hợp một mẫu

Rand R. Wilcox, trong Giới thiệu về Kiểm tra giả thuyết và ước tính mạnh mẽ (Ấn bản thứ năm) , 2022

4. 4. 3 Phương pháp Bootstrap-t

Phương thức thay thế chính cho bootstrap phần trăm phương thức bootstrap-t, cũng đã được . Ví dụ: khi làm việc với các phương tiện, chiến lược là sử dụng dữ liệu được quan sát để tính gần đúng mức phân phối của

T=n(X¯−μ)s

bằng cách tiến hành như sau

1

Tạo mẫu bootstrap X1⁎,…,Xn⁎ .

2

Tính toán X¯⁎ , s⁎ và . T⁎=n(X¯⁎−X¯)/s⁎based on the bootstrap sample generated in step 1.

3

Lặp lại bước 1 và 2 B lần, cho kết quả Tb⁎ , b=1,…, . .

Các giá trị Tb⁎ cung cấp ước tính gần đúng về phân phối của T và cụ thể là ước tính của α/2and 1−α/2quantiles.

Khi thử nghiệm H0 . μ=μ0 , có hai biến thể của phương thức bootstrap-t cần nhận xét. Đầu tiên là phương pháp đuôi bằng nhau. Đặt T(1)⁎≤⋯≤T(B)⁎Tb⁎values written in ascending order, let ℓ=αB/2, rounded to the nearest integer, and let u=B−ℓ. Then H0 bị từ chối nếu

T≤T(ℓ)⁎hoặcT≥T(u)⁎

Sắp xếp lại các số hạng, a 1−α khoảng tin cậy cho μ là

(4. 8)(X¯−T(u)⁎sn,X¯−T(ℓ)⁎sn).

Phương trình cuối cùng này có vẻ không chính xác vì T(u)⁎ , ước tính của 1−α/2quantile of the distribution of T, is used to compute the lower end of the confidence interval. Simultaneously, T(ℓ)⁎ , ước tính của α/2quantile, is used to compute the upper end of the confidence interval. It can be seen, however, that this last equation follows from the decision rule that rejects H0 . μ=μ0 if T≤T(ℓ)⁎ or T≥T(u)⁎. Also, when computing the upper end of the confidence interval, T(ℓ)⁎ sẽ âm, đó là lý do tại sao thuật ngữ T(ℓ)⁎snis subtracted from .

Biến thể thứ hai của phương pháp bootstrap-t, mang lại khoảng tin cậy đối xứng, sử dụng

T⁎=n. X¯⁎−X¯. S⁎

Let c=(1−α)B , được làm tròn thành số nguyên gần nhất. Bây giờ 1−α khoảng tin cậy cho μ là

X¯±T(c)⁎sn

Kết quả tiệm cận ( Hội trường , 1988a , 1988b) suggest that it tends to have more accurate probability coverage than the equal-tailed confidence interval, but some small-sample exceptions are noted later.

Một thuộc tính lý thuyết thú vị của phương pháp bootstrap-t là nó đúng bậc hai. Đại khái, khi sử dụng T, khi kích thước mẫu tăng lên, sự khác biệt giữa phạm vi xác suất thực tế và mức danh nghĩa sẽ tiến về 0 với tỷ lệ 1/n . Nhưng khi sử dụng phương pháp bootstrap-t, sự chênh lệch về 0 ở tỷ lệ 1/n . Nghĩa là, sự khác biệt tiến về 0 nhanh hơn so với các phương pháp dựa trên định lý giới hạn trung tâm.

Một lần nữa, có một vấn đề thực tế là chọn B, số lượng mẫu bootstrap. Các lựa chọn mặc định cho B được sử dụng bởi các chức năng R trong cuốn sách này dựa trên mục tiêu đạt được sự kiểm soát hợp lý tốt đối với xác suất xảy ra lỗi Loại I. Nhưng các lập luận có thể được đưa ra rằng có lẽ giá trị lớn hơn cho B có giá trị thực tế, mối quan tâm là nếu không thì có thể mất điện. Racine và MacKinnon (2007a) thảo luận chi tiết về vấn đề này và đề xuất phương pháp chọn số lượng mẫu bootstrap. (Cũng xem Jöckel, 1986 . ) Davidson và MacKinnon (2000) đề xuất quy trình thử nghiệm trước để chọn B. Kết quả lý thuyết do Olive (2010) đề xuất sử dụng B≥nlog(n).

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780128200988000105

Các phương pháp hồi quy khác

Rand R. Wilcox, trong Giới thiệu về Kiểm tra giả thuyết và ước tính mạnh mẽ (Ấn bản thứ năm) , 2022

Phương pháp dựa trên công cụ ước tính mạnh mẽ

Trước tiên, hãy xem xét mục tiêu tính toán khoảng tin cậy cho sự khác biệt giữa các độ dốc. Khi sử dụng bất kỳ công cụ ước tính mạnh nào có điểm phân tích cao hợp lý, kỹ thuật bootstrap phần trăm dường như đưa ra khoảng tin cậy chính xác hợp lý cho một phạm vi khá rộng của các giá trị không bình thường . Điều này gợi ý một phương pháp để giải quyết các mục tiêu được xem xét ở đây và các mô phỏng hỗ trợ việc sử dụng chúng. Tóm lại, quy trình bắt đầu bằng cách tạo mẫu bootstrap từ nhóm thứ j như được mô tả, ví dụ: trong Phần 11. 1. 1 . Nghĩa là, đối với nhóm thứ j, lấy mẫu ngẫu nhiên nj vector quan sát, với sự thay thế, từ (y1j,x1j . Đặt . Let dk⁎=βˆk1⁎−βˆk2⁎ là sự khác biệt giữa các ước tính kết quả của biến độc lập thứ k, k . Lặp lại quá trình này B lần, thu được . Repeat this process B times, yielding dk1⁎,…,dkB⁎ . Đối với mỗi k, hãy đặt các giá trị B này theo thứ tự tăng dần, thu được dk(1)⁎≤⋯≤dk(B)⁎ . Cho ℓ=αB/2 , u=(1−α/2)B, rounded to the nearest integer, in which case an approximate 1−αconfidence interval for βk1−βk2is (dk(ℓ+1)⁎,dk(u)⁎).

Để cung cấp một số dấu hiệu cho thấy phương thức hoạt động tốt như thế nào khi tính toán 0. khoảng tin cậy 95, Bảng 11. 5 và 11. 6 hiển thị αˆ , ước tính của một trừ đi phạm vi xác suất, khi . Trong các bảng này, VP đề cập đến ba loại điều khoản lỗi. , p=1, and M regression with Schweppe weights is used. In these tables, VP refers to three types of error terms: λ(x)=1 , λ(x)=x2 , . x. +1) λ(x)=1+2/(|x|+1) . Để thuận tiện, ba mẫu phương sai này được dán nhãn lần lượt là VP 1, VP 2 và VP 3. Tình huống VP 2 tương ứng với phương sai sai số lớn khi giá trị của x nằm ở đuôi phân phối của nó và VP 3 thì ngược lại. Ba điều kiện bổ sung cũng được xem xét. Đầu tiên, được gọi là C1, là nơi xi1xi2 , cũng như . Điều kiện thứ hai, C2, giống với điều kiện thứ nhất, chỉ có điều ϵi1and ϵi2, have identical distributions. The second condition, C2, is the same as the first condition, only ϵi2=4ϵi1 . Điều kiện thứ ba, C3, là nơi dành cho nhóm đầu tiên, cả xi1ϵi1have standard normal distributions, but for the second group, both xi2and ϵi2have a g-and-h distribution.

Bảng 11. 5 . Giá trị của αˆ , sử dụng phương pháp trong Mục 11. 2. 1 khi x có phân phối đối xứng, n=20.

xϵĐiều kiệnghghVPC1C2C30. 00. 00. 00. 010. 0290. 0400. 04020. 0420. 0450. 04530. 0280. 0390. 0390. 00. 00. 00. 510. 0290. 0360. 03620. 0450. 0390. 03930. 0250. 0370. 0370. 00. 00. 50. 010. 0260. 0400. 04120. 0430. 0430. 04330. 0290. 0400. 0400. 00. 00. 50. 510. 0280. 0360. 03620. 0420. 0400. 04030. 0230. 0370. 0370. 00. 50. 00. 010. 0240. 0350. 04020. 0510. 0580. 04630. 0140. 0230. 0390. 00. 50. 00. 510. 0230. 0350. 03620. 0490. 0540. 03930. 0130. 0200. 0370. 00. 50. 50. 010. 0220. 0390. 04020. 0500. 0390. 04330. 0140. 0220. 0400. 00. 50. 50. 510. 0240. 0370. 03620. 0520. 0580. 04030. 0130. 0200. 037

Bảng 11. 6 . Các giá trị của αˆ , x có phân phối lệch, n=20.

xϵĐiều kiệnghghVPC1C2C30. 50. 00. 00. 010. 0260. 0400. 04020. 0440. 0480. 04630. 0320. 0370. 0390. 50. 00. 00. 510. 0280. 0390. 03620. 0410. 0470. 03930. 0300. 0310. 0370. 50. 00. 50. 010. 0250. 0400. 04020. 0460. 0520. 04030. 0320. 0380. 0430. 50. 00. 50. 510. 0240. 0380. 03620. 0410. 0450. 04030. 0310. 0340. 0370. 50. 50. 00. 010. 0180. 0320. 04020. 0490. 0500. 04630. 0190. 0200. 0390. 50. 50. 00. 510. 0190. 0310. 03620. 0450. 0490. 03930. 0150. 0180. 0370. 50. 50. 50. 010. 0190. 0310. 04020. 0500. 0500. 04330. 0140. 0200. 0400. 50. 50. 50. 510. 0220. 0270. 03620. 0460. 0510. 04030. 0160. 0190. 037

Lưu ý rằng αˆ không bao giờ vượt quá 0. 06, và nói chung, nó nhỏ hơn 0. 05. Tuy nhiên, vẫn có chỗ để cải thiện vì trong một số trường hợp, αˆ giảm xuống dưới 0. 020. Điều này xảy ra khi ϵ có phân phối đuôi nặng, như dự kiến ​​dựa trên kết quả trong Chương 45 . Ngoài ra, VP 3, tương ứng với phương sai sai số lớn khi x ở gần tâm phân bố của nó, đóng vai trò. Mặc dù vậy, tất cả các dấu hiệu cho thấy, xét về phạm vi xác suất, phương pháp bootstrap kết hợp với . Also, VP 3, which corresponds to large error variances when x is near the center of its distribution, plays a role. Despite this, all indications are that, in terms of probability coverage, the bootstrap method in conjunction with βˆm (M hồi quy với trọng số Schweppe) hoạt động khá tốt trên . Có vẻ như khi sử dụng các công cụ ước tính mạnh khác, chẳng hạn như Theil–Sen, độ bao phủ xác suất lớn hơn hoặc bằng mức danh nghĩa lại thu được. Với n=30 , có những trường hợp phạm vi xác suất thực tế có thể cao tới 0. 975 khi tính 0. khoảng tin cậy 95. Tức là khi kiểm định giả thuyết hệ số góc bằng nhau, mức thực tế có thể thấp bằng 0. 025 khi kiểm tra ở 0. 05 cấp độ (cf. Luh và Guo, 2000 ).

Đối với việc kiểm tra giả thuyết tổng thể được đưa ra bởi Eq. (11. 12) , một sửa đổi của thống kê kiểm tra F, được đưa ra bởi phương trình. (11. 13) có thể được sử dụng. Chỉ cần thay thế công cụ ước tính HC4 bằng ước tính bootstrap về phương sai và hiệp phương sai giữa các công cụ ước tính đang được sử dụng. Chính xác hơn, đối với nhóm thứ j, hãy tạo mẫu bootstrap bằng cách lấy mẫu ngẫu nhiên bằng cách thay thế nj các vectơ quan sát từ ( . Dựa trên mẫu bootstrap này, biểu thị giao điểm ước tính và độ dốc bằng , yielding (yij⁎,xij1⁎,…,xijp⁎)(i=1,…,nj). Based on this bootstrap sample, denote the estimated intercept and slopes by (b0j⁎,…,bpj⁎) . Lặp lại quá trình này B lần, thu được kết quả (b0jb⁎,…,bpjb⁎) ( b=1,…, . Sử dụng ). Using B=100 dường như là đủ. Sau đó, hiệp phương sai giữa bkj⁎bℓj⁎ được ước tính với

skℓ=1B−1∑b=1B(bkjb⁎−b¯kj)(bℓjb⁎−b¯ℓj),

ở đâu b¯kj=∑bkjb⁎/B . Ma trận hiệp phương sai tương ứng Sj thay thế ước tính HC4 khi tính F và tất nhiên ước tính bình phương nhỏ nhất của hệ số góc và phần chặn được thay thế bằng một số ước tính mạnh. Không giống như phương pháp dựa trên OLS, giá trị tới hạn được điều chỉnh dường như không cần thiết và về mặt kiểm soát xác suất lỗi Loại I, việc loại bỏ các điểm đòn bẩy dường như không phải là vấn đề. Nhưng vì những lý do đã nêu trong Mục 10. 14. 1 , điều quan trọng là phải kiểm tra tác động của việc xóa các điểm đòn bẩy.

Đối với trường hợp đặc biệt khi J=2 các nhóm được so sánh, Moses và Klockars (2012) . Họ phát hiện ra rằng một biến thể của công cụ ước lượng Theil–Sen ( compare several techniques that include the percentile bootstrap method described here, but no results based on the bootstrap estimate of the covariances are reported. They found that a variation of the Theil–Sen estimator (Luh và Guo, 2000 ) hoạt động tốt trong các mô phỏng. Điểm phân tích của biến thể này của công cụ ước tính Theil–Sen là không xác định. Phương pháp này sử dụng một biểu thức rõ ràng của các lỗi tiêu chuẩn thay vì một công cụ ước tính bootstrap và nó dường như hoạt động tốt ngay cả khi có phương sai thay đổi. Họ đã xem xét ba phân phối không bình thường, chỉ một trong số đó bị sai lệch; . 6. Giá trị kurtosis lớn nhất là 2. 86. Kết quả mô phỏng trong Bảng 11. 5 và 11. 6 dựa trên những điểm khác biệt lớn hơn nhiều so với thông thường. Bởi vì các tình huống gặp phải khi độ lệch và độ nhọn ước tính lớn hơn đáng kể so với những gì được xem xét bởi Moses và Klockars, nên sẽ rất thú vị nếu biết liệu phương pháp tiếp cận của họ có tiếp tục hoạt động tốt cho các tình huống được xem xét trong Bảng . 5 và 11. 6 .

Đối với việc thực hiện nhiều so sánh dựa trên chặn, chỉ cần sử dụng phương pháp của Hochberg để kiểm soát xác suất của một hoặc nhiều lỗi Loại I. Điều tương tự cũng có thể được thực hiện khi xử lý bất kỳ độ dốc nào

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780128200988000178

So sánh hai nhóm

Rand Wilcox, trong Giới thiệu về Kiểm định giả thuyết và ước lượng chắc chắn (Ấn bản thứ ba) , 2012

5. 4. 1 So sánh M-Estimators

Phần này nhận xét về trường hợp đặc biệt có mục tiêu là so sánh M-số đo vị trí. Chương 4 lưu ý rằng, dựa trên các mô phỏng được thực hiện cho đến nay, phương pháp tốt nhất để tính toán khoảng tin cậy cho μm , . Khi so sánh M-số đo vị trí tương ứng với hai percentile bootstrap method. When comparing M-measures of location corresponding to two nhóm độc lập, bootstrap phân vị lại là phương pháp tốt nhất dựa trên kết quả hiện tại. Như trong trường hợp một mẫu, có các phương pháp bootstrap chưa được kiểm tra thông qua mô phỏng khi so sánh các phép đo M của vị trí, vì vậy không có ý kiến ​​​​cho rằng tất cả các kỹ thuật bootstrap khác không có giá trị thực tế cho vấn đề hiện tại. Khoảng tin cậy dựa trên ước tính sai số chuẩn sẽ cung cấp phạm vi bao phủ xác suất tốt khi cỡ mẫu đủ lớn, giả sử chênh lệch ước tính có phân phối chuẩn, nhưng không biết cỡ mẫu nên lớn đến mức nào trước khi phương pháp này có thể được khuyến nghị . Nếu cả hai phân phối đều đối xứng, thì khoảng tin cậy dựa trên sai số chuẩn ước tính dường như có giá trị khi phân phối t của Student được sử dụng để xác định giá trị tới hạn phù hợp, nhưng không có quy tắc quyết định tốt, dựa trên dữ liệu thực nghiệm có sẵn, liệu phân phối có đủ đối xứng hay không. (Người ta có thể kiểm tra giả định rằng các bản phân phối là đối xứng, nhưng một phép thử như vậy phải có bao nhiêu công suất để biện minh cho việc sử dụng một phương pháp giả định các bản phân phối đối xứng?) . Khi kích thước mẫu nhỏ, tất cả các dấu hiệu cho thấy bootstrap phần trăm là tốt nhất, vì vậy nên sử dụng phương pháp khác thay thế cho đến khi có bằng chứng rõ ràng.

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780123869838000056

Thiết kế một chiều và cao hơn cho các nhóm độc lập

Rand R. Wilcox, trong Giới thiệu về Kiểm tra giả thuyết và ước tính mạnh mẽ (Ấn bản thứ năm) , 2022

7. 4. 9 phương pháp Bootstrap phần trăm để so sánh trung bình, phương tiện cắt xén khác và lượng tử

Khi mục tiêu là thực hiện nhiều phép so sánh dựa trên các phương tiện được cắt bớt và lượng cắt bớt không quá nhỏ, chẳng hạn như ít nhất 20%, a boottrap phần trăm method appears to be relatively effective. With 15% trimming, and even 10% trimming, a percentile bootstrap performs reasonably well. For the special case, where the goal is to compare medians or other quantiles, and when tied values occur, it is the only known method that performs well in simulations. In terms of controlling the probability of one or more Type I errors, the methods in Section 7. 4. 7 có thể được sử dụng.

Cần lưu ý rằng Johnson và Romer (2016) mô tả một phương pháp thay thế để so sánh lượng phân vị của nhiều nhóm. Phương pháp của họ sử dụng ước tính bootstrap của các lỗi tiêu chuẩn. Vì vậy, nếu các giá trị bị ràng buộc có thể xảy ra, tất cả các dấu hiệu cho thấy phương pháp bootstrap phân vị là thích hợp hơn.

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780128200988000130

So sánh hai nhóm

Rand R. Wilcox, trong Giới thiệu về Kiểm tra giả thuyết và ước tính mạnh mẽ (Ấn bản thứ năm) , 2022

Suy luận về θD

Như đã lưu ý trước đây, θD là trung bình tổng thể của sự khác biệt điển hình giữa một quan sát được lấy mẫu ngẫu nhiên từ nhóm đầu tiên và một quan sát được lấy mẫu ngẫu nhiên . Cho Dik=Xi1−Xk2 , i=1,…,n1 . Ước tính của k=1,…,n2. The estimate of θD chỉ đơn giản là giá trị trung bình của mẫu dựa trên các giá trị Dik. Có thể sử dụng bootstrap phần trăm để tính khoảng tin cậy cho θD . Khoảng tin cậy của Cliff cho P có thể dễ dàng điều chỉnh để tính khoảng tin cậy cho θD cũng như ( Wilcox, 2018c). Briefly, let Pˆ(X1,X2) biểu thị ước tính của P dựa trên các mẫu ngẫu nhiên X1and X2. Let ωℓ là hằng số sao cho Pˆ(X1−ωℓ,X2)=cℓ, where cℓis the lower end of the confidence interval for P given by Eq. (5. 27) . Nghĩa là, dịch chuyển từng giá trị trong nhóm đầu tiên theo ωℓ dẫn đến ước tính P bằng cℓ. In a similar manner, ωu được chọn sao cho Pˆ(X1−ωu,X2)=cu, where cuis the upper end of the confidence interval for P given by Eq. (5. 27) . Gọi dℓ=θˆD(X1−ωℓ,X2) là ước lượng của θDwhen the data in the first group are shifted by ωℓ, and let du=θˆD(X1−ωu,X2). Then

(5. 28)(dℓ,du)

1−α khoảng tin cậy cho θD . Nói chung, phương trình. (5. 28) hoạt động tốt và có vẻ tốt hơn một chút so với bootstrap phần trăm. Tuy nhiên, đối với sự thay đổi lớn về vị trí, dℓ=du có thể xảy ra khi sử dụng phương trình. (5. 28) . Phương pháp bootstrap phân vị tránh được điều này, nhưng dℓdu có thể gần như .

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780128200988000117

Phương pháp Bootstrap

K. Singh, M. Xie, trong Bách khoa toàn thư quốc tế về giáo dục (Ấn bản thứ ba) , 2010

Khoảng tin cậy Bootstrap

Khoảng tin cậy cho tham số tổng thể nhất định θ là phạm vi dựa trên mẫu [ θˆ 1, θˆ . Phạm vi sở hữu thuộc tính θ sẽ nằm trong giới hạn của nó với xác suất cao (được chỉ định). Cái sau được gọi là mức độ tin cậy. Tất nhiên, xác suất này liên quan đến tất cả các mẫu có thể, mỗi mẫu tạo ra một khoảng tin cậy, do đó phụ thuộc vào cơ chế ngẫu nhiên liên quan đến việc vẽ các mẫu. Hai mức tin cậy được sử dụng nhiều nhất là 95% và 99%. Chúng tôi giới hạn bản thân ở mức 95% cho cuộc thảo luận của chúng tôi ở đây. Khoảng tin cậy truyền thống dựa trên kiến ​​thức về phân phối lấy mẫu của 2] given out for the unknown number θ. The range possesses the property that θ would lie within its bounds with a high (specified) probability. The latter is referred to as confidence level. Of course, this probability is with respect to all possible samples, each sample giving rise to a confidence interval which thus depends on the chance mechanism involved in drawing the samples. The two mostly used levels of confidence are 95% and 99%. We limit ourselves to the level 95% for our discussion here. Traditional confidence intervals rely on the knowledge of sampling distribution of θˆ , chính xác hoặc tiệm cận khi n → ∞. Dưới đây là một số thương hiệu tiêu chuẩn của khoảng tin cậy được xây dựng bằng cách sử dụng bootstrap.

Phương pháp phần trăm Bootstrap

Phương pháp này đã được đề cập trong phần giới thiệu, vì tính phổ biến của nó chủ yếu là do tính đơn giản và sức hấp dẫn tự nhiên của nó. Giả sử một người chấp nhận 1000 bản sao bootstrap của θˆ , được biểu thị bằng ( θ1*,θ2*,…,θ1000* . Sau khi xếp hạng từ dưới lên trên, chúng ta hãy biểu thị các giá trị bootstrap này là (). After ranking from bottom to top, let us denote these bootstrap values as (θ1*,θ2*,…,θ1000* ). Khi đó khoảng tin cậy phần trăm bootstrap ở mức độ tin cậy 95% sẽ là [ θ25*,θ975* ]. Chuyển sang các khía cạnh lý thuyết của phương pháp này, cần chỉ ra rằng phương pháp này yêu cầu tính đối xứng của phân phối lấy mẫu của θˆ xung quanh θ. Lý do là phương pháp này xấp xỉ phân phối lấy mẫu của θˆ − θ bằng phân phối bootstrap của θˆθˆB, which is contrary to the bootstrap thinking that the sampling distribution of θˆ− θ could be approximated by the bootstrap distribution of θˆB − θˆ. Interested readers are referred to Hall (1988) .

Phương pháp phần trăm bootstrap tập trung

Giả sử phân phối lấy mẫu của θˆ − θ được xấp xỉ bằng phân phối bootstrap của θˆB − θˆ, which is what the bootstrap prescribes. Denote 100s-th percentile of θˆ B (trong các bản sao bootstrap) bằng Bs. Khi đó, mệnh đề θˆ − θ nằm trong khoảng B0. 025 − θˆ , B0. 975 − θˆ sẽ mang xác suất ≈0. 95. Tuy nhiên, câu lệnh này dễ dàng chuyển thành câu lệnh mà θ nằm trong phạm vi (2 θˆ − B0. 975, 2 θˆ − B0. 025). Phạm vi thứ hai được gọi là khoảng tin cậy phần trăm bootstrap trung tâm (ở mức bao phủ 95%). Xét về 1000 lần sao chép bootstrap B0. 025 = θ(25)* và B0. 975 = θ(975)*.

Phương thức Bootstrap-t

Như đã đề cập trong phần 'Hỗ trợ lý thuyết', khởi động một hàm thống kê có dạng T = ( θˆ − θ)/ . Độ chính xác bổ sung này là do bootstrap gọi là hiệu chỉnh Edgeworth một lần. Người đọc có thể tìm thấy những chi tiết cần thiết trong Hall (1992b). Ví dụ cơ bản của T là thống kê t tiêu chuẩn (từ đó có tên bootstrap-t). t = ( θˆ, brings extra accuracy. This additional accuracy is due to so-called one-term Edgeworth correction by the bootstrap. The reader could find essential details in Hall (1992b). The basic example of T is the standard t-statistics (from which the name bootstrap-t is derived): t = (X― − μ)/s/ n , mà . Bản sao bootstrap của hàm T như vậy là TB = ( θˆ(the sample mean), and s standing for the sample standard deviation. The bootstrap counterpart of such a function T is TB = (θˆB )/SEB trong đó SEB giống hệt SE nhưng được tính toán trên một mẫu bootstrap. Biểu thị phần trăm bootstrap thứ 100 của TB bằng bs và xem xét tuyên bố. T nằm trong [b0. 025, b0. 975]. Sau khi thay thế T = ( θˆ −θ)/SE, câu lệnh trên chuyển thành 'θ nằm trong ( . 975, − SE b0.975, θˆ − SE b0. 025)’. Phạm vi này cho θ được gọi là khoảng tin cậy dựa trên bootstrap-t cho θ ở mức bao phủ 95%. Khoảng thời gian như vậy được biết là đạt được độ chính xác cao hơn so với phương pháp trước đó, được gọi là độ chính xác bậc hai trong tài liệu kỹ thuật.

Chúng tôi kết thúc phần này với nhận xét rằng B. Efron đã đề xuất hiệu chỉnh phương pháp phân vị thô sơ để mang lại độ chính xác cao hơn. Những hiệu chỉnh này được gọi là 'hiệu chỉnh sai lệch' và 'hiệu chỉnh sai lệch tăng tốc' của Efron. Chi tiết có thể được tìm thấy trong Efron và Tibshirani (1993) . bootstrap-t tự động thực hiện các chỉnh sửa như vậy, mặc dù bootstrapper cần tìm kiếm một công thức cho SE, điều này bị tránh trong phương pháp phân vị.

Xem chươngMua sách

Đọc toàn bộ chương

URL. https. //www. sciencedirect. com/khoa học/bài viết/pii/B9780080448947013099

Đánh giá mối quan hệ cấu trúc giữa các bản phân phối - một cách tiếp cận quy trình lượng tử dựa trên khoảng cách Mallows Làm cách nào bạn có thể tính khoảng tin cậy 95% bằng bootstrap?

Đối với 1000 mẫu lại bootstrap của chênh lệch trung bình, người ta có thể sử dụng giá trị thứ 25 và giá trị thứ 975 của chênh lệch được xếp hạng làm ranh giới của khoảng tin cậy 95%. (This captures the central 95% of the distribution.) Such an interval construction is known as a percentile interval.

Làm thế nào để tính toán bootstrap khoảng tin cậy?

Tính toán δ* = x* − x cho mỗi mẫu bootstrap (x là giá trị trung bình của dữ liệu gốc), sắp xếp chúng từ nhỏ nhất đến lớn nhất. Chọn δ. 1 là phân vị thứ 90, δ. 9 là phân vị thứ 10 của danh sách đã sắp xếp của δ*, cung cấp khoảng tin cậy 80% cho [x−δ.

Phần trăm cho giới hạn dưới của khoảng tin cậy 90% là gì?

Đối với mức độ tin cậy thấp hơn hoặc cao hơn 95%, phần trăm được sử dụng trong phép tính phải được thay đổi cho phù hợp. Ví dụ: đối với khoảng thời gian 90% (i. e. , với 5% ở mỗi đuôi), phân vị thứ 95 sẽ là cần thiết, trong khi đối với khoảng 99% (i. e. , với 0. 5% ở mỗi đuôi), 99. phần trăm thứ 5 sẽ là cần thiết.

Tại sao nên sử dụng phương pháp phần trăm bootstrap?

Phân phối ước tính bootstrap đó là ước tính dựa trên dữ liệu về phân phối lấy mẫu của trung vị mẫu . Tương tự, chúng ta có thể sử dụng lấy mẫu lại để ước tính phân phối lấy mẫu của bất kỳ số liệu thống kê nào mà không yêu cầu bất kỳ công thức phân tích nào. Đây là điểm hấp dẫn chính của bootstrap.