Khoảng tin cậy bootstrap là gì?

Những người cung cấp nội tạng để hiến tặng đôi khi tìm kiếm sự giúp đỡ của một chuyên gia tư vấn y tế đặc biệt. Các chuyên gia tư vấn này hỗ trợ bệnh nhân trong tất cả các khía cạnh của cuộc phẫu thuật, với mục tiêu giảm khả năng xảy ra các biến chứng trong quá trình phẫu thuật và phục hồi. Bệnh nhân có thể chọn chuyên gia tư vấn một phần dựa trên tỷ lệ biến chứng trước đây của khách hàng của chuyên gia tư vấn

Trong nghiên cứu tình huống về chuyên gia tư vấn y tế, tham số là \(p,\) xác suất xảy ra biến chứng thực sự đối với khách hàng của chuyên gia tư vấn y tế. Không có lý do gì để tin rằng \(p\) chính xác là \(\hat{p} = 3/62,\) nhưng cũng không có lý do gì để tin rằng \(p\) khác xa \(\hat . \) Bằng cách lấy mẫu có thay thế từ tập dữ liệu (một quy trình được gọi là bootstrapping), tính biến thiên của các giá trị \(\hat{p}\) có thể được tính gần đúng

Hầu hết các quy trình suy luận được đề cập trong văn bản này đều dựa trên cơ sở định lượng một bộ dữ liệu sẽ khác với bộ dữ liệu khác như thế nào khi cả hai đều được lấy từ cùng một quần thể. Việc lấy các mẫu lặp đi lặp lại từ cùng một quần thể là vô nghĩa bởi vì nếu bạn có đủ phương tiện để lấy nhiều mẫu hơn, cỡ mẫu lớn hơn sẽ có lợi cho bạn hơn là đánh giá riêng rẽ hai mẫu có cùng kích thước chính xác. Thay vào đó, chúng tôi đo lường cách các mẫu hoạt động theo ước tính của dân số

Hình 7. 1 cho thấy cách ước tính dân số ban đầu chưa biết bằng cách sử dụng mẫu để tính gần đúng tỷ lệ thành công và thất bại (trong trường hợp của chúng tôi, tỷ lệ biến chứng và không biến chứng đối với nhà tư vấn y tế)

Khoảng tin cậy bootstrap là gì?

Hình 7. 1. Dân số chưa biết được ước tính bằng cách sử dụng dữ liệu mẫu được quan sát. Lưu ý rằng chúng ta có thể sử dụng mẫu để tạo dân số ước tính hoặc khởi động để lấy mẫu. Số liệu quan sát được gồm 3 viên bi đỏ và 4 viên bi trắng nên ước lượng quần thể chứa 3/7 viên bi đỏ và 4/7 viên bi trắng

Bằng cách lấy mẫu lặp đi lặp lại từ dân số ước tính, có thể quan sát thấy sự thay đổi từ mẫu này sang mẫu khác. Trong Hình 7. 2 các mẫu bootstrap lặp lại rõ ràng là khác nhau và khác với quần thể ban đầu. Hãy nhớ lại rằng các mẫu bootstrap được lấy từ cùng một quần thể (ước tính) và do đó, sự khác biệt hoàn toàn là do sự biến đổi tự nhiên trong quy trình lấy mẫu

Khoảng tin cậy bootstrap là gì?

Hình 7. 2. Lấy mẫu Bootstrap cung cấp thước đo độ biến thiên của mẫu đối với mẫu. Lưu ý rằng chúng tôi đang lấy mẫu từ dân số ước tính được tạo từ dữ liệu được quan sát

Bằng cách tóm tắt từng mẫu bootstrap (ở đây, sử dụng tỷ lệ mẫu), chúng tôi thấy trực tiếp sự thay đổi của tỷ lệ mẫu, \(\hat{p},\) từ mẫu này sang mẫu khác. Phân phối của \(\hat{p}_{boot}\) cho kịch bản ví dụ được hiển thị trong Hình 7. 3 và phân phối bootstrap đầy đủ cho dữ liệu tư vấn y tế được hiển thị trong Hình 7. 6

Khoảng tin cậy bootstrap là gì?

Hình 7. 3. Tỷ lệ bootstrap được ước tính cho từng mẫu bootstrap. Kết quả phân phối bootstrap (dotplot) cung cấp thước đo về tỷ lệ thay đổi như thế nào từ mẫu này sang mẫu khác

Hóa ra trong thực tế, máy tính rất khó hoạt động với dân số vô hạn (với tỷ lệ phân chia giống như trong mẫu). Tuy nhiên, có một phương pháp vật lý và tính toán tạo ra phân phối bootstrap tương đương của tỷ lệ mẫu theo cách tính toán hiệu quả

Coi dữ liệu quan sát được là một túi bi có 3 viên thành công (màu đỏ) và 4 viên không đạt (màu trắng). Bằng cách lấy các viên bi ra khỏi túi cùng với sự thay thế, chúng tôi mô tả chính xác quy trình lấy mẫu giống như đã được thực hiện với dân số ước tính vô cùng lớn

Khoảng tin cậy bootstrap là gì?

Hình 7. 4. Việc lấy lại các mẫu lặp đi lặp lại từ dữ liệu mẫu cũng giống như quá trình tạo ra một ước tính lớn vô hạn về dân số. Việc lấy mẫu lại trực tiếp từ mẫu sẽ khả thi hơn về mặt tính toán. Lưu ý rằng việc lấy mẫu lại hiện được thực hiện với sự thay thế (nghĩa là mẫu ban đầu không bao giờ thay đổi) để mẫu ban đầu và dân số giả định ước tính là tương đương

Khoảng tin cậy bootstrap là gì?

Hình 7. 5. So sánh quá trình lấy mẫu từ dân số vô hạn ước tính và lấy mẫu lại bằng thay thế từ mẫu ban đầu. Lưu ý rằng biểu đồ chấm của tỷ lệ khởi động giống nhau vì quá trình ước tính số liệu thống kê là tương đương

Nếu chúng tôi áp dụng quy trình lấy mẫu bootstrap cho ví dụ về nhà tư vấn y tế, chúng tôi coi mỗi khách hàng là một trong những viên bi trong túi. Sẽ có 59 viên bi trắng (không biến) và 3 viên bi đỏ (có biến). Nếu chúng ta chọn 62 viên bi ra khỏi túi (mỗi lần một viên thay thế) và tính toán tỷ lệ bệnh nhân mô phỏng bị biến chứng, \(\hat{p}_{boot},\) thì tỷ lệ “bootstrap” này đại diện cho một

Trong một mô phỏng của 62 bệnh nhân, chúng tôi dự kiến ​​sẽ có bao nhiêu người bị biến chứng?

Một mô phỏng không đủ để hiểu được sự thay đổi từ tỷ lệ bootstrap này sang tỷ lệ bootstrap khác, vì vậy chúng tôi lặp lại mô phỏng 10.000 lần bằng máy tính

Hình 7. 6 cho thấy phân phối từ 10.000 mô phỏng bootstrap. Tỷ lệ bootstrapped thay đổi từ khoảng 0 đến 11. 3%. Sự thay đổi trong tỷ lệ bootstrapped khiến chúng tôi tin rằng xác suất phức tạp thực sự (tham số, \(p\)) có khả năng rơi vào khoảng từ 0 đến 11. 3%, vì những con số này chiếm 95% giá trị được lấy mẫu lại của bootstrap

Phạm vi của các giá trị cho tỷ lệ thực được gọi là khoảng tin cậy phần trăm bootstrap và chúng ta sẽ gặp lại nó trong một vài phần và chương tiếp theo

Khoảng tin cậy bootstrap là gì?

Hình 7. 6. Dữ liệu tư vấn y tế ban đầu được khởi động 10.000 lần. Mỗi mô phỏng tạo một mẫu từ dữ liệu gốc trong đó xác suất xảy ra biến chứng là \(\hat{p} = 3/62. \) Bootstrap 2. Tỷ lệ phần trăm 5 là 0 và 97. 5 phần trăm là 0. 113. Kết quả là. chúng tôi tin tưởng rằng, trong dân số, xác suất thực sự của một biến chứng là từ 0% đến 11. 3%

Tuyên bố ban đầu là tỷ lệ biến chứng thực sự của chuyên gia tư vấn thấp hơn tỷ lệ quốc gia là 10%. Ước tính khoảng từ 0 đến 11. 3% cho xác suất biến chứng thật chứng tỏ bác sĩ tư vấn phẫu thuật có tỷ lệ biến chứng thấp hơn trung bình cả nước?


Không. Vì khoảng thời gian trùng lặp 10%, nên có thể công việc của chuyên gia tư vấn có nguy cơ biến chứng thấp hơn hoặc có thể công việc của chuyên gia tư vấn có rủi ro cao hơn (i. e. , lớn hơn 10%) biến chứng. Ngoài ra, như đã đề cập trước đây, vì đây là nghiên cứu quan sát nên ngay cả khi có thể đo lường được mối liên quan, không có bằng chứng nào cho thấy công việc của chuyên gia tư vấn là nguyên nhân dẫn đến tỷ lệ biến chứng (cao hơn hoặc thấp hơn)

Khoảng tin cậy bootstrap có nghĩa là gì?

tạo nhiều mẫu lại (có thay thế) từ một tập hợp các quan sát và tính toán mức độ ảnh hưởng quan tâm trên mỗi mẫu lại này . Sau đó, các mẫu khởi động lại của kích thước hiệu ứng có thể được sử dụng để xác định 95% CI. Với máy tính, chúng ta có thể thực hiện 5000 mẫu lại rất dễ dàng.

bootstrap có ý nghĩa gì trong thống kê?

Phương pháp bootstrap là kỹ thuật thống kê để ước tính số lượng về tổng thể bằng cách lấy trung bình các ước tính từ nhiều mẫu dữ liệu nhỏ . Điều quan trọng là các mẫu được xây dựng bằng cách vẽ các quan sát từ một mẫu dữ liệu lớn tại một thời điểm và đưa chúng trở lại mẫu dữ liệu sau khi chúng được chọn.

Mục đích chính của bootstrapping là gì?

Bootstrapping là một quy trình thống kê lấy mẫu lại một tập dữ liệu để tạo nhiều mẫu mô phỏng . Quá trình này cho phép bạn tính toán các lỗi tiêu chuẩn, xây dựng khoảng tin cậy và thực hiện kiểm tra giả thuyết cho nhiều loại thống kê mẫu.

Bootstrapping trong thuật ngữ đơn giản là gì?

Khởi động là một thuật ngữ được sử dụng trong kinh doanh để chỉ quá trình chỉ sử dụng các nguồn lực hiện có, chẳng hạn như tiền tiết kiệm cá nhân, thiết bị máy tính cá nhân và không gian nhà để xe, để bắt đầu và phát triển một doanh nghiệp. . .