Điều gì làm cho một mẫu trở thành mẫu bootstrap?

Trong phần hướng dẫn này, bạn sẽ đi vào chi tiết cách thực hiện lấy mẫu bootstrap. Tôi sẽ chỉ cho bạn ý tưởng chính và ví dụ số thực tế của phương pháp bootstrap. Tôi cũng cung cấp cho bạn chi tiết "lập trình" để bạn thực hiện lấy mẫu bootstrap trong bảng tính như MS Excel

Ý tưởng chính của lấy mẫu bootstrap

Như đã đề cập trước đó trong hướng dẫn này, lấy mẫu bootstrap là lấy mẫu thay thế. Làm thế nào để làm điều đó? . Bạn dán nhãn quan sát của mình vào 5 quả bóng với tên

A, B, C, D, E

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

Đặt tất cả 5 quả bóng vào một cái rổ. Sau đó, từ 5 bi này, bạn rút ngẫu nhiên 1 bi và ghi tên. Sau khi bạn ghi lại nó, hãy đặt lại quả bóng này vào rổ. Đảm bảo rằng bạn trả lại bóng vào rổ trước khi thực hiện một lần rút ngẫu nhiên khác. Đây là lấy mẫu với sự thay thế

Lặp lại công việc bốc ngẫu nhiên một quả bóng khác, ghi nhãn và đặt lại quả bóng vào rổ cho đến hàng nghìn lần. Các nhãn được ghi lại được gọi là lấy mẫu bootstrap. Bạn có ý tưởng. Khá đơn giản phải không?

Hồ sơ của bạn có thể trông như thế này

, D, E, E, A, B, C, B, A, E, v.v.

Lưu ý rằng vì bạn vẽ bằng thay thế, việc lấy mẫu bootstrap sẽ lặp đi lặp lại nhiều lần. Đây là thuộc tính của lấy mẫu Bootstrap

Tại sao tôi cần lấy mẫu Bootstrap?

Nếu ý tưởng lấy mẫu bootstrap quá đơn giản thì tại sao chúng ta cần thực hiện lấy mẫu bootstrap?

Từ một mẫu, bạn chỉ có thể nhận được một thống kê, ví dụ như ý nghĩa. Bạn không biết khoảng tin cậy của giá trị trung bình này hoặc phân phối của giá trị trung bình này. Mẫu Bootstrap cung cấp thêm chi tiết về phân phối của giá trị trung bình này hoặc xác suất của giá trị trung bình này. Ví dụ trong MS excel dưới đây sẽ giúp bạn hiểu rõ hơn về ứng dụng

Làm thế nào để làm điều đó trong MS Excel? . Tệp Excel không chứa macro, chỉ có bảng tính thuần túy

Tải xuống ví dụ trang tính đi kèm với hướng dẫn này tại đây

Giả sử chúng tôi có 30 dữ liệu của mẫu ban đầu mà chúng tôi lấy từ một quan sát hoặc thí nghiệm hoặc khảo sát bằng câu hỏi. Chúng tôi đặt dữ liệu này trong một số hàng để chúng tôi có thể nhìn thấy chúng

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

1. Chọn vùng của mẫu ban đầu và sử dụng menu Chèn > Tên > Xác định và nhập "sample" vào mẫu ban đầu và nhấp vào nút OK

2. Trong bất kỳ ô nào khác bên dưới mẫu ban đầu này, giả sử ô B10, nhập

=INDEX(Mẫu,ROWS(Mẫu)* RAND ()+1,COLUMNS(Mẫu)* RAND ()+1)

Từ 'sample' trong công thức trên có nghĩa là tên (Menu. Chèn-Tên-Xác định) như được chỉ định trong bước 1 ở trên. Đây là lấy một mẫu ngẫu nhiên từ mẫu ban đầu (lấy mẫu lại) có thay thế. Nó chỉ đơn giản sử dụng hàm Index để định vị hàng ngẫu nhiên và cột ngẫu nhiên làm mẫu mới trong phạm vi vị trí của mẫu ban đầu. Chúng tôi đã tạo mẫu bootstrap đầu tiên

3. Sao chép ô B10 sang B10. K210 (hoặc nhiều như bạn muốn). Điều này là để tạo ra càng nhiều mẫu bootstrap. Chúng ta hãy coi mỗi hàng là một mẫu đơn (để đơn giản, chúng tôi chỉ tạo một mẫu chỉ bao gồm 10 dữ liệu) và chúng tôi đã tạo 201 mẫu

4. Bước tiếp theo là tính toán số liệu thống kê bootstrap. Bạn có thể lấy bất kỳ số liệu thống kê nào và ví dụ ở đây, chúng tôi chỉ sử dụng giá trị trung bình, trung vị, phạm vi giữa các phần tư và độ lệch chuẩn

= TRUNG BÌNH(B10. K10) để tính giá trị trung bình của một mẫu

=TRUNG BÌNH(B10. K10) để tính trung bình

=QUARTILE(B10. K10,3)-QUARTILE(B10. K10,1) để tính dải tứ phân vị

=STDEV(B10. K10) để tính độ lệch chuẩn

5. Sao chép số liệu thống kê bootstrap ở trên vào tất cả các hàng mẫu bootstrap (i. e. M10. P210)

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

Bạn có thể sử dụng F9 để lấy mẫu ngẫu nhiên mới. F9 là ký hiệu của hàm F9 được MS excel sử dụng để tính toán lại phép lặp

Bootstrap Khoảng tin cậy

Để có được khoảng tin cậy của số liệu thống kê bootstrap, chúng ta có thể sắp xếp số liệu thống kê và sử dụng công thức này

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

Sử dụng MS Excel, chúng ta có thể sử dụng hàm SMALL của excel để sắp xếp và lấy giá trị

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

Hãy nhớ rằng phân phối lấy mẫu không nhất thiết phải là phân phối Chuẩn. Bạn không thể sử dụng vì phân phối không xác định. Chỉ khi dữ liệu của bạn đến từ phân phối Chuẩn, kết quả của hai công thức sẽ gần giống nhau

Biểu đồ phân phối tần suất

Nếu bạn muốn xem biểu đồ, chúng tôi có thể tạo bin và tính toán tần suất của số liệu thống kê bootstrap. Ví dụ: bạn quan tâm đến phân phối trung bình. Vì các giá trị mẫu nằm trong khoảng từ 0 đến 100, nên chúng tôi có thể tạo 10 thùng

Giả sử chúng ta tạo các giá trị bin trong ô R10. R19 và số liệu thống kê bootstrap về giá trị trung bình nằm trong phạm vi của M10. M210

  1. Loại =Tần số(M10. M21,R10. R19) trong ô S10
  2. Trong khi con trỏ vẫn ở trong ô S10, hãy chọn vùng S10. S19 bằng cách tô sáng nó bằng chuột
  3. Nhấn F2, bạn sẽ thấy chính xác như hình bên dưới

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

4. Nhấn cùng lúc CTRL-SHIFT và ENTER và bạn sẽ nhận được tất cả tần suất của thùng

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

5. Bây giờ bạn có thể cộng tổng vào tần suất và tính toán xác suất tương đối, sau đó vẽ biểu đồ thùng và xác suất

Điều gì làm cho một mẫu trở thành mẫu bootstrap?

Tôi hy vọng bạn có thể thấy điểm ở đây. Chỉ trong mẫu của bạn, bạn có thể ước tính số liệu thống kê. Ví dụ, ở đây, ước lượng thống kê là trung bình mẫu. Sử dụng lấy mẫu bootstrap, bạn có thể làm được nhiều hơn các công cụ ước tính thống kê của mình. Giờ đây, bạn có thể nhận được cả phân phối của công cụ ước tính và số liệu thống kê (chẳng hạn như khoảng tin cậy, phương sai) của công cụ ước tính của bạn

Trái ngược với mô phỏng Monte Carlo mà bạn cần biết phân bố dân số, trong lấy mẫu Bootstrap, bạn cũng tạo dữ liệu của riêng mình (dựa trên quan sát) mà không cần biết phân bố dân số. Tất cả những gì bạn cần biết là mẫu của bạn. Sử dụng ý tưởng lấy mẫu có thay thế rất đơn giản, chúng tôi có thể tạo ra kết quả mạnh mẽ. Khá tuyệt vời, phải không?

Điều gì tạo nên một mẫu bootstrap?

Trong thống kê, Lấy mẫu Bootstrap là một phương pháp bao gồm việc vẽ lặp lại dữ liệu mẫu cùng với thay thế từ nguồn dữ liệu để ước tính tham số tổng thể .

Tại sao nó được gọi là mẫu bootstrap?

Cái tên “bootstrapping” xuất phát từ cụm từ “To lift yourself by his bootstraps. ” Cụm từ này ám chỉ điều phi lý và không thể.

Khi nào sử dụng lấy mẫu Bootstrap?

Khi kích thước mẫu không đủ để suy luận thống kê đơn giản. Nếu phân phối cơ bản là nổi tiếng, bootstrapping cung cấp một cách để giải thích cho các biến dạng gây ra bởi mẫu cụ thể có thể không đại diện đầy đủ cho dân số

Kích thước mẫu cho bootstrapping là gì?

Trong các trường hợp thông thường, cỡ mẫu nhỏ hơn 40 không thể được xử lý bằng cách giả sử phân phối chuẩn hoặc phân phối t. Các kỹ thuật Bootstrap hoạt động khá tốt với các mẫu có ít hơn 40 phần tử. Lý do cho điều này là bootstrapping liên quan đến việc lấy mẫu lại