Lấy mẫu có hệ thống trong Python

Lấy mẫu có hệ thống là phương pháp lấy mẫu xác suất trong đó mẫu được chọn từ dân số mục tiêu bằng cách chọn điểm bắt đầu ngẫu nhiên và chọn các thành viên khác sau một 'khoảng thời gian lấy mẫu' cố định. Khoảng thời gian lấy mẫu này được tính bằng cách chia kích thước tổng thể cho kích thước mẫu mong muốn

Ví dụ

Một tổ chức phi chính phủ địa phương đang tìm cách tạo một mẫu có hệ thống gồm 500 tình nguyện viên từ dân số 5000 người, họ có thể chọn mọi người thứ 10 [5000/500 = 10] trong dân số để tạo thành một khoảng thời gian lấy mẫu một cách có hệ thống

Lấy mẫu có hệ thống tiêu tốn ít thời gian nhất vì nó yêu cầu lựa chọn cỡ mẫu và xác định điểm bắt đầu cho mẫu này cần được tiếp tục đều đặn để tạo thành một mẫu

Các bước để hình thành một mẫu có hệ thống

Đối tượng cấu trúc xác định [dân số] để bắt đầu làm việc trên khía cạnh lấy mẫu

Tìm ra kích thước lý tưởng của mẫu [thích kích thước lớn hơn để đạt được kết quả chính xác]

Đối với mỗi thành viên của mẫu, phải được gán một số

Tính khoảng thời gian lấy mẫu [cỡ dân số/cỡ mẫu]

Một số sẽ được chọn ngẫu nhiên làm phần tử bắt đầu [r] của mẫu trong khoảng từ 1 đến [N/n] và khoảng này sẽ được thêm vào số ngẫu nhiên để tiếp tục thêm các phần tử vào mẫu. r, r+i, r+2i, v.v. sẽ là các phần tử của mẫu

Các loại lấy mẫu hệ thống

Lấy mẫu hệ thống tuyến tính

Một phương pháp lấy mẫu có hệ thống trong đó các mẫu không được lặp lại ở cuối và 'n' đơn vị được chọn là một phần của mẫu có 'N' đơn vị dân số. Nó dừng lại ở phần cuối của một quần thể

Lấy mẫu hệ thống tuần hoàn

Trong lấy mẫu hệ thống tuần hoàn, một mẫu bắt đầu lại từ cùng một điểm một lần nữa sau khi kết thúc, tương tự như lấy mẫu hệ thống tuyến tính nhưng có sự lặp lại. Ví dụ: nếu N = 7 và n = 2, k=3. 5 có tên là a, b, c, d, e. Có hai cách có thể để hình thành mẫu

  1. Nếu chúng ta coi k=3, các mẫu sẽ là – ad, be, ca, db và ec
  2. Nếu chúng ta coi k=4, các mẫu sẽ là – ae, ba, cb, dc và ed
Lấy mẫu hệ thống tuyến tínhLấy mẫu hệ thống tuần hoàn mẫu = k [khoảng thời gian lấy mẫu] mẫu = N [tổng dân số] Điểm bắt đầu và điểm kết thúc của mẫu này khác nhau. Lặp lại từ điểm bắt đầu sau khi xem xét toàn bộ tổng thể. Sắp xếp một cách tuyến tính trước khi lựa chọn. Bố trí theo hình tròn

Thuận lợi

Đơn giản và thuận tiện để các nhà nghiên cứu tạo, tiến hành và phân tích mẫu

Có lợi trong trường hợp dân số đa dạng vì mẫu được phân phối đồng đều

Nhược điểm

Khó khăn khi không ước tính được quy mô dân số

Dữ liệu bị sai lệch nếu mẫu được lấy từ một nhóm đã có mẫu

Đôi khi, ngay cả một sự sắp xếp tiêu chuẩn [thứ tự/mẫu] có thể không rõ ràng hoặc dễ nhìn thấy, dẫn đến sai lệch lấy mẫu

Lấy mẫu có hệ thống là một loại phương pháp lấy mẫu xác suất trong đó các thành viên mẫu từ một tổng thể lớn hơn được chọn theo một điểm bắt đầu ngẫu nhiên nhưng với một khoảng thời gian cố định, định kỳ. Khoảng thời gian này, được gọi là khoảng thời gian lấy mẫu, được tính bằng cách chia quy mô tổng thể cho quy mô mẫu mong muốn. Mặc dù dân số mẫu được chọn trước, lấy mẫu hệ thống vẫn được coi là ngẫu nhiên nếu khoảng thời gian định kỳ được xác định trước và điểm bắt đầu là ngẫu nhiên

Khi được thực hiện chính xác trên một nhóm lớn có quy mô xác định, việc lấy mẫu có hệ thống có thể giúp các nhà nghiên cứu, bao gồm cả các chuyên gia tiếp thị và bán hàng, có được những phát hiện mang tính đại diện về một nhóm người khổng lồ mà không cần phải tiếp cận với từng người trong số họ

Chìa khóa rút ra

  • Lấy mẫu có hệ thống là một phương pháp lấy mẫu xác suất trong đó một mẫu ngẫu nhiên, với khoảng thời gian định kỳ cố định, được chọn từ một tổng thể lớn hơn
  • Khoảng thời gian định kỳ cố định, được gọi là khoảng thời gian lấy mẫu, được tính bằng cách chia kích thước dân số cho kích thước mẫu mong muốn
  • Ưu điểm của phương pháp này bao gồm loại bỏ hiện tượng lựa chọn theo cụm và xác suất làm nhiễm bẩn dữ liệu thấp
  • Nhược điểm bao gồm trình bày quá mức hoặc trình bày quá mức các mẫu cụ thể và rủi ro thao túng dữ liệu cao hơn
  • Có ba loại mẫu hệ thống chính. Mẫu hệ thống ngẫu nhiên, mẫu hệ thống tuyến tính và mẫu hệ thống vòng tròn

1. 29

Lấy mẫu hệ thống

Hiểu lấy mẫu có hệ thống

Vì lấy mẫu ngẫu nhiên đơn giản của dân số có thể không hiệu quả và tốn thời gian, các nhà thống kê chuyển sang các phương pháp khác, chẳng hạn như lấy mẫu có hệ thống. Chọn cỡ mẫu thông qua cách tiếp cận có hệ thống có thể được thực hiện nhanh chóng. Khi một điểm bắt đầu cố định đã được xác định, một khoảng thời gian cố định sẽ được chọn để tạo điều kiện thuận lợi cho việc lựa chọn người tham gia

Lấy mẫu hệ thống thích hợp hơn lấy mẫu ngẫu nhiên đơn giản khi có rủi ro thao túng dữ liệu thấp. Nếu rủi ro như vậy cao khi nhà nghiên cứu có thể thao túng độ dài khoảng thời gian để thu được kết quả mong muốn, thì kỹ thuật lấy mẫu ngẫu nhiên đơn giản sẽ phù hợp hơn

Lấy mẫu có hệ thống phổ biến với các nhà nghiên cứu và nhà phân tích vì tính đơn giản của nó. Các nhà nghiên cứu thường cho rằng kết quả đại diện cho hầu hết các nhóm dân số bình thường trừ khi một đặc điểm ngẫu nhiên tồn tại một cách không cân xứng với mọi mẫu dữ liệu thứ n [điều này khó xảy ra]. Nói cách khác, một quần thể cần thể hiện mức độ ngẫu nhiên tự nhiên cùng với số liệu đã chọn. Nếu dân số có một kiểu mẫu tiêu chuẩn hóa, thì nguy cơ vô tình chọn các trường hợp rất phổ biến sẽ rõ ràng hơn

Trong lấy mẫu có hệ thống, cũng như với các phương pháp lấy mẫu khác, dân số mục tiêu phải được chọn trước khi chọn người tham gia. Một dân số có thể được xác định dựa trên bất kỳ số lượng đặc điểm mong muốn nào phù hợp với mục đích nghiên cứu đang được tiến hành. Một số tiêu chí lựa chọn có thể bao gồm tuổi tác, giới tính, chủng tộc, địa điểm, trình độ học vấn hoặc nghề nghiệp

Có một số phương pháp lấy mẫu dân số để suy luận thống kê. Lấy mẫu hệ thống là một hình thức lấy mẫu ngẫu nhiên

Các bước để tạo một mẫu có hệ thống

Bạn có thể sử dụng các bước sau để tạo mẫu có hệ thống

  1. Xác định dân số của bạn. Đây là nhóm mà bạn đang lấy mẫu
  2. Giải quyết trên một kích thước mẫu. Bạn muốn/cần lấy mẫu bao nhiêu đối tượng từ dân số để có ý tưởng phản ánh về nó?
  3. Chỉ định mỗi thành viên của dân số một số. Nếu nhóm bạn đang xem bao gồm, chẳng hạn như 10.000 người, hãy bắt đầu xếp họ thành hàng và cho họ số
  4. Quyết định khoảng thời gian lấy mẫu. Điều này có thể đạt được bằng cách chia cỡ dân số cho cỡ mẫu mong muốn
  5. Chọn một điểm bắt đầu. Điều này có thể được thực hiện bằng cách chọn một số ngẫu nhiên
  6. Xác định các thành viên của mẫu của bạn. Nếu bạn có điểm bắt đầu là 15 và khoảng thời gian mẫu là 100, phần tử đầu tiên của mẫu sẽ là 115, v.v.

Ví dụ về lấy mẫu có hệ thống

Là một ví dụ giả thuyết về lấy mẫu có hệ thống, giả sử rằng, trong dân số 10.000 người, một nhà thống kê chọn người thứ 100 để lấy mẫu. Các khoảng thời gian lấy mẫu cũng có thể có hệ thống, chẳng hạn như chọn một mẫu mới để lấy sau mỗi 12 giờ

Một ví dụ khác, nếu bạn muốn chọn một nhóm ngẫu nhiên gồm 1.000 người trong tổng số 50.000 người bằng cách sử dụng lấy mẫu có hệ thống, tất cả những người tham gia tiềm năng phải được đưa vào danh sách và điểm xuất phát sẽ được chọn. Sau khi danh sách được hình thành, mọi người thứ 50 trong danh sách [bắt đầu đếm tại điểm bắt đầu đã chọn] sẽ được chọn làm người tham gia, vì 50.000 ÷ 1.000 = 50

Ví dụ: nếu điểm bắt đầu được chọn là 20, thì người thứ 70 trong danh sách sẽ được chọn, tiếp theo là người thứ 120, v.v. Khi đã đến cuối danh sách và nếu cần thêm người tham gia, số đếm sẽ lặp lại ở đầu danh sách để kết thúc số đếm

Để tiến hành lấy mẫu có hệ thống, trước tiên các nhà nghiên cứu phải biết quy mô của dân số mục tiêu

Các loại lấy mẫu hệ thống

Nói chung, có ba cách để tạo ra một mẫu có hệ thống

  • lấy mẫu ngẫu nhiên có hệ thống. Hình thức lấy mẫu có hệ thống cổ điển trong đó đối tượng được chọn theo khoảng thời gian định trước
  • Lấy mẫu hệ thống tuyến tính. Thay vì chọn ngẫu nhiên khoảng thời gian lấy mẫu, mẫu bỏ qua được tạo theo đường dẫn tuyến tính
  • Lấy mẫu hệ thống tuần hoàn. Một mẫu bắt đầu lại tại cùng một điểm sau khi kết thúc

Lấy mẫu có hệ thống vs. Lấy mẫu cụm

Lấy mẫu theo hệ thống và lấy mẫu theo cụm khác nhau ở cách chúng lấy các điểm mẫu từ tổng thể có trong mẫu. Lấy mẫu cụm chia dân số thành các cụm, trong khi lấy mẫu hệ thống sử dụng các khoảng thời gian cố định từ dân số lớn hơn để tạo mẫu

Lấy mẫu có hệ thống chọn một điểm bắt đầu ngẫu nhiên từ dân số, sau đó một mẫu được lấy từ các khoảng cố định đều đặn của dân số tùy thuộc vào quy mô của nó. Lấy mẫu cụm chia dân số thành các cụm và sau đó lấy một mẫu ngẫu nhiên đơn giản từ mỗi cụm

Lấy mẫu theo cụm được coi là kém chính xác hơn các phương pháp lấy mẫu khác. Tuy nhiên, nó có thể tiết kiệm chi phí lấy mẫu. Lấy mẫu cụm là quy trình lấy mẫu hai bước. Nó có thể được sử dụng khi khó hoàn thành danh sách toàn bộ dân số. Ví dụ: có thể khó thu thập toàn bộ khách hàng của một cửa hàng tạp hóa để phỏng vấn.

Tuy nhiên, một người có thể tạo một tập hợp con ngẫu nhiên các cửa hàng, đây là bước đầu tiên trong quy trình. Bước thứ hai là phỏng vấn một mẫu khách hàng ngẫu nhiên của các cửa hàng đó. Đây là một quy trình thủ công, đơn giản có thể tiết kiệm thời gian và tiền bạc

Hạn chế của lấy mẫu có hệ thống

Một rủi ro mà các nhà thống kê phải xem xét khi tiến hành lấy mẫu có hệ thống liên quan đến cách tổ chức danh sách được sử dụng với khoảng thời gian lấy mẫu. Nếu dân số được đặt trong danh sách được tổ chức theo mô hình chu kỳ phù hợp với khoảng thời gian lấy mẫu, thì mẫu được chọn có thể bị sai lệch

Ví dụ: bộ phận nhân sự của một công ty muốn chọn một mẫu nhân viên và hỏi họ cảm thấy thế nào về các chính sách của công ty. Nhân viên được chia thành các nhóm gồm 20 người, với mỗi nhóm do một người quản lý đứng đầu. Nếu danh sách được sử dụng để chọn cỡ mẫu được tổ chức với các nhóm được nhóm lại với nhau, thì nhà thống kê có nguy cơ chỉ chọn người quản lý [hoặc không có người quản lý nào] tùy thuộc vào khoảng thời gian lấy mẫu

Ưu điểm của lấy mẫu hệ thống là gì?

Lấy mẫu có hệ thống rất dễ tiến hành và dễ hiểu, đó là lý do tại sao nó thường được các nhà nghiên cứu ưa chuộng. Giả định trung tâm, rằng các kết quả đại diện cho phần lớn dân số bình thường, đảm bảo rằng toàn bộ dân số được lấy mẫu đồng đều

Ngoài ra, lấy mẫu có hệ thống cung cấp mức độ kiểm soát cao hơn so với các phương pháp lấy mẫu khác do quy trình của nó. Lấy mẫu có hệ thống cũng mang yếu tố rủi ro thấp vì ít có khả năng dữ liệu bị nhiễm bẩn

Nhược điểm của lấy mẫu hệ thống là gì?

Nhược điểm chính của lấy mẫu hệ thống là quy mô của dân số là cần thiết. Không biết số lượng người tham gia cụ thể trong dân số, lấy mẫu hệ thống không hoạt động tốt. Ví dụ: nếu một nhà thống kê muốn kiểm tra độ tuổi của những người vô gia cư ở một khu vực cụ thể nhưng không thể biết chính xác có bao nhiêu người vô gia cư ở đó, thì họ sẽ không có quy mô dân số hoặc điểm xuất phát. Một bất lợi khác là dân số cần thể hiện mức độ ngẫu nhiên tự nhiên đối với nó, nếu không, rủi ro chọn các trường hợp tương tự sẽ tăng lên, làm mất mục đích của mẫu

Lấy mẫu cụm và lấy mẫu hệ thống khác nhau như thế nào?

Lấy mẫu theo cụm và lấy mẫu theo hệ thống khác nhau ở cách chúng lấy các điểm lấy mẫu từ tổng thể có trong mẫu. Lấy mẫu cụm chia dân số thành các cụm và sau đó lấy một mẫu ngẫu nhiên đơn giản từ mỗi cụm. Lấy mẫu có hệ thống chọn một điểm bắt đầu ngẫu nhiên từ dân số, sau đó một mẫu được lấy từ các khoảng cố định đều đặn của dân số tùy thuộc vào quy mô của nó. Lấy mẫu theo cụm dễ bị sai số lấy mẫu lớn hơn so với lấy mẫu theo hệ thống, mặc dù quy trình này có thể rẻ hơn

Điểm mấu chốt

Lấy mẫu có thể là một cách hiệu quả để rút ra kết luận về một nhóm người, vật phẩm hoặc điều gì đó đáng quan tâm. Lấy mẫu có hệ thống là một trong những cách phổ biến nhất để thực hiện điều này, vì nó rẻ hơn và tốn ít thời gian hơn các phương án khác. Vâng, nó không phải là hoàn hảo. Tuy nhiên, nếu bạn có một tập dữ liệu lớn không có mẫu giữa các khoảng thời gian, thì lấy mẫu có hệ thống có khả năng cung cấp các mẫu đáng tin cậy với chi phí tương đối thấp

Bốn 4 loại lấy mẫu là gì?

Các phương pháp lấy mẫu xác suất bao gồm lấy mẫu ngẫu nhiên đơn giản, lấy mẫu hệ thống, lấy mẫu phân tầng và lấy mẫu cụm .

Lấy mẫu ngẫu nhiên có hệ thống với ví dụ là gì?

Lấy mẫu ngẫu nhiên có hệ thống là phương pháp lấy mẫu ngẫu nhiên yêu cầu chọn mẫu dựa trên hệ thống các khoảng trong một quần thể được đánh số . Ví dụ: Lucas có thể đưa ra một cuộc khảo sát cho mọi khách hàng thứ tư đến rạp chiếu phim.

lấy mẫu trong Python là gì?

Phương thức sample[] trả về danh sách có lựa chọn ngẫu nhiên một số mục đã chỉ định từ một chuỗi .

Các loại lấy mẫu hệ thống là gì?

Dưới đây là các loại lấy mẫu có hệ thống. .
lấy mẫu ngẫu nhiên có hệ thống
Lấy mẫu hệ thống tuyến tính
Lấy mẫu hệ thống tuần hoàn

Chủ Đề