Đánh giá phân bố dữ liệu bởi excel năm 2024

Trong bài viết này, chúng tôi giới thiệu hàm HYPGEOM.DIST, một trong những hàm thống kê phổ biến trong Excel.

Mô tả: Hàm này trả về phân bố siêu bội, thích hợp cho các vấn đề liên quan đến tập hợp có số quan sát thành công hoặc không.

Cú pháp: HYPGEOM.DIST[mẫu_số, số_lượng_mẫu, tổng_dân_số_số, tổng_dân_số, tích_lũy]

Trong đó:

- Mẫu_số: Số lần thành công trong mẫu, là tham số bắt buộc.

- Số_lượng_mẫu: Kích thước của mẫu, là tham số bắt buộc.

- Tổng_dân_số_số: Số lần thành công, là tham số bắt buộc.

- Số_lượng_dân_số: Kích thước của tập hợp, là tham số bắt buộc.

- lũy_tích: Giá trị logic quyết định dạng thức của hàm, là tham số tùy chọn gồm có các giá trị sau:

+ lũy_tích = Đúng -> trả về hàm phân bỗ lũy tích.

+ lũy_tích = Sai -> trả về hàm mật độ xác suất.

Lưu ý:

- Bất kì đối số nào của hàm không phải là số nguyên -> chúng bị làm tròn thành số nguyên.

- Nếu bất kì giá trị của đối số nào không phải dạng số -> hàm trả về giá trị lỗi

VALUE!

- Nếu sample_s < 0 hoặc sample_s lớn hơn hoặc nhỏ hơn trong hai số: number_sample hoặc population_s -> hàm trả về giá trị lỗi

NUM!

- Nếu sample_s nhỏ hơn hoặc lớn hơn trong khoảng từ 0 đến [number_sample - number_population + population_s] -> hàm trả về giá trị lỗi

NUM!

- Nếu number_sample ≤ 0 hoặc number_sample > number_population -> hàm trả về giá trị lỗi

NUM!

- Nếu population_s ≤ 0 hoặc population_s > number_population -> hàm trả về giá trị lỗi

NUM!

- Nếu number_pop ≤ 0 -> hàm trả về giá trị lỗi

NUM!

- Phương trình siêu bội đặc trưng là:

P[X\=x]\=h[x;n,M,N]\=Mx][N−Mn−x][NnM−x]P[X=x]=h[x;n,M,N]=[Mx][N−Mn−x][Nn]

Trong trường hợp này:

+ x = mẫu_s

+ n = số_lượng_mẫu

+ M = dân_số_mẫu

+ N = số_lượng_dân

- Hàm HYPGEOM.DIST được sử dụng để lấy mẫu mà không thay thế một tập hữu hạn.

Ví dụ:

Tính hàm phân bố siêu bội tích luỹ và xác suất với dữ liệu trong bảng dưới đây:

- Tính giá trị hàm phân bố siêu bội xác suất. Tại ô cần tính, nhập công thức: =HYPGEOM.DIST[D6,D7,D8,D9,D11]

Bộ công cụ Analysis ToolPak trên Excel sẽ giúp bạn tiết kiệm thời gian và đơn giản hóa các bước phân tích dữ liệu tài chính, thống kê .

Để tải bộ công cụ Analysis ToolPak, bạn hãy thực hiện các bước sau.

1. Trên tab File, click Options.

2. Trong Add-ins, chọn Analysis ToolPak và click vào nút Go.

3. Kiểm tra Analysis ToolPak và click OK.

4. Trên tab Data, trong nhóm Analysis, click Data Analysis.

Hộp thoại sau sẽ xuất hiện bên dưới.

5. Ví dụ: chọn Histogram và click OK để tạo Histogram trong Excel.

Histogram in Excel

Ví dụ này sẽ hướng dẫn bạn cách tạo biểu đồ trong Excel.

1. Đầu tiên, bạn nhập bin numbers [upper levels] trong phạm vi C4: C8.

2. Trên tab Data, trong nhóm Analysis, click Data Analysis.

3. Chọn Histogram và click OK.

4. Chọn phạm vi A2: A19.

5. Click vào ô Bin Range và chọn phạm vi C4: C8.

6. Click vào nút tùy chọn Output Range, click vào hộp Output Range và chọn ô F3.

7. Kiểm tra Chart Output.

8. Click OK.

9. Click vào legend ở phía bên phải và nhấn Delete.

10. Dán nhãn đúng cách cho các bins.

11. Để loại bỏ khoảng cách giữa các bars, hãy click chuột phải vào một bars, click Format Data Series và thay đổi Gap Width thành 0%.

12. Để thêm đường viền, click chuột phải vào một bar, click Format Data Series, click vào Fill & Line icon, click Border và chọn màu.

Kết quả:

Nếu có Excel 2016 trở lên, bạn chỉ cần sử dụng loại biểu đồ Histogram.

13. Chọn phạm vi A1: A19.

14. Trên tab Insert, trong nhóm Charts, click vào biểu tượng Histogram.

15. Click Histogram.

Kết quả: Một biểu đồ có 3 bins.

Lưu ý: Excel sử dụng quy tắc tham chiếu thông thường của Scott để tính số bins và bin width.

16. Click chuột phải vào horizontal axis, sau đó click Format Axis.

Format Axis pane xuất hiện.

17. Xác định histogram bins. Để xác định, chúng ta sẽ sử dụng các số bin giống như trước đây [xem hình đầu tiên trên trang này].

  • Bin width: 5.
  • Number of bins: 6.
  • Overflow bin: 40.
  • Underflow bin: 20.

Kết quả:

Chúng ta đã tạo biểu đồ sau bằng cách sử dụng Analysis ToolPak [bước 1-12].

Kết luận: các bin labels thì trông khác nhau, nhưng biểu đồ thì giống nhau. ≤20 giống với 0-20, [20, 25] giống với 21-25,...

Mẹo: bạn cũng có thể sử dụng pivot tables để dễ dàng tạo frequency distribution trong Excel.

Descriptive Statistics in Excel

Bạn có thể sử dụng bộ công cụ Analysis ToolPak để tạo thống kê mô tả [descriptive statistics]. Ví dụ, bạn có điểm của 14 người tham gia trong một bài kiểm tra.

Để tạo descriptive statistics cho những điểm số này, bạn hãy thực hiện các bước sau.

1. Trên tab Data, trong nhóm Analysis, click Data Analysis.

2. Chọn Descriptive Statistics và click OK.

3. Chọn phạm vi A2: A15 làm Input Range.

4. Chọn ô C1 làm Output Range.

5. Hãy đảm bảo rằng Summary statistics được kiểm tra.

6. Click OK.

Kết quả:

Anova

Phân tích phương sai [ANOVA] là một công cụ phân tích được sử dụng trong thống kê phân tách biến thiên quan sát tổng hợp được tìm thấy bên trong một tập dữ liệu chia thành hai phần: các yếu tố hệ thống và các yếu tố ngẫu nhiên.

Dưới đây, bạn sẽ thấy mức lương của những người có bằng kinh tế, y học và lịch sử.

H0: μ1 = μ2 = μ3

H1: at least one of the means is different.

Để thực hiện ANOVA, bạn hãy thực hiện các bước sau.

1. Trên tab Data, trong nhóm Analysis, click Data Analysis.

2. Chọn Anova: Single Factor và click OK.

3. Click vào hộp Input Range và chọn phạm vi A2: C10.

4. Click vào hộp Output Range và chọn ô E1.

5. Click OK.

Kết quả:

Kết luận: nếu F > F crit, bạn sẽ bác bỏ đây là giả thuyết vô hiệu. Trong trường hợp: 15,196 > 3,443, chúng ta sẽ bác bỏ giả thuyết vô hiệu. Tuy nhiên, ANOVA sẽ không cho bạn biết sự khác biệt nằm ở đâu mà bạn cần sử dụng t-Test để kiểm tra.

F-Test in Excel

Ví dụ này sẽ hướng dẫn bạn cách thực hiện F-Test trong Excel. F-Test được sử dụng để kiểm tra giả thuyết không [null hypothesis] rằng phương sai của hai populations là bằng nhau.

Chúng ta sẽ có ví dụ về giờ học của 6 sinh viên nữ và 5 sinh viên nam.

H0: σ12 = σ22 H1: σ12 ≠ σ22

Để thực hiện F-Test, bạn hãy thực hiện các bước sau.

1. Trên tab Data, trong nhóm Analysis, click Data Analysis.

2. Chọn F-Test Two-Sample for Variances và click OK.

3. Click vào hộp Variable 1 Range và chọn phạm vi A2: A7.

4. Click vào hộp Variable 2 Range và chọn phạm vi B2: B6.

5. Click vào hộp Output Range và chọn ô E1.

6. Click OK.

Kết quả:

Quan trọng: hãy chắc chắn rằng phương sai [variance] của Variable 1 cao hơn phương sai của Variable 2. Trường hợp, 160> 21,7. Nếu không ra được kết quả như vậy, bạn hãy hoán đổi dữ liệu để ra kết quả tỷ lệ của Variable 1 so với Variable [F = 160 / 21,7 = 7,373].

Kết luận: nếu F > F Critical one-tail, chúng ta sẽ bác bỏ giả thuyết không [null]. Trong trường hợp này là 7,373 > 6,256. Vì thế, chúng ta sẽ bác bỏ giả thuyết không [null]. Phương sai [variances] của hai populations là không bằng nhau.

t-Test in Excel

Ví dụ này hướng dẫn bạn cách thực hiện t-Test trong Excel. t-Test được sử dụng để kiểm tra giả thuyết không [null] rằng giá trị trung bình của hai populations là bằng nhau.

Chúng ta sẽ có ví dụ về giờ học của 6 sinh viên nữ và 5 sinh viên nam.

Để thực hiện t-Test, bạn hãy thực hiện các bước sau.

1. Đầu tiên, bạn hãy thực hiện F-Test để xác định xem phương sai [variances] của hai populations có bằng nhau hay không.

2. Trên tab Data, trong nhóm Analysis, click Data Analysis.

3. Chọn t-Test: t: Two-Sample Assuming Unequal Variances và click OK.

4. Click vào hộp Variable 1 Range và chọn phạm vi A2: A7.

5. Click vào hộp Variable 2 Range và chọn phạm vi B2: B6.

6. Click vào ô Hypothesized Mean Difference và nhập 0 [H0: μ1 - μ2 = 0].

7. Click vào hộp Output Range và chọn ô E1.

8. Click OK.

Kết quả:

Kết luận: Chúng ta sẽ làm một phép thử two-tail [inequality]. Nếu t Stat t Critical two-tail, chúng ta sẽ bác bỏ giả thuyết không [null]. Trong trường hợp -2.365

Chủ Đề