Mục đích của giá trị trung bình, trung bình và chế độ trong mô-đun thống kê của Python giải thích với sự trợ giúp của các ví dụ là gì?

Phân hệ thống kê cung cấp các hàm thống kê toán học của dữ liệu số. Các chức năng thống kê phổ biến sau đây được định nghĩa trong mô-đun này

Bần tiện

Phương thức

numbers_even = [4,10,29,33,42,67] # 6 elements
numbers_odd = [4,10,29,33,42,67,99] # 7 elements
def find_median[list_of_numbers]:
    list_of_numbers.sort[]
    length = len[list_of_numbers]
    length_is_odd = True if length % 2 == 0 else False
    if length_is_odd:
        index = length//2
        median = list_of_numbers[index]
    else:
        index_1 = length//2
        index_2 = index_1 + 1
        median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
    return median
 
find_median[numbers_odd]
find_median[numbers_even]
2 tính trung bình cộng của các số trong danh sách

Ví dụ

Sao chép

>>> import statistics
>>> statistics.mean[[2,5,6,9]]
5.5

Trung bình

Phương thức

numbers_even = [4,10,29,33,42,67] # 6 elements
numbers_odd = [4,10,29,33,42,67,99] # 7 elements
def find_median[list_of_numbers]:
    list_of_numbers.sort[]
    length = len[list_of_numbers]
    length_is_odd = True if length % 2 == 0 else False
    if length_is_odd:
        index = length//2
        median = list_of_numbers[index]
    else:
        index_1 = length//2
        index_2 = index_1 + 1
        median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
    return median
 
find_median[numbers_odd]
find_median[numbers_even]
3 trả về giá trị ở giữa của dữ liệu số trong danh sách

Ví dụ

Sao chép

>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0

Cách thức

Phương thức

numbers_even = [4,10,29,33,42,67] # 6 elements
numbers_odd = [4,10,29,33,42,67,99] # 7 elements
def find_median[list_of_numbers]:
    list_of_numbers.sort[]
    length = len[list_of_numbers]
    length_is_odd = True if length % 2 == 0 else False
    if length_is_odd:
        index = length//2
        median = list_of_numbers[index]
    else:
        index_1 = length//2
        index_2 = index_1 + 1
        median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
    return median
 
find_median[numbers_odd]
find_median[numbers_even]
4 trả về điểm dữ liệu phổ biến nhất trong danh sách

Ví dụ

Sao chép

>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2

Độ lệch chuẩn

Phương pháp

numbers_even = [4,10,29,33,42,67] # 6 elements
numbers_odd = [4,10,29,33,42,67,99] # 7 elements
def find_median[list_of_numbers]:
    list_of_numbers.sort[]
    length = len[list_of_numbers]
    length_is_odd = True if length % 2 == 0 else False
    if length_is_odd:
        index = length//2
        median = list_of_numbers[index]
    else:
        index_1 = length//2
        index_2 = index_1 + 1
        median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
    return median
 
find_median[numbers_odd]
find_median[numbers_even]
5 tính toán độ lệch chuẩn trên một mẫu nhất định dưới dạng danh sách

Ví dụ

Sao chép

>>> import statistics
>>> statistics.stdev[[1,1.5,2,2.5,3,3.5,4,4.5,5]]
1.3693063937629153

Tìm hiểu về mô-đun thống kê trong tài liệu Python

Trong công việc của bạn với tư cách là một nhà phân tích dữ liệu, bạn có thể thường xuyên phải đối mặt với hàng đống dữ liệu số. Bước đầu tiên điển hình để hiểu ý nghĩa của một tập dữ liệu lớn là tính toán một số thống kê mô tả, chẳng hạn như giá trị trung bình, trung bình, chế độ, phương sai và độ lệch chuẩn, trong số những thứ khác. Với các biện pháp này, chúng tôi có thể tiến xa hơn để phân tích dữ liệu phức tạp hơn

Dung dịch

Hướng dẫn này đề xuất một số cách để mô tả dữ liệu của bạn bằng cách sử dụng ngôn ngữ lập trình Python thuần túy mà không sử dụng thêm thư viện nào. Hướng dẫn này có một mục tiêu. hiển thị Python đang hoạt động trong ngữ cảnh thống kê. Công bằng mà nói, trong công việc hàng ngày, bạn có thể sẽ sử dụng các thư viện như numpy, pandas hoặc scipy thay vì tự viết mã. Ở đây mặc dù bạn có thể thấy hoạt động bên trong của các chức năng. Điều đó nói rằng, chúng ta hãy bắt đầu với ý nghĩa

Bần tiện

Hãy xem xét dữ liệu mẫu sau đây, nơi chúng tôi có một danh sách các số nguyên [cũng có thể là kiểu dữ liệu float] và chúng tôi muốn tính giá trị trung bình. Trung bình cộng của dãy số bằng tổng các số chia cho độ dài của dãy

numbers = [4,10,29,33,42,67]
def find_mean[list_of_numbers]:
     sum_n = sum[list_of_numbers]
     len_n = len[list_of_numbers]
     mean = sum_n/len_n
     return mean
    
result = find_mean[numbers]

Chúng tôi xác định một hàm chấp nhận một tham số duy nhất là danh sách các số. Định nghĩa hàm chứa

  • biến
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    6 sử dụng hàm
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    7 để tổng hợp tất cả các thành viên của danh sách
  • biến
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    8 sử dụng hàm
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    0 để lấy độ dài của dãy
  • và một biến cho kết quả.
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    1, theo định nghĩa chia tổng cho độ dài

Trong trường hợp này, kết quả là 30. 83. Lưu ý rằng hàm

numbers_even = [4,10,29,33,42,67] # 6 elements
numbers_odd = [4,10,29,33,42,67,99] # 7 elements
def find_median[list_of_numbers]:
    list_of_numbers.sort[]
    length = len[list_of_numbers]
    length_is_odd = True if length % 2 == 0 else False
    if length_is_odd:
        index = length//2
        median = list_of_numbers[index]
    else:
        index_1 = length//2
        index_2 = index_1 + 1
        median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
    return median
 
find_median[numbers_odd]
find_median[numbers_even]
7 chấp nhận bất kỳ lần lặp nào để bạn có thể dễ dàng chuyển trực tiếp một bộ hoặc một tập hợp cho nó thay vì một danh sách. Mặt khác,
numbers_even = [4,10,29,33,42,67] # 6 elements
numbers_odd = [4,10,29,33,42,67,99] # 7 elements
def find_median[list_of_numbers]:
    list_of_numbers.sort[]
    length = len[list_of_numbers]
    length_is_odd = True if length % 2 == 0 else False
    if length_is_odd:
        index = length//2
        median = list_of_numbers[index]
    else:
        index_1 = length//2
        index_2 = index_1 + 1
        median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
    return median
 
find_median[numbers_odd]
find_median[numbers_even]
3 nhận bất kỳ đồ vật nào và đếm số đồ vật có trong đó

Trung bình

Trung bình là một loại trung bình khác cho chúng ta biết giá trị trung bình của tập dữ liệu là gì

Để tìm được ta phải sắp xếp dãy số theo thứ tự tăng dần. Cách tính trung vị phụ thuộc vào việc dãy chứa số phần tử chẵn hay lẻ. Vì vậy, chúng ta cần tính đến cả hai trường hợp

numbers_even = [4,10,29,33,42,67] # 6 elements
numbers_odd = [4,10,29,33,42,67,99] # 7 elements
def find_median[list_of_numbers]:
    list_of_numbers.sort[]
    length = len[list_of_numbers]
    length_is_odd = True if length % 2 == 0 else False
    if length_is_odd:
        index = length//2
        median = list_of_numbers[index]
    else:
        index_1 = length//2
        index_2 = index_1 + 1
        median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
    return median
 
find_median[numbers_odd]
find_median[numbers_even]

Nếu có số lượng phần tử lẻ thì trung vị là giá trị ở giữa, rất dễ nhận ra. Nếu là số chẵn thì phải tính tổng hai giá trị ở giữa. Giá trị trung bình của chúng là trung vị của dãy. Vì vậy, định nghĩa hàm bao gồm

  • Sắp xếp chuỗi bằng cách sử dụng
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    4. Hàm này hoạt động tại chỗ, ghi đè lên đối tượng hiện tại, do đó chúng ta không cần thêm một biến để giữ dãy đã sắp xếp
  • Lấy độ dài của chuỗi bằng cách sử dụng
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    5
  • Định nghĩa một biến Boolean
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    6 kiểm tra xem chuỗi đầu vào có số phần tử chẵn hay lẻ
  • Phân nhánh định nghĩa hàm theo biến
    numbers_even = [4,10,29,33,42,67] # 6 elements
    numbers_odd = [4,10,29,33,42,67,99] # 7 elements
    def find_median[list_of_numbers]:
        list_of_numbers.sort[]
        length = len[list_of_numbers]
        length_is_odd = True if length % 2 == 0 else False
        if length_is_odd:
            index = length//2
            median = list_of_numbers[index]
        else:
            index_1 = length//2
            index_2 = index_1 + 1
            median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
        return median
     
    find_median[numbers_odd]
    find_median[numbers_even]
    
    6
    • Nếu đúng, chúng ta chỉ cần thực hiện phép chia số nguyên của độ dài chuỗi cho 2 [ký hiệu là double
      numbers_even = [4,10,29,33,42,67] # 6 elements
      numbers_odd = [4,10,29,33,42,67,99] # 7 elements
      def find_median[list_of_numbers]:
          list_of_numbers.sort[]
          length = len[list_of_numbers]
          length_is_odd = True if length % 2 == 0 else False
          if length_is_odd:
              index = length//2
              median = list_of_numbers[index]
          else:
              index_1 = length//2
              index_2 = index_1 + 1
              median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
          return median
       
      find_median[numbers_odd]
      find_median[numbers_even]
      
      8]. Hành động này thực hiện phép chia số nguyên và tự động trả về một số nguyên. Sau đó, chúng tôi chuyển kết quả dưới dạng chỉ mục cho chuỗi đầu vào của mình và lấy trung vị
    • Nếu sai, chiều dài là một số chẵn. Chúng ta phải lấy hai thành viên ở giữa. Chúng tôi làm như vậy bằng một phép chia số nguyên khác để lấy chỉ số "trái" và gán cho
      numbers_even = [4,10,29,33,42,67] # 6 elements
      numbers_odd = [4,10,29,33,42,67,99] # 7 elements
      def find_median[list_of_numbers]:
          list_of_numbers.sort[]
          length = len[list_of_numbers]
          length_is_odd = True if length % 2 == 0 else False
          if length_is_odd:
              index = length//2
              median = list_of_numbers[index]
          else:
              index_1 = length//2
              index_2 = index_1 + 1
              median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
          return median
       
      find_median[numbers_odd]
      find_median[numbers_even]
      
      9. Bằng cách thêm 1 vào kết quả đó, chúng tôi nhận được
      >>> import statistics
      >>> statistics.median[[1,2,3,8,9]]
      3
      >>> statistics.median[[1,2,3,7,8,9]]
      5.0
      
      50 biểu thị chỉ số "đúng". Cuối cùng, ta lấy trung bình cộng của hai giá trị là trung vị của dãy số chẵn

Chúng tôi thậm chí có thể sử dụng chức năng trước đây của mình để tính giá trị trung bình. Tuy nhiên, mã có thể trở nên dài dòng hơn một chút vì chúng ta cần thêm một biến trình tự để giữ các số ở chỉ mục 1 và 2

>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
5

Cách thức

Kiểu của một dãy số là số xuất hiện thường xuyên nhất

Để thực hiện điều này, chúng ta phải xây dựng một thuật toán bao gồm hai bước

  1. Đếm số lần xuất hiện của mỗi số trong dãy
  2. Lấy số có tần suất xuất hiện cao nhất

Đây là một ví dụ

>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
7

Ở đây chúng tôi có một danh sách các số

>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
51. Tất cả các phần tử có mặt nhiều hơn một lần và chúng ta phải tìm ra phần tử nào có tần suất cao nhất. Trong hàm
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
52, chúng ta bắt đầu bằng cách khởi tạo một từ điển trống
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
53. Đối với mỗi phần tử của chuỗi đầu vào, chúng tôi kiểm tra xem số đó đã là một khóa trong từ điển đó chưa. Nếu vậy, chúng tôi tăng số đếm lên một. Nếu không, chúng tôi tạo khóa. Sau đó, chúng tôi sắp xếp từ điển với chức năng được sắp xếp theo thứ tự ngược lại và lấy phần tử đầu tiên bằng cách cắt [cắt theo chỉ mục
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
54 là không bao gồm, do đó chỉ lấy phần tử đầu tiên]. Tuy nhiên, key là danh sách một phần tử nên chúng ta phải thêm [0] để đảm bảo lấy được giá trị số nguyên duy nhất chứa. Từ đó dễ dàng trả về key và giá trị tương ứng là tần suất xuất hiện của số trong dãy nhập. Trong trường hợp này, chế độ là 2 xuất hiện 10 lần

Ghi chú. trước đây chúng tôi đã sử dụng chức năng

numbers_even = [4,10,29,33,42,67] # 6 elements
numbers_odd = [4,10,29,33,42,67,99] # 7 elements
def find_median[list_of_numbers]:
    list_of_numbers.sort[]
    length = len[list_of_numbers]
    length_is_odd = True if length % 2 == 0 else False
    if length_is_odd:
        index = length//2
        median = list_of_numbers[index]
    else:
        index_1 = length//2
        index_2 = index_1 + 1
        median = [list_of_numbers[index_1] + list_of_numbers[index_2]] / 2
    return median
 
find_median[numbers_odd]
find_median[numbers_even]
4. Ở đây chúng tôi không thể sử dụng nó vì nó chỉ áp dụng cho danh sách. Hàm chúng ta có thể sử dụng để sắp xếp từ điển là
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
56 trả về một bản sao của đối tượng đang được sắp xếp

Tối thiểu, tối đa và phạm vi

Một mô tả khác mà bạn có thể muốn tạo cho tập dữ liệu của mình là các giá trị tối thiểu và tối đa và phạm vi [sự khác biệt giữa tối thiểu và tối đa]

Ở đây, chúng tôi có một tập dữ liệu rất nhỏ, nhưng đối với một tập dữ liệu lớn hơn nhiều, giá trị tối thiểu, tối đa và phạm vi có thể không thể phát hiện được nếu không sử dụng một chức năng chuyên dụng cho điều đó. Ví dụ

>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
4

Điều này là đơn giản. chúng tôi sử dụng các hàm tối thiểu và tối đa tích hợp cho phù hợp. Để có được phạm vi, chúng tôi trừ tối thiểu từ tối đa. Cuối cùng, chúng tôi trả về một bộ kết quả. Nếu bạn gán đầu ra của hàm cho một biến, bạn sẽ có thể truy cập từng giá trị theo chỉ mục của nó, [0] là giá trị tối thiểu cho tập dữ liệu đối số

Phương sai và độ lệch chuẩn

Cả phương sai và độ lệch chuẩn [STDev] đều đại diện cho các biện pháp phân tán, i. e. , cách xa giá trị trung bình của các số riêng lẻ

Ví dụ: phương sai thấp có nghĩa là hầu hết các số tập trung gần với giá trị trung bình, trong khi phương sai cao hơn có nghĩa là các số phân tán hơn và cách xa giá trị trung bình. Có một lưu ý ở đây. tính toán phương sai một cách chính xác phụ thuộc vào việc chúng ta đang làm việc với một mẫu dữ liệu hay với toàn bộ dân số. Chức năng của chúng tôi cần tính đến điều đó

>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
5

Định nghĩa hàm bắt đầu bằng cách xác định danh sách "các loại phương sai" hợp lệ mà chúng ta có thể chấp nhận làm đối số. mẫu hoặc dân số. Nếu một đối số khác được thông qua, hàm sẽ tăng một giá trị

>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
57. Sau đó, chúng ta có biến
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
58. Nếu chúng tôi đang làm việc với một mẫu, thì chúng tôi lấy độ dài của chuỗi – 1. Nếu chúng ta đang làm việc với một dân số, thì chúng ta lấy độ dài như hiện tại. Tiếp theo, chúng tôi tính giá trị trung bình bằng cách sử dụng hàm chúng tôi đã xác định. Theo định nghĩa về phương sai trong thống kê, việc tiếp theo là lập một danh sách về sự khác biệt giữa từng phần tử trong dãy và giá trị trung bình. Có danh sách này
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
59, sau đó chúng ta cần bình phương từng giá trị đó và lưu trữ nó trong danh sách
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
70. Lưu ý việc sử dụng khả năng hiểu danh sách có ích, thay vì sử dụng vòng lặp for. Cuối cùng, chúng tôi tính phương sai bằng cách tính tổng các giá trị trong danh sách
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
71 và chia cho độ dài tương ứng. Để dễ đọc, chúng ta có thể làm tròn kết quả và trả về một bộ phương sai và độ lệch chuẩn. Chúng ta có thể kiểm tra chức năng với hai cuộc gọi với cùng một trình tự. Trong trường hợp đầu tiên, chúng tôi đại diện cho một mẫu, trong khi ở trường hợp thứ hai, dân số

tương quan

Hệ số tương quan, thường đề cập đến Pearson, là thước đo sự phụ thuộc giữa hai bộ dữ liệu

Ở đây chúng ta sẽ xây dựng một hàm Python từ đầu để tính hệ số tương quan theo

>>> import statistics
>>> statistics.stdev[[1,1.5,2,2.5,3,3.5,4,4.5,5]]
1.3693063937629153
1

Định nghĩa hàm bắt đầu bằng cách lấy độ dài của chuỗi

>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
72. Giả định là
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
72 và
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
74 có cùng độ dài. Một cách an toàn hơn để làm điều đó là kiểm tra độ dài trước và lấy một trong các chuỗi ngắn hơn nếu hai chuỗi khác nhau. Sau đó, ta nhân từng phần tử của
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
72 với từng phần tử của
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
74 và gán kết quả cho biến
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
77. Ta tính tổng các phần tử của
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
72 và
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
74 rồi tính bình phương của mỗi tổng theo định nghĩa để tìm mối tương quan, thu được các biến
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
40,
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
41,
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
42 và
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
43. Tiếp theo, đối với mỗi chuỗi đầu vào, chúng tôi bình phương phần tử được chứa và tính tổng kết quả. Các biến là
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
44 và
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
45 cho
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
72 và
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
47 và
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
48 cho
>>> import statistics
>>> statistics.median[[1,2,3,8,9]]
3
>>> statistics.median[[1,2,3,7,8,9]]
5.0
74. Trong khối mã cuối cùng, chúng tôi xây dựng các thuật ngữ tử số và mẫu số theo công thức thống kê cho mối tương quan. Kết quả được tính bằng cách chia tử số cho mẫu số

Để kiểm tra lại chức năng của chúng tôi, chúng tôi có thể sử dụng gói

>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
50 nơi chúng tôi có chức năng
>>> import statistics
>>> statistics.mode[[2,5,3,2,8,3,9,4,2,5,6]]
2
51 tích hợp

Như chúng ta thấy kết quả về cơ bản là giống nhau

Phần kết luận

Trong hướng dẫn này, chúng tôi đã kiểm tra cách phát triển các hàm từ đầu để tính giá trị trung bình, trung bình, chế độ, phạm vi tối đa, tối thiểu, phương sai và độ lệch chuẩn của một tập dữ liệu. Ngoài ra, chúng tôi đã nghiên cứu cách tìm mối tương quan giữa hai bộ dữ liệu. Với những ví dụ này, tôi hy vọng bạn sẽ hiểu rõ hơn về cách sử dụng Python để thống kê

Mục đích của giá trị trung bình, trung bình và chế độ trong mô-đun thống kê của Python là gì?

Giá trị trung bình, trung vị và chế độ là những chủ đề cơ bản của thống kê. Bạn có thể dễ dàng tính toán chúng bằng Python, có và không sử dụng các thư viện bên ngoài. Ba điều này là các biện pháp chính của xu hướng trung tâm. Xu hướng trung tâm cho chúng tôi biết các giá trị “bình thường” hoặc “trung bình” của tập dữ liệu .

Mục đích của giá trị trung bình, trung bình và chế độ là gì?

Giá trị trung bình, trung vị và chế độ là các thước đo khác nhau của trung tâm trong một tập dữ liệu số. Mỗi người cố gắng tóm tắt tập dữ liệu bằng một số duy nhất để biểu thị một điểm dữ liệu "điển hình" từ tập dữ liệu .

Mô-đun nào sẽ giúp bạn sử dụng các hàm như giá trị trung bình, trung bình và chế độ trong Python?

Mô-đun SciPy có phương pháp cho việc này. Tìm hiểu về mô-đun SciPy trong Hướng dẫn SciPy của chúng tôi.

Mô-đun nào được sử dụng trong Python để tìm giá trị trung bình và chế độ?

Vì tính toán giá trị trung bình là một hoạt động phổ biến, nên Python bao gồm chức năng này trong mô-đun thống kê. Nó cung cấp một số chức năng để tính toán thống kê cơ bản trên bộ dữ liệu

Chủ Đề