Hàm phân phối xác suất Python numpy

Nội dung này là một phần của loạt bài về chương 3 về xác suất từ ​​Sách học sâu của Goodfellow, tôi. , Bengio, Y. , và Courville, A. [2016]. Nó nhằm mục đích cung cấp trực giác/bản vẽ/mã trăn trên các lý thuyết toán học và được xây dựng theo hiểu biết của tôi về các khái niệm này

Github. có thể tìm thấy sổ ghi chép Python tương ứng tại đây

Giới thiệu

Tôi rất vui được giới thiệu ở đây phần tiếp theo của loạt bài về Sách học sâu của Goodfellow et al. Đây là bài viết/sổ tay đầu tiên được thực hiện từ chương 3 về Xác suất. Đối với những người đã biết bài viết/sổ tay của tôi về Chương 2 về đại số tuyến tính, mục tiêu và cấu trúc là như nhau. Mục tiêu là làm cho cuốn sách dễ tiếp cận hơn đối với những người không có nền tảng toán học sâu

Tôi nghĩ rằng có thể đạt được trực giác tốt hơn về các khái niệm toán học bằng cách sử dụng mã [ở đây là Python] và trực quan hóa. Cấu trúc tuân theo các chương phụ của cuốn sách và nó có thể được sử dụng làm nội dung bổ sung, đưa ra các ví dụ và chi tiết

Phần đầu tiên này là về chương 3. 1 đến 3. 3. Chương 3. 1 là phần giới thiệu về xác suất và không có khó khăn kỹ thuật. Do đó, bạn có thể trực tiếp đọc nó ở đây. Chương 3. 2 thực sự chỉ là một định nghĩa nên phần chính là 3. 3 về hàm khối lượng xác suất và hàm mật độ xác suất. Sau khi đọc xong, biến ngẫu nhiên và phân phối xác suất của chúng [đối với biến rời rạc và liên tục] sẽ không có bí mật nào dành cho bạn 🏄🏾‍♂️

Để hiểu nó, chúng ta cũng sẽ nghiên cứu một số công cụ toán học rất hữu ích

🔧 rời rạc so với. biến số liên tục

🔧 phái sinh

🔧 tích phân

🔧 Diện tích dưới đường cong

Những khái niệm này rất quan trọng để nắm bắt đối với khoa học dữ liệu nói chung và học máy

Đừng bỏ lỡ bài viết mới

3. 2 biến ngẫu nhiên

Mục tiêu của xác suất là để đối phó với sự không chắc chắn. Nó đưa ra cách để mô tả các sự kiện ngẫu nhiên. Biến ngẫu nhiên là biến có thể nhận nhiều giá trị phụ thuộc vào kết quả của một sự kiện ngẫu nhiên. Các kết quả có thể xảy ra là các giá trị có thể được lấy bởi biến

Nếu các kết quả là hữu hạn [ví dụ 6 khả năng trong một sự kiện ném xúc xắc] thì biến ngẫu nhiên được gọi là rời rạc

Nếu các kết quả có thể xảy ra là không hữu hạn [ví dụ: vẽ một số từ $0$ đến $1$ có thể cho vô số giá trị], thì biến ngẫu nhiên được gọi là liên tục

Như trong cuốn sách, chúng tôi sẽ sử dụng ký hiệu sau. một chữ thường trong kiểu chữ đơn giản cho một biến ngẫu nhiên. $\text{x}$

ví dụ 1

Giả sử biến $\text{x}$ là một biến ngẫu nhiên biểu thị kết quả của một lần gieo xúc xắc 🎲. Biến có thể nhận giá trị 1, 2, 3, 4, 5 hoặc 6. Là biến ngẫu nhiên rời rạc

3. 3 phân phối xác suất

Vậy một biến ngẫu nhiên có thể nhận nhiều giá trị. Một điều rất quan trọng là phải biết liệu một số giá trị có thường gặp hơn những giá trị khác hay không. Mô tả xác suất của mỗi giá trị có thể mà một biến ngẫu nhiên có thể nhận được gọi là phân phối xác suất của nó

Ý tưởng về biến rời rạc so với biến liên tục rất quan trọng và chúng ta sẽ nghiên cứu khái niệm phân phối xác suất trong cả hai trường hợp. Ngay cả khi chúng có liên quan với nhau, vẫn tồn tại một số khác biệt

Dù sao đi nữa, phân phối xác suất của một biến ngẫu nhiên $\text{x}$ mô tả xác suất của từng kết quả [xác suất bằng 1 nghĩa là biến sẽ luôn nhận giá trị này và xác suất bằng 0 nghĩa là biến đó sẽ không bao giờ gặp phải]. Chức năng này được gọi là phân phối xác suất. Cụ thể hơn, người ta gọi là hàm khối lượng xác suất cho biến rời rạc và hàm mật độ xác suất cho biến liên tục

3. 3. 1 Hàm khối lượng xác suất và biến rời rạc

Hàm khối lượng xác suất là hàm mô tả xác suất liên quan đến biến ngẫu nhiên $\text{x}$. Hàm này được đặt tên là $P[\text{x}]$ hoặc $P[\text{x} = x]$ để tránh nhầm lẫn. $P[\text{x} = x]$ tương ứng với xác suất để biến ngẫu nhiên $\text{x}$ nhận giá trị $x$ [lưu ý các kiểu chữ khác nhau]

ví dụ 2

Thí nghiệm súc sắc minh họa biến ngẫu nhiên rời rạc và hàm khối lượng xác suất

Hãy tung một con xúc xắc vô số lần và xem tỷ lệ của 1, tỷ lệ của 2, v.v. Chúng ta gọi $\text{x}$ là biến ngẫu nhiên tương ứng với kết quả tung xúc xắc. Như vậy biến ngẫu nhiên $\text{x}$ chỉ nhận các giá trị rời rạc sau. 1, 2, 3, 4, 5 hoặc 6. Do đó, nó là một biến ngẫu nhiên rời rạc

Mục đích của hàm khối lượng xác suất là mô tả xác suất của từng giá trị có thể. Trong ví dụ của chúng tôi, nó mô tả xác suất để nhận được 1, xác suất để nhận được 2, v.v. Trong trường hợp thử nghiệm gieo xúc xắc, chúng ta có cùng xác suất để nhận được từng giá trị [nếu chúng ta giả định rằng xúc xắc là hoàn hảo]. Điều này có nghĩa là chúng ta có thể viết

$$ \begin{align*} P[\text{x}=1]&=P[\text{x}=2]\\\\ &=P[\text{x}=3]\\\\

Bây giờ, làm thế nào chúng ta có thể tính các xác suất $P[\text{x}=1]$, $P[\text{x}=2]$, v.v. ?

$$ \begin{align*} P[\text{x}=1]&=P[\text{x}=2]\\\\ &=P[\text{x}=3]\\\\

Nhân tiện, phân phối này cho thấy cùng một xác suất cho mỗi giá trị. nó được gọi là phân phối đồng đều

Hàm khối lượng xác suất có thể trông giống như

Hàm khối lượng xác suất của thí nghiệm súc sắc

Trục y cho xác suất và trục x cho kết quả

Hãy tạo lại ví dụ đầu tiên này bằng mã để đảm bảo rằng mọi thứ đều rõ ràng

num_throws = 10000
outcomes = np.zeros[num_throws]
for i in range[num_throws]:
    # let's roll the die
    outcome = np.random.choice[['1', '2', '3', '4', '5', '6']]
    outcomes[i] = outcome


val, cnt = np.unique[outcomes, return_counts=True]
prop = cnt / len[outcomes]

# Now that we have rolled our die 10000 times, let's plot the results
plt.bar[val, prop]
plt.ylabel["Probability"]
plt.xlabel["Outcome"]
plt.show[]
plt.close[]

Tôi đã tạo một mảng chứa đầy $0$ bằng hàm Numpy

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
2. Ở mỗi lần ném, tôi chọn một giá trị trong số 6 khả năng. Sau đó, tôi đã sử dụng hàm Numpy
x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
3 với tham số
x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
4 được đặt thành
x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
5 để lấy số lượng của mỗi kết quả có thể xảy ra. Tôi vẽ biểu đồ tỷ lệ cho từng giá trị có thể

Chúng ta có thể thấy rằng phân phối giống như phân phối đều và mỗi kết quả có xác suất khoảng $\frac{1}{6}$ [$\approx 0. 17$]

phân phối xác suất chung

Bây giờ hãy xem điều gì sẽ xảy ra nếu chúng ta tung hai con xúc xắc. Đối với mỗi lần chết, các kết quả được liên kết với một xác suất nhất định. Chúng ta cần hai biến ngẫu nhiên để mô tả trò chơi, giả sử $\text{x}$ tương ứng với mặt xúc xắc đầu tiên và $\text{y}$ tương ứng với mặt xúc xắc thứ hai. Chúng tôi cũng có hai hàm khối lượng xác suất liên quan đến các biến ngẫu nhiên. $P[\text{x}]$ và $P[\text{y}]$. Ở đây, các giá trị có thể có của các biến ngẫu nhiên [1, 2, 3, 4, 5 hoặc 6] và các hàm khối lượng xác suất thực sự giống nhau cho cả hai viên xúc xắc, nhưng không nhất thiết phải như vậy

Phân phối xác suất chung rất hữu ích trong trường hợp chúng ta quan tâm đến xác suất mà $\text{x}$ nhận một giá trị cụ thể trong khi $\text{y}$ nhận một giá trị cụ thể khác. Chẳng hạn, xác suất để được 1 với con xúc xắc đầu tiên và 2 với con xúc xắc thứ hai là bao nhiêu? . Đây là những gì chúng ta gọi là xác suất chung

ví dụ 3

Ví dụ: hãy tính xác suất để có mặt 1 ở mặt xúc xắc đầu tiên và mặt 2 ở mặt thứ hai

$$ P[\text{x}=1, \text{y}=2] = \frac{1}{6} \times \frac{1}{6} = \frac{1}{36} \approx . 028 $$

Tính chất của hàm khối lượng xác suất

Một hàm là hàm khối lượng xác suất nếu

$$ \forall x \in \text{x}, 0 \leq P[x] \leq 1 $$

Ký hiệu $\forall$ có nghĩa là “cho bất kỳ”. Điều này có nghĩa là với mọi giá trị có thể có $x$ trong phạm vi $\text{x}$ [trong ví dụ về thử nghiệm lăn xúc xắc, tất cả các giá trị có thể là 1, 2, 3, 4, 5 và 6], xác suất . Xác suất bằng 0 nghĩa là sự kiện không thể xảy ra và xác suất bằng 1 nghĩa là bạn có thể chắc chắn rằng kết quả sẽ tương ứng với giá trị này

Trong ví dụ về xúc xắc, xác suất của mỗi giá trị có thể là $\frac{1}{6}$ nằm trong khoảng từ 0 đến 1. Tính chất này được đáp ứng

$$ \sum\limits_{x \in \text{x}} P[x] = 1 $$

Điều này có nghĩa là tổng các xác suất được liên kết với mỗi giá trị có thể bằng 1

Trong ví dụ về thí nghiệm xúc xắc, chúng ta có thể thấy rằng có 6 kết quả có thể xảy ra, mỗi kết quả có xác suất là $\frac{1}{6}$ với tổng số $\frac{1}{6} \times 6 = . Tính chất này được đáp ứng

3. 3. 2 Hàm mật độ xác suất và biến liên tục

Một số biến không rời rạc. Họ có thể lấy vô số giá trị trong một phạm vi nhất định. Nhưng chúng ta vẫn cần mô tả xác suất liên quan đến kết quả. Giá trị tương đương của hàm khối lượng xác suất z đối với một biến liên tục được gọi là hàm mật độ xác suất

Trong trường hợp hàm khối lượng xác suất, chúng ta thấy rằng trục y đưa ra xác suất. Chẳng hạn, trong biểu đồ mà chúng tôi đã tạo bằng Python, xác suất để nhận được $1$ bằng với $\frac{1}{6} \approx 0. 16 đô la [kiểm tra cốt truyện ở trên]. Đó là $\frac{1}{6}$ vì đây là một khả năng trong tổng số 6 khả năng

Tuy nhiên, chúng tôi không thể làm điều này cho các biến liên tục vì tổng số khả năng là vô hạn. Chẳng hạn, nếu chúng ta vẽ một số từ 0 đến 1, chúng ta có vô số kết quả có thể xảy ra [ví dụ 0. 320502304…]. Trong ví dụ trên, chúng tôi có 6 kết quả có thể xảy ra, dẫn đến xác suất khoảng $\frac{1}{6}$. Bây giờ, chúng ta có mỗi xác suất bằng $\frac{1}{+\infty} \approx 0$. Một chức năng như vậy sẽ không hữu ích lắm

Vì lý do đó, trục y của hàm mật độ xác suất không biểu thị các giá trị xác suất. Để có được xác suất, chúng ta cần tính diện tích dưới đường cong [chúng ta sẽ xem bên dưới một số chi tiết về diện tích dưới đường cong]. Ưu điểm là dẫn đến xác suất theo một khoảng nhất định [trên trục x]. diện tích dưới đường cong tăng nếu phạm vi tăng. Hãy xem một số ví dụ để làm rõ tất cả những điều này

Ví dụ 4

Giả sử rằng chúng ta có một biến ngẫu nhiên $\text{x}$ có thể nhận các giá trị từ 0 đến 1. Đây là hàm mật độ xác suất của nó

Hàm mật độ xác suất

Chúng ta có thể thấy rằng $0$ dường như là không thể [xác suất khoảng 0] và $1$ cũng vậy. Bức ảnh khoảng $0. 3 đô la có nghĩa là sẽ nhận được rất nhiều kết quả xung quanh giá trị này

Tìm xác suất từ ​​hàm mật độ xác suất giữa một phạm vi giá trị nhất định có thể được thực hiện bằng cách tính diện tích dưới đường cong cho phạm vi này. Ví dụ: xác suất rút ra một giá trị giữa $0. 5$ và 0$. 6$ tương ứng với khu vực sau

Hàm mật độ xác suất và diện tích dưới đường cong giữa 0. 5 và 0. 6

Chúng ta có thể dễ dàng thấy rằng nếu chúng ta tăng phạm vi, thì xác suất [diện tích dưới đường cong] cũng sẽ tăng theo. Chẳng hạn, đối với phạm vi 0. 5-0. 7

Hàm mật độ xác suất và diện tích dưới đường cong giữa 0. 5 và 0. 7

Chúng ta sẽ xem trong giây lát cách tính diện tích dưới đường cong và lấy xác suất liên quan đến một phạm vi cụ thể

Các tính chất của hàm mật độ xác suất

Những khác biệt giữa hàm khối lượng xác suất và hàm mật độ xác suất dẫn đến các thuộc tính khác nhau cho hàm mật độ xác suất

$$ \forall x \in \text{x}, p[x] \geq 0 $$

Trong trường hợp này, $p[x]$ không nhất thiết phải nhỏ hơn 1 vì nó không tương ứng với xác suất [bản thân xác suất sẽ vẫn cần nằm trong khoảng từ $0$ đến $1$]

Ví dụ 5

Chẳng hạn, giả sử rằng chúng ta có một biến ngẫu nhiên liên tục có thể nhận các giá trị trong khoảng từ $0$ đến $0. 5$. Biến này được mô tả bởi phân phối đều nên ta sẽ có hàm phân phối xác suất sau

Hàm mật độ xác suất [phân bố đều]. Diện tích dưới đường cong bằng 1 [$2 \times 0. 5$] và các giá trị y lớn hơn 1

Chúng ta có thể thấy rằng các giá trị y lớn hơn $1$. Xác suất được cho bởi diện tích dưới đường cong và do đó nó cũng phụ thuộc vào trục x

🤨 Nếu bạn muốn xem điều này một mình, chúng tôi sẽ tạo lại ví dụ này bằng Python. Để làm điều đó, chúng ta sẽ tạo một biến ngẫu nhiên $\text{x}$ có thể nhận giá trị từ $0$ đến $0. 5$ ngẫu nhiên. Phân phối đồng đều sẽ được sử dụng nhờ hàm Numpy

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
6. Các tham số của chức năng này là giá trị thấp nhất [bao gồm], giá trị cao nhất [không bao gồm] và số lượng mẫu. Vì vậy,
x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
7 sẽ tạo ra 10000 giá trị được chọn ngẫu nhiên là $\geq 0$ và $\lt 0. 5$

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]

có vẻ tốt. 🏄🏽‍♀️

Chúng ta có thể thấy rằng hình dạng trông giống như những gì tôi vẽ ở trên với các giá trị trục y xung quanh 2 cho tất cả $x$ giữa $0$ và $0. 5$

Tuy nhiên, có một điều có thể gây tò mò trong cốt truyện này. Chúng tôi đã nói về biến liên tục và ở đây chúng tôi đã biểu thị phân phối bằng các thanh. Lời giải thích giống như trước đây. chúng ta cần rời rạc hóa hàm để đếm số lượng kết quả trong mỗi khoảng thời gian. Trên thực tế, số khoảng là một tham số của hàm

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
8. Hãy cố gắng sử dụng nhiều thùng

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x, bins=1000]
plt.show[]

Chúng ta có thể thấy rằng chúng ta vẫn ở mức khoảng $2$ nhưng độ biến thiên lớn hơn trước [các thanh có thể đi từ 1 đến 4, đây không phải là trường hợp trong biểu đồ cuối cùng]. Có biết tại sao không?🤔

💡Điều này là do vì chúng tôi đã lấy nhiều thùng hơn nên số lượng giá trị trong mỗi thùng ít hơn dẫn đến ước tính kém chính xác hơn. Nếu giả thuyết này là đúng, chúng ta có thể giảm độ biến thiên này bằng cách tăng số lượng mẫu. Hãy thử điều đó

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
0

Thật tuyệt 🤸🏼‍♂️

Bây giờ chúng ta có thể đi đến tài sản thứ hai

$$ \int p[x]dx = 1 $$

Đối với hàm khối lượng xác suất, chúng ta đã thấy rằng tổng các xác suất phải bằng $1$. Đây không phải là trường hợp của các hàm mật độ xác suất vì xác suất tương ứng với diện tích dưới đường cong và không trực tiếp với các giá trị $y$. Tuy nhiên, điều này có nghĩa là diện tích dưới đường cong phải bằng 1

Chúng ta đã thấy trong ví dụ trước, rằng diện tích thực sự bằng 1. Nó có thể dễ dàng thu được và hình dung vì hình dạng bình phương của phân phối đồng đều. Do đó có thể nhân chiều cao với chiều rộng. $2 \times 0. 5 = 1$

Tuy nhiên trong nhiều trường hợp hình không phải là hình vuông và ta vẫn cần tính diện tích dưới đường cong. Hãy xem làm thế nào để làm điều này

🔧 Diện tích dưới đường cong

Diện tích dưới đường cong của hàm cho một phạm vi giá trị cụ thể có thể được tính bằng tích phân của hàm. Ta sẽ thấy việc tính tích phân của một hàm số ngược lại với việc tính đạo hàm. Điều này có nghĩa là nếu bạn rút ra một hàm $f[x]$ và tính tích phân của hàm kết quả $f’[x]$ thì bạn sẽ nhận được $f[x]$. 😮

Đạo hàm tại một điểm của hàm cho biết tốc độ thay đổi của nó. Mối liên hệ giữa hàm mô tả tốc độ thay đổi của một hàm khác [đạo hàm] và diện tích dưới đường cong 🤔 là gì?

Hãy bắt đầu với một điểm trên phái sinh. Và sau đó, với ví dụ đồ họa tiếp theo, nó sẽ rõ ràng. 🔮

Ví dụ 6

Chúng tôi muốn mô hình hóa tốc độ của một chiếc xe. Giả sử rằng hàm $f[x] = x^2$ xác định tốc độ của nó [trục y] theo hàm thời gian [trục x]

Đầu tiên, chúng ta sẽ vẽ đồ thị của hàm $f[x]=x^2$ để xem hình dạng của nó

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
1

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
2

Hình dạng là một parabol. Nó cho thấy tốc độ tăng chậm lúc đầu nhưng tăng dần trong một khoảng thời gian không đổi

Tôi đã tạo một biến $x$ [có hàm

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
9 từ Numpy] chứa tất cả các điểm của trục x. Vì vậy, nó chỉ là tất cả các giá trị từ -10 đến 10 với bước $0. 1$. Hãy xem 10 giá trị đầu tiên

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
4

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
5

Đây là tài liệu của hàm

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
9 từ Numpy

Trong ví dụ của chúng ta, hàm xác định tốc độ của xe theo hàm thời gian nên không có giá trị âm. Hãy chỉ lấy phần dương của trục x để tránh thời gian âm [chúng ta sẽ nói rằng 0 là thời điểm bắt đầu thử nghiệm]

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
7

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
2

Ok, tốt hơn

Đạo hàm của hàm này là $f’[x]=2x$. Để biết thêm thông tin về các quy tắc phái sinh, hãy kiểm tra tại đây

Đây là đồ thị của $f’[x]$

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
0

x = np.random.uniform[0, 0.5, 10000]

sns.distplot[x]
plt.show[]
1

🔧 phái sinh

Biểu diễn đạo hàm này cho thấy gia tốc. $f[x]$ mô tả vận tốc của xe theo hàm thời gian và đạo hàm $f’[x]$ biểu thị tốc độ thay đổi của vận tốc theo hàm thời gian, đó là gia tốc

Ta có thể thấy gia tốc của xe tăng tuyến tính theo thời gian. Đạo hàm cho chúng ta biết tốc độ thay đổi của tốc độ xe là $2x$. Chẳng hạn, khi $x=0$, tốc độ thay đổi bằng $2\times0=0$, vì vậy tốc độ không thay đổi. Khi $x=3$, tốc độ thay đổi là $2\times3=6$. Điều này có nghĩa là tại thời điểm này, tốc độ tăng thêm $6$ khi thời gian tăng thêm $1$

Tóm lại, đạo hàm của một hàm cho tốc độ thay đổi của nó. Trong ví dụ của chúng ta, tốc độ thay đổi là một hàm khác [$f’[x] = 2x$] nhưng nó có thể là một hằng số [tốc độ thay đổi luôn giống nhau, e. g. $f’[x]=2$] hoặc hàm bậc hai chẳng hạn [e. g. $f’[x] = x^3$]

🔧 tích phân

Có thể tính toán các công cụ phái sinh rất mạnh nhưng liệu có thể làm ngược lại không. đi từ tốc độ thay đổi đến chính sự thay đổi 😮. Chà, cái này hay đấy. Câu trả lời được đưa ra bởi tích phân của hàm

Tích phân của $f’[x]$ trả lại cho chúng ta $f[x]$. Ký hiệu là như sau

$$ \int f'[x] dx = f[x] $$

Điều này có nghĩa là chúng ta lấy $f’[x]$ để nhận lại $f[x]$. Ký hiệu $dx$ ở đây có nghĩa là chúng ta lấy tích phân trên $x$, tức là chúng ta tính tổng các lát cắt có trọng số bằng $y$ [xem tại đây]

Nếu chúng ta lấy lại ví dụ cuối cùng, chúng ta có

$$ \int 2x dx = x^2 + c $$

Chúng ta có thể thấy rằng có một sự khác biệt. việc thêm một hằng số $c$. Điều này là do vô số hàm có thể cho đạo hàm $2x$ [ví dụ: $x^2 + 1$ hoặc $x^2 + 294$…]. Chúng tôi mất một chút thông tin và chúng tôi không thể khôi phục thông tin đó

Và bây giờ, phần giải thích bằng hình ảnh [tôi thích cái này 💛]. chúng ta đã thấy rằng $2x$ là hàm mô tả tốc độ thay đổi [độ dốc] của hàm $x^2$. Bây giờ nếu chúng ta đi từ $f’[x]$ đến $f[x]$, chúng ta có thể thấy rằng diện tích dưới đường cong của $f’[x]$ tương ứng với $f[x]$

Diện tích dưới đường cong của $f’[x]$ tương ứng với $f[x]$. Điều này cho thấy tích phân và đạo hàm là các phép toán ngược như thế nào

Biểu đồ này cho thấy hàm $f’[x]=2x$ và chúng ta có thể thấy rằng diện tích dưới đường cong tăng theo cấp số nhân. Khu vực này được đại diện cho các phạm vi khác nhau [[0-0], [0-1], [0-2], [0-3]]. Chúng ta có thể tính diện tích dưới đường cong [sử dụng định lý Pitago và chia cho 2 vì diện tích là nửa hình vuông] và tìm các giá trị sau. 0, 1, 4, 9… Điều này tương ứng với hàm ban đầu $f[x]=x^2$. 🎺

Phần kết luận

Tóm lại, chúng ta đã thấy biến ngẫu nhiên là gì và cách biểu thị phân phối xác suất cho biến rời rạc [hàm khối lượng xác suất] và biến liên tục [hàm mật độ xác suất]. Chúng tôi cũng đã nghiên cứu khái niệm về phân phối xác suất chung và các công cụ toán học nền tảng như đạo hàm và tích phân

Bây giờ bạn có tất cả các công cụ để đi sâu hơn vào xác suất. Phần tiếp theo sẽ là về chap 3. 4 đến 3. 8. Chúng ta sẽ thấy cái mà chúng ta gọi là xác suất cận biên và có điều kiện, quy tắc dây chuyền và khái niệm độc lập

Tôi hy vọng rằng điều này đã giúp bạn có được trực giác tốt hơn về tất cả những điều này. Vui lòng liên hệ với tôi về bất kỳ câu hỏi/lưu ý/chỉnh sửa nào. 😀

Công thức hàm phân phối xác suất là gì?

Hàm phân phối xác suất . Hơn nữa, nếu có một khoảng nửa đóng được cho bởi [a, b] thì hàm phân phối xác suất được cho bởi công thức P[a < X ≤ b] = F[b] - F[a]. Hàm phân phối xác suất của biến ngẫu nhiên luôn nằm trong khoảng từ 0 đến 1. F[x] = P [X ≤ x]. Furthermore, if there is a semi-closed interval given by [a, b] then the probability distribution function is given by the formula P[a < X ≤ b] = F[b] - F[a]. The probability distribution function of a random variable always lies between 0 and 1.

Chức năng PDF trong Python là gì?

Một hàm xác định mối quan hệ giữa một biến ngẫu nhiên và xác suất của nó, sao cho bạn có thể tìm xác suất của biến đó bằng cách sử dụng hàm , được gọi là Hàm mật độ xác suất [PDF . Các loại biến khác nhau.

NP ngẫu nhiên bình thường [] được sử dụng để làm gì?

NumPy ngẫu nhiên. Hàm normal[] trong Python được sử dụng để tạo một mảng có hình dạng xác định và điền vào đó các giá trị ngẫu nhiên từ phân phối chuẩn [Gaussian] . Phân phối này còn được gọi là Đường cong hình chuông vì hình dạng đặc trưng của nó.

Chức năng phân phối xác suất giải thích với một ví dụ là gì?

Một phân phối được gọi là phân phối xác suất rời rạc, trong đó tập hợp các kết quả về bản chất là rời rạc. Ví dụ: nếu tung xúc xắc, thì tất cả các kết quả có thể xảy ra đều rời rạc và cho ra vô số kết quả . Nó còn được gọi là hàm khối lượng xác suất.

Chủ Đề