Total probability Rule là gì

Ví dụ

Có 2 hộp: Đỏ, Lam
Có 2 loại quả: Táo[màu lá], Cam[màu cam]

Chọn 1 hộp bất kỳ rồi bốc 1 quả bất kỳ trong hộp đó

Biến ngẫu nhiên [Random variable]

B: hộp, có thể nhận 1 trong 2 giá trị r[đỏ], b [lam]
F: quả, có thể nhận 1 trong 2 giá trị a[táo], o [cam]

Ký hiệu xác suất

Giả sử xác xuất chọn hộp đỏ trong 2 hộp là 4/10

$$
p[B=r] = 4/10 \\
p[B=b] = 6/10
$$

Conditional probability

p[Y|X]: the probability of Y given X

Ví dụ: Biết rằng ta đã bốc được hộp đỏ. Hỏi xác suất bốc được quả táo trong đó là bao nhiêu?

$$
p[F=a|B=r] = 2/8
$$

Joint probability

p[X,Y]: the probability of X and Y

Là xác suất xảy ra cả 2 sự kiện cùng 1 lúc
Ví dụ: xác suất chọn quả táo và quả táo đó ở hộp đỏ là bao nhiêu?

$$
\begin{align}
p[B=r,F=a] &= p[F=a|B=r] \times p[B=r] \
&= \frac{2}{8} \times \frac{4}{10} \
&= \frac{1}{10}
\end{align}
$$

Marginal probability

$$
\begin{align}
p[B=r] & = p[B=r,F=a] + p[B=r,F=o] \
& = \frac{1}{10} + \frac{3}{10}
& = \frac{4}{10}
\end{align}
$$

The Rules of Probability

X,Y: random variables
Sum rule:

$$
p[X] = \sum_Y p[X,Y]
$$

Product rule:

$$
p[X,Y] = p[Y|X]p[X]
$$

Chú ý

Tổng tất cả các xác suất phải bằng 1

$$
\sum_X p[X]= 1
$$

Bayes' theorem

$$
p[Y|X] = \frac{p[X|Y]p[Y]}{p[X]}
$$

p[Y]: prior probability
P[Y|X]: posterior probability

Probability densities

  • Xác suất trong khoảng $[x, x+\delta x$] với $\delta x \rightarrow 0$ là $p[x]\delta x$.
  • Xác suất trong khoảng $[a, b$] là

$$
p[x\in [a,b]] = \int_a^b p[x]\mathrm{d}x
$$

Tính chất

$$
\begin{align}
p[x] & \ge 0 \
\int_{-\infty}^{\infty} p[x]\mathrm{d}x & = 1
\end{align}
$$

Cumulative distribution function

Xác suất để x nằm trong khoảng $[-\infty,z]$:

$$
P[z] = \int_{-\infty}^{z} p[x]\mathrm{d}x
$$

Sum and product rules

$$
\begin{align}
p[x] &= \int p[x,y]\mathrm{d}y \
p[x,y] &= p[y|x]p[x]
\end{align}
$$

Expectations [Kỳ vọng]

Giá trị kỳ vọng của hàm $f[x]$

  • Biến rời rạc

$$
\mathbb{E}[f] = \sum_x p[x]f[x]
$$

  • Biến liên tục

$$
\mathbb{E}[f] = \int_x p[x]f[x]\mathrm{d}x
$$

Mở rộng

  • Kỳ vọng hàm nhiều biến: cần chỉ rõ là kỳ vọng theo biến nào

$$
\mathbb{E}_x[f[x,y]]
$$

  • Conditional expectation

$$
\mathbb{E}_ x[f|y] = \sum_x p[x|y]f[x]
$$

Variance [Phương sai]

$$
\begin{align}
\mathrm{var}[f] & = \mathbb{E}\big[\big[f[x] - \mathbb{E}[f[x]]\big]^2\big] \
& = \mathbb{E}[f[x]^2] - \mathbb{E}[f[x]]^2
\end{align}
$$

  • Đặc biệt:

$$
\mathrm{var}[x] = \mathbb{E}[x^2] - \mathbb{E}[x]^2
$$

Covariance

Covariance giữa 2 biến x,y là 1 ma trận:

$$
\begin{align}
\mathrm{cov}[x,y] &= \mathbb{E}_ {x,y}\big[{x-\mathbb{E}[x]}{y-\mathbb{E}[y]}\big] \
&= \mathbb{E}_ {x,y}[xy] -\mathbb{E}[x]\mathbb{E}[y]
\end{align}
$$

Trường hợp biến ngẫu nhiên nhiều chiều:

$$
\begin{align}
\mathrm{cov}[\mathbf{x},\mathbf{y}] &= \mathbb{E}_ {\mathbf{x},\mathbf{y}}\big[{\mathbf{x}-\mathbb{E}[\mathbf{x}]}{\mathbf{y}^T-\mathbb{E}[\mathbf{y}^T]}\big] \
&= \mathbb{E}_ {\mathbf{x},\mathbf{y}}[\mathbf{x}\mathbf{y}^T] -\mathbb{E}[\mathbf{x}]\mathbb{E}[\mathbf{y}^T]
\end{align}
$$

Baysian probabilities

Quay trở lại với bài toán curve fitting.

  • Observed data $ \mathcal{D} = {t_ 1,\ldots,t_ N} $
  • Parameters $\mathbf{w}$

Frequentist perspective

  • $\mathbf{w}$ là cố định [chỉ tồn tại 1]
  • Likelihood: $p[\mathcal{D}|\mathbf{w}]$
    • có parameters $\mathbf{w}$, xác suất để sinh ra data $\mathcal{D}$
  • Maximum likelihood:
    • tìm $\mathbf{w}$ để $p[\mathcal{D}|\mathbf{w}]$ là lớn nhất

Bayes perspective

$\mathbf{w}$ không cố định nên cũng có thể coi là 1 biến ngẫu nhiên với xác suất là $p[\mathbf{w}]$

Theo định lý Bayes:

$$
p[\mathbf{w}|\mathcal{D}] = \frac{p[\mathcal{D}|\mathbf{w}]p[\mathbf{w}]}{p[\mathcal{D}]}
$$

Thay vì chỉ tìm max của likelihood thì cần phải tìm max của posterior $p[\mathbf{w}|\mathcal{D}]$

Video liên quan

Chủ Đề