Kiến thức

Tổng hợp kiến thức Lý thuyết xác suất & Thống kê toán

At first, we sample in the ( is odd) equidistant points around :

where is some step.
Then we interpolate points by polynomial

(1)

Its coefficients are found as a solution of system of linear equations:

(2)

Here are references to existing equations: (

1

), (

2

).
Here is reference to non-existing equation (??).
LÝ THUYẾT XÁC SUẤT

THỐNG KÊ MÔ TẢ

 Tổng thể (Population) Mẫu (Sample) Kích thước (size) $N$ $n$ Liệt kê giá trị $(x_1,x_2,...,x_N)$ $(x_1,x_2,...,x_n)$ Trung bình (mean) $\mu=\frac{\sum_{i=1}^{N}x_i&space;}{N}$ $\bar{x}=\frac{\sum_{i=1}^n&space;x_i}{n}$ Phương sai (variance) $\sigma^2=\frac{\sum_{i=1}^{N}(x_i&space;-&space;\mu)^2}{N}$ $s^2=\frac{\sum_{i=1}^{n}(x_i&space;-&space;\bar{x})^2}{n-1}$ Độ lệch chuẩn (standard deviation) $\sigma&space;=&space;\sqrt{\sigma^2}$ $s=\sqrt{s^2}$ Hệ số biến thiên (Coef. of variation) $CV=\frac{\sigma}{\mu}\cdot&space;100\%$ $CV=\frac{s}{\bar{x}}&space;\cdot&space;100\%$ Tứ phân vị (Quartile) $Q_1,Q_2,Q_3$ Khoảng tứ phân vị (Interquartile Range) $IQR=Q_3&space;-&space;Q_1$ Giá trị chuẩn hóa (Z-score) $z_i&space;=&space;\frac{x_i-\mu}{\sigma}$ $z_i&space;=&space;\frac{x_i&space;-&space;\bar{x}}{s}$ Hệ số bất đối xứng (Skewness) $a_3&space;=&space;\frac{\sum_{i=1}^{n}(x_i-\bar{x})^3&space;/&space;n}{s^3}$ Hệ số nhọn (Kurtorsis) $a_4&space;=&space;\frac{\sum_{i=1}^n&space;(x_i&space;-\bar{x})^4/n}{s^4}$ $Kurt&space;=&space;\frac{\sum_{i=1}^n&space;(x_i&space;-\bar{x})^4/n}{s^4}&space;-&space;3$ Hiệp phương sai (Covariance) $Cov(X,Y)=\frac{\sum_{i=1}^{N}(x_i-\mu_X)(y_i&space;-&space;\mu_Y)}{N}$ $cov(X,Y)=\frac{\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})}{n-1}$ Hệ số tương quan (Correlation coef.) $\rho(X,Y)=\frac{Cov(X,Y)}{\sigma_X&space;\sigma_Y}$ $r(X,Y)=\frac{cov(X,Y)}{s_X&space;s_Y}$

CÁC CÔNG THỨC XÁC SUẤT

 Xác suất theo định nghĩa cổ điển (Classical definition) $P(A)=\frac{N_A}{N}$ Xác suất theo định nghĩa thống kê (Statistical definition) $P(A)&space;\approx&space;\frac{f_A}{n}$ khi  $n&space;\to&space;\infty$ Xác suất hai biến cố đối lập (Prob. of complement events) $P(\bar{A})&space;+&space;P(A)=1$ Xác suất tích hai biến cố (Prob. of intersection) $P(A&space;\cdot&space;B)&space;=&space;P(A)&space;\cdot&space;P(B|A)=&space;P(B)&space;\cdot&space;P(A|B)$ Xác suất có điều kiện (Conditional probability) $P(A|B)=\frac{P(A\cdot&space;B)}{P(B)}$ Hai biến cố độc lập (Independent events) $P(A|B)=P(B)$ và  $P(B|A)=P(B)$ $P(A\cdot&space;B)=P(A)\cdot&space;P(B)$ Nhiều biến cố độc lập toàn phần (Totally independent events) $P&space;\left(\prod_{i=1}^{n}&space;A_i&space;\right)&space;=&space;\prod_{i=1}^{n}&space;P(A_i)$ Xác suất tổng hai biến cố (Prob. of union) $P(A+B)=P(A)+P(B)-P(A\cdot&space;B)$ Hai biến cố xung khắc (Mutually exclusive events) $P(A+B)=P(A)+P(B)$ Nhiều biến cố xung khắc (Mutually exclusive events) $P\left(&space;\sum_{i=1}^{n}A_i&space;\right)=\sum_{i=1}^{n}P(A_i)$ Công thức xác suất đầy đủ (Total probability) $P(B)=\sum_{i=1}^{n}P(A_i)\cdot&space;P(B|A_i)$ Công thức Bayes (Bayes’s theorem) $P(A_i|B)=\frac{P(B\cdot&space;A_i)}{P(B)}=\frac{P(A_i)\cdot&space;P(B|A_i)}{\sum_{i=1}^{n}P(A_i)\cdot&space;P(B|A_i)}$

BIẾN NGẪU NHIÊN

Bảng phân phối xác suất của BNN rời rạc
 $X$ $x_1$ $x_2$ $\cdots$ $x_n$ $P(X)$ $p_1$ $p_2$ $\cdots$ $p_n$

$\sum_{i=1}^{n}p_i&space;=&space;1$

Hàm phân phối xác suất $F(x)=P(X

$P(a\leq&space;X

Hàm mật độ xác suất của BNN liên tục $f(x)=F^\prime(x)$

$\int_{-\infty}^{+\infty}f(x)dx=1$

$P(a

Kỳ vọng $E(X)=&space;\begin{cases}&space;\displaystyle&space;\sum_{i=1}^{n}x_i&space;p_i&space;&&space;\text{&space;discrete&space;}&space;\\&space;\displaystyle&space;\int_{-\infty}^{+\infty}&space;x&space;f(x)&space;dx&space;&&space;\text{&space;continuous&space;}&space;\end{cases}$
Phương sai $V(X)=&space;E\big[X&space;-&space;E(X)&space;\big]^2&space;=&space;E(X^2)&space;-&space;\big[E(X)&space;\big]^2$

$E(X^2)=&space;\begin{cases}&space;\displaystyle&space;\sum_{i=1}^{n}x_i^2&space;p_i&space;&&space;\text{&space;discrete&space;}&space;\\&space;\displaystyle&space;\int_{-\infty}^{+\infty}&space;x^2&space;f(x)&space;dx&space;&&space;\text{&space;continuous&space;}&space;\end{cases}$

Độ lệch chuẩn $\sigma&space;=&space;\sqrt{V(X)}$
Mốt

Biến ngẫu nhiên hai chiều rời rạc

 $X$   $Y$ $y_1$ $y_2$ $\cdots$ $y_m$ $\sum&space;=&space;P(X)$ $x_1$ $p_{11}$ $p_{12}$ $\cdots$ $p_{1m}$ $P(x_1)$ $x_2$ $p_{21}$ $p_{22}$ $\cdots$ $p_{2m}$ $P(x_2)$ $\vdots$ $\vdots$ $\vdots$ $\ddots$ $\vdots$ $\vdots$ $x_n$ $p_{n1}$ $p_{n2}$ $\cdots$ $p_{nm}$ $P(x_n)$ $\sum&space;=&space;P(Y)$ $P(y_1)$ $P(y_2)$ $\cdots$ $P(y_m)$ $1$

 Hiệp phương sai $Cov(X,Y)=E\Big[\big[X&space;-&space;E(X)\big]&space;\big[Y&space;-&space;E(Y)&space;\big]&space;\Big]$ $=&space;E(X&space;\cdot&space;Y)&space;-&space;E(X)\cdot&space;E(Y)&space;=&space;\sum_{i}&space;\sum_{j}&space;x_i&space;y_j&space;p_{ij}&space;-&space;E(X)\cdot&space;E(Y)$ Hệ số tương quan $\rho(X,Y)=\frac{Cov(X,Y)}{\sigma_X&space;\sigma_Y}$ Nếu $X,Y$độc lập $Cov(X,Y)=&space;\rho(X,Y)=0$ Tính chất của kì vọng, phương sai Với $c$ là hằng số Kì vọng Phương sai $E(c)=c$ $V(c)=0$ $E(X+c)=E(X)+c$ $V(X+c)=V(X)$ $E(c\cdot&space;X)=c\cdot&space;E(X)$ $V(c\cdot&space;X)&space;=&space;c^2&space;\cdot&space;V(X)$ $E(X&space;\pm&space;Y)=E(X)\pm&space;E(Y)$ $V(X\pm&space;Y)=&space;V(X)&space;+&space;V(Y)&space;\pm&space;2&space;Cov(X,Y)$ $E\big(\sum&space;X_i&space;\big)=\sum&space;E(X_i)$ $V\big(\sum&space;X_i&space;\big)=\sum&space;V(X_i)$ nếu các $X_i$ độc lập

PHÂN PHỐI XÁC SUẤT THÔNG DỤNG

 Phân phối Không-một Bernoulli:$A(p)$ Công thức tính xác suất $P(X=x)=p^x&space;(1-p)^{1-x}&space;\quad;&space;\quad&space;x&space;=&space;0,1$ Tham số $E(X)=p&space;\quad&space;;&space;\quad&space;V(X)=p(1-p)$ Phân phối Nhị thức Binomial: $B(n,p)$ Công thức tính xác suất $P(X=x)=C_n^xp^x(1-p)^{n-x}\quad;\quad&space;x=0,1,2,...,n$ Tham số $E(X)=np&space;\quad&space;;&space;\quad&space;V(X)=np(1-p)$ Phân phối Poisson $P(\lambda)$ Công thức tính xác suất $P(X=x)=\frac{\lambda^xe^{-\lambda}}{x!}&space;\quad;&space;\quad&space;x=0,1,2,...$ Tham số $E(X)=\lambda&space;\quad&space;;&space;\quad&space;V(X)=\lambda$ Phân phối Đều Uniform: $U(a,b)$ Hàm mật độ $f(x)=&space;\begin{cases}&space;\dfrac{1}{b-a}&space;&&space;:&space;x&space;\in&space;(a,b)&space;\\&space;\quad&space;0&space;&&space;:&space;x&space;\notin&space;(a,b)&space;\end{cases}$ Tham số $E(X)=&space;\frac{a+b}{2}&space;\quad&space;;&space;\quad&space;V(X)=&space;\frac{(b-a)^2}{12}$ Phân phối Chuẩn Normal: $N(\mu,&space;\sigma^2)$ Hàm mật độ $f(x)=\frac{1}{\sigma&space;\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}&space;\quad;&space;\quad&space;x&space;\in&space;\mathbb{R}$ Tham số $E(X)=\mu&space;\quad&space;;&space;\quad&space;V(X)&space;=&space;\sigma^2$ Chuẩn hóa $f(z)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}&space;\quad;&space;\quad&space;z&space;\in&space;\mathbb{R}$ Công thức xác suất $P(a $P(|X-\mu|&space;<&space;\varepsilon)&space;=&space;2&space;\cdot&space;P\left(Z&space;<&space;\frac{\varepsilon}{\sigma}&space;\right)$ Quy tắc $P(\mu-\sigma&space; $P(\mu-2\sigma&space; $P(\mu-3\sigma&space; Giá trị tới hạn $z_\alpha&space;:&space;P(Z&space;>z_\alpha&space;)&space;=&space;\alpha$ Phân phối Khi-bình phương Chi-squared: $\chi^2(n)$ Giá trị tới hạn $\chi^{2(n)}_\alpha&space;:&space;P&space;\Big[\chi^2(n)&space;>&space;\chi^{2(n)}_\alpha&space;\Big]&space;=&space;\alpha$ Phân phối Student $T(n)$ Giá trị tới hạn $t^{(n)}_{\alpha}&space;:&space;P\Big[T(n)&space;>&space;t^{(n)}_{\alpha}&space;\Big]&space;=&space;\alpha$ Phân phối Fisher $F(n_1,n_2)$ Giá trị tới hạn $f^{(n_1,n_2)}_\alpha&space;:&space;P\Big[F(n_1,n_2)&space;>&space;f^{(n_1,n_2)}_\alpha&space;\Big]&space;=&space;\alpha$

MẪU NGẪU NHIÊN

 Mẫu kích thước $n$ $W_n&space;=(X_1,X_2,...,X_n)$ Trung bình mẫu (sample mean) $\bar{X}=\frac{\sum_{i=1}^{n}X_i}{n}$ $E(\bar{X})=\mu$ ;  $V(\bar{X})=\frac{\sigma^2}{n}$ $\bar{X}\sim&space;N\Big(\mu,&space;\frac{\sigma^2}{n}\Big)$   ;  $\frac{\bar{X}-\mu}{S/\sqrt{n}}&space;\sim&space;T^{(n-1)}$ khi  $X&space;\sim&space;N(\mu,\sigma^2)$ hoặc khi $n$ đủ lớn Phương sai mẫu (sample variance) $S^2=\frac{\sum_{i=1}^{n}(X_i-\bar{X})^2}{n-1}$ $E(S^2)=\sigma^2$ $\frac{(n-1)S^2}{\sigma^2}&space;\sim&space;\chi^{2(n-1)}$ khi  $X&space;\sim&space;N(\mu,\sigma^2)$ Tần suất mẫu (sample proportion) $\hat{p}=\frac{X_A}{n}$ $E(\hat{p})=p$   ;    $V(\hat{p})=\frac{p(1-p)}{n}$ $\hat{p}&space;\sim&space;N\Big(p,&space;\frac{p(1-p)}{n}&space;\Big)$ khi $n$ đủ lớn Hiệp phương sai mẫu (sample covariance) $Cov(X,Y)=\frac{\sum_{i=1}^{n}(X_i-\bar{X})(Y_i-\bar{Y})}{n-1}$ Hệ số tương quan mẫu (sample correlation) $R_{X,Y}=\frac{Cov(X,Y)}{S_X&space;S_Y}$

ƯỚC LƯỢNG ĐIỂM

 Tính chất ước lượng điểm Không chệch (unbiasness) $E(\hat{\theta})&space;=&space;\theta$ Hiệu quả (efficient) không chệch và $V(\hat{\theta})$  nhỏ nhất Ước lượng hợp lý tối đa (maximum likelihood estimator) Hàm hợp lý $L(\theta)&space;=&space;\begin{cases}&space;\prod_i&space;P(x_i)&space;&:&space;\text{discrete}&space;\\&space;\prod_i&space;f(x_i)&space;&:&space;\text{continous}&space;\end{cases}$ Tối đa hóa hàm hợp lý hoặc logarit hàm hợp lý $L(\theta)&space;\rightarrow&space;max$ hoặc  $\ln&space;L(\theta)&space;\rightarrow&space;max$

KHOẢNG TIN CẬY (Confidence Interval)

 Trung bình tổng thể khi không biết $\sigma$ Hai phía $\bar{X}-t^{(n-1)}_{\alpha/2}\frac{S}{\sqrt{n}}<\mu<&space;\bar{X}+t^{(n-1)}_{\alpha/2}\frac{S}{\sqrt{n}}$ hay  $\bar{X}&space;\pm&space;\varepsilon$ $n=\Big(&space;t_{\alpha/2}^{(n-1)}&space;\frac{S}{\varepsilon}&space;\Big)^2$ Tối đa $\mu<&space;\bar{X}+t^{(n-1)}_{\alpha}\frac{S}{\sqrt{n}}$ Tối thiểu $\bar{X}-t^{(n-1)}_{\alpha}\frac{S}{\sqrt{n}}<\mu$ TB tổng thể khi biết $\sigma$ Hai phía $\bar{X}-z_{\alpha/2}\frac{\sigma}{\sqrt{n}}<\mu<\bar{X}+z_{\alpha/2}\frac{\sigma}{\sqrt{n}}$ $n=\Big(&space;z_{\alpha/2}&space;\frac{\sigma}{\varepsilon}&space;\Big)^2$ Phương sai tổng thể Hai phía $\frac{(n-1)S^2}{\chi^{2(n-1)}_{\alpha/2}}<\sigma^2<\frac{(n-1)S^2}{\chi^{2(n-1)}_{1-\alpha/2}}$ Tần suất tổng thể Hai phía $\hat{p}-z_{\alpha/2}\frac{\sqrt{\hat{p}(1-\hat{p})}}{\sqrt{n}} hay $\hat{p}&space;\pm&space;\varepsilon$ $n=z^2_{\alpha/2}&space;\frac{\hat{p}(1-\hat{p})}{\varepsilon^2}$

KIỂM ĐỊNH GIẢ THUYẾT VỀ THAM SỐ (Parametric Hypothesis Testing)

Kiểm định một tham số, một tổng thể, một mẫu

 Kiểm đinh Giả thuyết gốc Thống kê Giả thuyết đối Miền bác bỏ Trung bình tổng thể phân phối chuẩn, biết phương sai tổng thể $H_0:&space;\mu_1&space;=&space;\mu_2$ $T=\frac{\bar{X}-\mu_0}{\sigma&space;/&space;\sqrt{n}}$ $H_1:&space;\mu&space;\neq&space;\mu_0$ $|Z|&space;>&space;z_{\alpha/2}$ $H_1:&space;\mu&space;>&space;\mu_0$ $Z>z_\alpha$ $H_1:&space;\mu&space;<&space;\mu_0$ $Z&space;<&space;-&space;z_\alpha$ Trung bình tổng thể phân phối chuẩn, không biết phương sai tổng thể $H_0:&space;\mu_1&space;=&space;\mu_2$ $T=\frac{\bar{X}-\mu_0}{S&space;/&space;\sqrt{n}}$ $H_1:&space;\mu&space;\neq&space;\mu_0$ $|T|>t_{\alpha/2}^{(n-1)}$ $H_1:&space;\mu&space;>&space;\mu_0$ $T>t_{\alpha}^{(n-1)}$ $H_1:&space;\mu&space;<&space;\mu_0$ $T<-t_{\alpha}^{(n-1)}$ Phương sai tổng thể phân phối chuẩn $H_0:&space;\sigma^2&space;=&space;\sigma^2_0$ $\chi^2=\frac{(n-1)S^2}{\sigma^2_0}$ $H_1:&space;\sigma^2&space;\neq&space;\sigma^2_0$ $\chi^2>\chi^{2(n-1)}_{\alpha/2}$ hoặc $\chi^2&space;<&space;\chi^{2(n-1)}_{1-&space;\alpha/2}$ $H_1:&space;\sigma^2&space;>&space;\sigma^2_0$ $\chi^2>\chi^{2(n-1)}_{\alpha}$ $H_1:&space;\sigma^2&space;<&space;\sigma^2_0$ $\chi^2&space;<&space;\chi^{2(n-1)}_{1-&space;\alpha}$ Tần suất tổng thể $H_0:&space;p&space;=&space;p_0$ $Z=\frac{\hat{p}-p_0}{\sqrt{p_0(1-p_0)/n}}$ $H_1:&space;p&space;\neq&space;p_0$ $|Z|&space;>&space;z_{\alpha/2}$ $H_1:&space;p&space;>&space;p_0$ $Z>z_\alpha$ $H_1:&space;p&space;<&space;p_0$ $Z&space;<&space;-&space;z_\alpha$

Kiểm định hai tham số, hai tổng thể, hai mẫu

 Kiểm đinh Giả thuyết gốc Thống kê Giả thuyết đối Miền bác bỏ Hai trung bình tổng thể phân phối chuẩn, giả sử phương sai bằng nhau $H_0:&space;\mu_1&space;=&space;\mu_2$ $T=\frac{\bar{X}_1&space;-&space;\bar{X}_2}{\sqrt{S^2_p&space;\Big(&space;\dfrac{1}{n_1}&space;+&space;\dfrac{1}{n_2}\Big)}}$ $S^2_p&space;=&space;\frac{(n_1-1)S^2_1&space;+&space;(n_2-1)S^2_2}{n_1&space;+&space;n_2&space;-&space;2}$ $H_1:&space;\mu_1&space;\neq&space;\mu_2$ $|T|>t^{(n_1+n_2-2)}_{\alpha/2}$ $H_1:&space;\mu_1&space;>&space;\mu_2$ $T>t^{(n_1+n_2-2)}_{\alpha}$ $H_1:&space;\mu_1&space;<&space;\mu_2$ $T<-t^{(n_1+n_2-2)}_{\alpha}$ Hai trung bình tổng thể phân phối chuẩn, giả sử phương sai khác nhau $H_0:&space;\mu_1&space;=&space;\mu_2$ $T=\frac{\bar{X}_1&space;-&space;\bar{X}_2}{\sqrt{&space;\dfrac{S^2_1}{n_1}&space;+&space;\dfrac{S^2_2}{n_2}&space;}}$ $n_1>30,n_2>30$ $H_1:&space;\mu_1&space;\neq&space;\mu_2$ $|T|>z_{\alpha/2}$ $H_1:&space;\mu_1&space;>&space;\mu_2$ $T>z_{\alpha}$ $H_1:&space;\mu_1&space;<&space;\mu_2$ $T<-z_{\alpha}$ Hai phương sai tổng thể phân phối chuẩn $H_0:&space;\sigma^2_1&space;=&space;\sigma^2_2$ $F=\frac{S^2_1}{S^2_2}$ $H_1:&space;\sigma^2_1&space;\neq&space;\sigma^2_2$ $F>f^{(n_1-1,n_2-1)}_{\alpha/2}$ hoặc $F $H_1:&space;\sigma^2_1&space;>&space;\sigma^2_2$ $F>f^{(n_1-1,n_2-1)}_{\alpha}$ $H_1:&space;\sigma^2_1&space;<&space;\sigma^2_2$ $F Hai tần suất tổng thể $H_0:&space;p_1&space;=&space;p_2$ $Z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\bar{p}(1-\bar{p})&space;\Big(\dfrac{1}{n_1}&space;+&space;\dfrac{1}{n_2}\Big)}}$ $\bar{p}=\frac{n_1&space;\hat{p}_1&space;+&space;n_2&space;\hat{p}_2}{n_1&space;+&space;n_2}$ $H_1:&space;p_1&space;\neq&space;p_2$ $|Z|&space;>&space;z_{\alpha/2}$ $H_1:&space;p_1&space;>&space;p_2$ $Z>z_\alpha$ $H_1:&space;p_1&space;<&space;p_2$ $Z&space;<&space;-&space;z_\alpha$

KIỂM ĐỊNH PHI THAM SỐ (Non-parametric Testing)

 Thống kê Cặp giả thuyết Miền bác bỏ Kiểm định tính độc lập của hai dấu hiệu định tính $\chi^2=n&space;\Big[\sum_i&space;\sum_j&space;\frac{n_i&space;m_j}{n_{ij}^2}&space;-1&space;\Big]$ $H_0:$  hai dấu hiệu độc lập $H_1:$ hai dấu hiệu không độc lập $\chi^2&space;>&space;\chi^{2((h-1)(k-1))}_\alpha$ Jacque-Berra Kiểm định tính phân phối chuẩn $\chi^2=n&space;\Big[&space;\frac{Skew^2}{6}&space;+&space;\frac{K^2}{24}&space;\Big]$ $H_0:$ biến phân phối chuẩn $H_1:$ biến không phân phối chuẩn $\chi^2&space;>&space;\chi^{2(2)}_\alpha$

This entry was posted in

Cần biết

,

Hướng dẫn học tập

. Bookmark the