Untitled

2026-02-04 数学笔记/03.概率论与数理统计 Hongwei Zhao

随机变量及其分布¶

随机变量的概念¶

随机变量（Random variable） ：值随机会而定的变量，研究随机试验的一串事件。可按维数分为一维、二维至多维随机变量。按性质可分为离散型随机变量以及连续型随机变量。
分布（Distribution） ：事件之间的联系，用来计算概率。
示性函数（Indication function） ：$I_A(\omega)=\begin{cases}
1& \omega \in A \
0& \text{ 反之}
\end{cases} $，事件$ A $随机变量$ I_A $示出来，$ I_A $为事件$ A$ 示性函数。

离散型随机变量及其分布¶

离散型随机变量 ：设 $X$ 一随机变量，如果 $X$ 只取有限个或可数个值，则称 $X$ 一个（一维）离散型随机变量。
概率函数 ：设 $X$ 一随机变量，其全部可能值为 ${a_1, a_2,...}$ ，则 $p_i=P(X=a_i),i=1,2,...$ 为 $X$ 概率函数。
概率分布 ：离散型随机变量的概率分布可以用分布表来表示：

可能值	$a_1$	$a_2$	...	$a_i$	...
概率	$p_1$	$p_2$	...	$p_i$	...

概率分布函数 ：

定义：设 $X$ 一随机变量，则函数

F(X)=P(X\leq x)\quad(-\infty<x<\infty)

称为 $X$ 分布函数。（注：这里并未限定 $X$ 离散型的，它对任何随机变量都有定义。）

性质：
- $F(x)是单调非降的：当x_1<x_2 ，有F(x_1)\leq F(X_2).$
- 当 $x \rightarrow \infty$ ， $F(x)\rightarrow1$ ；当 $x \rightarrow-\infty$ ， $F(x)\rightarrow0$ .
离散型随机变量分布函数 ：

对于离散型随机变量， $F(X)=P(X\leq x)=\sum_{{i|a_i\leq x}}p_i, \quad p_i=P(X=i)=F(i)-F(i-1)$ 。

二项分布（Bionomial distribution）：

定义：设某事件 $A$ 一次试验中发生的概率为 $p$ ，先把试验独立地重复n次，以 $X$ $A$ 这n次试验中发生的次数，则 $X$ 值 $0,1,...,n$ ，且有

P(X=k)=\binom{n}{k}p^k(1-p)^{n-k},\quad k=0,1,...,n

称X 从二项分布，记为X\sim B(n,p). 服从二项分布的条件 ：1. 各次试验的条件是稳定的，即事件A 概率p 各次试验中保持不变；2. 各次试验的独立性 泊松分布（Poisson distribution） ： 定义 ：设随机变量X 概率分布为

P(X=i)=\frac{\lambda^i}{i!}e^{-\lambda},\quad i=0,1,2,...,\quad\lambda>0

则称X 从参数为\lambda Poisson分布，并记X\sim P(\lambda). 特点 ： 描述稀有事件发生概率 作为二项分布的近似。若X\sim B(n,p)，其中n 大，p 小，而np=\lambda 太大时（一般n>30,np\leq5），则X 分布接近泊松分布P(\lambda). 推导 ： 若事件A\sim B(n,p)，且n 大，p 小，而np=\lambda 太大时，设\lambda=np，

\begin{align}
P(X=i)&=\lim_{n\rightarrow \infty}\binom{n}{i}(\frac{\lambda}{n})^i(1-\frac{\lambda}{n})^{n-i}\
&=\lambda^i\lim_{n\rightarrow \infty}\frac{\binom{n}{i}}{n^i}\lim_{n\rightarrow \infty}(1-\frac{\lambda}{n})^{n-i}\
&=\lambda^i e^{-\lambda}\lim_{n\rightarrow \infty}\frac{n(n-1)(n-2)...(n-i+1)}{i!n^i}\
&=\lambda^i e^{-\lambda}\lim_{n\rightarrow \infty}\frac{(1-\frac{1}{n})(1-\frac{2}{n})...(1-\frac{i-1}{n})}{i!}\
&=\frac{\lambda^i}{i!}e^{-\lambda}
\end{align}

连续型随机变量及其分布¶ 连续型随机变量 ：设X 一随机变量，如果X不仅有无限个而且有不可数个值，则称X 一个连续型随机变量。 概率密度函数 ： 定义 ：设连续型随机变量X 概率分布函数F(x)，则F(x) 导数f(x)=F'(x) 为X 概率密度函数。 性质 ： 对于所有的-\infty<x<+\infty，有f(x)\ge 0； \int_{-\infty}^{+\infty}f(x)dx=1； 对于任意的-\infty<a\leq b<+\infty，有P(a\leq X\leq b)=F(b)-F(a)=\int_{a}^{b}f(x)dx. 注 ： 对于任意的-\infty<x<+\infty，有P(X=x)=\int_{x}^{x}f(u)du=0. 假设有总共一个单位的质量连续地分布在a\leq x\leq b ，那么f(x) 示在点x 质量密度且\int_{c}^{d}f(x)dx 示在区间[c, d] 的全部质量。 概率分布函数 ：设X 一连续型随机变量，则

F(x)=\int_{-\infty}^xf(u)du,\quad-\infty<x<+\infty

正态分布（ Normal distribution ） ： 定义 ：如果一个随机变量具有概率密度函数

f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad -\infty<x<+\infty

其中-\infty<\mu<+\infty,\ \sigma^2>0，则称X 正态随机变量，并记为X\sim N(\mu,\sigma^2).特别地，\mu=0,\sigma=1 正态分布成为标准正态分布。用\Phi(x) \phi(x) 示标准正态分布N(0,1) 分布函数和密度函数。 性质 ： 正态分布的密度函数是以x=\mu 对称轴的对称函数，\mu 为位置参数，密度函数在x=\mu 达到最大值，在(-\infty,\mu) (\mu,+\infty) 严格单调。 \sigma 大小决定了密度函数的陡峭程度，通常称\sigma 正态分布的形状参数。 若X\sim N(\mu,\sigma^2)，则Y=(X-\mu)/\sigma\sim N(0,1). \Phi(-k)=1-\Phi(k) 图像（密度和分布函数图） ： 指数分布（Exponential distribution） ： 定义 ：若随机变量X 有概率密度函数

f(x)=
\begin{cases}
\lambda e^{-\lambda x}& x>0 \
0& x\leq 0
\end{cases}
=\lambda e^{-\lambda x}I_{(0,\infty)}(x)

其中\lambda >0 常数，则称X 从参数为\lambda 指数分布。 概率分布函数 ：$F(x)=\begin{cases} 1-e^{-\lambda x}& x>0 \ 0& x\leq 0 \end{cases}=(1-e^{-\lambda x})I_{(0,\infty)}(x)$ 性质 ： 无后效性，即无老化，要来描述寿命（如元件等）的分布。 证明 ： “无老化”就是说在时刻x 常工作的条件下，其失效率总保持为某个常数\lambda>0，与x 关，可表示

\begin{align}
&P(x\leq X\leq x+h|X>x)/h=\lambda\quad(h\rightarrow0)\
证：\
&\lim_{h\rightarrow0}\frac{P(x\leq X\leq x+h|X>x)}{h}\
=&\lim_{h\rightarrow0}\frac{P(x\leq X\leq x+h,X>x)}{P(X>x)h}\
=&\lim_{h\rightarrow0}\frac{P(x< X\leq x+h)}{P(X>x)h}\
=&\lim_{h\rightarrow0}\frac{-e^{-\lambda t}|^{x+h}{x}}{-e^{-\lambda t}|^{\infty}{x}h}\
=&\lim_{h\rightarrow0}\frac{e^{-\lambda x}-e^{-\lambda x-\lambda h}}{e^{-\lambda x}h}\
=&\lim_{h\rightarrow0}\frac{1-\frac{1}{e^{xh}}}{h}\
=&\lim_{h\rightarrow0}\lambda e^{-\lambda h}\
=&\lambda
\end{align}

\lambda 失效率，失效率越高，平均寿命就越小。 图像（密度函数） ： 均匀分布（Uniform distribution） ： 定义 ：设a<b，如果分布F(x) 有密度函数

f(x)=
\begin{cases}
\frac{1}{b-a}& a\leq x\leq b \
0& 其它
\end{cases}
=\frac{1}{b-a}I_{(a,b)}(x)

则该分布为区间[a,b] 的均匀分布。 概率分布函数 ：$F(x)=\begin{cases} 0& x\leq a \ \frac{x-a}{b-a}& ab \end{cases}$ 性质 ：\forall R(c,d) \subset R(a,b),\ P(c<X<d)=\frac{d-c}{b-a} 多维随机变量（随机向量）¶ 随机向量 ：设X={X_1,...,X_n}.如果每个X_i 是一个随机变量，i=1,...,n，则称X n 随机变量或者随机向量。 离散型随机向量的分布 ：如果每一个X_i 是一个离散型随机变量，i=1,...,n，则称X={X_1,...,X_n} 一n 离散型随机变量。设X_i 所有可能取值为{a_{i1},a{i2},...},\quad i=1,...,n，则称

p(j_1,...,j_n)=P(X_1=a_{1j_1},...,X_n=a_{nj_n}),\quad j_1,...,j_n=1,2,...

为n 随机变量X 概率函数，这也是其联合分布。 其具有下列性质： p(j_1,...,j_n)\geq0,\quad j_i=1,2,...,\quad i=1,2,...,n; \sum_{j_1,...,j_n}p(j_1,...,j_n)=1. 注 ：对于高维离散型随机变量，一般不使用分布函数 多项式分布 定义 ：设A_1,A_2,...,A_n 某一试验之下的完备事件群，分别以p_1,p_2,...,p_n 事件A_1,A_2,...,A_n 概率，则p_i\geq 0,\quad p_1+...+p_n=1.将试验独立地重复N ，以X_i 在这N 试验中事件A_i 现的次数(i=1,...,n)，则X=(X_1,...,X_n) 一个n 随机向量。该分布记作M(N;p_1,...,p_n). 概率分布函数 ：P(X_1=k_1,X_2=k_2,...,X_n=k_n)=\frac{N!}{k_1!k_2!...k_n!}p_1^{k_1}p_2^{k_2}....p_n^{k_n} 连续型随机向量的分布 ：X={X_1,...,X_n} n 连续型随机变量，如果存在\R^n 的非负函数f(x_1,...,x_n)，使得对任意的-\infty<a_1\leq b_1<+\infty,...,-\infty<a_n\leq b_n <+\infty，有

P(a_1\leq X_1 \leq b_1,...,a_n\leq X_n\leq b_n)=\int_{a_n}^{b_n} ...\int_{a_1}^{b_1}f(x_1,...,x_n)dx_1...dx_n

则称为 f X 概率密度函数。有

P(a_1\leq X_1 \leq b_1,...,a_n\leq X_n\leq b_n)=F(x_1,...,x_n)

则称为F X （联合）分布函数。其中分布函数F(X_1,...,X_n) 有下述性质： F(x_1,...,x_n) 调非降； 对任意的1\leq j \leq n，有\lim_{x_j\rightarrow-\infty F(x_1,...,x_n)}=0； \lim_{x_1\rightarrow\infty,...,x_n\rightarrow\infty}F(x_1,...,x_n)=1 边缘分布 ：因为X 每个分量X_i 是一维随机变量，故它们都有各自的分布F_i\ (i=1,...,n)，这些都是一维分布，称为随机向量X 其分布F 边缘分布。 离散型随机向量 行和与列和就是边缘分布。即固定某个x_i，即可计算边缘分布，故有

p_X(x_i)=P(X=x_i)=\sum_{j}^{m}P(X=x_i,Y=y_j)=\sum_{j}^{m}p_{ij}=p_{i\cdot},\quad i=1,2,...,n\
p_Y(y_i)=P(Y=y_i)=\sum_{i}^{m}P(X=x_i,Y=y_j)=\sum_{i}^{m}p_{ij}=p_{j\cdot},\quad j=1,2,...,n

连续型随机向量 为求某分量X_i 概率密度函数，只需把f(x_1,...,x_n) 的x_i 定，然后对x_1,...,x_{i-1},x_{i+1},...,x_n -\infty \infty 间做定积分，如

(X,Y)\sim f(x, y)\
f_X(u)=\int^{+\infty}{-\infty}f(u,v)dv\
f_Y(u)=\int^{+\infty}{-\infty}f(u,v)du\

注 ：二维正态分布N(a,b,\sigma_1^2,\sigma_2^2,\rho ) 边缘分布密度分别是一维正态分布N(a,\sigma_1^2) N(b,\sigma_2^2)。因此联合分布可推边缘分布，而边缘分布不可推联合分布。 条件分布和随机变量的独立性¶ 离散型随机变量的条件分布 ：设(X,Y) 二维离散型随机变量，对于给定的事件{Y=y_j}，其概率P(Y=y_j)>0，则称

P(X=x_i|Y=y_j)=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}=\frac{p_{ij}}{p_{\cdot j}},\quad i=1,2,...

为在给定 Y=y_j 条件下 X 条件分布律。类似的，称

P(Y=y_i|X=x_j)=\frac{P(X=x_i,Y=y_j)}{P(X=x_j)}=\frac{p_{ij}}{p_{i\cdot}},\quad j=1,2,...

为在给定 X=x_j 条件下 Y 条件分布律。 连续型随机变量的条件分布 ：设 (X,Y) 二维连续型随机变量，对于给定条件 Y=y 的条件概率密度为

f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}, \quad f_Y(y)>0.\

类似的，在 X=x 的条件概率密度为

f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}, \quad f_X(x)>0.\

二维正态分布\rho=0 ，其联合密度分布等于条件密度分布的乘积。 随机变量的独立性 称随机变量X_1, ...,X_n 互独立， 离散型随机变量 则联合分布律等于各自的边缘分布律的乘积，即

P(X_1=x_1,...,X_n=x_n)=P(X_1=x_1)...P(X_n=x_n)

其中 (x_1,...x_n) (X_1,...,X_n) 值域中的任意一点。 连续型随机变量 则联合密度等于各自的边缘密度的乘积，即

f(x_1,...,x_n)=f_1(x_1)...f_n(x_n),\quad \forall(x_1,...,x_n)\in \R ^n

更具一般地 设 X_1,...,X_n n 随机变量，如果它们的联合分布函数等于各自边缘分布函数的乘积，即

F(X_1, ...,x_n)=F_1(x_1)...F_n(x_n),\quad \forall (x_1,...,x_n)\in \R^n

则称随机变量X_1, ...,X_n 互独立。 一些重要的结论 随机变量的函数的概率分布¶   最简单的情形，是由一维随机变量X 概率分布去求其一给定函数Y=g(X) 分布。较为常见的，是由(X_1,X_2,...,X_n) 分布去求Y=g(X_1,X_2,...,X_n) 分布。更一般地，由(X_1,X_2,...,X_n) 分布去求(Y_1,Y_2,...,Y_m) 分布，其中Y_i=g_i(X_1,X_2,...,X_n),\quad i=1,2,...,m. 离散型分布的情形 ：设X 分布律为P(X=x_i)=p_i,\quad i=1,2,... g:R\rightarrow R，令Y=g(X)，则Y 分布律为

P(Y=y_j)=P(g(X)=y_j)=\sum_{x_i:g(x_i)=y_j}P(X=x_i)=\sum_{i:g(x_i)=y_j}p_i

即把Y=g(X_1,...,X_n) 以取的不同值找出来，把与某个值相应的全部(X_1,...,X_n) 的概率加起来，即得Y 这个值的概率。 连续型分布的情形 一个变量的情况 设X 密度函数f(x).设Y=g(x)，g 一个严格单调的函数，即当x_1 ，必有g(x_1)\ 当x_1>x_2 ，必有g(x_1)>g(x_2).又设g 导数g' 在。由于g 严格单调性，其反函数X=h(Y) 在，且h 导数h' 存在。有g(X) 密度函数l(y)

l(y)=f(h(y))|h'(y)|.

多个变量的情形 以两个为例，设 (X_1,X_2) 密度函数 f(x_1,x_2) ， Y_1,Y_2 是 (X_1,X_2) 函数：

Y_1=g_1(X_1,X_2),\quad Y_2=g_2(X_1,X_2),

要求 (Y_1,Y_2) 概率密度函数 l(y_1,y_2) .假定 (X_1,X_2) (Y_1,Y_2) 一一对应变换有逆变换：

X_1=h_1(Y_1,Y_2),\quad X_2=h_2(Y_1,Y_2)

即雅可比行列式

J(y_1,y_2)=\begin{vmatrix}
\partial h_1/\partial y_1&\partial h_1/\partial y_2 \
\partial h_2/\partial y_1&\partial h_2/ \partial y_2
\end{vmatrix}

不为0.在 (Y1,Y2) 平面上任取一个区域 A ，变换后到 (X_1,X_2) 面的区域 B ，则有

P((Y_1,Y_2)\in A)=P((X_1,X_2)\in B)=\iint_Bf(x_1,x_2)dx_1dx_2\
P((Y_1,Y_2)\in A)=\iint_Af(h_1(y_1,y_2),h_2(y_1,y_2))|J(y_1,y_2)|dy_1dy_2

随机变量和的密度函数 设(X_1,X_2) 联合密度函数为f(x_1,x_2)，Y=X_1+X_2 密度函数： 一般的，l(y)=\int_{-\infty}^\infty f(x_1,y-x_1)dx_1=\int_{-\infty}^\infty f(x,y-x)dx. 若X_1,X_2 立，则l(y)=\int_{-\infty}^\infty f_1(x)f_2(y-x)dx=\int_{-\infty}^\infty f_1(y-x)f_2(x)dx. 两个独立的正态变量的和仍服从正态分布，且有关的参数相加，其逆命题也成立。 随机变量商的密度函数 设(X_1,X_2) 联合密度函数为f(x_1,x_2)，Y=X_1/X_2 密度函数： 一般的，l(y)=\int_{0}^\infty x_1f(x_1,x_1y)dx_1. 若X_1,X_2 立，则l(y)=\int_{0}^\infty x_1f_1(x_1)f_2(x_1y)dx_1. 统计学三大分布 引入两个重要的特殊函数： \Gamma(x)=\int_0^\infty e^{-t}t^{x-1}dt\quad (x>0) 和 B(x,y)=\int_0^1t^{x-1}(1-t)^{y-1}dt\quad (x>0,y>0) 其中，\Gamma(1)=1,\quad \Gamma(1/2)=\sqrt{\pi},\quad \Gamma(n)=(n-1)! B(x,y)=\Gamma(x)\Gamma(y)/\Gamma(x+y) 卡方分布，记作\chi_n^2 密度函数 ：k_n(x)=\frac{1}{\Gamma(\frac{n}{2}2^{n/2})}e^{-x/2}x^{(n-2)/2}I_{(0,\infty)}(x) 性质 ：1. 设X_1,X_2 立，X_1\sim\chi_m^2,X_2\sim\chi_n^2，则X_1+X_2\sim\chi_{m+n}^2 ​ 2. 若X_1,...,X_n 立，且都服从指数分布，则X=2\lambda(X_1+...+X_n)\sim\chi_{2n}^2 t 布，记作t_n 设X_1，X_2 立，X_1\sim\chi_n^2,X_2\sim N(0,1)，而Y=X_2/\sqrt{X_1/n}，则Y\sim t_n. 密度函数 ：t_n(y)=\frac{\Gamma((n+1)/2)}{\sqrt{n\pi}\Gamma(n/2)}(1+\frac{y^2}{n})^{(\frac{n+1}{2})} 性质 ：密度函数关于原点对称，其图形与正态分布N(0,1) 密度函数的图形相似。 F 布，记作F_{mn} 设X_1,X_2 立，X_1\sim\chi_n^2,X_2\sim\chi_m^2，而Y=m^{-1}X_2/(n^{-1}X_1)，则Y\sim F_{mn} 密度函数 ：f_{mn}(y)=m^{m/2}n^{n/2}\frac{\Gamma(\frac{m+n}{2})}{\Gamma(\frac{m}{2})\Gamma(\frac{n}{2})}y^{m/2-1}(my+n)^{-(m+n)/2}\quad (y>0) 三大分布的几个重要性质 设X_1,...,X_n 立同分布，有公共的正态分布N(\mu,\sigma^2).记\bar{X}=(X_1+...+X_n),S^2=\sum_{i=1}^{n}(X_i-\bar(X))^2/(n-1).则(n-1)S^2/\sigma^2=\sum_{i=1}^{n}(X_i-\bar{X})^2/\sigma^2\sim\chi_{n-1}^{2}. 设X_1,...,X_n 假定同1，则\sqrt{n}(\bar{X}-\mu)/S\sim t_{n-1} 设X_1,...,X_n,Y_1,...,Y_m 立，X_i 有分布N(\mu1,\sigma_1^2)，Y_j 有分布N(\mu_2,\sigma_2^2)，则

[\sum_{j=1}^m(Y_j-\bar{Y})^2/(\sigma_2^2(m-1))]/[\sum_{i=1}^n(X_i-\bar{X})^2/(\sigma_1^2(n-1))]\sim F_{m-1,n-1}

若\sigma_1^2=\sigma_2^2，则

\sqrt{\frac{nm(n+m-2)}{n+m}}[(\bar{X}-\bar{Y})-(\mu_1-\mu_2)]/[\sum_{i=1}^{n}(X_i-\bar{X})^2+\sum_{j=1}^m(Y_j-\bar{Y})^2]^{1/2}\sim t_{n+m-2}
$$

随机变量及其分布¶

随机变量的概念¶

离散型随机变量及其分布¶

连续型随机变量及其分布¶

多维随机变量（随机向量）¶

条件分布和随机变量的独立性¶

随机变量的函数的概率分布¶

¶

评论