随机变量及其分布¶
随机变量的概念¶
- 随机变量(Random variable) :值随机会而定的变量,研究随机试验的一串事件。可按维数分为一维、二维至多维随机变量。按性质可分为离散型随机变量以及连续型随机变量。
- 分布(Distribution) :事件之间的联系,用来计算概率。
- 示性函数(Indication function) :$I_A(\omega)=\begin{cases}
1& \omega \in A \
0& \text{ 反之}
\end{cases},事件A 随机变量I_A 示出来,I_A 为事件A$ 示性函数。
离散型随机变量及其分布¶
-
离散型随机变量 :设X 一随机变量,如果X只取有限个或可数个值,则称X 一个(一维)离散型随机变量。
-
概率函数 :设X 一随机变量,其全部可能值为{a_1, a_2,...},则p_i=P(X=a_i),i=1,2,... 为X 概率函数。
-
概率分布 :离散型随机变量的概率分布可以用分布表来表示:
| 可能值 | a_1 | a_2 | ... | a_i | ... |
|---|---|---|---|---|---|
| 概率 | p_1 | p_2 | ... | p_i | ... |
- 概率分布函数 :
- 定义 :设X 一随机变量,则函数
F(X)=P(X\leq x)\quad(-\infty<x<\infty)
称为X 分布函数。(注:这里并未限定X 离散型的,它对任何随机变量都有定义。)
-
性质 :
- F(x)是单调非降的:当x_1<x_2 ,有F(x_1)\leq F(X_2).
- 当x \rightarrow \infty ,F(x)\rightarrow1;当x \rightarrow-\infty ,F(x)\rightarrow0.
离散型随机变量分布函数 :
对于离散型随机变量,F(X)=P(X\leq x)=\sum_{{i|a_i\leq x}}p_i, \quad p_i=P(X=i)=F(i)-F(i-1)。
- 二项分布(Bionomial distribution):
-
定义 :设某事件A 一次试验中发生的概率为p,先把试验独立地重复n次,以X A 这n次试验中发生的次数,则X 值0,1,...,n,且有
P(X=k)=\binom{n}{k}p^k(1-p)^{n-k},\quad k=0,1,...,n
称X 从二项分布,记为X\sim B(n,p).服从二项分布的条件 :1. 各次试验的条件是稳定的,即事件A 概率p 各次试验中保持不变;2. 各次试验的独立性
- 泊松分布(Poisson distribution) :
-
定义 :设随机变量X 概率分布为
P(X=i)=\frac{\lambda^i}{i!}e^{-\lambda},\quad i=0,1,2,...,\quad\lambda>0
则称X 从参数为\lambda Poisson分布,并记X\sim P(\lambda).特点 :
-
描述稀有事件发生概率
-
作为二项分布的近似。若X\sim B(n,p),其中n 大,p 小,而np=\lambda 太大时(一般n>30,np\leq5),则X 分布接近泊松分布P(\lambda).
推导 :
若事件A\sim B(n,p),且n 大,p 小,而np=\lambda 太大时,设\lambda=np,
\begin{align}
P(X=i)&=\lim_{n\rightarrow \infty}\binom{n}{i}(\frac{\lambda}{n})^i(1-\frac{\lambda}{n})^{n-i}\
&=\lambda^i\lim_{n\rightarrow \infty}\frac{\binom{n}{i}}{n^i}\lim_{n\rightarrow \infty}(1-\frac{\lambda}{n})^{n-i}\
&=\lambda^i e^{-\lambda}\lim_{n\rightarrow \infty}\frac{n(n-1)(n-2)...(n-i+1)}{i!n^i}\
&=\lambda^i e^{-\lambda}\lim_{n\rightarrow \infty}\frac{(1-\frac{1}{n})(1-\frac{2}{n})...(1-\frac{i-1}{n})}{i!}\
&=\frac{\lambda^i}{i!}e^{-\lambda}
\end{align}
连续型随机变量及其分布¶
-
连续型随机变量 :设X 一随机变量,如果X不仅有无限个而且有不可数个值,则称X 一个连续型随机变量。
-
概率密度函数 :
- 定义 :设连续型随机变量X 概率分布函数F(x),则F(x) 导数f(x)=F'(x) 为X 概率密度函数。
-
性质 :
- 对于所有的-\infty<x<+\infty,有f(x)\ge 0;
- \int_{-\infty}^{+\infty}f(x)dx=1;
- 对于任意的-\infty<a\leq b<+\infty,有P(a\leq X\leq b)=F(b)-F(a)=\int_{a}^{b}f(x)dx.
-
注 :
- 对于任意的-\infty<x<+\infty,有P(X=x)=\int_{x}^{x}f(u)du=0.
- 假设有总共一个单位的质量连续地分布在a\leq x\leq b ,那么f(x) 示在点x 质量密度且\int_{c}^{d}f(x)dx 示在区间[c, d] 的全部质量。
-
概率分布函数 :设X 一连续型随机变量,则
F(x)=\int_{-\infty}^xf(u)du,\quad-\infty<x<+\infty
正态分布(Normal distribution) :
-
定义 :如果一个随机变量具有概率密度函数
f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad -\infty<x<+\infty
其中-\infty<\mu<+\infty,\ \sigma^2>0,则称X 正态随机变量,并记为X\sim N(\mu,\sigma^2).特别地,\mu=0,\sigma=1 正态分布成为标准正态分布。用\Phi(x) \phi(x) 示标准正态分布N(0,1) 分布函数和密度函数。性质 :
- 正态分布的密度函数是以x=\mu 对称轴的对称函数,\mu 为位置参数,密度函数在x=\mu 达到最大值,在(-\infty,\mu) (\mu,+\infty) 严格单调。
- \sigma 大小决定了密度函数的陡峭程度,通常称\sigma 正态分布的形状参数。
- 若X\sim N(\mu,\sigma^2),则Y=(X-\mu)/\sigma\sim N(0,1).
- \Phi(-k)=1-\Phi(k)
图像(密度和分布函数图) :


- 指数分布(Exponential distribution) :
-
定义 :若随机变量X 有概率密度函数
f(x)=
\begin{cases}
\lambda e^{-\lambda x}& x>0 \
0& x\leq 0
\end{cases}
=\lambda e^{-\lambda x}I_{(0,\infty)}(x)
其中\lambda >0 常数,则称X 从参数为\lambda 指数分布。概率分布函数 :$F(x)=\begin{cases}
1-e^{-\lambda x}& x>0 \
0& x\leq 0
\end{cases}=(1-e^{-\lambda x})I_{(0,\infty)}(x)$性质 :
- 无后效性,即无老化,要来描述寿命(如元件等)的分布。
证明 :
“无老化”就是说在时刻x 常工作的条件下,其失效率总保持为某个常数\lambda>0,与x 关,可表示
\begin{align}
&P(x\leq X\leq x+h|X>x)/h=\lambda\quad(h\rightarrow0)\
证:\
&\lim_{h\rightarrow0}\frac{P(x\leq X\leq x+h|X>x)}{h}\
=&\lim_{h\rightarrow0}\frac{P(x\leq X\leq x+h,X>x)}{P(X>x)h}\
=&\lim_{h\rightarrow0}\frac{P(x< X\leq x+h)}{P(X>x)h}\
=&\lim_{h\rightarrow0}\frac{-e^{-\lambda t}|^{x+h}{x}}{-e^{-\lambda t}|^{\infty}{x}h}\
=&\lim_{h\rightarrow0}\frac{e^{-\lambda x}-e^{-\lambda x-\lambda h}}{e^{-\lambda x}h}\
=&\lim_{h\rightarrow0}\frac{1-\frac{1}{e^{xh}}}{h}\
=&\lim_{h\rightarrow0}\lambda e^{-\lambda h}\
=&\lambda
\end{align}
- \lambda 失效率,失效率越高,平均寿命就越小。
图像(密度函数) :

- 均匀分布(Uniform distribution) :
-
定义 :设a<b,如果分布F(x) 有密度函数
f(x)=
\begin{cases}
\frac{1}{b-a}& a\leq x\leq b \
0& 其它
\end{cases}
=\frac{1}{b-a}I_{(a,b)}(x)
则该分布为区间[a,b] 的均匀分布。概率分布函数 :$F(x)=\begin{cases}
0& x\leq a \
\frac{x-a}{b-a}& ab
\end{cases}$性质 :\forall R(c,d) \subset R(a,b),\ P(c<X<d)=\frac{d-c}{b-a}
多维随机变量(随机向量)¶
-
随机向量 :设X={X_1,...,X_n}.如果每个X_i 是一个随机变量,i=1,...,n,则称X n 随机变量或者随机向量。
-
离散型随机向量的分布 :如果每一个X_i 是一个离散型随机变量,i=1,...,n,则称X={X_1,...,X_n} 一n 离散型随机变量。设X_i 所有可能取值为{a_{i1},a{i2},...},\quad i=1,...,n,则称
p(j_1,...,j_n)=P(X_1=a_{1j_1},...,X_n=a_{nj_n}),\quad j_1,...,j_n=1,2,...
为n 随机变量X 概率函数,这也是其联合分布。其具有下列性质:
- p(j_1,...,j_n)\geq0,\quad j_i=1,2,...,\quad i=1,2,...,n;
- \sum_{j_1,...,j_n}p(j_1,...,j_n)=1.
注 :对于高维离散型随机变量,一般不使用分布函数
- 多项式分布
-
定义 :设A_1,A_2,...,A_n 某一试验之下的完备事件群,分别以p_1,p_2,...,p_n 事件A_1,A_2,...,A_n 概率,则p_i\geq 0,\quad p_1+...+p_n=1.将试验独立地重复N ,以X_i 在这N 试验中事件A_i 现的次数(i=1,...,n),则X=(X_1,...,X_n) 一个n 随机向量。该分布记作M(N;p_1,...,p_n).
-
概率分布函数 :P(X_1=k_1,X_2=k_2,...,X_n=k_n)=\frac{N!}{k_1!k_2!...k_n!}p_1^{k_1}p_2^{k_2}....p_n^{k_n}
- 连续型随机向量的分布 :X={X_1,...,X_n} n 连续型随机变量,如果存在\R^n 的非负函数f(x_1,...,x_n),使得对任意的-\infty<a_1\leq b_1<+\infty,...,-\infty<a_n\leq b_n <+\infty,有
P(a_1\leq X_1 \leq b_1,...,a_n\leq X_n\leq b_n)=\int_{a_n}^{b_n} ...\int_{a_1}^{b_1}f(x_1,...,x_n)dx_1...dx_n
则称为f X 概率密度函数。有
P(a_1\leq X_1 \leq b_1,...,a_n\leq X_n\leq b_n)=F(x_1,...,x_n)
则称为F X (联合)分布函数。其中分布函数F(X_1,...,X_n) 有下述性质:- F(x_1,...,x_n) 调非降;
- 对任意的1\leq j \leq n,有\lim_{x_j\rightarrow-\infty F(x_1,...,x_n)}=0;
- \lim_{x_1\rightarrow\infty,...,x_n\rightarrow\infty}F(x_1,...,x_n)=1
- 边缘分布 :因为X 每个分量X_i 是一维随机变量,故它们都有各自的分布F_i\ (i=1,...,n),这些都是一维分布,称为随机向量X 其分布F 边缘分布。
-
离散型随机向量

行和与列和就是边缘分布。即固定某个x_i,即可计算边缘分布,故有
p_X(x_i)=P(X=x_i)=\sum_{j}^{m}P(X=x_i,Y=y_j)=\sum_{j}^{m}p_{ij}=p_{i\cdot},\quad i=1,2,...,n\
p_Y(y_i)=P(Y=y_i)=\sum_{i}^{m}P(X=x_i,Y=y_j)=\sum_{i}^{m}p_{ij}=p_{j\cdot},\quad j=1,2,...,n
连续型随机向量
为求某分量X_i 概率密度函数,只需把f(x_1,...,x_n) 的x_i 定,然后对x_1,...,x_{i-1},x_{i+1},...,x_n -\infty \infty 间做定积分,如
(X,Y)\sim f(x, y)\
f_X(u)=\int^{+\infty}{-\infty}f(u,v)dv\
f_Y(u)=\int^{+\infty}{-\infty}f(u,v)du\
注 :二维正态分布N(a,b,\sigma_1^2,\sigma_2^2,\rho ) 边缘分布密度分别是一维正态分布N(a,\sigma_1^2) N(b,\sigma_2^2)。因此联合分布可推边缘分布,而边缘分布不可推联合分布。
条件分布和随机变量的独立性¶
-
离散型随机变量的条件分布 :设(X,Y) 二维离散型随机变量,对于给定的事件{Y=y_j},其概率P(Y=y_j)>0,则称
P(X=x_i|Y=y_j)=\frac{P(X=x_i,Y=y_j)}{P(Y=y_j)}=\frac{p_{ij}}{p_{\cdot j}},\quad i=1,2,...
为在给定Y=y_j 条件下X 条件分布律。类似的,称
P(Y=y_i|X=x_j)=\frac{P(X=x_i,Y=y_j)}{P(X=x_j)}=\frac{p_{ij}}{p_{i\cdot}},\quad j=1,2,...
为在给定X=x_j 条件下Y 条件分布律。连续型随机变量的条件分布 :设(X,Y) 二维连续型随机变量,对于给定条件Y=y 的条件概率密度为
f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}, \quad f_Y(y)>0.\
类似的,在X=x 的条件概率密度为
f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}, \quad f_X(x)>0.\
二维正态分布\rho=0 ,其联合密度分布等于条件密度分布的乘积。
- 随机变量的独立性
称随机变量X_1, ...,X_n 互独立,
-
离散型随机变量
则联合分布律等于各自的边缘分布律的乘积,即
P(X_1=x_1,...,X_n=x_n)=P(X_1=x_1)...P(X_n=x_n)
其中(x_1,...x_n) (X_1,...,X_n) 值域中的任意一点。连续型随机变量
则联合密度等于各自的边缘密度的乘积,即
f(x_1,...,x_n)=f_1(x_1)...f_n(x_n),\quad \forall(x_1,...,x_n)\in \R ^n
更具一般地
设X_1,...,X_n n 随机变量,如果它们的联合分布函数等于各自边缘分布函数的乘积,即
F(X_1, ...,x_n)=F_1(x_1)...F_n(x_n),\quad \forall (x_1,...,x_n)\in \R^n
则称随机变量X_1, ...,X_n 互独立。一些重要的结论

随机变量的函数的概率分布¶
最简单的情形,是由一维随机变量X 概率分布去求其一给定函数Y=g(X) 分布。较为常见的,是由(X_1,X_2,...,X_n) 分布去求Y=g(X_1,X_2,...,X_n) 分布。更一般地,由(X_1,X_2,...,X_n) 分布去求(Y_1,Y_2,...,Y_m) 分布,其中Y_i=g_i(X_1,X_2,...,X_n),\quad i=1,2,...,m.
- 离散型分布的情形 :设X 分布律为P(X=x_i)=p_i,\quad i=1,2,...
g:R\rightarrow R,令Y=g(X),则Y 分布律为
P(Y=y_j)=P(g(X)=y_j)=\sum_{x_i:g(x_i)=y_j}P(X=x_i)=\sum_{i:g(x_i)=y_j}p_i
即把Y=g(X_1,...,X_n) 以取的不同值找出来,把与某个值相应的全部(X_1,...,X_n) 的概率加起来,即得Y 这个值的概率。- 连续型分布的情形
-
一个变量的情况
设X 密度函数f(x).设Y=g(x),g 一个严格单调的函数,即当x_1
,必有g(x_1)\ 当x_1>x_2 ,必有g(x_1)>g(x_2).又设g 导数g' 在。由于g 严格单调性,其反函数X=h(Y) 在,且h 导数h' 存在。有g(X) 密度函数l(y)
l(y)=f(h(y))|h'(y)|.
多个变量的情形
以两个为例,设(X_1,X_2) 密度函数f(x_1,x_2),Y_1,Y_2 是(X_1,X_2) 函数:
Y_1=g_1(X_1,X_2),\quad Y_2=g_2(X_1,X_2),
要求(Y_1,Y_2) 概率密度函数l(y_1,y_2).假定(X_1,X_2) (Y_1,Y_2) 一一对应变换有逆变换:
X_1=h_1(Y_1,Y_2),\quad X_2=h_2(Y_1,Y_2)
即雅可比行列式
J(y_1,y_2)=\begin{vmatrix}
\partial h_1/\partial y_1&\partial h_1/\partial y_2 \
\partial h_2/\partial y_1&\partial h_2/ \partial y_2
\end{vmatrix}
不为0.在(Y1,Y2) 平面上任取一个区域A,变换后到(X_1,X_2) 面的区域B,则有
P((Y_1,Y_2)\in A)=P((X_1,X_2)\in B)=\iint_Bf(x_1,x_2)dx_1dx_2\
P((Y_1,Y_2)\in A)=\iint_Af(h_1(y_1,y_2),h_2(y_1,y_2))|J(y_1,y_2)|dy_1dy_2
随机变量和的密度函数
设(X_1,X_2) 联合密度函数为f(x_1,x_2),Y=X_1+X_2 密度函数:
- 一般的,l(y)=\int_{-\infty}^\infty f(x_1,y-x_1)dx_1=\int_{-\infty}^\infty f(x,y-x)dx.
- 若X_1,X_2 立,则l(y)=\int_{-\infty}^\infty f_1(x)f_2(y-x)dx=\int_{-\infty}^\infty f_1(y-x)f_2(x)dx.
两个独立的正态变量的和仍服从正态分布,且有关的参数相加,其逆命题也成立。
随机变量商的密度函数
设(X_1,X_2) 联合密度函数为f(x_1,x_2),Y=X_1/X_2 密度函数:- 一般的,l(y)=\int_{0}^\infty x_1f(x_1,x_1y)dx_1.
- 若X_1,X_2 立,则l(y)=\int_{0}^\infty x_1f_1(x_1)f_2(x_1y)dx_1.
统计学三大分布
引入两个重要的特殊函数:
\Gamma(x)=\int_0^\infty e^{-t}t^{x-1}dt\quad (x>0) 和 B(x,y)=\int_0^1t^{x-1}(1-t)^{y-1}dt\quad (x>0,y>0)
其中,\Gamma(1)=1,\quad \Gamma(1/2)=\sqrt{\pi},\quad \Gamma(n)=(n-1)!
B(x,y)=\Gamma(x)\Gamma(y)/\Gamma(x+y)
-
卡方分布,记作\chi_n^2
密度函数 :k_n(x)=\frac{1}{\Gamma(\frac{n}{2}2^{n/2})}e^{-x/2}x^{(n-2)/2}I_{(0,\infty)}(x)
性质 :1. 设X_1,X_2 立,X_1\sim\chi_m^2,X_2\sim\chi_n^2,则X_1+X_2\sim\chi_{m+n}^2
2. 若X_1,...,X_n 立,且都服从指数分布,则X=2\lambda(X_1+...+X_n)\sim\chi_{2n}^2
-
t 布,记作t_n
设X_1,X_2 立,X_1\sim\chi_n^2,X_2\sim N(0,1),而Y=X_2/\sqrt{X_1/n},则Y\sim t_n.
密度函数 :t_n(y)=\frac{\Gamma((n+1)/2)}{\sqrt{n\pi}\Gamma(n/2)}(1+\frac{y^2}{n})^{(\frac{n+1}{2})}
性质 :密度函数关于原点对称,其图形与正态分布N(0,1) 密度函数的图形相似。
-
F 布,记作F_{mn}
设X_1,X_2 立,X_1\sim\chi_n^2,X_2\sim\chi_m^2,而Y=m^{-1}X_2/(n^{-1}X_1),则Y\sim F_{mn}
密度函数 :f_{mn}(y)=m^{m/2}n^{n/2}\frac{\Gamma(\frac{m+n}{2})}{\Gamma(\frac{m}{2})\Gamma(\frac{n}{2})}y^{m/2-1}(my+n)^{-(m+n)/2}\quad (y>0)
三大分布的几个重要性质
-
设X_1,...,X_n 立同分布,有公共的正态分布N(\mu,\sigma^2).记\bar{X}=(X_1+...+X_n),S^2=\sum_{i=1}^{n}(X_i-\bar(X))^2/(n-1).则(n-1)S^2/\sigma^2=\sum_{i=1}^{n}(X_i-\bar{X})^2/\sigma^2\sim\chi_{n-1}^{2}.
-
设X_1,...,X_n 假定同1,则\sqrt{n}(\bar{X}-\mu)/S\sim t_{n-1}
-
设X_1,...,X_n,Y_1,...,Y_m 立,X_i 有分布N(\mu1,\sigma_1^2),Y_j 有分布N(\mu_2,\sigma_2^2),则
[\sum_{j=1}^m(Y_j-\bar{Y})^2/(\sigma_2^2(m-1))]/[\sum_{i=1}^n(X_i-\bar{X})^2/(\sigma_1^2(n-1))]\sim F_{m-1,n-1}
若\sigma_1^2=\sigma_2^2,则
\sqrt{\frac{nm(n+m-2)}{n+m}}[(\bar{X}-\bar{Y})-(\mu_1-\mu_2)]/[\sum_{i=1}^{n}(X_i-\bar{X})^2+\sum_{j=1}^m(Y_j-\bar{Y})^2]^{1/2}\sim t_{n+m-2}
$$
¶
- F(x)是单调非降的:当
评论