Untitled

六、假设检验¶

6.1 假设检验的基本思想和概念¶

基本思想

以“女士品茶”为例，对于该女士有没有品茶的能力，有两种假设：该女士没有品茶能力和该女士有品茶能力。在统计上这两个非空不相交参数集合称作统计假设，简称假设。通过样本对一个假设作出对与不对的判断，则称为该假设的一个检验。若检验结果否定该命题，则称拒绝这个假设，否则就接受（不拒绝）这个假设。

假设可分为两种：1. 参数假设检验，即已经知道数据的分布，针对总体的某个参数进行假设检验；2. 非参数假设检验，即数据分布未知，针对该分布进行假设检验。

假设检验的基本步骤

建立假设—>选择检验统计量，给出拒绝域形式—>选择显著性水平—>给出拒绝域—>做出判断

Step 1：建立假设

主要针对参数假设检验问题

设有来自某分布族 ${F(x,\theta)|\theta\in\Theta}$ 样本 $x_1,...,x_n$ ，其中 $\Theta$ 参数空间，设 $\Theta_0\in\Theta$ ，且 $\Theta_0\neq\phi$ ，则命题 $H_0:\theta\in\Theta_0$ 为原假设或零假设（null hypothesis），若有另一个 $\Theta_1$ （ $\Theta_1\in\Theta,\Theta_1\Theta_0=\phi$ ，常见的一种情况是 $\Theta_1=\Theta-\Theta_0$ ），则命题 $H_1:\theta\in\Theta_1$ 为 $H_0$ 对立假设或备择假设（alternative hypotheis），当 $H_0$ 简单假设，即 $\Theta_0$ 含一个点时，备择假设有三种可能： $H_1':\theta\neq\theta_0$ ， $H_1'':\theta<\theta_0$ ， $H_1''':\theta>\theta_0$ 。

Step 2：选择检验统计量，给出拒绝域形式

根据样本计算统计量 $Z$ （如样本均值、标准差等，称为检验统计量），并基于某个法则既可以决定接受 $H_0$ 是拒绝 $H_0$ ，具体地，当统计量在拒绝域 $W$ 即拒绝 $H_0$ ，在接受域 $\overline{W}$ 即接受 $H_0$ 。由此可见，一个拒绝域 $W$ 一确定一个检验法则，反之，一个检验法则也唯一确定一个拒绝域。

注：不能用一个样本（例子）证明一个命题（假设成立），但是可以用一个样本（例子）去推翻一个命题。此外，拒绝域与接受域之间有一个模糊域，即统计量恰好符合法则，通常将模糊域归为接受域，因此接受域是复杂的。

Step 3：选择显著性水平

假设检验基于小概率事件，即小概率事件在一次试验中几乎不会发生，因此选择一个很小的概率值 $\alpha$ ，令 $p(拒绝H_0|H_0为真)\leq\alpha$ ，表示 $Z\in W$ 一个小概率事件，在一次试验中不应该发生。如果通过样本得到的统计量 $z\in W$ ，即不该发生的小概率事件竟然发生了，那么应该拒绝 $H_0$ 。

由于向本是随机的，通常做检验时可能做出错误判断，由此引入了两个错误，分别为第一类错误和第二类错误，如下表所示。

观测数据情况总体情况总体情况

$H_0$ 真 $H_1$ 真

接受 $H_0$ 第一类错误（拒真）正确

拒绝 $H_0$ 正确犯第二类错误（取伪）

犯第一类错误概率： $\alpha=P(X\in W|H_0)$ ，即 $\alpha=P(拒绝H_0|H_0为真)$ ；

犯第二类错误概率： $\beta=P(X\in \overline{W}|H_1)$ ，即 $\beta=P(接受H_0|H_0为假)$ 。

可以证明的，在一定样本量下，两类错误概率无法共同减小，但是当样本增加时，可以同时减小。

证明该问题需要引入是函数，下面将简单介绍势函数，但不对上述结论证明。

定义：设检验问题 $H_0:\theta\in\Theta_0\quad vs\quad H_1:\theta \in \Theta_1$ 拒绝域为 $W$ ，则样本观测值 $\mathbf{X}$ 在拒绝域 $W$ 的概率称为该检验的势函数，记为

$g(\theta)=P_\theta(\mathbf{X}\in W),\ \theta\in\Theta=\Theta_0\cup\Theta_1\ g(\theta)=\left{\begin{matrix} \alpha(\theta) & \theta\in\Theta_0\ 1-\beta(\theta) &\theta\in\Theta_1 \end{matrix}\right.$

第一类错误概率 $\alpha$ 为初始设定的很小的概率，称为置信水平，称该检验时显著性水平为 $\alpha$ 显著性检验，简称水平为 $\alpha$ 检验。为了尽量减少两类错误，可简单的将其简化为减小第一类错误概率（第二类错误概率难求）。常用的 $\alpha=0.05$ 时也选择 0.1 或 0.01。

观测数据情况	总体情况	总体情况
	$H_0$ 真	$H_1$ 真
接受 $H_0$	第一类错误（拒真）	正确
拒绝 $H_0$	正确	犯第二类错误（取伪）

Step 4：给出拒绝域

为了使得第一类错误的概率尽可能小，给定一个较小的 $\alpha$ ，并选择一个数 $k$ ，设定若 $Z\geq k$ 绝 $H_0$ ，使得 $P(u=|\frac{z-\mu}{\sigma/\sqrt{n}}|\geq k)\leq \alpha$ ，所以 $k=u_{\alpha/2}$ 。

注：算拒绝域时，需基于标准正态分布。

Step 5：做出判断

通过样本计算统计量，若统计量在拒绝域中，则拒绝原假设，否则接受原假设。

**检验的 $p$ **

不同置信水平 $\alpha$ 取值，可能会存在不同的结果。因此引入新的指标，即利用样本观测值能够作出拒绝原假设的最小显著水平，称为检验的 $p$ 。由检验的 $p$ 与心目中的显著性水平 $\alpha$ 行比较，可以容易做出检验结论：

若 $\alpha\geq p$ ，则在显著性水平 $\alpha$ 拒绝 $H_0$ ；
若 $\alpha<p$ ，则在显著性水平 $\alpha$ 接受 $H_0$ .

注：一般以 $p<0.05$ 为有统计学差异， $p<0.01$ 为有显著统计学差异， $p<0.001$ 有极其显著的统计学差异。

六、假设检验¶

6.1 假设检验的基本思想和概念¶

¶

评论