假设检验

发表于2025-11-16|更新于2026-03-01|数学分布

|浏览量:

六、假设检验

6.1 假设检验的基本思想和概念

基本思想

以“女士品茶”为例，对于该女士有没有品茶的能力，有两种假设：该女士没有品茶能力和该女士有品茶能力。在统计上这两个非空不相交参数集合称作统计假设，简称假设。通过样本对一个假设作出对与不对的判断，则称为该假设的一个检验。若检验结果否定该命题，则称拒绝这个假设，否则就**接受（不拒绝）**这个假设。

假设可分为两种：1. 参数假设检验，即已经知道数据的分布，针对总体的某个参数进行假设检验；2. 非参数假设检验，即数据分布未知，针对该分布进行假设检验。
假设检验的基本步骤

建立假设—>选择检验统计量，给出拒绝域形式—>选择显著性水平—>给出拒绝域—>做出判断

Step 1：建立假设

主要针对参数假设检验问题

设有来自某分布族${F(x,\theta)|\theta\in\Theta}$ 样本$x_1,…,x_n$，其中$\Theta$ 参数空间，设$\Theta_0\in\Theta$，且$\Theta_0\neq\phi$，则命题$H_0:\theta\in\Theta_0$ 为原假设或零假设（null hypothesis），若有另一个$\Theta_1$（$\Theta_1\in\Theta,\Theta_1\Theta_0=\phi$，常见的一种情况是$\Theta_1=\Theta-\Theta_0$），则命题$H_1:\theta\in\Theta_1$ 为$H_0$ 对立假设或备择假设（alternative hypotheis），当$H_0$ 简单假设，即$\Theta_0$ 含一个点时，备择假设有三种可能：$H_1’:\theta\neq\theta_0$，$H_1’’:\theta<\theta_0$，$H_1’’’:\theta>\theta_0$。

Step 2：选择检验统计量，给出拒绝域形式

根据样本计算统计量$Z$（如样本均值、标准差等，称为检验统计量），并基于某个法则既可以决定接受$H_0$ 是拒绝$H_0$，具体地，当统计量在拒绝域$W$ 即拒绝$H_0$，在接受域$\overline{W}$ 即接受$H_0$。由此可见，一个拒绝域$W$ 一确定一个检验法则，反之，一个检验法则也唯一确定一个拒绝域。

注：不能用一个样本（例子）证明一个命题（假设成立），但是可以用一个样本（例子）去推翻一个命题。此外，拒绝域与接受域之间有一个模糊域，即统计量恰好符合法则，通常将模糊域归为接受域，因此接受域是复杂的。

Step 3：选择显著性水平

假设检验基于小概率事件，即小概率事件在一次试验中几乎不会发生，因此选择一个很小的概率值$\alpha$，令$p(拒绝H_0|H_0为真)\leq\alpha$，表示$Z\in W$ 一个小概率事件，在一次试验中不应该发生。如果通过样本得到的统计量$z\in W$，即不该发生的小概率事件竟然发生了，那么应该拒绝$H_0$。

由于向本是随机的，通常做检验时可能做出错误判断，由此引入了两个错误，分别为第一类错误和第二类错误，如下表所示。

观测数据情况总体情况总体情况

$H_0$ 真 $H_1$ 真

接受$H_0$ 第一类错误（拒真）正确

拒绝$H_0$ 正确犯第二类错误（取伪）

犯第一类错误概率：$\alpha=P(X\in W|H_0)$，即$\alpha=P(拒绝H_0|H_0为真)$；

犯第二类错误概率：$\beta=P(X\in \overline{W}|H_1)$，即$\beta=P(接受H_0|H_0为假)$。

可以证明的，在一定样本量下，两类错误概率无法共同减小，但是当样本增加时，可以同时减小。

证明该问题需要引入是函数，下面将简单介绍势函数，但不对上述结论证明。

定义：设检验问题$H_0:\theta\in\Theta_0\quad vs\quad H_1:\theta \in \Theta_1$ 拒绝域为$W$，则样本观测值$\mathbf{X}$ 在拒绝域$W$ 的概率称为该检验的势函数，记为

$$
g(\theta)=P_\theta(\mathbf{X}\in W),\ \theta\in\Theta=\Theta_0\cup\Theta_1\
g(\theta)=\left{\begin{matrix}
\alpha(\theta) & \theta\in\Theta_0\
1-\beta(\theta) &\theta\in\Theta_1
\end{matrix}\right.
$$

第一类错误概率$\alpha$ 为初始设定的很小的概率，称为置信水平，称该检验时显著性水平为$\alpha$ 显著性检验，简称水平为$\alpha$ 检验。为了尽量减少两类错误，可简单的将其简化为减小第一类错误概率（第二类错误概率难求）。常用的$\alpha=0.05$ 时也选择 0.1 或 0.01。

Step 4：给出拒绝域

为了使得第一类错误的概率尽可能小，给定一个较小的$\alpha$，并选择一个数$k$，设定若$Z\geq k$ 绝$H_0$，使得$P(u=|\frac{z-\mu}{\sigma/\sqrt{n}}|\geq k)\leq \alpha$，所以$k=u_{\alpha/2}$。

注：算拒绝域时，需基于标准正态分布。

Step 5：做出判断

通过样本计算统计量，若统计量在拒绝域中，则拒绝原假设，否则接受原假设。

**检验的$p$ **

不同置信水平$\alpha$ 取值，可能会存在不同的结果。因此引入新的指标，即利用样本观测值能够作出拒绝原假设的最小显著水平，称为**检验的$p$ **。由检验的$p$ 与心目中的显著性水平$\alpha$ 行比较，可以容易做出检验结论：
- 若$\alpha\geq p$，则在显著性水平$\alpha$ 拒绝$H_0$；
- 若$\alpha<p$，则在显著性水平$\alpha$ 接受$H_0$.
注：一般以$p<0.05$ 为有统计学差异， $p<0.01$ 为有显著统计学差异，$p<0.001$ 有极其显著的统计学差异。

文章作者: Hongwei Zhao

文章链接: https://geeks-z.github.io/Blog/2025/11/16/%E6%95%B0%E5%AD%A6/05.%E5%88%86%E5%B8%83/03.%E5%81%87%E8%AE%BE%E6%A3%80%E9%AA%8C/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Hongwei Zhao's Blog！

相关推荐

基于最优传输的分类损失函数

EMO：基于最优传输思想设计的分类损失函数众所周知，分类任务的标准损失是交叉熵（Cross Entropy，等价于最大似然MLE，即Maximum Likelihood Estimation），它有着简单高效的特点，但在某些场景下也暴露出一些问题，如偏离评价指标、过度自信等，相应的改进工作也有很多，此前我们也介绍过一些，比如《再谈类别不平衡问题：调节权重与魔改Loss的对比联系》、《如何训练你的准确率？》、《缓解交叉熵过度自信的一个简明方案》等。由于LLM的训练也可以理解为逐token的分类任务，默认损失也是交叉熵，因此这些改进工作在LLM流行的今天依然有一定的价值。在这篇文章中...

信息量假设 $X$ 是一个离散型随机变量，其取值集合为$\chi$，概率分布函数为$p(x)=Pr(X=x),x∈\chi$，我们定义事件$X=x_0$ 的信息量为： $$I(x_0)=−log(p(x_0))$$ 可以理解为，一个事件发生的概率越大，则它所携带的信息量就越小，而当$p(x_0)=1$ 时，熵将等于 0，也就是说该事件的发生不会导致任何信息量的增加。举个例子，小明平时不爱学习，考试经常不及格，而小王是个勤奋学习的好学生，经常得满分，所以我们可以做如下假设：事件 A：小明考试及格，对应的概率$P(x_A)...

最优运输概述

文章来源：Optimal Transport的前世今生 | (一) 从Monge问题到Kantorovich问题仓库：Awesome Optimal Transport in Deep Learning 1. OT发展时间线Optimal Transport (OT) 最优传输是什么？一句话概括：OT问题是一个优化问题，它的目标是优化出两个分布之间传输的最小代价解。近几年OT受到广泛关注，在各大ML/CV/NLP顶会中都能看到它的影子，CVPR 2023更是接收了5篇用OT处理CV任务的文章。为了让大家能够了解OT是怎么一步步火起来的，在时代的浪潮中捕捉一些se...

Wasserstein距离

推土机距离问题（Earth Mover’s Distance）假设地面上有 $m$ 个土堆，第 $i$ 个土堆有 $r_i$ 数量的土；同时另一边有 $n$ 个坑，第 $j$ 个坑可以容纳 $c_j$ 数量的土。假设所有的土能刚好被所有的坑填满，那么就有关系： $$\sum_i{r_i}=\sum_j{c_j}\tag{1.1}$$我们现在要把土从 $m$ 搬到 $n$ ，传输方案就可以用一个 $m\times n$ 的矩阵 $Y=[\gamma_{i,j}]{m\times n}$ 表示，其中 $\gamma{i,j}$ 表示从第 $i$ 个土堆搬到第 $j$ 个坑...

最优传输之梯度流

梯度流欧式空间如果我们想要求解 $f(x)$ 的最小值，使用梯度下降法可知： $$x_{t+1}=x_t-\alpha\nabla_{x_t} f(x_t)\tag{3.1}$$其中 $\alpha$ 为学习率。如果使学习率趋向于0并记为 $\Delta t$ ， $x_{t+1}$ 记为 $x_{t+\Delta t}$ ，那么有： $$\frac{dx}{dt}=-\nabla_{x}f(x)\tag{3.2}$$则（3.2）式称为梯度流。将（3.2）写成逆向Euler形式（ODE前向和逆向是相等的），有： $$\begin{array}{c} x_{t+1}&#...

先验分布与后验分布

1.回顾贝叶斯定理首先，我们先来复习一下贝叶斯定理：$$p(\Theta|X)=\frac{p(X|\Theta)p(\Theta)}{p(X)}$$在这个简简单单的式子当中，蕴含了我们要掌握的很多重要内容： $p(\Theta)$ ：先验分布。反映的是在观测到数据之前我们对待估计的参数 $\Theta$ 的了解和认识。 $p(X|\Theta)$ ：在确定了参数的情况下，试验数据的概率分布。实际上这就是对实际观测数据的一种描述。 $p(\Theta|X)$ ：后验分布。后验分布就是我们通过贝叶斯定理得到的最终的分析结果，反映的是在给定观测数据的基础上，我们对于参数的新的...