假设检验

假设检验的基本概念

假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是 由抽样误差引起还是本质差别造成的统计推断方法。显著性检验是假设检验中最常用的一种方法,也 是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统 计推理,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有Z检验、t检验、卡方检验、 F检验等。

参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度 不同。

  • 参数估计讨论的是用样本统计量估计总体参数的方法。

  • 假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。

假设检验的分类

包括参数和非参数检验:

  • 参数假设检验(parametric test):总体的分布形式已知,需要对总体的未知参数进行假设检验。

  • 非参数假设检验(non-parametric test):对总体分布形式所知甚少,需对未知分布函数的形式及其他特征 进行假设检验。

本文主要讨论参数假设检验。

假设检验的原理

假设检验的原理:小概率原理。假设检验的基本思想是概率性质的反证法。(不同于纯数学中的反证法)

什么是小概率?

  • 概率是0~1之间的一个数,因此小概率就是接近0的一个数

  • 著名的英国统计家Ronald Fisher 把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是 小概率

  • Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的

什么是小概率原理

小概率原理:—发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。

根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行 观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一 次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。

检验中使用的小概率是检验前人为指定的。

几种常见的假设检验

正态总体均值的假设检验

单个总体的情况

设总体\(X \sim N(\mu, \sigma^2)\)\(X_1,X_2,\ldots,X_n\)是来自总体\(X\)的一个样本,均值\(\mu\)的检验 分为双边检验和单边检验。检验目地是总体均值\(\mu\)是否等于(或大于,或小于)\(\mu_0\)

  • 双边检验 \[ H_0: \mu = \mu_0, H_1: \mu \neq \mu_0 \]

  • 左单侧检验 \[ H_0: \mu \geq \mu_0, H_1: \mu < \mu_0 \]

  • 右单侧检验 \[ H_0: \mu \leq \mu_0, H_1: \mu > \mu_0 \]

在讨论中,又分为总体方差\(\sigma^2\)已知和未知两种情况。

  1. 如果方差\(\sigma^2\)已知,当\(H_0\)为真时,构造检验统计量 \[ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)\]

给定显著水平\(\alpha\), - 对于双侧检验,当\(|Z| \geq Z_{\alpha/2}\)

  • 对于左单侧检验,当\(Z \leq -Z_{\alpha}\)

  • 对于右侧检验,则当\(Z \geq Z_{\alpha}\)

则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)

上述方法称为正态检验法

2.如果方差\(\sigma^2\)未知,当\(H_0\)为真时,构造检验统计量 \[ T = \frac{\bar{X} - \mu_0}{S / \sqrt{n}} \sim t(n-1)\]

  • 对于双边检验,当\(|T| \geq Z_{\alpha/2}(n-1)\)时,

  • 对于单侧检验,当\(T \leq -T_{\alpha}(n-1)\)

  • 对于右侧检验,当\(T \geq T_{\alpha}(n-1)\)

则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)

这种方法称为t检验法。 在实际问题中,正态分布的总体方差通常是未知的,所以常用t检验法来检验。

两个总体的情况

假设\(X_1,X_2,\ldots,X_{n1}\)是来自总体\(X\sim N(\mu_1, \sigma^2_1)\)的样本,\(Y_1,Y_2,\ldots,Y_{n2}\)是来自总体\(Y\sim N(\mu_2, \sigma^2_2)\)的样本,且两样本独立。检验的目的是两个总体的均值是否相等(或两个总体的均值之差是否为零)。

  • 双边检验 \[ H_0: \mu_1 = \mu_2, \qquad, H_1:\mu_1 \neq \mu_2\]

  • 左单侧检验 \[ H_0: \mu_1 \geq \mu_2, \qquad, H_1:\mu_1 < \mu_2\]

  • 右单侧检验 \[ H_0: \mu_1 \leq \mu_2, \qquad, H_1:\mu_1 > \mu_2\]

分几种情况讨论:

  1. 方差\(\sigma^2_1\)\(\sigma^2_2\)已知

\(H_0\)为真时,检验统计量 \[ Z = \frac{\bar{X} - \bar{Y}}{\sqrt{\frac{\sigma^{2}_{1}}{n_1} + \frac{\sigma^{2}_{2}}{n_2}}} \sim N(0,1)\]

给定显著水平\(\alpha\), - 对于双侧检验,当\(|Z| \geq Z_{\alpha/2}\)

  • 对于左单侧检验,当\(Z < -Z_{\alpha}\)

  • 对于右侧检验,则当\(Z \geq Z_{\alpha}\)

,则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)

  1. 方差\(\sigma^2_1 = \sigma^2_2 = \sigma^2\)未知

\(H_0\)为真,检验统计量 \[T = \frac{\bar{X} - \bar{Y}}{S_{p} \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 -2)\] 其中\(S_{p}\)为两个样本对\(\sigma\)的联合估计 \[ s_{p} = \sqrt{\frac{(n_1 - 1)S^2_{1} + (n_2 -1)S^2_2}{n_1 + n_2 - 2}}\]

给定显著水平\(\alpha\)

  • 对于双侧检验,当\(|T| \geq t_{\alpha/2}(n_1 + n_2 - 2)\)时,

  • 对于左单侧检验,当\(T \leq -t_{\alpha}(n_1 + n_2 -2)\)

  • 对于右侧检验,则当\(T \geq t_{\alpha}(n_1 + n_2 - 2)\)

,则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)

  1. 方差\(\sigma^2_1 \neq \sigma^2_2\)且未知

\(H_0\)为真时,检验统计量 \[T = \frac{\bar{X} - \bar{Y}}{\sqrt{\frac{S^2_1}{n_1} + \frac{S^2_2}{n_2}}} \sim t(\hat{v})\]

近似成立,其中\(\hat{v}\)为t分布的自由度。 \[ \hat{v} = \frac{(\frac{S^2_1}{n_1} + \frac{S^2_2}{n_2})^2}{\frac{(S^2_1)^2}{n^2_1(n_1 -1)} + \frac{(s^2_2)^2}{n^2_2(n_2 - 1)}}\]

给定显著水平\(\alpha\)

  • 对于双侧检验,当\(|T| \geq t_{\alpha/2}(\hat{v})\)

  • 对于左单侧检验,当\(T < -t_{\alpha}(\hat{v})\)

  • 对于右侧检验,则当\(T \geq t_{\alpha}(\hat{v})\)

,则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)

正态总体方差的假设检验

单个总体情况

\(X_1,X_2,\ldots,X_n\)是来自总体\(X\sim N(\mu, \sigma^2)\)的样本,其检验问题为

  • 双边检验 \[ H_0: \sigma^2 = \sigma^2_{0}, H_1: \sigma^2 \neq \sigma^2_{0}\]

  • 左单侧检验 \[ H_0: \sigma^2 \geq \sigma^2_{0}, H_1: \sigma^2 < \sigma^2_{0}\]

  • 右单侧检验 \[ H_0: \sigma^2 \leq \sigma^2_{0}, H_1: \sigma^2 > \sigma^2_{0}\]

分均值\(\mu\)已知和未知两种情况讨论,

1.均值\(\mu\)已知

\(H_0\)为真时,检验统计量 \[ \chi^2 = \frac{n \hat{\sigma}^2}{\sigma^2_{0}} \sim \chi^2(n)\] 其中\(\hat{\sigma}^2\)\[ \hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \mu)^2\]

给定显著水平\(\alpha\)

  • 对于双侧检验,当\(\chi^2 \geq \chi^{2}_{\alpha/2}(n)\)\(\chi^2 \leq \chi^{2}_{1 - \alpha/2}(n)\)

  • 对于左单侧检验,当\(\chi^{2} \leq \chi^{2}_{1 - \alpha}(n)\)

  • 对于右侧检验,则当\(\chi^{2} \geq \chi^{2}_{\alpha}(n)\)

,则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)

2.均值\(\mu\)未知

\(H_0\)为真时,检验统计量

\[ \chi^{2} = \frac{(n-1)S^2}{\sigma^{2}_{0}} \sim \chi^2(n-1)\]

给定显著水平\(\alpha\)

  • 对于双侧检验,当\(\chi^2 \geq \chi^{2}_{\alpha/2}(n-1)\)\(\chi^2 \leq \chi^{2}_{1 - \alpha/2}(n-1)\)

  • 对于左单侧检验,当\(\chi^{2} \leq \chi^{2}_{1 - \alpha}(n-1)\)

  • 对于右侧检验,则当\(\chi^{2} \geq \chi^{2}_{\alpha}(n-1)\)

,则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)

两个总体情况

假设\(X_1,X_2,\ldots,X_{n1}\)是来自总体\(X\sim N(\mu_1, \sigma^2_1)\)的样本,\(Y_1,Y_2,\ldots,Y_{n2}\)是来自总体\(Y\sim N(\mu_2, \sigma^2_2)\)的样本,且两样本独立。其检验问题为:

  • 双边检验 \[ H_0: \sigma^2_1 = \sigma^2_2, \qquad, H_1:\sigma^2_1 \neq \sigma^2_2\]

  • 左单侧检验 \[ H_0: \sigma^2_1 \geq \sigma^2_2, \qquad, H_1:\sigma^2_1 < \sigma^2_2\]

  • 右单侧检验 \[ H_0: \sigma^2_1 \leq \sigma^2_2, \qquad, H_1:\sigma^2_1 > \sigma^2_2\]

分几种情况讨论:

  1. 均值\(\mu_1\)\(\mu_2\)已知

\(\mu_1\)\(\mu_2\)已知时,令 \[ \hat{\sigma_1}^2 = \frac{1}{n_1} \sum_{i=1}^{n_1} (X_i - \mu_1)^2\] \[ \hat{\sigma_2}^2 = \frac{1}{n_2} \sum_{i=1}^{n_2} (Y_i - \mu_2)^2\]\(H_0\)为真时,检验统计量 \[ F = \frac{\hat{\sigma_1}^2}{\hat{\sigma_2}^2} \sim F(n_1,n_2)\]

\(F\)确定拒绝域。给定显著水平\(\alpha\)

  • 对于双侧检验,当\(F \geq F_{\alpha/2}(n_1,n_2)\)\(F \leq F_{1 - \alpha/2}(n_1,n_2)\)

  • 对于左单侧检验,当\(F \leq F_{1 - \alpha}(n_1,n_2)\)

  • 对于右侧检验,则当\(F \geq F_{\alpha}(n_1,n_2)\)

,则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)

2.均值\(\mu_1\)\(\mu_2\)未知,当\(H_0\)为真时,有

\[ F = \frac{S^2_1}{S^2_2} \sim F(n_1 -1, n_2 - 1)\]

一般约定取较大方差作为分子,较小的方差作为分母,这样计算出来的\(F>1\)

给定显著水平\(\alpha\)

  • 对于双侧检验,当\(F \geq F_{\alpha/2}(n_1 - 1,n_2 - 1)\)\(F \leq F_{1 - \alpha/2}(n_1 -1,n_2 -1)\)

  • 对于左单侧检验,当\(F \leq F_{1 - \alpha}(n_1 - 1,n_2 - 1)\)

  • 对于右侧检验,则当\(F \geq F_{\alpha}(n_1 - 1,n_2 - 1)\)

,则认为\(H_0\)不成立,即拒绝\(H_0\)而接受\(H_1\)