假设检验的概念与方法

假设检验,就是我们先假定参数的值,然后通过抽样的方式来确定我们的假设是否成立的统计方法。假设检验的步骤为:1,提出假设;2,选择合适的抽样分布;3,确定显著性水平,就是允许有多少的概率犯错;4,确定接受域和拒绝域;5,给出判断。这里最关键的是选择抽样分布,抽样分布确定了,接受域和拒绝域就比较容易获得。

笔记下载:假设检验的概念与步骤

我们用例子来说明假设检验的方法与步骤。

例1,某工厂用一台包装机包装奶粉,袋装奶粉的重量是一个随机变量,服从正态分布。机器 工作正常时,其均值为 \(0.5 kg\),标准差为 \(0.015kg\),某日松井包装机工作是否正常,随机抽取 \(9\) 袋,测得净重为

\[0.497\quad 0.506\quad 0.518\quad 0.524\quad 0.498\quad 0.511\quad 0.520\quad 0.515\quad 0.512\]

问机器工作是否正常?

解:(1) 首先确定我们的问题是:工作是否正常,所以可以设:

假设(原假设):工作正常, \(H_0: \mu=0.5\)( \(\mu=\mu_0\))

对立假设(备择假设):工作不正常, \(H_1:\mu\ne 0.5\)(\mu\ne \mu_0)

(2)选择抽样分布:在做区间估计的时候,我们知道,方差已知的情况下估计均值,采用的是正态分布:

\[z=\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)\]

这给了我们一个自然的选择,就是选择与区间估计一样的样本分布,因为这个分布除了总体均值 \(\mu\) 以外,其它都是已知的,所以用这个分布作检验是最自然最合适的选择。

\[z=\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)\]

(3)显著性水平:与区间估计一样,这取决于我们愿意在多大程度上接受“真实值”被遗落的情形。这个值一般是事先给出的。例如这里我们确定显著性水平为 \(\alpha=0.5\),也就是说我们有 \(5\%\) 的可能拒绝真实值;

(4)接受域与拒绝域:由区间估计我们知道,如果工作正常,也就是说总体 \(\mu=0.5=\mu_0\) 的时候,应该有

\[P\left\{-z_{\frac{\alpha}{2}}\le \frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}\le \right\}z_{\frac{\alpha}{2}}=1-\alpha\]

所以若 \[-z_{\frac{\alpha}{2}}\le \frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}\le z_{\frac{\alpha}{2}}\]

则接受原假设,也就是说工作正常;若

\[\frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}<-z_{\frac{\alpha}{2}}\quad \text{或者}\quad \frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}> z_{\frac{\alpha}{2}}\]

则拒绝原假设,接受备择假设,就是认为工作不正常。

(5)计算,将各项数值代入到上式里去,并且查表得到 \(z_{\frac{\alpha}{2}}\) 便可确实接受还拒绝原假设。首先 \(\bar{x}=0.511, \sigma=0.015\),查表得 \(z_{\frac{\alpha}{2}}=z_{0.025}=1.96\)

\[\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}=\frac{0.511-0.5}{0.015/3}=2.2>1.96\]

所以拒绝原假设,接受备择假设,也就是认为包装机工作不正常。

2,假设检验的步骤:由上面的例子,可以得到假设检验的步骤为

(1)提出假设: \(H_0: \mu=\mu_0; H_1:\mu\ne mu_0\),当然也会有其它类型的假设;

(2)选择合适的抽样分布;

(3)确定显著性水平,这个通常会给出;

(4)确定接受域和拒绝域,这个从抽样分布可以推算出来;

(5)计算,作出判断。

3,相关的概念:

(1)双边检验与单边检验

双边检验:\(\mu=\mu_0\);

单边检验:\(\mu\le\mu_0\) 或者 \(\mu\ge\mu_0\)

单边检验要复杂一点。

(2)两类错误

弃真错误:当 \(H_0\) 为真时,拒绝 \(H_0\)

取伪错误:当 \(H_0\) 不真时,接受 \(H_0\)

我们选择显著性水平时,就是选择弃真错误的概率。也就是拒绝真实值的概率。弃真错误的概率称为显著性水平。