概率论与数理统计 第八章 假设检验

第八章 假设检验

8.1 假设检验的基本概念

一、问题的提出

提出统计假设 这是两个对立的假设。假设 称为原假设零假设,而假设 称为备择假设对立假设。备择假设描述的内容与原假设对立,它作为备择假设的含义是,在假设检验问题中,否定原假设后,则选择备择假设的结论

关于总体参数的检验称为参数的假设检验,关于总体分布的假设称为非参数的假设检验

参数假设检验分为参数的单侧假设检验双侧假设检验

二、假设检验的接收域与拒绝域

使原假设 得以接受的检验统计量取值的区域称为检验的接收域,使原假设 被拒绝的检验统计量取值的区域称为检验的拒绝域

三、假设检验的两类错误和检验水平

假设检验可能犯的第一类错误是弃真错误: 本来是正确的却被拒绝了,犯第一类错误的概率为 这个事先给定的 称为假设检验的显著性水平

假设检验可能翻的第二类错误是纳伪错误: 实际上不正确,却被接受了

一般先保证犯第一类错误的概率 有较小的值如 再尽可能地使犯第二类错误的概率尽可能小

8.2 参数的假设检验

一、单个正态总体均值 的检验

1. 总体方差 已知

原假设成立时,检验统计量 ,若给定显著性水平为 ,则 得到原假设 的拒绝域为 ,在这个检验中我们使用了统计量 ,其服从的分布为 ,若一检验方法使用了服从标准正态分布的统计量,则称为 检验法

2. 总体方差 未知

检验统计量

得到原假设 的拒绝域为

若一检验方法使用了服从 分布的统计量,则称为 检验法

二、单个正态总体方差 的检验

取检验统计量为 其拒绝域为 运用了服从 的统计量,常称为检验法

当总体均值已知时,常取检验统计量为 在原假设 成立时,它服从 分布

三、两个正态总体均值差 的检验

1. 当总体方差 均已知时

成立时,有检验统计量 于是,显著性水平为 的检验的拒绝域为 ,即 上述几个检验称为两样本 检验法

2. 当总体方差 均未知,但

当原假设 成立时,有检验统计量 其中 于是,显著性水平为 的拒绝域为 ,或 上述几个检验称为两样本 检验法

四、两个正态总体方差 的检验

当参数 未知。当原假设 成立时,有检验统计量 得到检验问题的拒绝域为 当参数 已知时,以

五、大样本检验方法

的精确分布复杂,其极限分布是 ,当 都足够大时,以 作为 的近似分布,确定出检验问题的拒绝域为

8.3 分布的假设检验

是来自总体 的一个样本,在显著性水平 下,检验假设 其中 为某一个已知或仅含有若干个未知参数的分布函数

处理这个问题的一般原则:设法确定一个量 ,它具有某种理由可以作为样本 与理论分布 之间偏离的度量,就具体的样本观测值算出 的值,记为 ,然后在假设 成立的条件下,算出概率 它被称为在选定的偏离值表 之下,样本与理论分布的拟合优度

越大,表示样本与理论分布的拟合越好,假设 就越可信

一般地,事先根据某种考虑,确定显著性水平 ,当 时拒绝 ,否则接受 ,通常称这种类型的检验为拟合优度检验

一、理论分布完全已知且只取有限个值

为只取有限个值,且理论分布完全已知的离散型分部总体,则假设可表述为 其中 均已知,且

表示 中等于 的个数。考虑样本容量 足够大时,由大数定律, 中等于 的个数应大致为 ,不妨设 为“理论频数”,把 称为“经验频数

显然里,理论频数与经验频数的差异越小,越符合原假设 。有下列统计量 定理 若原假设成立,则当样本容量 时, 的分布是自由度为 分布,即

给定显著性水平,计算出 的值,得原假设 的拒绝域为 根据实际经验,样本容量 不应小于

二、理论分布只取有限个值但含有未知参数

为只取有限个值 ,总体分布律为 其中 为未知参数,可在一定范围内变化,参数个数 ,此时,原假设的一般提法是 其中 为参数 在其变化范围内的一组值

通常采用 的最大似然估计值 代替参数真值 ,不过此时 的抽样分布发生一点变化

定理 在一定条件下,若原假设 成立,则当样本容量 足够大时,由上式确定的统计量 的分布近似服从自由度为 分布,即

由此结果,对给定显著性水平 ,原假设的拒绝域为

三、总体分布为一般分布

是抽自总体 的样本,欲检验原假设 其中 完全已知,或含有未知参数,将其记为

检验原假设 的基本方法是通过区间的划分转化为已讨论过的情况