第八章 假设检验
8.1 假设检验的基本概念
一、问题的提出
提出统计假设 这是两个对立的假设。假设
称为原假设或零假设,而假设
称为备择假设或对立假设。备择假设描述的内容与原假设对立,它作为备择假设的含义是,在假设检验问题中,否定原假设后,则选择备择假设的结论
关于总体参数的检验称为参数的假设检验,关于总体分布的假设称为非参数的假设检验
参数假设检验分为参数的单侧假设检验和双侧假设检验
二、假设检验的接收域与拒绝域
使原假设
得以接受的检验统计量取值的区域称为检验的接收域,使原假设
被拒绝的检验统计量取值的区域称为检验的拒绝域,
三、假设检验的两类错误和检验水平
假设检验可能犯的第一类错误是弃真错误:
本来是正确的却被拒绝了,犯第一类错误的概率为 这个事先给定的
称为假设检验的显著性水平
假设检验可能翻的第二类错误是纳伪错误: 实际上不正确,却被接受了
一般先保证犯第一类错误的概率 有较小的值如
再尽可能地使犯第二类错误的概率尽可能小
8.2 参数的假设检验
一、单个正态总体均值 的检验
1. 总体方差 已知
原假设成立时,检验统计量 ,若给定显著性水平为 ,则 得到原假设 的拒绝域为
,在这个检验中我们使用了统计量
,其服从的分布为 ,若一检验方法使用了服从标准正态分布的统计量,则称为 检验法
2. 总体方差 未知
检验统计量
有 得到原假设 的拒绝域为
若一检验方法使用了服从
分布的统计量,则称为
检验法
二、单个正态总体方差 的检验
取检验统计量为 其拒绝域为 或 运用了服从
的统计量,常称为检验法
当总体均值已知时,常取检验统计量为 在原假设 成立时,它服从
分布
三、两个正态总体均值差
的检验
1. 当总体方差 和 均已知时
在
成立时,有检验统计量 于是,显著性水平为
的检验的拒绝域为 ,即 上述几个检验称为两样本 检验法
2.
当总体方差 和 均未知,但 时
当原假设
成立时,有检验统计量 其中 于是,显著性水平为
的拒绝域为 ,或 上述几个检验称为两样本 检验法
四、两个正态总体方差
的检验
当参数
未知。当原假设
成立时,有检验统计量 得到检验问题的拒绝域为 或 当参数
已知时,以
五、大样本检验方法
令
的精确分布复杂,其极限分布是 ,当 都足够大时,以 作为 的近似分布,确定出检验问题的拒绝域为
或
8.3 分布的假设检验
设 是来自总体
的一个样本,在显著性水平 下,检验假设 其中
为某一个已知或仅含有若干个未知参数的分布函数
处理这个问题的一般原则:设法确定一个量 ,它具有某种理由可以作为样本
与理论分布 之间偏离的度量,就具体的样本观测值算出
的值,记为
,然后在假设 成立的条件下,算出概率 它被称为在选定的偏离值表
之下,样本与理论分布的拟合优度
越大,表示样本与理论分布的拟合越好,假设 就越可信
一般地,事先根据某种考虑,确定显著性水平 ,当 时拒绝 ,否则接受 ,通常称这种类型的检验为拟合优度检验
一、理论分布完全已知且只取有限个值
设
为只取有限个值,且理论分布完全已知的离散型分部总体,则假设可表述为 总体分布率为 其中 均已知,且
以 表示 中等于 的个数。考虑样本容量 足够大时,由大数定律, 中等于 的个数应大致为 ,不妨设 为“理论频数”,把
称为“经验频数”
显然里,理论频数与经验频数的差异越小,越符合原假设 。有下列统计量 定理 若原假设成立,则当样本容量 时, 的分布是自由度为 的 分布,即
给定显著性水平,计算出
的值,得原假设 的拒绝域为 根据实际经验,样本容量
不应小于
二、理论分布只取有限个值但含有未知参数
设 为只取有限个值 ,总体分布律为 其中
为未知参数,可在一定范围内变化,参数个数 ,此时,原假设的一般提法是 总体分布率为 其中
为参数
在其变化范围内的一组值
通常采用
的最大似然估计值
代替参数真值 ,不过此时
的抽样分布发生一点变化
定理 在一定条件下,若原假设 成立,则当样本容量 足够大时,由上式确定的统计量 的分布近似服从自由度为 的 分布,即
由此结果,对给定显著性水平 ,原假设的拒绝域为
三、总体分布为一般分布
设 是抽自总体
的样本,欲检验原假设 的分布函数为 其中
完全已知,或含有未知参数,将其记为
检验原假设
的基本方法是通过区间的划分转化为已讨论过的情况