假设检验
数理统计
假设检验基本思想和概念
某厂生产一种灯管,其寿命服从正态分布,过去很长时间来看灯管平均寿命为小时,现在采用新工艺后,在生产的灯管中抽取25只,测得平均寿命为1675小时,问采用新工艺后,灯管的寿命是否显著提高(是否服从新的正态分布).
- 假设
- 表示表示采用新工艺后产品平均寿命没有显著增加.
- 表示采用新工艺后产品寿命有显著增加.
我们可以把第一假设称为原假设,第二个假设称为备择假设.如果我们期望能够从子样的观察值中得到对某一陈述的强有力的支持,一般把其否定作为原假设.中必须接受一个,拒接另一个.
- 母体分布类型已知,仅涉及几个未知参数的假设称为参数假设.
- 母体分布类型未知,统计假设只能对未知函数的类型和它的某些特征提出假设,称为非参数假设.
- 临界域(拒绝域)
我们把字样空间划分成两个互不相交的子集,当字样的观察值点时,我们拒绝原假设,接受备择假设,反之亦然.这样的划分构成一个准则,我们称这个子样空间的子集为检验的临界域.
两类错误
- 由于子样的随机性,在进行半段是可能犯两类错误.
- 为真,而子样的观察值落入,按照给定的检验法则,我们应该拒绝,这种错误称为第一类错误.
犯第一类错误的概率(拒真概率) :
- 同样,如果为真,而我们拒绝接受,称为犯第二类错误.
犯第二类错误的概率 =
- 我们把犯第一类错误的概率称为显著性水平,对其加以限制.
假设检验的步骤(用前面的例题来说明)
- 根据问题要求建立原假设和备择假设.
在例题中,母体的分布为方差已知的正态分布.
原假设 .
备择假设 .
- 选取一个合适的检验统计量(一般就是标准正态分布),使得其在为真时的抽样分布不含任何位置参数,从而可以获得它的分位数.
这里我们选用统计量.
- 给定显著性水平,并求出临界域,使.
在例题的临界域为
有的时候临界域是双边的.
参数假设检验
这里仅介绍母体的分布为正态时()的几种显著性检验方法,这里的假设都是对这两个参数的假设.
- 的检验
- 方差已知
检验统计量,称为u检验
- 未知
检验统计量, 其中,称为t检验
- 的检验
回顾:F分布
一个F-分布的随机变量是两个卡方分布变量的比率.
非参数假设检验
在做非参数假设检验之前,需要对母体的分布类型进行推断.我们将讨论母体分布的假设检验问题.
非参数假设检验问题,所研究的是如何用子样去拟合母体分布,所以又称为分布拟合优度检验.
1. 概率图纸法
概率分布函数本来是一条s型曲线,我们把纵坐标进行"缩放",可以把它拉成一条直线,同时也就得到了一张概率图纸,然后处理样本数据(排序,计算频率,做修正),把每个样本点标在概率图纸上,用最小二乘法拟合出一条直线.根据直线斜率和横坐标交点可以求出和.
2.拟合检验法