1、第一节第一节 假设检验的基本问题假设检验的基本问题第二节第二节 几种常见的假设检验几种常见的假设检验 第三节第三节 假设检验的两类错误与功效假设检验的两类错误与功效 第七章 假设检验 第一节第一节 假设检验的基本问题假设检验的基本问题 一、假设检验的概念与种类一、假设检验的概念与种类 二、原假设和备择假设二、原假设和备择假设 三、显著性水平和拒绝域三、显著性水平和拒绝域 四、假设检验的基本步骤四、假设检验的基本步骤 所谓假设检验,就是事先对所谓假设检验,就是事先对总体参数总体参数或或总体分布形态总体分布形态做出一个规定或假设,然后利用样本提供的信息,以做出一个规定或假设,然后利用样本提供的信息
2、,以一定的概率来检验假设是否成立(或是否合理),或一定的概率来检验假设是否成立(或是否合理),或者说判断总体的真实情况是否与原假设存在显著的系者说判断总体的真实情况是否与原假设存在显著的系统性差异。统性差异。在统计中,常见的统计假设有:总体均值(或总体成在统计中,常见的统计假设有:总体均值(或总体成数、总体方差等)等于(或大于、小于)某一数值,数、总体方差等)等于(或大于、小于)某一数值,总体相关系数等于总体相关系数等于0 0,两总体均值(或两总体成数、两,两总体均值(或两总体成数、两总体方差)相等,总体分布服从正态分布等。总体方差)相等,总体分布服从正态分布等。根据检验的目的不同,假设检验可
3、以分为双侧检验和根据检验的目的不同,假设检验可以分为双侧检验和单侧检验两类。双侧检验是指同时注意总体参数估计单侧检验两类。双侧检验是指同时注意总体参数估计值与其假设值相比的偏高和偏低倾向的检验。单侧检值与其假设值相比的偏高和偏低倾向的检验。单侧检验是指只注意总体参数估计值比其假设值偏高或偏低验是指只注意总体参数估计值比其假设值偏高或偏低倾向的检验倾向的检验,它是单方向的。它是单方向的。要进行假设检验,必须设立要进行假设检验,必须设立原假设和备择假设原假设和备择假设。原假设也称零假设或虚无假设,是研究者对总体参数原假设也称零假设或虚无假设,是研究者对总体参数值事先提出的假设,是被检验的假设。备择
4、假设也称值事先提出的假设,是被检验的假设。备择假设也称对立假设,是研究者通过检验希望能够成立的假设,对立假设,是研究者通过检验希望能够成立的假设,是当原假设不成立时供选择的假设。是当原假设不成立时供选择的假设。设总体参数设总体参数 的假设值为的假设值为 ,那么原假设记为:,那么原假设记为:它表示总体参数值与其假设值之间没有显著差异。它表示总体参数值与其假设值之间没有显著差异。备择假设记为:备择假设记为:(双侧检验时)(双侧检验时)或或 (右单侧检验时)(右单侧检验时)或或 (左单侧检验时)(左单侧检验时)000H:10H:10H:10H:假设检验的实质就是样本信息是否有充分的理由来否假设检验的
5、实质就是样本信息是否有充分的理由来否定原假设。定原假设。一方面原假设一方面原假设H H0 0受到保护而不被轻易否定,使它处于受到保护而不被轻易否定,使它处于有利地位;另一方面当原假设有利地位;另一方面当原假设H H0 0被接收时,又认为它被接收时,又认为它不一定正确。不一定正确。还须指出,备择假设的表达式中是不含有等号的,即还须指出,备择假设的表达式中是不含有等号的,即等号一定存在于原假设中。等号一定存在于原假设中。进行假设检验,概率论中关于小概率事件在一次试验进行假设检验,概率论中关于小概率事件在一次试验中是不可能事件的原则是其所要遵循的基本原则。中是不可能事件的原则是其所要遵循的基本原则。
6、由抽样分布理论可知,若原假设成立,则样本统计值由抽样分布理论可知,若原假设成立,则样本统计值与总体参数假设值偏差很大的事件是一个小概率事件。与总体参数假设值偏差很大的事件是一个小概率事件。倘若在一次抽样中,样本统计值与总体参数假设值相倘若在一次抽样中,样本统计值与总体参数假设值相差很大,那么在原假设成立的条件下,就是出现了一差很大,那么在原假设成立的条件下,就是出现了一个小概率事件。一旦出现小概率事件,就要怀疑原假个小概率事件。一旦出现小概率事件,就要怀疑原假设的正确性,从而否定原假设。若一次抽样的样本统设的正确性,从而否定原假设。若一次抽样的样本统计值与总体参数假设值相差不大,那么就没有理由
7、拒计值与总体参数假设值相差不大,那么就没有理由拒绝原假设,也就只好接受原假设。绝原假设,也就只好接受原假设。现在的问题是,概率小到多少的事件为小概率事件?现在的问题是,概率小到多少的事件为小概率事件?这个概率是在假设检验之前由人们事先主观选定的,这个概率是在假设检验之前由人们事先主观选定的,用用 表示。表示。究竟取多大为宜,应视具体情况而定,究竟取多大为宜,应视具体情况而定,通常取通常取0.050.05或或0.010.01,有时也取,有时也取0.100.10,而把概率小于上,而把概率小于上述值的事件称为小概率事件。述值的事件称为小概率事件。越大,样本统计值与越大,样本统计值与总体参数假设值之间
8、的差异成为显著性差异的可能性总体参数假设值之间的差异成为显著性差异的可能性越大;越大;越小,这种差异成为显著性差异的可能性越小。越小,这种差异成为显著性差异的可能性越小。因此的因此的 大小就成了判定这种差异是否显著的一个标大小就成了判定这种差异是否显著的一个标准,故称为显著性水平。准,故称为显著性水平。1-1-,则是样本统计值与总,则是样本统计值与总体参数假设值之差不超过一定范围的概率。体参数假设值之差不超过一定范围的概率。接受或拒绝原假设,最终要以显著性水平为依据确定接受或拒绝原假设,最终要以显著性水平为依据确定评判的规则。评判规则有两种;临界值规则和评判的规则。评判规则有两种;临界值规则和
9、P-P-值规值规则。则。所谓临界值规则,就是先把值转化为一定分布下的临所谓临界值规则,就是先把值转化为一定分布下的临界值,然后计算检验统计值,最后把检验统计值与临界值,然后计算检验统计值,最后把检验统计值与临界值相比较来判断是否拒绝原假设。界值相比较来判断是否拒绝原假设。所谓所谓P-P-值规则,就是先计算检验统计值值规则,就是先计算检验统计值 ,然后求出,然后求出统计量分布曲线图中与检验统计值相对应的、称之为统计量分布曲线图中与检验统计值相对应的、称之为观测到的显著性水平观测到的显著性水平P-P-值,最后把值,最后把P-P-值与事先给定的值与事先给定的显著性水平值显著性水平值 相比较来判断是否
10、拒绝原假设。相比较来判断是否拒绝原假设。Z 检验统计量是样本统计量的标准化形式,其构造公式检验统计量是样本统计量的标准化形式,其构造公式为为 或或 。凡是检验统计量之值的绝。凡是检验统计量之值的绝对值小于临界值的绝对值,那么就接受原假设;若检对值小于临界值的绝对值,那么就接受原假设;若检验统计量之值的绝对值大于或等于临界值的绝对值,验统计量之值的绝对值大于或等于临界值的绝对值,那么就拒绝原假设。这样,临界值就把样本统计量的那么就拒绝原假设。这样,临界值就把样本统计量的概率分布区域分成了两部分(即把检验统计量的取值概率分布区域分成了两部分(即把检验统计量的取值分成了两个区域):不超过临界值的区域
11、和超过临界分成了两个区域):不超过临界值的区域和超过临界值的区域。我们把不超过临界值的区域称为接受域,值的区域。我们把不超过临界值的区域称为接受域,把超过临界值的区域(含临界值点)称为拒绝域。标把超过临界值的区域(含临界值点)称为拒绝域。标准正态分布的拒绝域如图准正态分布的拒绝域如图5-1、图、图5-2所示。所示。()ZSE()tSE1 接受域 拒绝域 拒绝域 2Z2Z22 0 图图5-1 正态分布双侧检验接受域与拒绝域示意图正态分布双侧检验接受域与拒绝域示意图(a)左单侧检验)左单侧检验 (b)右单侧检验)右单侧检验 图图5-2 正态分布单侧检验接受域与拒绝域示意图正态分布单侧检验接受域与拒
12、绝域示意图1 接受域 拒绝域 0 Z1 接受域 拒绝域 0 Z假设检验的假设检验的基本原理基本原理(一)提出原假设和备择假设;(一)提出原假设和备择假设;(二)确定检验的显著性水平;(二)确定检验的显著性水平;(三)根据样本统计量的概率分布确定出与相对应的临(三)根据样本统计量的概率分布确定出与相对应的临界值,即确定接受域和拒绝域;界值,即确定接受域和拒绝域;(四)构造检验统计量,并根据样本观测数据计算出检(四)构造检验统计量,并根据样本观测数据计算出检验统计值;验统计值;(五)比较检验统计值与临界值,做出接受或拒绝原假(五)比较检验统计值与临界值,做出接受或拒绝原假设的判断。设的判断。第二节
13、第二节 几种常见的假设检验几种常见的假设检验 一、总体均值的检验一、总体均值的检验 二、两个总体均值之差的检验二、两个总体均值之差的检验 三、总体成数的检验三、总体成数的检验 四、两总体成数之差的检验四、两总体成数之差的检验 五、总体方差的检验五、总体方差的检验 六、两总体方差之比的检验六、两总体方差之比的检验 总体均值检验的目的是总体均值总体均值检验的目的是总体均值 是否等于(或大于,是否等于(或大于,或小于)或小于)。我们可以建立假设如下:。我们可以建立假设如下:(双侧检验)(双侧检验)或或 (左单侧检验)(左单侧检验)或或 (右单侧检验)(右单侧检验)下面我们分几种情况加以介绍。下面我们
14、分几种情况加以介绍。0010HXXHXX:0010HXXHXX:0010HXXHXX:X0X (一)总体服从正态分布且方差已知(一)总体服从正态分布且方差已知 根据抽样分布原理,当总体服从正态分布根据抽样分布原理,当总体服从正态分布 时,时,那么从中抽取容量为那么从中抽取容量为n n的样本,其样本均值的样本,其样本均值 服从正态服从正态分布分布 (为了简便,只讨论重复抽样情况),而统(为了简便,只讨论重复抽样情况),而统计量计量 服从标准正态分布。服从标准正态分布。所以,当原假设为真时,我们可以构造检验统计量为:所以,当原假设为真时,我们可以构造检验统计量为:对于双侧检验,针对给定的显著性水平
15、对于双侧检验,针对给定的显著性水平 ,当,当 时,时,要接受要接受H H0 0;当;当 时,则要拒绝时,则要拒绝H H0 0而接受而接受H H1 1。2(,)N X Sx2(,)SN XnxXZSn0 xXZSn2ZZ2ZZ(二)总体分布及其方差均未知但大样本(二)总体分布及其方差均未知但大样本 根据中心极限定理,当样本容量足够大时(根据中心极限定理,当样本容量足够大时(n30n30),),样本均值样本均值 也趋于服从数学期望为也趋于服从数学期望为 ,方差为,方差为 的正的正态分布。但由于态分布。但由于 未知,要以样本方差未知,要以样本方差 来来估计,这时统计量估计,这时统计量 趋于服从标准正
16、态分布。趋于服从标准正态分布。所以,如果原假设所以,如果原假设 成立,我们也可以构造检验成立,我们也可以构造检验统计量为:统计量为:根据与(一)相同的规则,通过比较根据与(一)相同的规则,通过比较 值与临界值值与临界值或或 ,可以做出接受,可以做出接受H H0 0或拒绝或拒绝H H1 1的判断,唯一不同之的判断,唯一不同之处,就是以处,就是以 代替了代替了 。xX2Sn2S22()1ixxsn0 xXZsn00HXX:0 xXZsnZZ2ZsS(三)总体为正态分布,但方差未知且小样本(三)总体为正态分布,但方差未知且小样本 若总体服从正态分布若总体服从正态分布 ,但,但 未知而要用样本方未知而
17、要用样本方差差 估计,那么当估计,那么当 时,统计量时,统计量 服从自由度服从自由度为为n-1的的t分布。分布。如果原假设如果原假设 成立,则检验统计量为:成立,则检验统计量为:根据规定的显著性水平根据规定的显著性水平 来确定临界值来确定临界值 或或 ,通过比较通过比较t和和 (或(或 ),来做出接受或拒绝原假设),来做出接受或拒绝原假设的判断。这种检验称为小样本的判断。这种检验称为小样本t检验。检验。对于双侧检验,当对于双侧检验,当 ,接受原假设,接受原假设 而拒绝而拒绝备择假设备择假设 ;若;若 ,则要拒绝,则要拒绝H0而接受而接受H1。同理,对于左单侧检验,当同理,对于左单侧检验,当 时
18、,拒绝时,拒绝 而而接受接受 ;若;若 。则接受。则接受H0。对于右单侧检。对于右单侧检验,当验,当 时,拒绝时,拒绝 而接受而接受 若若 ,则接受则接受H0。2(,)N X S2S2s30n xXtsn00HXX:0 xXtsn(,1)2nt(,1)nt2tt2tt00HXX:10HXX:2tttt00HXX:10HXX:tt tt00HXX:10HXX:tt 设两个总体的均值分别为设两个总体的均值分别为 和和 ,两个总体的方差分,两个总体的方差分别为别为 和和 ,来自两个总体的样本容量分别为,来自两个总体的样本容量分别为n1和和n2,样本均值分别为样本均值分别为 和和 。检验的目的是两个总
19、体的均。检验的目的是两个总体的均值是否相等,或两个总体的均值之差是否为零。我们值是否相等,或两个总体的均值之差是否为零。我们可以建立假设如下:可以建立假设如下:(双侧检验)(双侧检验)或或 (左单侧检验)(左单侧检验)或或 (右单侧检验)(右单侧检验)下面分几种情况加以介绍。下面分几种情况加以介绍。1X2X21S22S1x2x012112HXXHXX:012112HXXHXX:012112HXXHXX:(一)两个总体服从正态分布且方差已知(一)两个总体服从正态分布且方差已知 根据抽样分布原理,统计量根据抽样分布原理,统计量 服从标准服从标准正态分布。正态分布。如果原假设如果原假设 成立,我们可
20、构造检验统计量成立,我们可构造检验统计量为:为:对于双侧检验,当对于双侧检验,当 时拒绝时拒绝H0,当,当 时接时接受受H0。对于左单侧检验,当。对于左单侧检验,当 时拒绝时拒绝H0,当,当 时接受时接受H0。对于右单侧检验,当。对于右单侧检验,当 时拒绝时拒绝H0,当,当 时接受时接受H0。1212221212()()xxXXZSSnn012HXX:12221212xxZSSnn2ZZ2ZZZZ ZZ ZZZZ (二)(二)两个总体方差未知但大样本两个总体方差未知但大样本 若两个总体方差若两个总体方差 和和 未知且不相等,要分别以样未知且不相等,要分别以样本方差本方差 和和 来估计,那么当来
21、估计,那么当n1和和n2都足够大时,统都足够大时,统计量计量 趋于服从标准正态分布。趋于服从标准正态分布。当原假设当原假设 成立时,我们可构造检验统计量为:成立时,我们可构造检验统计量为:21S22S21s22s1212221212()()xxXXZssnn012HXX:12221212xxZssnn (三)两个总体服从正态分布,但方差未知且小样本(三)两个总体服从正态分布,但方差未知且小样本 若两个总体服从正态分布,方差未知且相等,那么当若两个总体服从正态分布,方差未知且相等,那么当n1和和n2都不够大时,那么下列统计量服从自由度为都不够大时,那么下列统计量服从自由度为n1+n2-2的的t分
22、布,即:分布,即:其中其中 为合并标准差。为合并标准差。当原假设成立时,检验统计量为:当原假设成立时,检验统计量为:对于双侧检验,当对于双侧检验,当 时要拒绝时要拒绝H0,当,当 要接受要接受H0。对于左单侧检验,当。对于左单侧检验,当 时要拒绝时要拒绝H0,当,当 时要接受时要接受H0。对于右单侧检验,。对于右单侧检验,当当 时要拒绝时要拒绝H0,当,当 要接受要接受H0。121212()()11xxXXtsnn22112212(1)(1)2nsnssnn1212()11xxZsnn12(,2)2nntt12(,2)2nntt12(,2)nntt 12(,2)nntt 12(,2)nntt1
23、2(,2)nntt 检验的目的是判断总体成数检验的目的是判断总体成数P P是否等于是否等于P P0 0,我们可以建,我们可以建立假设如下:立假设如下:(双侧检验)(双侧检验)或或 (左单侧检验)(左单侧检验)或或 (右单侧检验)(右单侧检验)0010HPPHPP:0010HPPHPP:0010HPPHPP:根据抽样分布定理可知,当样本容量足够大,即根据抽样分布定理可知,当样本容量足够大,即nP和和n(1-P)都大于)都大于5时,样本成数时,样本成数p的抽样分布近似服从的抽样分布近似服从正态分布,而统计量正态分布,而统计量 服从标准正态分布。其中,由于服从标准正态分布。其中,由于N一般都很大,因
24、此一般都很大,因此总体方差总体方差 简化为简化为 。因此,当原假设为真时,我们可以构造检验统计量为:因此,当原假设为真时,我们可以构造检验统计量为:对于给定的显著性水平对于给定的显著性水平 ,可查得临界值,可查得临界值 或或 。通过比较通过比较 与与 或或 ,可做出拒绝原假设,可做出拒绝原假设H0或接受或接受原假设原假设H0的判断。判断规则与总体均值检验相同。的判断。判断规则与总体均值检验相同。(1)pPZPPn11NPPN()1PP()000(1)pPZPPn2ZZZ2ZZ 设两个总体成数分别为设两个总体成数分别为P1和和P2,来自两个总体的样本,来自两个总体的样本容量分别为容量分别为n1和
25、和n2,样本成数分别为,样本成数分别为p1和和p2。检验两。检验两个总体成数是否相等,或两个总体成数之差是否为零,个总体成数是否相等,或两个总体成数之差是否为零,我们可以建立假设如下:我们可以建立假设如下:(双侧检验)(双侧检验)或或 (左单侧检验)(左单侧检验)或或 (右单侧检验)(右单侧检验)012112HPPHPP:012112HPPHPP:012112HPPHPP:当当n1和和n2都足够大时(即都足够大时(即n n1 1P P1 1、n n1 1P P1 1 (1-P(1-P1 1)、n n2 2P P2 2、n n2 2P P2 2(1-P(1-P2 2)均大于均大于5 5),两个样
26、本成数之差的抽样分布),两个样本成数之差的抽样分布渐近服从正态分布,即:渐近服从正态分布,即:由于由于P P1 1、P P2 2未知,要以未知,要以p1和和p2来估计,因此在原假设来估计,因此在原假设H H0 0为真时,我们要以两个样本的合并成数作为两个总体为真时,我们要以两个样本的合并成数作为两个总体成数的共同的估计值,即:成数的共同的估计值,即:这样,当原假设成立时,检验统计量就成为:这样,当原假设成立时,检验统计量就成为:1212122212()()(1)(1)ppPPZPPPPnn112212n pn pPnn1212()11(1)()ppZPPnn 检验目的是判断正态总体方差检验目的
27、是判断正态总体方差S S2 2是否是否S S0 02 2等于,我们可等于,我们可建立假设为:建立假设为:(双侧检验)(双侧检验)或或 (左单侧检验)(左单侧检验)或或 (右单侧检验)(右单侧检验)22002210HSSHSS:22002210HSSHSS:22002210HSSHSS:当原假设为真时,我们可构造服从自由度为当原假设为真时,我们可构造服从自由度为n-1n-1的的 分分布的检验统计量:布的检验统计量:对于给定的显著性水平对于给定的显著性水平 ,在双侧检验时,在双侧检验时,分布的左分布的左临界值为临界值为 ,右临界值为,右临界值为 。当。当 ,就接受原假设就接受原假设H H0 0;若
28、;若 或或 ,就要拒绝,就要拒绝原假设原假设H H0 0 。在左单侧检验时,临界值为。在左单侧检验时,临界值为 ,当,当 时,就接受原假设时,就接受原假设H H0 0 ;若;若 ,就拒绝原假设,就拒绝原假设H H0 0 。在右单侧检验时,临界值为在右单侧检验时,临界值为 ,当,当 ,就接受,就接受原假设原假设H H0 0 ;若;若 ,就拒绝原假设,就拒绝原假设H H0 0 。分布检分布检验的拒绝域如图验的拒绝域如图5-35-3、图、图5-45-4所示。所示。22220(1)nsS22(1,1)2n2(,1)2n222122221222122(1,1)n2212212(,1)n22222拒绝域
29、接受域1 拒绝域 图图5-3 分布双侧检验接受域与拒绝域示意图分布双侧检验接受域与拒绝域示意图212212212拒绝域 接受域1 接受域1拒绝域22(a)左单侧检验)左单侧检验 (b)右单侧检验)右单侧检验图图5-4 分布单侧检验接受域与拒绝域示意图分布单侧检验接受域与拒绝域示意图 设两个总体方差分别为设两个总体方差分别为S S1 12 2和和S S2 22 2,相应的样本方差分别,相应的样本方差分别s s1 12 2为和为和s s2 22 2,检验目的是判断两个总体方差是否相等,检验目的是判断两个总体方差是否相等,我们可建立假设为:我们可建立假设为:(双侧检验)(双侧检验)或或 (左单侧检验
30、)(左单侧检验)或或 (右单侧检验)(右单侧检验)2201222112HSSHSS:2201212112HSSHSS:2201212112HSSHSS:如果原假设成立,那么来自两个总体的两个样本方差之如果原假设成立,那么来自两个总体的两个样本方差之比应接近于比应接近于1 1。因此当两个总体为正态总体时,我们可。因此当两个总体为正态总体时,我们可构造检验统计量为:构造检验统计量为:它服从分子自由度为它服从分子自由度为n n1 1-1-1,分母自由度为,分母自由度为n n2 2-1-1的的F F分布。分布。对于给定的显著性水平对于给定的显著性水平 ,在双侧检验时,分布的左临,在双侧检验时,分布的左
31、临界值为界值为 右临界值为右临界值为 。当当 时,接受原假设时,接受原假设H H0 0;若;若 或或 ,则,则要拒绝原假设要拒绝原假设H H0 0而接受而接受H H1 1 。在左单侧检验时,临界值。在左单侧检验时,临界值为为 ,若,若 ,要接受原假设,要接受原假设H H0 0 ;若;若 ,则拒绝原假设则拒绝原假设H H0 0而接受而接受H H1 1 。在右单侧检验时,临界值。在右单侧检验时,临界值为为 ,若,若 ,要接受,要接受H H0 0 ;若;若 ,要拒绝,要拒绝H H0 0而而接受接受H H1 1 。分布检验的拒绝域于图。分布检验的拒绝域于图5-35-3、图、图5-45-4相似。相似。2
32、122sFs12(1,1,1)2nnF12(,1,1)2nnF122FFF12FF2FF12(1,1,1)nnF1FF1FF12(,1,1)nnFFFFF第三节第三节 假设检验的两类错误与功效假设检验的两类错误与功效 一、假设检验的两类错误一、假设检验的两类错误 二、犯第二类错误的概率的计算二、犯第二类错误的概率的计算 三、假设检验的功效三、假设检验的功效 第一类错误是第一类错误是“以真为假以真为假”的错误,即原假设正确但的错误,即原假设正确但却被拒绝的错误,也称为却被拒绝的错误,也称为“弃真弃真”错误。产生第一类错误。产生第一类错误的概率是由假设检验的显著性水平给出的,即错误的概率是由假设检
33、验的显著性水平给出的,即是是 ,因此它又称为,因此它又称为 错误。错误。第二类错误是第二类错误是“以假为真以假为真”的错误,即原假设不正确的错误,即原假设不正确却被接受的错误,也称为却被接受的错误,也称为“纳伪纳伪”错误。犯第二类错错误。犯第二类错误的概率是当备择假设成立时,检验统计值落入接受误的概率是当备择假设成立时,检验统计值落入接受域的概率,一般用域的概率,一般用 表示,因此它又称为表示,因此它又称为 错误。错误。假设检验的两类错误假设检验的两类错误 原假设原假设H H0 0为真为真原假设原假设H H0 0为假为假接受原假设接受原假设 正确决策正确决策1-1-错误错误拒绝原假设拒绝原假设
34、 错误错误正确决策正确决策1-1-)(20 xSEZX 接受域接受域 20X)(20 xSEZX1X2 图图5-5 双侧检验两类错误的关系双侧检验两类错误的关系 接受域接受域 0X)(0 xSEZX1X 图图5-6 单侧检验两类错误的关系单侧检验两类错误的关系 (一)在双侧检验中的计算(一)在双侧检验中的计算 先求出当原假设先求出当原假设 为真时的两个临界值:为真时的两个临界值:和和 其中抽样标准误其中抽样标准误 通常要以来通常要以来 估计。估计。然后求出当备择假设然后求出当备择假设 为真时,样本均值为真时,样本均值 落入落入区间区间 内的概率,此即为内的概率,此即为 ,计算公式为:,计算公式
35、为:00HXX:102CXZSE x()202CXZSE x()SE x())(xse11HXX:x12(,)C C1112112Pr()()()()()CXxXCXCxCPxxx(二)在单侧检验中(二)在单侧检验中 的计算的计算 对于左单侧检测,先求出原假设对于左单侧检测,先求出原假设 为真时的临界为真时的临界值值 ,然后求出当备择假设,然后求出当备择假设 为真时,为真时,样本均值样本均值 落入区间落入区间 内的概率,此即为内的概率,此即为 ,计,计算公式为:算公式为:对于右单侧检验,先求出当原假设对于右单侧检验,先求出当原假设 为真时的临为真时的临界值界值 ,然后求出当备择假设,然后求出当
36、备择假设 为真为真时,样本均值时,样本均值 落入区间落入区间 内的概率,此即内的概率,此即为为 ,计算公式为:,计算公式为:00HXX:02()CXZSE x11HXX:x(,)C 11Pr()()()()xXCXxCPSE xSE x00HXX:02()CXZSE x(,)C11Pr()()()()xXCXxCPSE xSE x11HXX:x 从理论上说,统计假设检验应把一切不真的从理论上说,统计假设检验应把一切不真的H H0 0都舍弃,都舍弃,而把一切真的而把一切真的H H1 1都接受。由于都接受。由于 是拒绝真的是拒绝真的H H1 1 (即接(即接受不真的受不真的 )的概率,因此接受真的
37、)的概率,因此接受真的H H1 1 (即拒绝不真(即拒绝不真的)的)H H0 0的概率便是的概率便是1 1 。我们希望。我们希望 尽可能小,也尽可能小,也就意味着就意味着1 1 尽可能大。概率尽可能大。概率1 1 就称为假设检验就称为假设检验的功效。的功效。1 1 越接近于越接近于1 1,说明检验功效越好,说明检验功效越好,1 1 越接近于越接近于0 0,说明检验功效越差。,说明检验功效越差。由于由于 值随着实际值值随着实际值 与假设值与假设值 之间的差距变化而之间的差距变化而变化,因此对于不同的变化,因此对于不同的 值,值,1 1 也是变化的。在给也是变化的。在给定的定的 下,把下,把1 1
38、 的值绘成曲线,就称为检验功效曲的值绘成曲线,就称为检验功效曲线,如图线,如图5-85-8所示。所示。1X0X1X1.00.80.60.40.2640.4839X时,10.51610.051X 52 54 56 58 60 62 64 66 68 图图5-8 检验功效曲线示意图检验功效曲线示意图 影响检验功效的因素很多,如样本容量、显著性水平、影响检验功效的因素很多,如样本容量、显著性水平、H H0 0和和H H1 1的方向性、实验技术和测定工具的可靠性等。就的方向性、实验技术和测定工具的可靠性等。就 与与 的关系而言,当样本容量的关系而言,当样本容量n n固定时,增大固定时,增大 ,检验,检
39、验功效功效1 1 就会增强。就会增强。但前面已指出,但前面已指出,是主要应避免的错误,因此是主要应避免的错误,因此 必须必须控制在一个较小的水平。这样,在假设检验中需要对控制在一个较小的水平。这样,在假设检验中需要对犯两类错误的概率进行适当的平衡。如果犯第一类错犯两类错误的概率进行适当的平衡。如果犯第一类错误所造成的损失比犯第二类错误所造成的损失更严重,误所造成的损失比犯第二类错误所造成的损失更严重,那么那么 要小些;反之,要小些;反之,要小些。如果要同时使要小些。如果要同时使 和和 都尽量小,或者说既要提高假设检验的功效而都尽量小,或者说既要提高假设检验的功效而又不想使犯第一类错误的风险增大,那么只能是增加又不想使犯第一类错误的风险增大,那么只能是增加样本容量。样本容量。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。