1、第一节第一节 检验假设与检验假设与P值值 假设检验过去称显著性检验。它是利假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题出发间接判断要解决的问题(H1)是否是否成立。然后在成立。然后在H0成立的条件下计算检验成立的条件下计算检验统计量,最后获得统计量,最后获得P值来判断值来判断。假设检验基本思想假设检验基本思想问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesis test)。例例81 通过以往大规模调查,
2、已知某地一般新通过以往大规模调查,已知某地一般新生儿的头围均数为生儿的头围均数为34.50cm,标准差为,标准差为1.99cm。为研究某矿区新生儿的发育状况,现从该地某为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿矿区随机抽取新生儿55人,测得其头围均数为人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?一般新生儿头围总体均数是否不同?本例:本例:034.50,33.89cmXcm,造成造成0X的可能原因有二的可能原因有二:假设检验的目的假设检验的目的就是判断差别就是判断差别是由哪种原因造成的。是由哪种
3、原因造成的。抽样误差造成的;抽样误差造成的;本质差异造成的。本质差异造成的。一般新生儿头围一般新生儿头围 34.50cm 33.89cn矿区新生儿头围矿区新生儿头围 34.50cmX 一种假设一种假设H0另一种假设另一种假设H1抽样误差抽样误差总体不同总体不同 第二节第二节 假设检验的基本步骤假设检验的基本步骤s例例81 通过以往大规模调查,已知某地一般新生儿的头围均数为34.50cm,标准差为1.99cm。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?1.建立检验假设,确定检验水
4、准(选用单侧或双侧检验)建立检验假设,确定检验水准(选用单侧或双侧检验)(1)无效假设又称零假设,记为)无效假设又称零假设,记为 H0;(2)备择假设又称对立假设,记为)备择假设又称对立假设,记为 H1。对于检验假设,须注意:对于检验假设,须注意:检验假设是针对总体而言,而不是针对样本;检验假设是针对总体而言,而不是针对样本;H0和和 H1是相互联系,对立的假设,后面的结论是是相互联系,对立的假设,后面的结论是 根据根据 H0和和 H1作出的,因此两者不是可有可无,而是作出的,因此两者不是可有可无,而是 缺一不可;缺一不可;H1的内容直接反映了检验单双侧。若的内容直接反映了检验单双侧。若H1中
5、只是中只是 0 或或 0,则此检验为单侧检验。,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。验较保守和稳妥。(3)检验水准检验水准,过去称显著性水准,是预,过去称显著性水准,是预先规定的概率值,它确定了小概率事件
6、的先规定的概率值,它确定了小概率事件的标准。在实际工作中常取标准。在实际工作中常取 =0.05。可根据可根据不同研究目的给予不同设置。不同研究目的给予不同设置。根据变量和资料类型、设计方根据变量和资料类型、设计方案、统计推断的目的、是否满足特案、统计推断的目的、是否满足特定条件等(如定条件等(如数据的分布类型数据的分布类型)选)选择相应的检验统计量。择相应的检验统计量。2.计算检验统计量计算检验统计量(33.89-34.50)(1.99/55)2.273u 3.确定确定P值,下结论值,下结论如例如例81已得到已得到P60)或或 已知已知时。检验统计量分别为时。检验统计量分别为0000000 (
7、)()XXXXunSSnXXun较大时已知时P121 例8-2 P121 例8-2s例例82(续例7-5)1995年,已知某地20岁应征男青年的平均身高为168.5cm。2003年,在当地20岁应征男青年中随机抽取85人,平均身高为171.2 cm,标准差为5.3cm,问2003年当地20岁应征男青年的身高与1995年相比是否不同?P121 例8-20171.2 168.54.70/5.3/85XuSns检验界值u0.05/2=1.96,u0.01/2=2.58,u u0.01/2,得P30且且n230)时。检验统计量为时。检验统计量为 P122 例8-3两均数之差的标准误的估计值两均数之差的
8、标准误的估计值P122 例8-3两均数之差的标准误的估计值两均数之差的标准误的估计值12222211222.95.24.23/1.9/322.7/40XXuSnSn 由于由于u0.05/2=1.96,u0.01/2=2.58,|u|u0.01/2,得得P u0.01,故P0.01,按=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为经健康教育后,该地成年男性高血压患病率有所降低。二、两个率比较的二、两个率比较的u检验检验 推断两个总体率是否相同推断两个总体率是否相同 P124例例8-51212121211(1)()ppccppppuppnn例例85 某医院用黄芪注射液和胎盘球蛋白进行穴
9、某医院用黄芪注射液和胎盘球蛋白进行穴位注射治疗小儿支气管哮喘病人,黄芪注射液位注射治疗小儿支气管哮喘病人,黄芪注射液治疗治疗117例,有效例,有效103例;胎盘球蛋白治疗例;胎盘球蛋白治疗55例例,有效,有效49例。试比较两种疗法有效率有无差别例。试比较两种疗法有效率有无差别%37.885511749103cp 0.88030.89090.00540.8837(1 0.8837)/(1/117 1/55)u su0.05/2=1.96,现|u|0.05,按=0.05检验水准接受H0,差异无统计学意义,尚不能认为两种疗法治疗小儿支气管哮喘的疗效有差别。第五节 检验水准与两类错误 I型错误和型错误
10、和II型错误型错误 假设检验是利用小概率反证法思想,假设检验是利用小概率反证法思想,从问题的对立面从问题的对立面(H0)出发间接判断要解决的出发间接判断要解决的问题问题(H1)是否成立,然后在假定是否成立,然后在假定H0成立的条成立的条件下计算检验统计量,最后根据件下计算检验统计量,最后根据P值判断结值判断结果,此推断结论具有概率性,因而无论果,此推断结论具有概率性,因而无论拒拒绝绝还是还是不拒绝不拒绝H0,都可能犯错误。详见表,都可能犯错误。详见表8-1。I I 型错误:型错误:“实际无差别,但下了有差别的实际无差别,但下了有差别的结论结论”,假阳性错误假阳性错误。犯这种错误的概率是。犯这种
11、错误的概率是(其值等于检验水准其值等于检验水准)IIII型错误型错误:“实际有差别,但下了不拒绝实际有差别,但下了不拒绝H H0 0的的结论结论”,假阴性错误假阴性错误。犯这种错误的概率是。犯这种错误的概率是(其值未知其值未知)。但但 n n 一定时,一定时,增大,增大,则减少则减少 。假设检验的结果假设检验的结果 客观实际客观实际 拒绝拒绝 H0“接受”“接受”H0 H0成立成立 I 型错误型错误()推断正确推断正确(1 )H0不成立不成立 即即 H1成立成立 推断正确推断正确(1 )II 型错误型错误()可能发生的两类错误可能发生的两类错误图图8-2 I型错误与型错误与II型错误示意图型错
12、误示意图(以单侧以单侧u检验为例检验为例)H1:0 成立 界值 0 1 1 1-1-:检验效能检验效能(powerpower):当当两总体确有差两总体确有差别,按别,按检验水准检验水准 所能发现这种差别的能力所能发现这种差别的能力。减少(增加)减少(增加)I型错误型错误,将会,将会增加(减少)增加(减少)II型错误型错误增大增大n 同时降低同时降低 与与 与与 间的关系间的关系减少减少I型错误型错误的主要方法:假设检验时设定的主要方法:假设检验时设定 值值。减少减少II型错误型错误的主要方法:的主要方法:提高提高检验效能检验效能。提高提高检验效能的最有效方法:检验效能的最有效方法:增加样本量增
13、加样本量。如何如何选择合适的样本量:选择合适的样本量:实验设计实验设计。第六节第六节 单侧检验与双侧检验单侧检验与双侧检验 s图83 双侧u检验的检验水准 n图84 单侧u检验的检验水准 单侧检验单侧检验 概念概念 第七节 假设检验的统计意义与实际意义 1.要有严密的研究设计,尤其是下要有严密的研究设计,尤其是下因果因果结论结论。2.不同的资料应选用不同检验方法。不同的资料应选用不同检验方法。3.正确理解正确理解“显著性显著性”一词的含义一词的含义(用用统计统计学意义学意义一词一词替代替代)。4.结论不能绝对化结论不能绝对化,提倡使用精确提倡使用精确P值值。5.注意统计注意统计“显著性显著性”
14、与医学与医学/临床临床/生物生物 学学“显著性显著性”的区别的区别 6.可信区间与假设检验各自不同的可信区间与假设检验各自不同的作用,要结合使用。作用,要结合使用。一方面一方面,可信区间可信区间亦可回答亦可回答假设检验假设检验的问题,算的问题,算得的可信区间若包含了得的可信区间若包含了H0,则按,则按 水准,不拒绝水准,不拒绝H0;若不包含若不包含H0,则按,则按 水准,拒绝水准,拒绝H0,接受,接受H1。另一方面另一方面,可信区间不但能回,可信区间不但能回答差别有无统计学意义,而且还能答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提比假设检验提供更多的信息,即提示差别有无实际的专
15、业意义。示差别有无实际的专业意义。有实际专业意义的值 H0 (2)(3)(4)(5)(1)有实际 可能有实际 无实际 样本例数 可接受 专业意义 专业意义 专业意义 太少 H0 有统计学意义 无统计学意义 可信区间在统计推断上提供的信息可信区间在统计推断上提供的信息 虽然虽然可信区间可信区间亦可回答亦可回答假设检验假设检验的的问题,并能提供更多的信息,但并不意问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率可信区间只能在预先规定的概率 检验检验水准水准 的前提下进行计算,而假设检验能的前提下进行计算,而假设检验能够获得一较为确切的概率够获得一较为确切的概率P值。值。