1、研究生医学统计学假设检验研究 第五章第五章 假设检验基础假设检验基础 第一节第一节 假设检验的基本思想及步骤假设检验的基本思想及步骤第二节第二节 单组样本资料的假设检验单组样本资料的假设检验第三节第三节 假设检验的两类错误假设检验的两类错误一、假设检验的概念:一、假设检验的概念:一般科研程序:一般科研程序:统计上的假设检验统计上的假设检验:假设检验亦称为显著性检验,是判断样本指标与总体指假设检验亦称为显著性检验,是判断样本指标与总体指标或样本指标与样本指标之间的差异有无统计学意义的一种标或样本指标与样本指标之间的差异有无统计学意义的一种统计方法。统计方法。假说假说验证验证对假说作出结论对假说作
2、出结论v假设检验的原理:假设检验的原理:假设检验的基本思想是反证法和小假设检验的基本思想是反证法和小概率的思想。概率的思想。v反证法思想:首先提出假设(由于未经检验是否成立,反证法思想:首先提出假设(由于未经检验是否成立,所以称为无效假设),用适当的统计方法确定假设成立的所以称为无效假设),用适当的统计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立,拒绝它;可能性大小,如果可能性小,则认为假设不成立,拒绝它;如果可能性大,还不能认为它不成立。如果可能性大,还不能认为它不成立。v小概率思想:是指小概率事件在一次随机试验中认为小概率思想:是指小概率事件在一次随机试验中认为基本上不会发
3、生。基本上不会发生。概率小于多少算小概率是相对的,在进行统计分析概率小于多少算小概率是相对的,在进行统计分析时要事先规定,即检验水准时要事先规定,即检验水准。二、假设检验的基本步骤:二、假设检验的基本步骤:例例5-1 5-1 已知北方农村儿童前囟门闭合月龄为已知北方农村儿童前囟门闭合月龄为14.114.1月。某研究人月。某研究人员从东北某县抽取员从东北某县抽取3636名儿童,得囟门闭合月龄均值为名儿童,得囟门闭合月龄均值为14.314.3月,月,标准差为标准差为5.085.08月。问该县儿童前囟门闭合月龄的均数是否大于月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?一般儿童?3608.53
4、.141.140 nsX 已知:已知:从统计学角度考虑东北某县与北方儿童前囟门闭合从统计学角度考虑东北某县与北方儿童前囟门闭合月龄有差别有两种可能:月龄有差别有两种可能:1 1)差别是由于抽样误差引起的,统计学上称为无统)差别是由于抽样误差引起的,统计学上称为无统计学意义。计学意义。2 2)差异是本质上的差异,即二者来自不同总体。统)差异是本质上的差异,即二者来自不同总体。统计学上称为有统计学意义。计学上称为有统计学意义。3608.53.141.140 nsX 已知:已知:造成两者不等的原因:造成两者不等的原因:非同一总体,即非同一总体,即 存在本质上的差别,同时有存在本质上的差别,同时有抽样
5、误差存在。抽样误差存在。0 0 同一总体,即同一总体,即 但有抽样误差存在;但有抽样误差存在;0 0 X0 0 X1 1、建立检验假设与单双侧、建立检验假设与单双侧2 2、确定检验水准、确定检验水准3 3、选择检验方法并计算统计量、选择检验方法并计算统计量4 4、确定、确定P P值值5 5、作出推断结论、作出推断结论假设检验的基本步骤假设检验的基本步骤(采用反证法思想)采用反证法思想)1 1、建立检验假设与单双侧、建立检验假设与单双侧 假设有两种:一种为检验假设或称无效假设,符号为假设有两种:一种为检验假设或称无效假设,符号为H H0 0;一种为备择假设,符号为一种为备择假设,符号为H H1
6、1。这两种假设都是根据统计推断。这两种假设都是根据统计推断的目的要求而提出的对总体特征的假设。应当注意检验假设的目的要求而提出的对总体特征的假设。应当注意检验假设是针对总体而言,而不是针对样本。是针对总体而言,而不是针对样本。H H0 0是从反证法的思想提是从反证法的思想提出的,出的,H H1 1和和H H0 0是相联系的但又是相对立的假设。是相联系的但又是相对立的假设。H H0 0一般设为某两个或多个总体参数相等,即认为一般设为某两个或多个总体参数相等,即认为他们之间的差别是由于抽样误差引起的。他们之间的差别是由于抽样误差引起的。H H1 1的假设和的假设和H H0 0的假设相互对立,即认为
7、他们之间存的假设相互对立,即认为他们之间存在着本质的差异。在着本质的差异。H H1 1的内容反映出检验的单双侧。的内容反映出检验的单双侧。单双侧的确定一是根据专业知识,已知东北某县囱单双侧的确定一是根据专业知识,已知东北某县囱门月龄闭合值不会低于一般值;二是研究者只关心东北门月龄闭合值不会低于一般值;二是研究者只关心东北某县值是否高于一般人群值,应当用单侧检验某县值是否高于一般人群值,应当用单侧检验。一般认一般认为双侧检验较为稳妥,故较为常用。为双侧检验较为稳妥,故较为常用。2 2、确定检验水准:亦称为显著性水准,符号为、确定检验水准:亦称为显著性水准,符号为,是预,是预先给定的概率值。是判定
8、样本指标与总体指标或两样本先给定的概率值。是判定样本指标与总体指标或两样本指标间的差异有无统计学显著性意义的概率水准,在实指标间的差异有无统计学显著性意义的概率水准,在实际工作中,际工作中,常取常取0.050.05。可根据不同的研究目的给予可根据不同的研究目的给予不同的设置,如方差齐性检验,正态性检验不同的设置,如方差齐性检验,正态性检验常取常取0.10.1或或0.20.2。3 3、选择检验方法并计算统计量:要根据所分析资料的类、选择检验方法并计算统计量:要根据所分析资料的类型和统计推断的目的要求选用不同的检验方法。型和统计推断的目的要求选用不同的检验方法。4 4、确定、确定P P值:值:P
9、P值是指由值是指由H H0 0所规定的总体中做随机抽样,所规定的总体中做随机抽样,获得等于及大于(或等于及小于)现有统计量的概率。当获得等于及大于(或等于及小于)现有统计量的概率。当求得检验统计量的值后,一般可通过特制的统计用表直接求得检验统计量的值后,一般可通过特制的统计用表直接查出查出P P值。值。5 5、作出推断结论:(、作出推断结论:(包括统计结论和专业结论)包括统计结论和专业结论)按按水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1差别有统计学差别有统计学意义。意义。按按水准,不拒绝水准,不拒绝H H0 0,差别无统计学意义。,差别无统计学意义。统统 计计 结结 论论P P值
10、值t t 值值 ,tt ,tt P P05.0(:1.140100单侧),:HH 2 2、计算统计量:根据资料类型和检验方法选择、计算统计量:根据资料类型和检验方法选择351361236.03608.51.143.140 nnsXt 1 1、建立检验假设,确立检验水准、建立检验假设,确立检验水准3 3、确定、确定P P值,做出统计推断值,做出统计推断 P P值的意义:如果总体状况和值的意义:如果总体状况和H H0 0一致,统计量获得现有数一致,统计量获得现有数值以及更不利于值以及更不利于H H0 0的数值的可能性(概率)有多大。的数值的可能性(概率)有多大。25.0682.0)35(25.0)
11、35(25.0 Pttt得得查查 t t 值表:值表:按按=0.05=0.05水准,不拒绝水准,不拒绝H H0 0,差别无统计学意义,差别无统计学意义,故还不能认为该县儿童前囟门闭合月龄的均数大于故还不能认为该县儿童前囟门闭合月龄的均数大于一般儿童。一般儿童。第五章第五章 假设检验基础假设检验基础 第一节第一节 假设检验的基本思想及步骤假设检验的基本思想及步骤第二节第二节 单组样本资料的假设检验单组样本资料的假设检验第三节第三节 假设检验的两类错误假设检验的两类错误目的:推断该样本所代表的未知总体均数目的:推断该样本所代表的未知总体均数与已知总体与已知总体均数均数0 0是否相等(已知总体均数是
12、否相等(已知总体均数0 0是指标准值,理论是指标准值,理论值或经大量观察所得的稳定值)。值或经大量观察所得的稳定值)。或推断该样本所代表的总体分布与已知总体分或推断该样本所代表的总体分布与已知总体分布是否相同。布是否相同。)(:000100 或或单单侧侧:HH一、单组样本均数的一、单组样本均数的t t检验检验样本来自正态总体样本来自正态总体N(,N(,2 2),总体标准差未知或样本量较小),总体标准差未知或样本量较小时,采用单样本时,采用单样本t t检验。检验。1),(0 ntnsXt 例例5-2 5-2 某药物某药物100100没个在某溶剂没个在某溶剂1L1L中溶解后的标准浓度为中溶解后的标
13、准浓度为20.00mg/L20.00mg/L。现采用某种测定方法进行溶解实验:把。现采用某种测定方法进行溶解实验:把100mg100mg的的这种药物溶解在这种药物溶解在1L1L的该溶剂中的该溶剂中,在充分溶解后测定其药物浓在充分溶解后测定其药物浓度。由于药物溶解实验的测量存在随机误差度。由于药物溶解实验的测量存在随机误差,故定义用这种故定义用这种测量方法大量重复溶解实验所得到的平均浓度为这个药物测量方法大量重复溶解实验所得到的平均浓度为这个药物100mg100mg在某溶剂在某溶剂1L1L中溶解后的药物总体平均浓度。研究者把中溶解后的药物总体平均浓度。研究者把这个药物溶解实验重复这个药物溶解实验
14、重复1111次次,每次实验将这个药物每次实验将这个药物100mg100mg溶解溶解在在1L1L的该溶剂中的该溶剂中,测量后得到的结果如下测量后得到的结果如下:20.99 20.41:20.99 20.41 20.10 20.00 20.91 22.41 20.00 23.00 22.00 19.89 20.10 20.00 20.91 22.41 20.00 23.00 22.00 19.89 21.11 21.11。请问。请问:用这种方法所获得的药物总体平均浓度是否用这种方法所获得的药物总体平均浓度是否与标准浓度值相同与标准浓度值相同?05.0(:/200100双侧),:HLmgH 2 2、
15、计算统计量:根据资料类型和检验方法选择、计算统计量:根据资料类型和检验方法选择101111056.311067.120983.200nnsXt1 1、建立检验假设,确立检验水准、建立检验假设,确立检验水准3 3、确定、确定P P值,做出统计推断值,做出统计推断 P P值的意义:如果总体状况和值的意义:如果总体状况和H H0 0一致,统计量获得现有数一致,统计量获得现有数值以及更不利于值以及更不利于H H0 0的数值的可能性(概率)有多大。的数值的可能性(概率)有多大。02.001.0,763.2,169.3)10(01.0)10(02.0)10(02.0)10(01.0Pttttt得查查 t
16、t 值表:值表:按按=0.05=0.05水准,拒绝水准,拒绝H0H0,接受,接受H1 H1,差别有统计学意义,可,差别有统计学意义,可以认为这种方法所获得的药物总体平均浓度是否与标准浓度以认为这种方法所获得的药物总体平均浓度是否与标准浓度值不同。由于样本均数高于值不同。由于样本均数高于20.00mg/L20.00mg/L,故可以认为这种方,故可以认为这种方法测定的药物总体平均浓度高于标准浓度。法测定的药物总体平均浓度高于标准浓度。)(:000100 或或单单侧侧:HH样本来自正态总体样本来自正态总体N(,N(,2 2),总体标准差已知或样本量足够),总体标准差已知或样本量足够大时,采用单样本大
17、时,采用单样本z z检验检验nXz/0二、单组样本均数的二、单组样本均数的Z Z检验检验例例5-3 5-3 一般中学男生的心率平均值为一般中学男生的心率平均值为7575次次/min,/min,标准差标准差5.05.0次次/min/min(大规模调查获得)。我们通过抽样调查,获得经常参(大规模调查获得)。我们通过抽样调查,获得经常参加体育锻炼的某中学加体育锻炼的某中学100100名男生的心率平均值为名男生的心率平均值为6565次次/min/min,问经常参加体育锻炼的中学男生心率是否与一般中学男生不问经常参加体育锻炼的中学男生心率是否与一般中学男生不同?同?100nmin/65min/0.5mi
18、n/750,次,次,次x05.0(:min/750100双侧),次:HH 2 2、计算统计量:根据资料类型和检验方法选择、计算统计量:根据资料类型和检验方法选择201000.575650nXz1 1、建立检验假设,确立检验水准、建立检验假设,确立检验水准3 3、确定、确定P P值,做出统计推断值,做出统计推断 P P值的意义:如果总体状况和值的意义:如果总体状况和H H0 0一致,统计量获得现有数一致,统计量获得现有数值以及更不利于值以及更不利于H H0 0的数值的可能性(概率)有多大。的数值的可能性(概率)有多大。001.0,29.3001.0001.0Pzzz得查查 z z 值表:值表:按
19、按=0.05=0.05水准,拒绝水准,拒绝H0H0,接受,接受H1 H1,差别有高度统计学意义,差别有高度统计学意义,可以认为经常参加体育锻炼的中学男生心率与一般中学男生可以认为经常参加体育锻炼的中学男生心率与一般中学男生不同。由于样本均数低于不同。由于样本均数低于7575次次/min/min,故可以推断经常参加体,故可以推断经常参加体育锻炼的中学男生心率低于一般中学男生。育锻炼的中学男生心率低于一般中学男生。三、单组二项分布资料的假设检验三、单组二项分布资料的假设检验直接计算概率法直接计算概率法00100:或单侧HH检验假设为:检验假设为:当当H0成立时,检验统计量为:成立时,检验统计量为:
20、)()(KXPKXP或例例5 54 4 一种鸭通常感染某种传染病的概率是一种鸭通常感染某种传染病的概率是0.20.2,现将,现将一种药物注射到一种药物注射到2525只鸭后发现有只鸭后发现有1 1只鸭发生感染,试判断只鸭发生感染,试判断这种药物对预防感染是否有效。这种药物对预防感染是否有效。05.0(:2.00100单侧),:HH 2 2、计算统计量:根据资料类型和检验方法选择、计算统计量:根据资料类型和检验方法选择 在在H H0 0成立的前提下,成立的前提下,2525只鸭中感染的只数只鸭中感染的只数X XB(25,0.2),B(25,0.2),则有则有0274.08.02.08.0)1()0(
21、)1(24112525CXPXPXP1 1、建立检验假设,确立检验水准、建立检验假设,确立检验水准3 3、确定、确定P P值,做出统计推断值,做出统计推断 这表明在自然情况下,这表明在自然情况下,2525只鸭感染只数不超过只鸭感染只数不超过1 1只属于小只属于小概率事件,很难在一次实验中出现,故在概率事件,很难在一次实验中出现,故在=0.05=0.05水准上,水准上,拒绝拒绝H0H0,接受,接受H1 H1,差别有高度统计学意义,可以认为药,差别有高度统计学意义,可以认为药物对预防感染有效。物对预防感染有效。nXPnNPnnNX1,1,(正态近似法正态近似法如果二项分布的如果二项分布的或或1-1
22、-不太小,则当不太小,则当n n足够大时,即阳性足够大时,即阳性数与阴性数都大于等于数与阴性数都大于等于5 5时,近似地有时,近似地有0100:HH检验假设为:检验假设为:1,011,01000000NnpZNnnXZ 当当H0成立时,检验统计量为:成立时,检验统计量为:当当n n不太大时,需作连续性校正:不太大时,需作连续性校正:1,015.01,015.0000000NnnpZNnnXZ 05.0),(8.0:8.0:100 单单侧侧HH例例5-5 5-5 某医院称治疗声带白斑的有效率为某医院称治疗声带白斑的有效率为80%80%,今统计前来,今统计前来求医的此类患者求医的此类患者6060例
23、,其中例,其中4545例治疗有效。试问该医院宣称例治疗有效。试问该医院宣称的疗效是否客观?的疗效是否客观?1 1、建立检验假设,确立检验水准、建立检验假设,确立检验水准 2 2、计算统计量:根据资料类型和检验方法选择、计算统计量:根据资料类型和检验方法选择8069.0602.08.0605.08.075.0 Z3 3、确定、确定P P值,做出统计推断值,做出统计推断 按按=查查t t 临界值表:临界值表:(单侧)(单侧)Z Z0 0,故可认为该医院宣称的有效率尚属客观。,故可认为该医院宣称的有效率尚属客观。四、单组四、单组PossionPossion分布资料的假设检验分布资料的假设检验直接计算
24、概率法直接计算概率法检验假设为:检验假设为:当当H0成立时,检验统计量为:成立时,检验统计量为:)()(KXPKXP或00100:或单侧HH例例5 56 6 某罕见非传染性疾病的患病率一般为某罕见非传染性疾病的患病率一般为15/1015/10万,万,现在某地区调查现在某地区调查10001000人,发现阳性者人,发现阳性者2 2人,问此地区患病人,问此地区患病率是否高于一般。率是否高于一般。05.0(:10/150100单侧)万,:HH 2 2、计算统计量:根据资料类型和检验方法选择、计算统计量:根据资料类型和检验方法选择 在在H H0 0成立的前提下,所调查的成立的前提下,所调查的100010
25、00人中发现的阳性数人中发现的阳性数 X XP(0.15),P(0.15),则有则有0102.0)1291.08607.0(1)1()0(1)2(XPXPXP1 1、建立检验假设,确立检验水准、建立检验假设,确立检验水准3 3、确定、确定P P值,做出统计推断值,做出统计推断 这表明在自然情况下,这表明在自然情况下,10001000人中阳性数不低于人中阳性数不低于2 2人属于小人属于小概率事件,故在概率事件,故在=0.05=0.05水准上,拒绝水准上,拒绝H0H0,接受,接受H1 H1,差,差别有高度统计学意义,可以此地区患病率高于一般。别有高度统计学意义,可以此地区患病率高于一般。0100:
26、HH正态近似法正态近似法当总体均数当总体均数2020时,时,PoissonPoisson分布近似正态分布。分布近似正态分布。当当H H0 0成立时,检验统计量为:成立时,检验统计量为:1,000NXZ例例5-5 5-5 某地十年前计划到某地十年前计划到20002000年把孕产妇死亡率将到年把孕产妇死亡率将到25/1025/10万以下。万以下。20002000年监测资料显示,该地区平均而言,年监测资料显示,该地区平均而言,每每1010万例活产儿孕产妇死亡万例活产儿孕产妇死亡3131人。问该地区降低孕产妇死人。问该地区降低孕产妇死亡的目标是否达到?亡的目标是否达到?31,250X 2 2、计算统计
27、量:根据资料类型和检验方法选择、计算统计量:根据资料类型和检验方法选择1 1、建立检验假设,确立检验水准、建立检验假设,确立检验水准05.025:25:100HH2.125253100XZ3 3、确定、确定P P值,做出统计推断值,做出统计推断 按按=查查t t临界值表:临界值表:(单侧单侧)Z ZZ ZZ Z0 0,故可认为该地区达到了预定目标。,故可认为该地区达到了预定目标。五、单组样本的符号秩和检验五、单组样本的符号秩和检验参数:描述总体的指标称为参数。参数:描述总体的指标称为参数。参数统计:许多统计推断方法,要求来自总体分布型是已知参数统计:许多统计推断方法,要求来自总体分布型是已知的
28、,在这种假设基础上,对总体进行统计推断(进行估计的,在这种假设基础上,对总体进行统计推断(进行估计和检验)称为参数统计。和检验)称为参数统计。非参数检验:不依赖于总体分布类型,也不对总体参数进行非参数检验:不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验的方法称为非参数检验。统计推断的假设检验的方法称为非参数检验。l1 1、分布型未知、分布型未知l2 2、分布极度偏态、分布极度偏态l3 3、方差明显不齐时、方差明显不齐时l4 4、等级资料、等级资料参数检验所检验的是参数参数检验所检验的是参数非参数检验检验的是分布非参数检验检验的是分布l优点:优点:l 1 1、计算简单便于掌握。、计算
29、简单便于掌握。l 2 2、应用范围广。、应用范围广。l 3 3、收集资料方便。、收集资料方便。l缺点:缺点:l 1 1、适用于参数检验的资料用、适用于参数检验的资料用 非参数检验时降低检验效能。非参数检验时降低检验效能。l 2 2、犯第二类错误的概率加大。、犯第二类错误的概率加大。秩和检验秩和检验 游程检验游程检验 序贯检验序贯检验 2 2 检检 验验例例5-6 5-6 已知某地正常人尿氟含量中位数为已知某地正常人尿氟含量中位数为2.15mmol/L2.15mmol/L。今在该地某厂随机抽取今在该地某厂随机抽取1212名工人测得尿氟含量名工人测得尿氟含量(mmol/L)(mmol/L),结果见
30、表,结果见表5-15-1。问该厂工人的尿氟含量是。问该厂工人的尿氟含量是否高于当地正常人?否高于当地正常人?91.043.19101.223.37112.424.5780.842.9970.572.7260.472.6250.372.5240.272.42-1-0.032.122.50.052.20-2.5-0.052.1002.15秩次秩次差值差值d尿氟含量尿氟含量 检验步骤:检验步骤:1.1.假设:假设:H H0 0:差值总体中位数:差值总体中位数M Md d=0=0 H H1 1:M:Md d0 0 2.2.求差值:求差值:3.3.编秩:编秩:4.4.求秩和并确定检验统计量:分别求正负秩
31、次之和求秩和并确定检验统计量:分别求正负秩次之和,正秩次正秩次的和以的和以T T+表示表示,负秩次的和以负秩次的和以T T-+-+为为62.5,T62.5,T-为为3.5,3.5,以绝对较以绝对较小秩和作检验统计量小秩和作检验统计量,本例取本例取T=3.5T=3.5。5.5.确定确定P P值并做出推断结论值并做出推断结论,查查T T界值表,得界值表,得P0.005P0.05P0.05作出无统计学意义的作出无统计学意义的“阴性阴性”结论时,研究者则面临着犯第结论时,研究者则面临着犯第类错误的可能性,类错误的可能性,应当考虑是否总体间的差异确实存在,有可能由于检验效能应当考虑是否总体间的差异确实存
32、在,有可能由于检验效能不足而未能把总体中确有的差异反映出来。近年来,许多国不足而未能把总体中确有的差异反映出来。近年来,许多国际会议对于假设检验中际会议对于假设检验中P0.05P0.05作出的作出的“阴性阴性”结论,应附有结论,应附有第第类错误概率为据,因而有必要介绍其计算方法。类错误概率为据,因而有必要介绍其计算方法。影响检验功效的因素:影响检验功效的因素:(1 1)总体参数间差异越大,检验功效越大)总体参数间差异越大,检验功效越大(2 2)个体差异(标准差)越小,检验功效越大)个体差异(标准差)越小,检验功效越大(3 3)样本含量越大,检验功效越大)样本含量越大,检验功效越大(4 4)检验水准)检验水准定得越大,检验功效越大定得越大,检验功效越大