1、第三章第三章 总体均数的估计与假设检验总体均数的估计与假设检验 第三章第三章 总体均数的估计与假设检验总体均数的估计与假设检验 均数的抽样误差与标准误均数的抽样误差与标准误 t分布分布 总体均数的估计总体均数的估计 假设检验的一般步骤假设检验的一般步骤检验检验 u 检验检验 两均数的等效检验两均数的等效检验 正态性检验正态性检验 两样本方差齐性检验两样本方差齐性检验 假设检验时应注意的问题假设检验时应注意的问题 利用总体均数的可信区间进行假设检验利用总体均数的可信区间进行假设检验 课堂讨论课堂讨论一、一、均数的抽样误差与标准误(均数的抽样误差与标准误()其分布特点如下:其分布特点如下:(1)原
2、始总体呈正态分布,则样本均数抽样分布也呈正态)原始总体呈正态分布,则样本均数抽样分布也呈正态分布,甚至原始分布为偏态分布,若分布,甚至原始分布为偏态分布,若n足够大(足够大(n60),则样,则样本均数也逼近正态分布。本均数也逼近正态分布。(2)样本均数的总均数等于原始总体均数。)样本均数的总均数等于原始总体均数。反复从总体中抽取反复从总体中抽取n 一定的样本,得到无数样本均数,也一定的样本,得到无数样本均数,也构成一个总体。构成一个总体。xxs ,某变量值总体分布某变量值总体分布某变量值某变量值n相同的样本均数总体分布相同的样本均数总体分布一、一、均数的抽样误差与标准误(均数的抽样误差与标准误
3、()均数的抽样误差:均数的抽样误差:抽样引起的样本均数与总体均数之间或样本均数抽样引起的样本均数与总体均数之间或样本均数 之间的差别。之间的差别。标准误:标准误:即样本均数的标准差。表示样本均数对总体均数的离散程度。即样本均数的标准差。表示样本均数对总体均数的离散程度。xxs ,Nx2 Kxx2 n12nxxSnSSx 例例4.1某市随机抽查某市随机抽查12岁男孩岁男孩100人,人,得身高均数得身高均数139.6cm,标准差,标准差6.85cm,资料,求标准误?资料,求标准误?)(685.010085.6cmnSSx 若若X或或 X服从正态分布服从正态分布 N(,2),则可作正),则可作正态变
4、量态变量 X或或 X的的 u 代换。代换。则则 u 服从标准正态分布服从标准正态分布 N(0,1)二、二、t 分布分布xunxu/实际工作中,实际工作中,往往未知,往往未知,S 代替代替,此时此时就不是就不是u代换,而是代换,而是 t 代换。代换。无数无数t点所组成的分布,称点所组成的分布,称t分布。分布。nS/Xtt 分布的特征:分布的特征:(1)以)以 0 为中心,两侧对称的单峰分布为中心,两侧对称的单峰分布 (2)与)与 u 分布比较,峰值较低,两边上翘分布比较,峰值较低,两边上翘 (3)有一个参数)有一个参数 ,当,当 ,t分布分布u分布分布 0.67451.28161.64491.9
5、6002.32632.57582.80703.09023.2905P804 (1)点估计:)点估计:X (2)区间估计:)区间估计:按一定的概率(按一定的概率(1-)估计总体均数所在范围)估计总体均数所在范围(或称可信区间),常用(或称可信区间),常用95%和和99%的概率估计。的概率估计。1)当)当 未知时未知时三、三、总体均数的估计总体均数的估计 ,/,/xxStxStx22 例例2.12 11名名18岁男大学生身高得均数岁男大学生身高得均数172.25厘米,标准差厘米,标准差3.31厘米,试估计该地厘米,试估计该地18岁男大学生总体身高均数的岁男大学生总体身高均数的95%可信区间。可信区
6、间。本例本例n=11,则,则=10,查,查t界值表得:双侧界值表得:双侧t0.0510=2.228 2)未知,但未知,但n足够大时;足够大时;例某地例某地110名名18岁男大学生身高均数为岁男大学生身高均数为172.73厘厘米,标准差为米,标准差为4.09厘米,试估计该地厘米,试估计该地18岁男大学岁男大学生总体身高均数的生总体身高均数的95%可信区间。可信区间。本例本例n=110,双侧双侧u0.05=1.96xSxnSxnxu/3)当)当 已知时。已知时。关于可信区间的准确性和精密度关于可信区间的准确性和精密度准确度反映在可信度(准确度反映在可信度(1-)的大小上;)的大小上;精密度反映在可
7、信区间的长度上。精密度反映在可信区间的长度上。xxuxux22/,四、四、假设检验的一般步骤假设检验的一般步骤例例:据大量调查知,健康成年男子脉搏的均数为据大量调查知,健康成年男子脉搏的均数为72次分,某医生在山区随机调查了次分,某医生在山区随机调查了25名健康男子,其名健康男子,其脉搏均数为脉搏均数为74.2次次/分,标准差为分,标准差为6.0次次/分,能否认分,能否认为该山区成年男子的脉搏高于一般人群?为该山区成年男子的脉搏高于一般人群?分析两均数不等的原因有两种可能性:分析两均数不等的原因有两种可能性:(1)仅仅由于抽样误差所致;)仅仅由于抽样误差所致;(2)除抽样误差外还由于环境条件的
8、影响。)除抽样误差外还由于环境条件的影响。如何判断?如何判断?统计上是通过假设检验来回答这个问题。统计上是通过假设检验来回答这个问题。(1)建立假设:)建立假设:H0:(检验假设或无效假设检验假设或无效假设)总体参数相等总体参数相等 为什么称其为无效假设?为什么称其为无效假设?H1:(备择假设备择假设)总体参数不等总体参数不等(2)确立检验水准确立检验水准 指拒绝实际上成立指拒绝实际上成立 H0 的所犯错误的概率的所犯错误的概率(I 类错误)。通常类错误)。通常 =0.05,但并不绝对。,但并不绝对。为什么检验水准为什么检验水准 通常取通常取0.05?(3)选定检验方法和计算检验统计量选定检验
9、方法和计算检验统计量 如:、如:、F、X2 等等(4)确定确定P值,作出推断结论值,作出推断结论 P值是指由所规定的总体中(本例值是指由所规定的总体中(本例 =0)作随机抽样,获得等于或大于现)作随机抽样,获得等于或大于现由样本计算得到的检验统计量值的概率。由样本计算得到的检验统计量值的概率。即即 P(t或或u、F、X2 等)。等)。若:若:P 时,则拒绝时,则拒绝H0,接受,接受H1 P 时,则不拒绝时,则不拒绝H0 应用:应用:用于两均数比较的假设检验;用于两均数比较的假设检验;资料要求:资料要求:(1)资料随机取自正态总体;)资料随机取自正态总体;(2)两总体方差齐性(相等)。)两总体方
10、差齐性(相等)。五、五、t t 检验检验1、样本均数与总体均数比较、样本均数与总体均数比较 例例4.4 据大量调查知,健康成年男子脉搏据大量调查知,健康成年男子脉搏的均数为的均数为72次次/分,某一身在山区随机调查了分,某一身在山区随机调查了25名健康男子,其脉搏均数为名健康男子,其脉搏均数为74.2次次/分,标分,标准差为准差为6.0次次/分,能否认为该山区成年男子的分,能否认为该山区成年男子的脉搏高于一般人群?脉搏高于一般人群?H0:=0 H1:0 单侧:单侧:=0.05 nS/0 Xt833.125/0.6722.74 125 24 查查t界值表(界值表(P804),得单侧),得单侧 t
11、0.05,24=1.711 因因:t=1.833 t0.05,24 所以:所以:P 0.05 结论:按照结论:按照 =0.05水准,拒绝水准,拒绝H0,故可,故可认为该山区健康成年男子脉搏高于一般人群。认为该山区健康成年男子脉搏高于一般人群。上例如用双侧检验,查表得双侧上例如用双侧检验,查表得双侧 t0.05,24=2.064 则则:t=1.833 0.05。结论相反。结论相反。单侧检验效率要高于双侧检验。单侧检验效率要高于双侧检验。如何选择单侧或双侧检验?如何选择单侧或双侧检验?主要根据专业知识而定。主要根据专业知识而定。如某指标只高不低或只低不高。如某指标只高不低或只低不高。2、配对设计的
12、两均数比较、配对设计的两均数比较 同源配对同源配对 观察指标测自同一受试对象或标本。观察指标测自同一受试对象或标本。异源配对异源配对 观察指标测自不同受试对象或标本,观察指标测自不同受试对象或标本,但不同受试对象或标本配成对子,每对除处但不同受试对象或标本配成对子,每对除处理因素不同外,其它非处理因素一致或基本理因素不同外,其它非处理因素一致或基本一致。一致。统计分析是比较配对差值与总体均数统计分析是比较配对差值与总体均数 0 的差别进行的的差别进行的 表2.7 12名妇女最大呼气率分别用两法测得的结果(L/min)被测者编号 Wright 法 Mini法 1 490 525 2 397 41
13、5 3 512 508 4 401 444 5 470 500 6 415 460 7 431 390 8 429 432 9 420 420 10 275 227 11 165 268 12 421 443 d(4)d2(5)35122518324-41643184930900452025-4116813900-4823041031060922484 d 206 d2 21426 H0:d=0 H1:d 0 =0.05 1=11 n为对子数或差值个数为对子数或差值个数t0.10,11=1.796,t0.20,11=1.363,故故 0.20 P 0.10。例:某单位研究饮食中缺乏维生素例:某
14、单位研究饮食中缺乏维生素E与肝中维生与肝中维生素素A含量的关系,将同种属的大白鼠按性别相同,年含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对子,共龄、体重相近者配成对子,共8对,并将每对中的两对,并将每对中的两头动物随机分到正常饲料组和头动物随机分到正常饲料组和E缺乏组,过一定时期缺乏组,过一定时期将大白鼠杀死,测得其肝中将大白鼠杀死,测得其肝中A的含量如下表,问不同的含量如下表,问不同饲料的大白鼠肝中维生素饲料的大白鼠肝中维生素A含量有无差别?含量有无差别?(3)成组设计两样本均数的比较)成组设计两样本均数的比较 例 2.17 某医生测得18 例慢性支气管炎患者及16 例健康
15、人的尿17酮类固醇排出量(mg/dl)分别为 X1和 X2,试问两组的均数有无不同。X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12 X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18 122本例本例 t=1.80.05H0:1=2 H1:1 2 =0.05(4)成组设计的两样本几何均数的比较)成组设计的两样本几何均数的比较 一般认为此类资料呈对数
16、正态分布,因此,需将一般认为此类资料呈对数正态分布,因此,需将原始资料取对数后,再作两组对数值均数的原始资料取对数后,再作两组对数值均数的t检验。检验。例 2.19 将 20 名钩端螺旋体病人的血清随机分为两组,分别用标准株和水生株做凝溶试验,测得稀释倍数如下,问两株的平均效价有无差别?标准株(11 人)100,200,400,400,400,400,800,1600,1600,1600,3200水生株(9 人)100,100,100,200,200,200,200,400,400 H0:两株的总体几何均数相等两株的总体几何均数相等 H1:两株的总体几何均数不等两株的总体几何均数不等 =0.0
17、5 将两组数据分别取对数,将两组数据分别取对数,X1=lgA,X2=lgB (A、B 分别代表两组原始数据)分别代表两组原始数据)注意:这里直接比较的是注意:这里直接比较的是 lgG1 与与 lgG2,但间接说明,但间接说明 了了 G1 与与 G2 的差别。的差别。应用:应用:当当 已知;或已知;或 未知,但未知,但n足够大时(此时足够大时(此时t分布接近分布接近u 分布)。用于两均数的比较。分布)。用于两均数的比较。常用于两大样本均数的比较。常用于两大样本均数的比较。其它资料要求同其它资料要求同t检验。检验。六、六、u 检验检验 例例2.18 某地抽样调查了部分健康成人的红细胞某地抽样调查了
18、部分健康成人的红细胞数,其中男性数,其中男性360人,均数为人,均数为4.660 1012/L,标准,标准差为差为0.575 1012/L;女性;女性255人,均数为人,均数为4.178 1012/L,标准差为,标准差为0.291 1012/L,试问该地男、女,试问该地男、女平均红细胞数有无差别?平均红细胞数有无差别?是推断两种处理效果是否相近或相等的统计方法。是推断两种处理效果是否相近或相等的统计方法。为什么推断两种处理效果是否相近或相等不能用为什么推断两种处理效果是否相近或相等不能用前面所述的假设检验方法?前面所述的假设检验方法?等效检验的假设等效检验的假设 H0:|1-2|H1:|1-2
19、|为等效界值,若两总体均数差值在为等效界值,若两总体均数差值在 范围内为范围内为等效,超过则为不等效。等效,超过则为不等效。检验水准、自由度及结果判断同检验水准、自由度及结果判断同t。211211212121222211212121 nnnnnnSnSnXXSXXtXX)()()(两样本均数等效检验公式为:两样本均数等效检验公式为:q 值的选定在等效检验中十分重要,一般把值的选定在等效检验中十分重要,一般把专业上或公认的有意义的两种处理措施的差专业上或公认的有意义的两种处理措施的差值作为等效检验的值作为等效检验的 值。值。如:血压的如:血压的 值为值为5mmHg,白细胞为,白细胞为500个个/
20、mm3。q要求样本:要求样本:21XX例例 据下表资料能否认为两种方法测定结果等效?据下表资料能否认为两种方法测定结果等效?火焰光度法和四苯硼钠法测定血钾浓度(火焰光度法和四苯硼钠法测定血钾浓度(mmol/L)的比较)的比较 方法方法 n X S 火焰光度法火焰光度法 118 4.55 0.48 四苯硼钠法四苯硼钠法 118 4.67 0.46 设等效界值设等效界值=0.25mmol/L H0:|1-2|H1:|1-2|=0.05 122=2340.02 P 0.5 H0:r 1=0;r 2=0 H1:r1 0;r2 0 =0.10或或0.2(宜稍大以减少(宜稍大以减少型错误)型错误)(1)偏
21、度系数)偏度系数111ggSgu222ggSgu=0.156/0.230=0.678P 0.53 3、柯尔莫柯罗夫、柯尔莫柯罗夫-斯米尔诺夫斯米尔诺夫(Kolmogorov-SmirnovKolmogorov-Smirnov)检验)检验一般作为小样本的正态检验方法一般作为小样本的正态检验方法例抽样调查某地20名3岁女孩身高(cm)的原始数据如下:80.1 89.3 92.4 97.1 97.0 82.5 89.1 92.6 96.2 96.7 84.4 91.3 94.7 99.5 97.9 87.3 90.5 94.8 100.1 100.7 检验样本所属的总体是否呈正态分布?本例经计算 X
22、=92.71 S=5.89抽样调查某地抽样调查某地 20名名3岁女孩身高(岁女孩身高(cm)资料如下:)资料如下:检验统计量为:检验统计量为:dmax=0.0869,查表得:查表得:P0.8九、九、两样本方差齐性检验两样本方差齐性检验S21 较大,较大,S22 较小。较小。2221SSF(方差不齐的(方差不齐的Levene检验:不依赖总体分布的具体形式)检验:不依赖总体分布的具体形式)例:由例:由X光片上测得两组病人的肺门横径右侧(光片上测得两组病人的肺门横径右侧(cm),),算得结果如下,试检验两个方差的齐性。算得结果如下,试检验两个方差的齐性。肺癌病人:肺癌病人:n1=10,X1=6.21
23、,S1=1.79cm 矽肺矽肺0期病人:期病人:n2=50,X2=4.34,S2=0.56cm 1 1=10 1=9,=21=50 1=49查附表查附表3,P806(齐性检验用双尾界值)(齐性检验用双尾界值)得:得:F0.10/2,(9,49)F0.10/2,(9,48)=2.08,所以所以 P 0.10H0:两总体方差相等两总体方差相等 H1:两总体方差不等两总体方差不等 =0.10=1.792/0.562=10.222221SSF 一般同质的两组资料方差相差不大,若两样本方差一般同质的两组资料方差相差不大,若两样本方差相差一倍左右,要注意方差不齐的可能。相差一倍左右,要注意方差不齐的可能。
24、问题:问题:若方差不齐,将如何处理?若方差不齐,将如何处理?(1)采用适当的变量变换,使达到方差齐性;)采用适当的变量变换,使达到方差齐性;(2)采用秩和检验;)采用秩和检验;(3)采用近似法)采用近似法 t检验:检验:Cochran&Cox法法 Satterthwaite法法例:由例:由X光片上测得两组病人的肺门横径右侧光片上测得两组病人的肺门横径右侧(cm),算得结果如下,试检验两个方差的齐性。),算得结果如下,试检验两个方差的齐性。肺癌病人:肺癌病人:n1=10,X1=6.21,S1=1.79cm 矽肺矽肺0期病人:期病人:n2=50,X2=4.34,S2=0.56cm H H0 0:=
25、2 2 H H1 1:2 2 =0.05=0.05(1)选用的方法应符合其应用条件)选用的方法应符合其应用条件(2)正确理解差别有无显著性的统计意义)正确理解差别有无显著性的统计意义 结论中的结论中的“拒绝拒绝 H0,接受,接受H1”,习惯上亦称,习惯上亦称“差别显著差别显著”,不应误解为相差很大。反之,不应误解为相差很大。反之,“不拒绝不拒绝H0”,不应误解为相差不大或一定相等。,不应误解为相差不大或一定相等。例两篇同类文章,两样本均数比较,甲文例两篇同类文章,两样本均数比较,甲文P0.05;乙文乙文 P0.01。是否可认为乙文中两样本。是否可认为乙文中两样本均数差值较甲文大?为什么?均数差
26、值较甲文大?为什么?十、十、假设检验时应注意的问题假设检验时应注意的问题(3)结论不能绝对化)结论不能绝对化 统计的结论是按着概率大小作出判断,统计的结论是按着概率大小作出判断,若取若取 =0.05,此时拒绝,此时拒绝H0,仍有,仍有0.05的概率的概率犯错误;同样,不拒绝犯错误;同样,不拒绝H0,也可产生错误。,也可产生错误。第一类错误:第一类错误:拒绝实际上成立的拒绝实际上成立的H0所犯的错误。所犯的错误。P=第二类错误:第二类错误:不拒绝实际上不成立的不拒绝实际上不成立的H0所犯的错误。所犯的错误。P=,而而 未知。未知。样本含量一定时,增大样本含量一定时,增大,则减少,则减少,减少,减
27、少 则增大则增大,所以,所以,的确定并不是越小越好,一般取的确定并不是越小越好,一般取0.05较较合理。合理。怎样才能同时减少怎样才能同时减少、?(4)结论时,尽可能明确概率范围)结论时,尽可能明确概率范围(5)统计结论应与专业结论相结合。)统计结论应与专业结论相结合。十一、十一、利用总体均数的可信区间进行假设检验利用总体均数的可信区间进行假设检验(1)样本均数与总体均数比较)样本均数与总体均数比较 例例2.14 据大量调查知,健康成年男子脉搏的均数据大量调查知,健康成年男子脉搏的均数为为72次分,某一身在山区随机调查了次分,某一身在山区随机调查了25名健康男子,名健康男子,其脉搏均数为其脉搏
28、均数为74.2次次/分,标准差为分,标准差为6.0次次/分,能否认分,能否认为该山区成年男子的脉搏高于一般人群?为该山区成年男子的脉搏高于一般人群?单侧总体均数的单侧总体均数的95%可信区间:可信区间:不包括不包括 0=72,P0.05总体均数的总体均数的95%可信区间:可信区间:(3)成组设计两样本均数的比较)成组设计两样本均数的比较 例2.17 某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为 X1和 X2,试问两足组的均数有无不同。X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2
29、.16 5.55 5.94 4.40 5.35 3.80 4.12X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18 H0:1=2 H1:1 2 =0.05总体均数的总体均数的95%可信区间:可信区间:包括包括 1-2=0,P0.051.H0:0=2.H0:d=03.3.H H0 0:1 1-2 2=0=0抽样调查得甲地抽样调查得甲地100名健康男工人的血胆固醇名健康男工人的血胆固醇(mg/100ml)得得 X=180,S=30,假定血胆固醇呈正假定血胆固醇呈正态分布态分布,问问:
30、(1)甲地全体健康男工人的血胆固醇平均数估计在什么范围?(2)乙地抽样查得男工人血胆固醇 X=190,S=35,n=125,甲乙两地男工人血胆固醇是否相同?某实验室观察局部温热治疗小鼠移植性肿某实验室观察局部温热治疗小鼠移植性肿瘤的疗效瘤的疗效,以生存日数作观察指标以生存日数作观察指标,结果如下结果如下.问问两组生存日数有无差别两组生存日数有无差别?两组小鼠发癌后生存日数 实验组 对照组 10 2 12 3 15 4 15 5 16 6 17 7 18 8 20 9 23 10 90 11 12 13 10名某病患者名某病患者,用某药治疗用某药治疗,测得治疗前及治疗测得治疗前及治疗后一个月的后
31、一个月的 血沉(mm/小时)如下表:病人号 1 2 3 4 5 6 7 8 9 10 治疗前 10 13 6 11 10 7 8 8 5 9 治疗后 6 9 3 10 10 4 2 5 3 3 问该药是否有效问该药是否有效?1.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗 后一个月的血沉(mm/小时)如下表,问两药的疗效有无差别?病人号 1 2 3 4 5 6 7 8 9 10 甲 药 治疗前 10 13 7 11 10 7 8 8 7 9 治疗后 8 9 8 10 10 4 5 5 6 5 病人号 1 2 3 4 5 6 7 8 9 10 乙 药 治疗前 9 10 9
32、 13 8 6 10 11 10 10 治疗后 6 5 5 3 3 7 8 5 7 4 某地抽样调查了部分健康成人血红蛋白量(g%)结果如下表:血红蛋白量(g%)结果 性别 例数 均数 标准差 男 306 13.45 0.71 女 255 11.76 1.02 问男、女血红蛋白均数有无差别?用二乙胺化学法与气相色谱法测定车间空气中CS2的含量,结果如下,问两法所得结果有无差别(提示:资料不呈正态分布)?两种方法测定车间空气中CS2含量(mg/M3)样本号 化学法 色谱法 1 50.7 60.0 2 3.3 3.3 3 28.8 30.0 4 46.2 43.2 5 1.2 2.2 6 25.5
33、 27.5 7 2.9 4.9 8 5.4 5.0 9 3.8 3.2 10 1.0 4.0 1.20名正常人与铅作业工人尿棕色素定性检查结果如下,问铅作业工人尿棕色素是于正常人?(50分)正常人与铅作业工人尿棕色素检查结果 结果 正常人 铅作业工人 合计 -18 8 26 +2 10 12 +0 7 7 +0 3 3 合计 20 28 48 观察某种防治菌痢措施的效果,结果如下.问能否认为该措施有效?(50分)1979年两组人群菌痢发病率比较 分 组 人 数 菌痢例数 发病率 实 验 组 4118 21 5.1 对 照 组 5217 72 13.8 1.用某药治疗胃癌,对溃疡型与梗阻型胃癌的治疗结果如下,问对两型胃癌的治疗效果有无差异?某药对胃癌治疗的结果 结 果 溃疡型 梗阻型 治 愈 5 1 显 效 8 4 好 转 10 7 无 效 2 6 合 计 25 18 THE END