1、 计量资料假设检验之二计量资料假设检验之二1N(0,02)n1 n2 n3 n4 n nx4x3x2x1xxN(,2)样本与总体的关系样本与总体的关系2假设检验的一般步骤假设检验的一般步骤 建立假设(反证法):建立假设(反证法):确定显著性水平(确定显著性水平():):计算统计量:计算统计量:u,t,2 确定概率值:确定概率值:做出推论做出推论3第三节第三节 t 检验和检验和u检验检验4一、样本均数与总体均数的比较一、样本均数与总体均数的比较 u检验(大样本)检验(大样本)t检验(小样本)检验(小样本)5三、三、完全随机设计两总体均数的比较完全随机设计两总体均数的比较p28例题3.7:某医生研
2、究野木瓜用于手术后的镇痛,以哌替啶作为对照,观察两药的镇痛时间(h),问两者的平均镇痛时间有无不同?处理例数均数标准差 野木瓜 30 6.2 1.4 哌替啶 28 3.5 1.2表.野木瓜和哌替啶的镇痛时间h6目的:目的:由两个样本均数的差别推断两样本所代表的由两个样本均数的差别推断两样本所代表的 总体均数间有无差别。总体均数间有无差别。计算公式:计算公式:t 统计量统计量:t=自由度自由度=n1+n2 221|21xxSxx)11(21221nnSScxx2)1()1(212221212nnnSnSSc7例题条件:例题条件:一个样本一个样本:均数均数6.25,标准差标准差1.4;另一个样本另
3、一个样本:均数均数3.5,标准差标准差1.2;n1=30;n2=28 认为两个总体为正态分布且方差齐认为两个总体为正态分布且方差齐 适用条件:适用条件:已知已知/可计算两个样本均数及它们的标准差可计算两个样本均数及它们的标准差 ;两个样本例数均小或两个样本之一的例数少于两个样本例数均小或两个样本之一的例数少于100100;两个总体为正态分布且方差齐(相等)两个总体为正态分布且方差齐(相等)8 建立假设:建立假设:检验假设检验假设 H0:两组药物镇痛时间相同两组药物镇痛时间相同,1=2 备择假设备择假设 H1:两组药物镇痛时间两组药物镇痛时间不同;不同;1 2 确定显著性水平(确定显著性水平()
4、:):0.05 计算统计量计算统计量t 值值921XX21SXXt 212CXXn1n1SS212)1()1(212221212nnnSnsSC计算公式:合并标准误合并标准误合并方差合并方差合并自由度合并自由度10859.728130122830)128(2.11304.15.32.6112)1()1(222121222121212121nnnnnSnSXXSXXtXX11 确定概率值:自由度:确定概率值:自由度:30+28 2 =56 t 0.05(56)=2.005 7.859 t 0.05(56),p 0.05;做出推论做出推论:按按=0.05水准水准,拒绝拒绝H0,接受接受H1,可以认
5、为可以认为 两组药物镇痛疗效不同。两组药物镇痛疗效不同。12例题例题3.8 为了摸清高碘是否影响儿童的智力发育为了摸清高碘是否影响儿童的智力发育,造成智力低下造成智力低下,研究者抽样调查了农村高碘地区研究者抽样调查了农村高碘地区100名小学生和非高碘区名小学生和非高碘区105名小学生的智商名小学生的智商(IQ),结果如表结果如表3.3,问该农村高碘区小学生智商水平问该农村高碘区小学生智商水平与非高碘区有无不同与非高碘区有无不同?组别组别 n X s高碘区高碘区 100 73.07 10.75非高碘区非高碘区 105 80.30 11.83表表3.3 高碘区与非高碘区儿童智商比较高碘区与非高碘区
6、儿童智商比较13比较的目的是推断两样本各自代表的总体均数1与2是否相等。当两样本含量n1、n2均足够大(100)时,可用两样本均数比较的u检验。1422212121222121nSnSXXSSXXuXX两样本均数比较的两样本均数比较的u检验公式检验公式:15(1)(1)建立假设:建立假设:H H0 0:1 1=2 2,H H1 1:1 12 2,(2)(2)检验水准检验水准 =0.05=0.05(3)(3)计算统计量计算统计量u u值:值:222121212X2X21nSnSXXSSXXu21 58.410583.1110075.1030.8007.7322u16(4)(4)确定确定p p值值
7、 u u0.050.05=1.96=1.96。今今 u u 1.961.96,P P 0.050.05。(u (uu u0.001 0.001,p0.001),p0.001)(5)(5)作出判断作出判断,按按=0.05=0.05的检验水准拒绝的检验水准拒绝H H0 0,接受,接受H H1 1。差异有。差异有(高度高度)显著性显著性,可认为高碘地区农可认为高碘地区农村小学生智商与非高碘区小学生的不同。村小学生智商与非高碘区小学生的不同。17四、成组设计的两样本几何均数的比较四、成组设计的两样本几何均数的比较目的:推断两样本几何均数各自代表的总体几何均数有无差别目的:推断两样本几何均数各自代表的总
8、体几何均数有无差别方法:将观察值进行对数变化以后,按均数的检验进行。方法:将观察值进行对数变化以后,按均数的检验进行。适用:等比资料和对数正态分布资料适用:等比资料和对数正态分布资料18例题.(自学)19第四节方差不齐时两小样本均数的比较第四节方差不齐时两小样本均数的比较 一般情况下,当对两小样本均数进行比较时,采用t检验,它要求两样本的总体方差齐,所以应先对两样本的方差进行方差齐性检验。进行方差齐性检验的条件是两样本均来自正态分布总体。20一、方差齐性检验(方差齐性检验)一、方差齐性检验(方差齐性检验)例:为研究肥胖与脂质代谢的关系,在某小学中随机抽取30名肥胖儿童(肥胖组)和30名正常儿童
9、(对照组),测定两组儿童脂质过氧化物(LPO)得下表结果,请先检验两总体的LPO方差是否相等。21 表 两组儿童血液中LPO含量umol/L 分组 n 肥胖组 30 9.36 0.83 对照组 30 7.58 0.64SX 221.1.建立假设:建立假设:H H0 0:1 12 2=2 22 2,两总体方差相等两总体方差相等 H H1 1:1 12 22 22 2,两总体方差不相等两总体方差不相等2.2.0.100.10(宜较大以减少宜较大以减少IIII类错误)类错误).计算统计量计算统计量 F F 值值 F=s12(较大较大)/s22(较小)较小)=0.832/0.642=1.6822324
10、 例:由X光片上测得两组病人肺门横径右侧距R1值(cm),结果如下,请先检验两组的总体方差是否相等,然后进行假设检验。肺癌病人 矽肺0期病人cmScmXn79.121.610111cmScmXn56.034.450222251.方差齐性检验F=s12(较大较大)/s22(较小)较小)=1.792/0.562=10.21726确定确定P P值,查附表值,查附表12 F 12 F 界值表界值表作出统计推论。作出统计推论。方差齐性检验在样本含量较小时不敏感,而在样本含量较大时太敏感,故统计学家对两个样本方差齐性检验在样本含量较小时不敏感,而在样本含量较大时太敏感,故统计学家对两个样本均数比较时是否需
11、要进行方差齐性检验有不同看法。均数比较时是否需要进行方差齐性检验有不同看法。27当两总体方差不齐的时候,两样本均数的比较可以用近似 检验或数据变换或用后述的非参数检验。这里给大家介绍近似 检验 282、t检验t检验有三种方法可供选择,分别是检验有三种方法可供选择,分别是:ochran Cox法校正界值法校正界值Welch法法Satterthwaite法法校正自由度校正自由度软件中常用2911)(2414222222121212121nsnsSSnSnSXXtxxXXSatterthwaite法公式如下30例题:3.10 1=2 1231272.35056.01079.134.421.62222
12、212121nSnSXXt936.9150)5056.0(110)1079.1(5056.01079.111)(222222224142222121nsnsSSxxXX取整数取整数32确定确定p值值以自由度为,查附表的以自由度为,查附表的t界值表得界值表得 0.005p0.01 (p )5.5.作出判断在作出判断在=0.05的水准上,拒绝的水准上,拒绝0,接受接受H1,差异有显著性(有统计学意义),可认为两组病人差异有显著性(有统计学意义),可认为两组病人值不等。值不等。33正态性检验(正态性检验(normality test):):统计量:偏度系数、峰度系数;统计量:偏度系数、峰度系数;W值
13、、值、D值等值等 统计图:统计图:PP图、图、QQ图、直方图、茎叶图、箱图等图、直方图、茎叶图、箱图等第五节第五节 正态性检验正态性检验3435假设检验是根据统计量分布概率的规律,及概率的大小对原假设(假设检验是根据统计量分布概率的规律,及概率的大小对原假设(H0)作出判定。因此在判定的)作出判定。因此在判定的过程不可避免地存在着判断错误。过程不可避免地存在着判断错误。型错误和型错误和型错误型错误36 假设检验推断的结果假设检验推断的结果 实际情况实际情况 拒绝拒绝H H0 0 不拒绝不拒绝H H0 0 H H0 0成立成立 型错误型错误 推断正确推断正确(1(1 )H H0 0不成立不成立
14、推断正确(推断正确(1 1b b)型错误型错误b b(1 1b b)即把握度()即把握度(power of a test):power of a test):两总体确有差别,被检出有差别的能力两总体确有差别,被检出有差别的能力(1 1)即可信度()即可信度(confidence level):confidence level):重复抽样时,样本区间包含总体参数(重复抽样时,样本区间包含总体参数()的百)的百分数分数 型错误和型错误和型错误型错误37类错误(弃真错误):是指如果样本来自类错误(弃真错误):是指如果样本来自=0 0的总体,即的总体,即H H0 0实际是成立的。但由于抽样实际是成立的
15、。但由于抽样的偶然性获得了较大的的偶然性获得了较大的t t(u u)值,则)值,则PPP,按按水准,不拒绝水准,不拒绝H H0 0,得出,得出=0 0的结论,的结论,此结论当然也是错误的。此结论当然也是错误的。类错误的概率通常难以估计,它与特定的类错误的概率通常难以估计,它与特定的H H1 1假设有关。只有当样本含量、总体标准差以假设有关。只有当样本含量、总体标准差以及按规定的及按规定的条件下,才能估算它的大小。条件下,才能估算它的大小。39(1-1-)称检验效能(或称把握度)称检验效能(或称把握度)(power)(power)它是指如果对比资料的两总体确实存在差异,按现有它是指如果对比资料的
16、两总体确实存在差异,按现有水准,能够检测其有差别的能力。水准,能够检测其有差别的能力。作假设检验时,检验效能(把握度)不能作假设检验时,检验效能(把握度)不能75%75%。4041 与与 b b 间的关系间的关系减少(增加)减少(增加)I型错误,将会增加(减少)型错误,将会增加(减少)II型型错误错误增大增大n 同时降低同时降低 与与 b b b b42两类错误的关系:两类错误的关系:一般来说,当样本含量固定时,一般来说,当样本含量固定时,愈小,愈小,愈大;反之,愈大;反之,愈大,愈大,愈小。愈小。实际工作中,往往根据实际工作中,往往根据的大小,来控制的大小,来控制。若设计的重点在于减少。若设
17、计的重点在于减少,一般取,一般取=0.01=0.01;若设计的重点是减少若设计的重点是减少,则取,则取=0.05=0.05。若要同时减少。若要同时减少和和,则需要增加样本含量。,则需要增加样本含量。43441、收集资料时应确保资料的可比性,同时注意样本的随机性;、收集资料时应确保资料的可比性,同时注意样本的随机性;2、根据研究目的、设计类型、获取资料的特点选择恰当的统计方法和计算统计量的具体公式;、根据研究目的、设计类型、获取资料的特点选择恰当的统计方法和计算统计量的具体公式;3、正确理解假设检验结论中、正确理解假设检验结论中“差别差别”的含义。差别有显著性,不能理解为数值大小的差异,而的含义
18、。差别有显著性,不能理解为数值大小的差异,而只能理解为按一定的概率认为接受或拒绝只能理解为按一定的概率认为接受或拒绝H0假设的理由有多大;假设的理由有多大;454、下结论不能绝对化。假设检验的结论与选择的检验水准、单双侧检验有关;与两类错误的、下结论不能绝对化。假设检验的结论与选择的检验水准、单双侧检验有关;与两类错误的概率大小有关;还与专业的特点有关。尤其是概率值接近检验水准时,下结论更要慎重。概率大小有关;还与专业的特点有关。尤其是概率值接近检验水准时,下结论更要慎重。5、注意检验方法的应用条件。如作、注意检验方法的应用条件。如作t检验或检验或F检验时,要注意作正态性检验或方差齐性检验,检验时,要注意作正态性检验或方差齐性检验,以免得出错误结论。以免得出错误结论。46