研究生-统计学讲义-第4讲第4章-正态性检验和方差齐性检验课件.ppt

上传人(卖家):三亚风情 文档编号:3406696 上传时间:2022-08-28 格式:PPT 页数:52 大小:629.54KB
下载 相关 举报
研究生-统计学讲义-第4讲第4章-正态性检验和方差齐性检验课件.ppt_第1页
第1页 / 共52页
研究生-统计学讲义-第4讲第4章-正态性检验和方差齐性检验课件.ppt_第2页
第2页 / 共52页
研究生-统计学讲义-第4讲第4章-正态性检验和方差齐性检验课件.ppt_第3页
第3页 / 共52页
研究生-统计学讲义-第4讲第4章-正态性检验和方差齐性检验课件.ppt_第4页
第4页 / 共52页
研究生-统计学讲义-第4讲第4章-正态性检验和方差齐性检验课件.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

1、第三节第三节 正态性、方差齐性检验、变量变换、正态性、方差齐性检验、变量变换、t 检验检验 一、正态性检验一、正态性检验1正态性检验的意义正态性检验的意义正态分布具有两大特征:一是对称,二是正态峰,如正态分布具有两大特征:一是对称,二是正态峰,如图,分布不对称即偏态,分布偏度如图中两实线所示图,分布不对称即偏态,分布偏度如图中两实线所示,其中一条频数集中在小值一端,峰偏左,长尾向右,其中一条频数集中在小值一端,峰偏左,长尾向右称为正偏态或左偏态;另一条频数集中在大值一端,称为正偏态或左偏态;另一条频数集中在大值一端,峰在右,长尾向左称为负偏态或右偏态。峰在右,长尾向左称为负偏态或右偏态。分布的

2、峰度如图分布的峰度如图4-54-5中的两条实线所示,一条中的两条实线所示,一条“高、高、瘦瘦”,峰态尖峭而尾部伸展,为尖峭峰;另一条,峰态尖峭而尾部伸展,为尖峭峰;另一条“矮、矮、胖胖”,峰顶平阔且尾部短促,为平阔峰。尖峭峰与平,峰顶平阔且尾部短促,为平阔峰。尖峭峰与平阔峰都不同于正态峰。阔峰都不同于正态峰。描述对称的统计量常用偏度系数(描述对称的统计量常用偏度系数(coefficient of skewness),描述正态峰的统计量常用峰度系数),描述正态峰的统计量常用峰度系数(coefficient of kurtosis),计算公式为:),计算公式为:niixxsn133)()1(1ni

3、ixxsn144)()1(1Skewness=Kurtosis=偏度偏度s=0表示正态;偏度系数表示正态;偏度系数s0,表示数据分布有,表示数据分布有长尾拖在右边为正偏态;偏度系数长尾拖在右边为正偏态;偏度系数s0表示数据分布表示数据分布有长尾拖在左边为负偏态。偏度系数的绝对值愈大,有长尾拖在左边为负偏态。偏度系数的绝对值愈大,表示数据分布形态的偏斜程度愈大。表示数据分布形态的偏斜程度愈大。峰度系数峰度系数k=0,表示数据分布与正态分布的陡缓峭程,表示数据分布与正态分布的陡缓峭程度相同;峰度系数度相同;峰度系数k0,表示比正态分布峰高,为尖,表示比正态分布峰高,为尖峭峰;峰度系数峭峰;峰度系数

4、k0表示比正态分布峰低为平阔峰。表示比正态分布峰低为平阔峰。H0:总体服从正态分布;:总体服从正态分布;H1:总体不服从正态分布。:总体不服从正态分布。用统计软件不方便时,否定正态性的方法最简单的是用统计软件不方便时,否定正态性的方法最简单的是将均数与中位数及标准差进行比较,均数与中位数两将均数与中位数及标准差进行比较,均数与中位数两者不等且相差较大时,分布不对称;标准差大于均数者不等且相差较大时,分布不对称;标准差大于均数时,表示数据分散,曲线时,表示数据分散,曲线“矮、胖矮、胖”,峰平阔,与正,峰平阔,与正态峰度不同,可以判定不符合正态分布。态峰度不同,可以判定不符合正态分布。t 检验或方

5、差分析对正态性的要求:检验或方差分析对正态性的要求:(1)当变量)当变量x 值有正有负时,一般用值有正有负时,一般用 3S +3S范范围内是否包括了该批数据的最小值与最大值作出判断,围内是否包括了该批数据的最小值与最大值作出判断,当最小值与最大值均在此范围之间时,可采用当最小值与最大值均在此范围之间时,可采用 t检检验或方差分析作统计推断。验或方差分析作统计推断。(2)医药指标的测定值通常为正值,反映数据分布情)医药指标的测定值通常为正值,反映数据分布情况的频数曲线左侧况的频数曲线左侧50%的数据只可能在的数据只可能在0,范围内范围内变化,而标准差变化,而标准差S是频数分布曲线上拐点到均数的距

6、离,是频数分布曲线上拐点到均数的距离,故故S,由于存在抽样误差,由于存在抽样误差,S 可能大于可能大于 ,也可也可能略小于能略小于2S,但一般不会小于,但一般不会小于2S很多。若很多。若 2S或略或略小于小于2S时,可用时,可用 t 检验或方差分析法;若检验或方差分析法;若 远小于远小于2S时,则不用时,则不用 t 检验或方差分析法作统计推断。检验或方差分析法作统计推断。XXXXXXX例例4.4 判断例判断例 3.1 资料的数据文件血糖的正态性。资料的数据文件血糖的正态性。H0:总体服从正态分布,总体服从正态分布,H1:总体不服从正态分布。总体不服从正态分布。使用使用SPSS打开数据文件打开数

7、据文件L1101.sav以后,可用以后,可用1-Sample K-S Test法(柯尔莫哥诺夫法(柯尔莫哥诺夫-斯米尔诺夫检验)斯米尔诺夫检验)二、二、方差齐性检验方差齐性检验 总体方差相等(即差异无统计学意义),称为方差总体方差相等(即差异无统计学意义),称为方差齐性(齐性(homogeneity of variance).方差齐性检验(方差齐性检验(test for homogeneity of variance)是)是利用理论上来自正态分布的总体的各样本信息,来推断利用理论上来自正态分布的总体的各样本信息,来推断它们的总体方差是否相等。它们的总体方差是否相等。方差齐性检验主要用于:方差齐

8、性检验主要用于:两组或多组间变异度的两组或多组间变异度的比较;比较;两个或多个样本均数间比较时,须先进行方两个或多个样本均数间比较时,须先进行方差齐性检验,若方差齐,可用差齐性检验,若方差齐,可用 t 检验或方差分析,否检验或方差分析,否则可用变量变换的方法,使之方差齐后再用则可用变量变换的方法,使之方差齐后再用 t 检验或检验或方差分析,或用对方差没有特别要求的方差分析,或用对方差没有特别要求的 t 检验或其他检验或其他非参数的统计方法。非参数的统计方法。二、预备知识二、预备知识F 分布与分布与 2分布分布 总体方差相等(即差异无统计学意义),称为方差总体方差相等(即差异无统计学意义),称为

9、方差齐性(齐性(homogeneity of variance)。方差齐性检验)。方差齐性检验(test for homogeneity of variance)是利用理论上来自)是利用理论上来自正态总体的各样本信息,来推断它们的总体方差是否正态总体的各样本信息,来推断它们的总体方差是否相等。我们先介绍两个检验统计量的分布相等。我们先介绍两个检验统计量的分布-F分布和分布和 2分布。分布。(1)F分布分布 数理统计中定义:如果随机变量数理统计中定义:如果随机变量X1、X2分分别服从自由度为别服从自由度为df1,df2的的 2分布,则称随机变量分布,则称随机变量 2211/dfXdfXF=服从自

10、由度为服从自由度为df1,df2的的F分布(分布(F-distribution)。)。F分布(分布(F-distribution)有两个自由度,第一自由度为)有两个自由度,第一自由度为分子自由度分子自由度df1;第二自由度为分母自由度;第二自由度为分母自由度df2,且位置,且位置不能更换。不能更换。F分布曲线偏向左边,随着自由度分布曲线偏向左边,随着自由度df1,df2的同时增大的同时增大,F分布曲线趋向于对称。分布曲线趋向于对称。)1,1(F)12,8(F)2,5(F不同配对自由度的不同配对自由度的 F 分布分布 F分布曲线偏向左边,随着自由度分布曲线偏向左边,随着自由度df1,df2的同时

11、增大,的同时增大,F分布曲线趋向于对称。我们用分布曲线趋向于对称。我们用F(df1,df2)表示自由度表示自由度为为df1,df2 时,检验水准时,检验水准的的F界值,界值,本书附表本书附表6 录用了按录用了按P(F F(df1,df2)=编制的编制的F界界值表,表中横标目为分母的自由度值表,表中横标目为分母的自由度df2,纵标目为分子,纵标目为分子的自由度的自由度df1,表中数字表示,表中数字表示F 的界值的界值F(df1,df2);附;附表表6右上角插图中阴影部分,表示右上角插图中阴影部分,表示 F 分布曲线下,界分布曲线下,界值值F(df1,df2)右侧面积占总面积的百分数,意义是:从右

12、侧面积占总面积的百分数,意义是:从正态总体作随机抽样,得到统计量正态总体作随机抽样,得到统计量F值大于界值值大于界值 F(df1,df2)的概率的概率P(F F(df1,df2)=。例如:查附。例如:查附表表6,界值,界值F0.05(5,10)=3.33,它表示自由度,它表示自由度df1=5,df2=10 时,时,F F 值大于值大于3.33的概率为的概率为0.05,即,即P(F 3.33)=0.05;显然;显然P(F12.1)=0.01,P(F 12.1)=0.99。因一般都按组成。因一般都按组成统计量统计量F的分子大于分母计算的分子大于分母计算 F 值。所以附表值。所以附表4中中F界界值都

13、大于值都大于1。从附表从附表6最后一列看的出来,最后一列看的出来,随机变量取值的单侧随机变量取值的单侧 P 界值(即单侧界值(即单侧时的界值)与同侧的双侧时的界值)与同侧的双侧2P界值界值(即双侧(即双侧时的界值)相等,时的界值)相等,F 分布具有倒数性质:分布具有倒数性质:),(211dfdfFF(1),(df2,df1)利用利用 F 分布的倒数性质可以求得单侧分布的倒数性质可以求得单侧 F 界值表中界值表中没有列出的没有列出的 F 界值,也可以求得按组成统计量界值,也可以求得按组成统计量 F 的的分子小于分母时分子小于分母时F分布的界值。例如,查附表分布的界值。例如,查附表6,F0.05(

14、2,5)=5.786,F 界值表中没有列出界值表中没有列出F0.95(5,2),利用利用 F 分布的倒数性质可得分布的倒数性质可得F0.95(5,2)=1/F0.05(2,5)=1/5.79=0.173 F 分布用于方差分析和两样本比较时的方差齐性检分布用于方差分析和两样本比较时的方差齐性检验的重要依据是下面的性质:验的重要依据是下面的性质:如果分别从两个正态总体如果分别从两个正态总体N(1,1)和)和N(2,2)中,随机抽取样本含量为中,随机抽取样本含量为n1,n 2的两个样本,算出样的两个样本,算出样本均数和方差分别为本均数和方差分别为 1,S和和 2,S,则统计量,则统计量XX22222

15、121/ssF=服从自由度为服从自由度为df1=n1-1,df2=n2-1的的 F 分布。分布。F分子的自由度分子的自由度df1=1时,单侧时,单侧F界值界值=双侧双侧t界值的平界值的平方,即单侧方,即单侧F(1,df)=双侧双侧t 2(df)。(2).2分布分布 数理统计中定义:如果数理统计中定义:如果u1,u2,.,un是是n个独立的标准正态变量,则称随机变量个独立的标准正态变量,则称随机变量 2=u12+u22+.+un2 (4-25)服从自由度为服从自由度为df=n的的 2分布(分布(2-distribution)。)。卡方分布的均数是卡方分布的均数是n1或自由度或自由度df,卡方总体

16、方差,卡方总体方差等于等于2(n1)或或df 2分布曲线偏向左边,随自由度分布曲线偏向左边,随自由度df的不同而不同,的不同而不同,自由度越小越偏,自由度相当大时,自由度越小越偏,自由度相当大时,2分布曲线接近分布曲线接近正态分布曲线。正态分布曲线。附表附表4 列出自由度从列出自由度从1 到到 500的卡方分布一些重要累积分布函数的卡方分布一些重要累积分布函数值范围从值范围从0.995到到0.005,表的左边列出的自由度确定不同的,表的左边列出的自由度确定不同的分布例如下图中,自由度分布例如下图中,自由度df=3,=3,并且,并且Var()=6 32 2 2 2 Var=variance 2分

17、布的规律可从附表分布的规律可从附表4得到。附表得到。附表4 4为单侧为单侧 2界值界值表,表中横标目为自由度表,表中横标目为自由度df,纵标目为概率,纵标目为概率P,表中数,表中数字表示自由度为字表示自由度为df时,时,水准下的水准下的 2界值界值 2(df);附表;附表右上角插图中阴影部分,表示右上角插图中阴影部分,表示 2分布曲线下,界值分布曲线下,界值 2(df)右侧面积占总面积的百分数右侧面积占总面积的百分数,表示从正态总体作,表示从正态总体作随机抽样,得到统计量随机抽样,得到统计量 2值大于界值值大于界值 2(df)的概率为的概率为。单侧单侧的界值的界值 2(df)可由附表可由附表4

18、直接查出;直接查出;求双侧求双侧的的 2界值时:需用界值时:需用/2值查附表值查附表4,得出右,得出右侧的侧的 2界值,由于界值,由于 2分布不对称,另一侧的分布不对称,另一侧的 2界值,需界值,需用(用(1-/2)查附表)查附表4得出。例如,直接查附表得出。例如,直接查附表2,得单,得单侧侧 2界值界值 20.05(5)=11.07,它表示自由度,它表示自由度df=5时,时,2值值大于大于11.07的概率为的概率为0.05,P(23时,可认为不满足时,可认为不满足方差齐性的条件。方差齐性的条件。四四.样本方差与已知总体方差比较样本方差与已知总体方差比较 记已知的(或规定记已知的(或规定的)总

19、体方差为的)总体方差为20。按(式。按(式4-28)计算检验统计量)计算检验统计量 2(2分布见第十章),可检验分布见第十章),可检验H0:2=20是否成立,是否成立,若由样本算得的若由样本算得的 2 2(n1)界值界值,则,则P,按,按水准拒水准拒绝绝H0;否则不能拒绝;否则不能拒绝H0。2=(n-1)s2/2=(n-1)s2/20,df=n-1(4-28)【例【例4.6】某剂型药物正常生产过程中,含碳量某剂型药物正常生产过程中,含碳量(%))服从均数为服从均数为1.408,方差为,方差为0.0482的正态分布。今从某的正态分布。今从某班产品中随机抽取班产品中随机抽取5件,测得其含碳量(件,

20、测得其含碳量(%)为)为1.32,1.55,1.36,1.40和和1.44,判断该班生产该剂型药物含,判断该班生产该剂型药物含碳量的波动性是否超标?碳量的波动性是否超标?解:样本方差解:样本方差S2=0.0882。20=0.0482 H0:2 0.0482;H1:2 0.0482 。=0.05。检验统计量检验统计量 2=(n-1)s2/20=(5-1)0.0882/0.0482=13.5;以自由度;以自由度df=n-1=4查查 2界值表(附表界值表(附表4),得,得 20.01(51)=13.28,P t0.018),P0.01,拒绝,拒绝H0,可认为人工培植人参中,可认为人工培植人参中M物质

21、的含物质的含量与野生人参不同。量与野生人参不同。也可用可信区间推断,本例,差值的也可用可信区间推断,本例,差值的95%可信区间为可信区间为(-22.2129,-20.0538),不包含),不包含0(如果(如果H0成立,则差成立,则差值的均数应为值的均数应为0),所以,按),所以,按=0.05水准,可认为人工水准,可认为人工培植人参中培植人参中M物质含量与野生人参不同。物质含量与野生人参不同。B.SPSS 软件计算软件计算 操作过程:操作过程:Analyze Compare Means One-Sample T Test,将,将M物质的含量物质的含量x选入选入Test variable s(检验

22、变量检验变量)框中,在)框中,在Test Value(检验值检验值)对话框)对话框中改原系统默认值中改原系统默认值0为检验值为检验值63.5(如图(如图5-5),),OK。输出结果:输出结果:One-Sample Statistics NMeanStd.DeviationStd.Error MeanM物质含量942.36671.40446.46815 如图,如图,n=9,差别的均数,差别的均数 =42.3667,标准差,标准差S=1.40446,标准误标准误=s/=0.46815;nXOne-Sample Test Test Value=63.5 tdfSig.(2-tailed)Mean D

23、ifference95%Confidence Interval of the Difference LowerUpperX-45.1428.000-21.1333-22.2129-20.0538 t 检验统计量检验统计量=45.142,自由度,自由度df=8,双侧,双侧P=0.0000.05,可认为人工培植人参中,可认为人工培植人参中M物质的含量物质的含量与野生人参不同。同时,由与野生人参不同。同时,由95%Confidence Interval of the Difference(差别的差别的95%可信区间可信区间)为为(-22.2129,-20.0538),不包含,不包含63.5,也可以认

24、为人工培植人参中物,也可以认为人工培植人参中物质的含量与野生人参不同。质的含量与野生人参不同。配对设计实验均数比较统计方法的选择见图配对设计实验均数比较统计方法的选择见图4-10。三、三、配对设计的均数比较配对设计的均数比较(配对配对 t 检验检验)配对设计实验的均数比较,满足正态性时,可用配对设计实验的均数比较,满足正态性时,可用配对配对 t 检验;不满足正态性时,可用非参数检验,检验;不满足正态性时,可用非参数检验,也可以作变量转换使达到正态性后,用也可以作变量转换使达到正态性后,用 t 检验。本检验。本节介绍配对节介绍配对 t 检验法。假设配对差值检验法。假设配对差值 d 的总体均数的总

25、体均数d为为0,推断配对差值的样本均数与,推断配对差值的样本均数与0之间的差异有之间的差异有无显著性而作出判断。检验统计量为:无显著性而作出判断。检验统计量为:ddSdnSdt|/|自由度自由度df=n1 P64例例4.8 为研究三棱莪术液的抑瘤效果,将为研究三棱莪术液的抑瘤效果,将20只小白只小白鼠配成鼠配成10对,然后将每对中的两只小白鼠随机分到实对,然后将每对中的两只小白鼠随机分到实验组和对照组中,两组动物都接种肿瘤,实验组在验组和对照组中,两组动物都接种肿瘤,实验组在对对子子号号对对照照组组x实实验验组组yd=xy123456789103.64.54.24.43.75.67.04.15

26、.04.53.02.32.41.14.03.72.71.92.61.30.62.21.83.3-0.31.94.32.22.43.2合合计计n=10,d=21.6(1)建立假设和确定检验水准建立假设和确定检验水准H0:d=0,H1:d0.=0.05 (2)计算检验统计量计算检验统计量t值:值:17.510/32.116.2 t(3)确定确定 P 值和作出结论:据值和作出结论:据自由度自由度df=n1=9查查 t 界值表界值表(附表(附表5),双侧),双侧t0.001(9)=4.78,t t0.001(9),P 0.001,拒绝,拒绝H0,接受,接受H1。可认为三棱莪术液有抑瘤效可认为三棱莪术液

27、有抑瘤效果。果。如使用统计软件,在如使用统计软件,在数据编辑窗的变量窗口数据编辑窗的变量窗口分别以实验组和对照组分别以实验组和对照组为变量名,在数据窗口为变量名,在数据窗口键入实验组和对照组数键入实验组和对照组数据,建立数据文件如图据,建立数据文件如图,采用,采用Paired-Sample T Test(配对样本(配对样本t检验)检验)过程,操作过程:过程,操作过程:输出结果:如图,差值输出结果:如图,差值=2.1600,标准差,标准差S1.321,标准误标准误=0.41772,统计量,统计量 t=5.171,自由度,自由度df=9,双,双侧侧P=0.001,拒绝,拒绝H0,接受,接受H1。四

28、、四、完全随机设计资料的两均数比较(成组完全随机设计资料的两均数比较(成组 t 检验)检验)(一)、正态分布资料的两小样本均数比较(一)、正态分布资料的两小样本均数比较 满足正态性的两小样本资料均数比较,满足方差齐性满足正态性的两小样本资料均数比较,满足方差齐性时,可用时,可用t检验(参数检验),常称成组检验(参数检验),常称成组t检验;不满检验;不满足时,可用足时,可用t检验,也可以用非参数检验(见第十一检验,也可以用非参数检验(见第十一章),或者作变量转换使达到正态性后,用章),或者作变量转换使达到正态性后,用 t 检验。检验。有的学者提出,有的学者提出,t 检验在方差不齐的情况下,只要具

29、检验在方差不齐的情况下,只要具备正态性和两样本含量相等的条件,仍不失为效能较备正态性和两样本含量相等的条件,仍不失为效能较优的检验方法。优的检验方法。1.H0:12=0;H1:12 0 ,=0.05 212212111|)()(|nnSXXtc t(n1+n22)2)1()1(212222112 nnsnsnSc当两样本含量相等当两样本含量相等n1=n2=n时,上式可化简为:时,上式可化简为:nSSSc22212 其中其中2.方差不齐的两小样本均数比较,可采用方差不齐的两小样本均数比较,可采用 t检验,检验检验,检验统计量为统计量为 t值:值:2221212121|)()(|nSnSXXt 校

30、正校正t值不服从自由度值不服从自由度df=n-1的的t分布,自由度分布,自由度df为:为:)1/()/()1/()/(/2222212121222121 nnsnnsnsnsdf例例4.9 某医师研究转铁蛋白测定对病毒性肝炎诊断的临某医师研究转铁蛋白测定对病毒性肝炎诊断的临床意义,测得床意义,测得12名正常人和名正常人和15名病毒性肝炎患者血清名病毒性肝炎患者血清转铁蛋白含量的结果如下,已检验两组方差相等,问转铁蛋白含量的结果如下,已检验两组方差相等,问患者和健康人转铁蛋白含量是否有差异。患者和健康人转铁蛋白含量是否有差异。正常人正常人(x1,n1=12):265.4,271.5,284.6,

31、291.3,254.8,275.9,281.7,268.6,264.1,273.2,270.8,260.5 病毒性肝炎患者病毒性肝炎患者(x2,n2=15):256.9,235.9,215.4,251.8,224.7,228.3,231.1,253.0,221.7,218.8,233.8,230.9,240.7,260.7,224.4 解:解:H0:1=2,即正常人与病毒性肝炎患者的转铁,即正常人与病毒性肝炎患者的转铁蛋白含量相等;蛋白含量相等;H1:12,=0.05 4.7)151121(21512391.14)115(397.10)112(/)21.23587.271(22 t据自由度据自

32、由度dfn1n221215225查查t界值表界值表(附附表表5),得,得t0.001(125)=3.725,P 0.001,按所取,按所取=0.05水准水准拒绝拒绝H0,可认为病毒性肝炎患者的转铁蛋白量较低。,可认为病毒性肝炎患者的转铁蛋白量较低。如使用如使用SPSS11.5统计软件,在数据编辑窗口中,统计软件,在数据编辑窗口中,分别以观察对象和分别以观察对象和 x 为变量名,在观察对象的为变量名,在观察对象的Value(值标签)中标签(值标签)中标签1为正常人,为正常人,2为病毒性肝炎患者为病毒性肝炎患者;在;在 x 的的Label(变量标签)标签(变量标签)标签x 为转铁蛋白量,为转铁蛋白

33、量,键入相应的转铁蛋白量键入相应的转铁蛋白量x数据,建立如如图数据,建立如如图5-11的数的数据文件以后,采用据文件以后,采用Two-Sample T Test(两样本(两样本 t 检检验)过程分析,操作过程分两步:验)过程分析,操作过程分两步:1.先做探索性分析,检验正态先做探索性分析,检验正态性和方差齐性。性和方差齐性。Tests of Normality转铁蛋白含量正常正常人人.11612.200(*).98612.998 观察观察对象对象Kolmogorov-Smirnov(a)Shapiro-Wilk StatisticdfSig.StatisticdfSig.患者患者.14715.

34、200(*).92715.245 正态性检验结果,因样本含量正态性检验结果,因样本含量50,宜看正常人的,宜看正常人的Shapiro-Wilk统计量统计量=0.986,P值值=0.998;患者;患者的的Shapiro-Wilk统计量统计量=0.927,P值值=0.245,均满足正态性。,均满足正态性。转铁蛋转铁蛋白含量白含量Based on Mean1.877125.183 Based on Median1.127125.299 Based on Median and with adjusted df1.127122.304.300 Levene Statisticdf1df2Sig.Base

35、d on trimmed mean1.798125.192 Test of Homogeneity of Variance 四种方差齐性检验结果四种方差齐性检验结果P值都大于值都大于0.05,可认为满足,可认为满足方差齐性。方差齐性。2.再做成组再做成组 t 检验,采用检验,采用Independent-Sample T Test过过程,操作过程:程,操作过程:Independent Samples Test1.877.183 7.40225.00036.66004.95280 26.4595 46.860497.67524.79.00036.66004.77644 26.8186 46.501

36、39Equal variancesassumedEqual variancesnot assumedXFSig.LevenesTest forEquality ofVariancestdfSig.(2-tailed)MeanDifferenceStd.ErrorDifferenceLowerUpper95%ConfidenceInterval of theDifferencet-test for Equality of Means(二)、非正态分布的两均数比较(二)、非正态分布的两均数比较 当资料与正态分布偏倚较大时,可用采用非参数检当资料与正态分布偏倚较大时,可用采用非参数检验验(见第见第9

37、章章),也可用适当的变量变换,使不满足正态,也可用适当的变量变换,使不满足正态性的资料,达到参数检验的要求,再用性的资料,达到参数检验的要求,再用 t 检验。检验。例例4.10 为了研究补益法对预防注射的效果有无增强作为了研究补益法对预防注射的效果有无增强作用,将观察值对象分两组,甲组用,将观察值对象分两组,甲组24人,用补益法加预人,用补益法加预防注射;乙组防注射;乙组22人,只用预防注射。免疫后采血,分人,只用预防注射。免疫后采血,分别测定抗体滴度,结果用滴度倒数表示如下,问两组别测定抗体滴度,结果用滴度倒数表示如下,问两组免疫效果有无差别?免疫效果有无差别?抗体滴度倒数抗体滴度倒数x:4

38、 8 16 32 64 128 256 甲组人数甲组人数f1:4 4 2 8 1 3 2 乙组人数乙组人数f2:3 4 3 7 2 2 1 本例变量本例变量x的观察值呈倍数关系,不满足正态性,可的观察值呈倍数关系,不满足正态性,可用对数变换,使使达到正态性的要求,再用用对数变换,使使达到正态性的要求,再用 t 检验。检验。正态性检验输出结果:在正态性检验输出结果:在Tests of Normality中,输中,输出了甲组抗体滴度倒数的出了甲组抗体滴度倒数的Shapiro-Wilk统计量统计量=0.670,P=0.000;乙组;乙组Shapiro-Wilk=0.650,P值值=0.000,均不满

39、足正态性。因不满足正态性,考虑本例变量值均不满足正态性。因不满足正态性,考虑本例变量值x为等比数列的数据,所以,先将原变量作对数变换为等比数列的数据,所以,先将原变量作对数变换,使服从正态分布。,使服从正态分布。2.再用变换后的新变量做成组再用变换后的新变量做成组t检验检验 操作过程同例操作过程同例4.9。输出结果:。输出结果:统计量统计量F=0.306,单侧,单侧P=0.583。故不能认为两组的。故不能认为两组的总体方差不齐;检验统计量总体方差不齐;检验统计量t=0.151,双侧,双侧P=0.881;双;双侧检验不拒绝侧检验不拒绝H0,不能认为两组免疫效果有差别。,不能认为两组免疫效果有差别

40、。(三三)构成比不同的两样本均数比较(加权均数法构成比不同的两样本均数比较(加权均数法)两样本均数比较,如果资料不满足齐同可比性时,应设两样本均数比较,如果资料不满足齐同可比性时,应设法在统计分析时尽量消除影响因素的干扰。这里介绍构法在统计分析时尽量消除影响因素的干扰。这里介绍构成比不同时两样本均数比较的加权均值法。成比不同时两样本均数比较的加权均值法。【例【例4.11】将将90名慢性胆管炎病例用完全随机方法分名慢性胆管炎病例用完全随机方法分配到甲、乙两种疗法组治疗,以血清中某酶降低值作配到甲、乙两种疗法组治疗,以血清中某酶降低值作为疗效判断的指标,为疗效判断的指标,90名病例中病情轻的有名病

41、例中病情轻的有46例,病例,病情重的有情重的有44例在两组分配有不同,检验资料满足正态例在两组分配有不同,检验资料满足正态性和方差齐性,整理资料如表性和方差齐性,整理资料如表4-7。xxx 轻病人(轻病人(46例)例)重病人(重病人(44例)例)合计(合计(90例)例)病例病例数数降低值降低值S病例数病例数降低值降低值S病例病例数数降低值降低值S甲疗法甲疗法1224.05.93612.54.54815.44.9乙疗法乙疗法3423.56.0813.54.64221.65.8 若不考虑两组病情构成比不同,用不分病情的合计若不考虑两组病情构成比不同,用不分病情的合计数据比较两样本均数,得数据比较两

42、样本均数,得t5.497,P0.01,可认为,可认为乙疗法降低某酶的疗效优于甲疗法。这样的结论是不乙疗法降低某酶的疗效优于甲疗法。这样的结论是不正确的。实际上,仔细分析上表正确的。实际上,仔细分析上表4-7可发现,疗效反应可发现,疗效反应病情轻的患者较好,病情重的患者相对较差。病情轻的患者较好,病情重的患者相对较差。若要消除病情因素构成比不同的影响,综合比较若要消除病情因素构成比不同的影响,综合比较两疗法降低某酶的疗效,或者要在综合回答两种疗法两疗法降低某酶的疗效,或者要在综合回答两种疗法差异有无统计学意义外,同时还了解病情因素的影响差异有无统计学意义外,同时还了解病情因素的影响大小,可采用两

43、因素设计试验的方差分析或协方差分大小,可采用两因素设计试验的方差分析或协方差分析。若仅仅为了删除病情因素的影响,则可用加权均析。若仅仅为了删除病情因素的影响,则可用加权均值法来进行分析。值法来进行分析。下面结合本例介绍加权均值法的步骤:下面结合本例介绍加权均值法的步骤:(1)按)按wini/N分别计算不同构成的权重系数分别计算不同构成的权重系数wi。本例本例50岁与岁与50岁的权重系数为:岁的权重系数为:w 5 046/90=0.511,w504490=0.489(2)按(式)按(式4-37)分别计算两比较组的加权均值)分别计算两比较组的加权均值w与标准差与标准差sw。加权均值加权均值 w=wii,加权均数标准差,加权均数标准差Sw WiSi (式(式4-37)本例:甲疗法:本例:甲疗法:w甲甲=0.51123.5+0.48913.5=18.6,Sw 甲甲0.5116.0+0.4894.6=5.3;乙疗法:乙疗法:w乙乙0.51124.0+0.48912.518.4,Sw B乙乙0.511 5.9+0.4894.5=5.2。(3)对加权均值进行检验。本例满足正态性和方差)对加权均值进行检验。本例满足正态性和方差齐性,用齐性,用 t 检验得检验得 t0.181,P0.5,不能认为甲、乙,不能认为甲、乙两种疗法的疗效有差别。两种疗法的疗效有差别。XXX

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(研究生-统计学讲义-第4讲第4章-正态性检验和方差齐性检验课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|