1、1第三讲第三讲 利用利用SAS得到估计与检验的结果得到估计与检验的结果目的:通过目的:通过ttest过程和假设检验内容过程和假设检验内容进一步了解进一步了解SAS系统系统2课程目标课程目标 掌握用分析员系统进行假设检验的方掌握用分析员系统进行假设检验的方法法 掌握掌握ttest过程进行假设检验的方法过程进行假设检验的方法3主要内容主要内容 单个总体参数的假设检验单个总体参数的假设检验 单个总体分布的假设检验单个总体分布的假设检验 成对组的假设检验成对组的假设检验 两组的比较两组的比较4分析员应用系统分析员应用系统统计统计(s)假设检验假设检验(H)方差的单样本检验方差的单样本检验(V)567s
2、Xnt0 0 Xnu niinXXnS122020221 统统计计量量单个总体的假设检验单个总体的假设检验81122,XuXunn1,Xun1,Xun 置置信信区区间间91122(1),(1)SSXtnXtnnn1,(1)SXtnn1(1),SXtnn102222122(1)(1),11nsnsnn22(1),1nsn221(1),1nsn 112.利用利用means过程过程.常用选择项常用选择项alpha=、clm、lclm、uclm、prt|probt t1.利用分析员应用系统利用分析员应用系统.方法方法3.利用利用ttest过程过程.常用选择项常用选择项alpha=、H0=、12案例案例
3、2.1(续续)我们仍然用案例我们仍然用案例2.1中的中的100名学生身高和体重的数据,请完成以下名学生身高和体重的数据,请完成以下任务:任务:(1)求学生体重均值求学生体重均值 和方差和方差 2的的95%的置的置信区间信区间.(2)检验学生体重数据的均值检验学生体重数据的均值 =62(=0.1).(3)检验学生体重数据的方差检验学生体重数据的方差 2=50(=0.01).13体重均值是否等于体重均值是否等于62的检验结果的检验结果1415结果的解释结果的解释(1)p值为值为0.7411大于大于0.01,没有理由拒,没有理由拒绝原假设(方差为绝原假设(方差为50).(2)方差的方差的95%置信区
4、间为置信区间为 (36.511,63.914)该区间包含该区间包含50,所以在显著水平为,所以在显著水平为0.05下,也没有理由拒绝原假设下,也没有理由拒绝原假设.16data Y100(keep=y);set anli101;y=w62;run;proc means data=Y100 alpha=0.1 t prt clm;var y;run;用均值过程用均值过程17MEANS 过程分析变量:分析变量:y t 值值Pr|t|均值下限均值下限90%均值的置信限均值的置信限均值上限均值上限90%均值的置信限均值的置信限-1.210.2273-1.97868120.306681218(1)因为因
5、为 P(|t|1.21)=0.22730.1所以不能拒绝体重的均值为所以不能拒绝体重的均值为62的假设的假设.(2)因为置信区间包含因为置信区间包含0,所以不能拒绝,所以不能拒绝体重的均值为体重的均值为62的假设的假设.(3)此时均值的置信区间为此时均值的置信区间为(1.9786812 62,0.3066812 62).结果的解释结果的解释19202122 用分析员应用系统可以求单个总体和两个总用分析员应用系统可以求单个总体和两个总体的均值、方差的置信区间及假设检验体的均值、方差的置信区间及假设检验.区间区间估计既可以是单边的,也可以是双边的,同时估计既可以是单边的,也可以是双边的,同时还可以
6、画出直观的图形还可以画出直观的图形.用用means过程可以在方差未知的情况下求均过程可以在方差未知的情况下求均值的置信区间及均值是否为值的置信区间及均值是否为0的假设检验的假设检验(不是不是0的要作一个平移变换的要作一个平移变换),但不能求方差的置信,但不能求方差的置信区间也不能进行方差的假设检验区间也不能进行方差的假设检验.分析员系统和分析员系统和means过程在进行单过程在进行单变量假设检验方面的区别变量假设检验方面的区别23TTEST过程过程1.作用:用于进行作用:用于进行t检验检验(单个总体、两组独立数单个总体、两组独立数据、成对数据据、成对数据)2.基本语句基本语句 PROC TTE
7、ST ;CLASS variable;PAIRED variables;BY variables;VAR variables;FREQ variable;WEIGHT variable;24proc ttest data=anli101 h0=62 alpha=0.05;var w;run;检验均值是否等于检验均值是否等于62的程序:的程序:T-TestsVariableDFtValuePr|t|w99-1.210.2273输出结果:输出结果:25两组比较两组比较1.独立组独立组:两组独立的观测数据:两组独立的观测数据.2.成对组成对组:每个个体包含成对测量值:每个个体包含成对测量值.3.两总
8、体的比较:均值的比较、方差的两总体的比较:均值的比较、方差的比较、分布的比较比较、分布的比较.26 Obs sex fatpctObs sex fatpct 1 m 13.3 1 m 13.3 2 m 19.0 2 m 19.0 3 m 20.0 3 m 20.0 4 m 8.0 4 m 8.0 5 m 18.0 5 m 18.0 6 m 22.0 6 m 22.0 7 m 20.0 7 m 20.0 8 m 31.0 8 m 31.0 9 m 21.0 9 m 21.0 10 m 12.0 10 m 12.0 11 m 16.0 11 m 16.0 12 m 12.0 12 m 12.0 1
9、3 m 24.0 13 m 24.0 14 w 22.0 14 w 22.0 15 w 26.0 15 w 26.0 16 w 16.0 16 w 16.0 17 w 12.0 17 w 12.0 18 w 21.7 18 w 21.7 19 w 23.2 19 w 23.2 20 w 21.0 20 w 21.0 21 w 28.0 21 w 28.0 22 w 30.0 22 w 30.0 23 w 23.0 23 w 23.0 独立组独立组案例案例3.1男女脂肪含量男女脂肪含量百分比是否显百分比是否显著不同的检验著不同的检验.27 两个变量:一个为分类变两个变量:一个为分类变量,只取两个
10、值;另一个为分量,只取两个值;另一个为分析变量析变量(数值型变量数值型变量).1.利用利用means、ttest过程;过程;2.利用利用chart、gchart过程;过程;3.利用利用分析员系统分析员系统.教材中的例教材中的例2.3.128-sex=m-sex=m-Analysis Variable:fatpct Analysis Variable:fatpctN Mean Std Dev Minimum MaximumN Mean Std Dev Minimum Maximum-13 18.1769 6.0324 8.0000 31.000013 18.1769 6.0324 8.0000
11、31.0000-sex=w-sex=w-N Mean Std Dev Minimum MaximumN Mean Std Dev Minimum Maximum-10 22.2900 5.3197 12.0000 30.000010 22.2900 5.3197 12.0000 30.0000-FREQUENCY0123456fatpct MIDPOINTsexmw10152025301015202530在vbar语句加选项group=sex的输出结果31在vbar语句加选项subgroup=sex的输出结果321.在在means过程中,过程中,by语句和语句和class语句的语句的区别区别(
12、是否先排序,输出形式不同是否先排序,输出形式不同).2.在在chart、gchart过程中使用过程中使用by语句语句(两张两张图图),vbar语句中使用语句中使用选项选项group=(一张图,一张图,两组并排两组并排)或或subgroup=(不同颜色表示的罗在一不同颜色表示的罗在一起图起图)输出形式的区别输出形式的区别.注意:注意:33成对组成对组:student exam1 exam2 scordiffstudent exam1 exam2 scordiff 1 93 98 5 1 93 98 5 2 88 74 -14 2 88 74 -14 3 89 67 -22 3 89 67 -22
13、 4 88 92 4 4 88 92 4 5 67 83 16 5 67 83 16 6 89 90 1 6 89 90 1 7 83 74 -9 7 83 74 -9 8 94 97 3 8 94 97 3 9 89 96 7 9 89 96 7 10 55 81 26 10 55 81 26 11 88 83 -5 11 88 83 -5 12 91 94 3 12 91 94 3 13 85 89 4 13 85 89 4 14 70 78 8 14 70 78 8 15 90 96 6 15 90 96 6 16 90 93 3 16 90 93 3 17 94 81 -13 17 9
14、4 81 -13 18 67 81 14 18 67 81 14 19 87 93 6 19 87 93 6 20 83 91 8 20 83 91 8 案例案例3.2 20个学生个学生两次考试成两次考试成绩是否有显绩是否有显著差异的检著差异的检验验.34 两个变量:均为分析变量两个变量:均为分析变量(数数值型变量值型变量),是一个个体的两次观,是一个个体的两次观测,需要求差,然后对差变量进测,需要求差,然后对差变量进行统计分析行统计分析(相当于单变量的统计分相当于单变量的统计分析析).没有分类变量没有分类变量.1.利用利用means、ttest过程;过程;2.利用利用chart、gchart
15、过程过程.例例2.3.235means过程的输出结果过程的输出结果36两总体的比较:两总体的比较:1.均值的比较均值的比较2.方差的比较方差的比较3.分布的比较分布的比较方差相等方差相等方差不相等方差不相等37表表3.1 进行两组均值比较的统计检验进行两组均值比较的统计检验组的类型组的类型检检验验的的类类型型独立组独立组成对组成对组参数检验参数检验(正态分布正态分布)两样本两样本t检验检验成对差值成对差值t检验检验非参数检验非参数检验Wilcoxon秩和检验秩和检验Wilcoxon符号秩检验符号秩检验38参数检验参数检验:(假设假设总体为正态分布总体为正态分布)独立组:独立组:方差是否相等的检
16、验方差是否相等的检验(F检验检验)方差相等时均值是否相等的检验方差相等时均值是否相等的检验(t检验检验)方差不相等时均值是否相等的检方差不相等时均值是否相等的检验验(近似近似t检验检验)39 22221212max,min,Fssss 方差是否相等的检验方差是否相等的检验(F检验检验)2211112222221 11 1iiiisxxnsxxn 其中其中40 22222221112121222211211 11 211 iiiixxnsxxnsnnsnsns其中其中 2122111nnsxxt 方差相等时均值是否相等的检验方差相等时均值是否相等的检验(t检验检验)41 22212121nsns
17、xxt 方差不相等时均值是否相等的检验方差不相等时均值是否相等的检验(近似近似t检验检验)42 T-Tests T-TestsVariable Method Variances DF t Value Pr|t|Variable Method Variances DF t Value Pr|t|fatpctfatpct Pooled Equal 21 -1.70 0.1031 Pooled Equal 21 -1.70 0.1031fatpct Satterthwaitefatpct Satterthwaite Unequal 20.5 -1.73 0.0980 Unequal 20.5 -1.
18、73 0.0980 Equality of Variances Equality of Variances Variable Method Num DF Den DF F Value Pr F Variable Method Num DF Den DF F Value Pr F fatpct fatpct Folded F 12 9 1.29 0.7182 Folded F 12 9 1.29 0.7182SAS的输出结果的输出结果43(1)利用利用ttest过程过程(需要需要class语句语句)(2)利用分析员系统利用分析员系统例例2.3.1实现独立组均值相等的检验实现独立组均值相等的检验4
19、4(1)利用利用means过程,需要先计算两个变量过程,需要先计算两个变量的差;的差;(2)利用利用ttest过程,不需要计算两个变量过程,不需要计算两个变量的差的差,利用语句:利用语句:paired exam2*exam1;(3)利用分析员系统利用分析员系统.例例2.3.2实现成对组均值相等的检验的方法实现成对组均值相等的检验的方法45These PAIRED statements.yield these comparisons PAIRED A*B;A-BPAIRED A*B C*D;A-B and C-DPAIRED(A B)*(C D);A-C,A-D,B-C,and B-DPAIRE
20、D(A B)*(C B);A-C,A-B,and B-CPAIRED(A1-A2)*(B1-B2);A1-B1,A1-B2,A2-B1,and A2-B2PAIRED(A1-A2):(B1-B2);A1-B1 and A2-B246 Statistics Lower CL Upper CL Lower CL Upper CLDifference N Mean Mean Mean Std Dev Std Dev Std Dev Std Errexam2-exam1 20-2.585 2.55 7.6846 8.3434 10.971 16.024 2.4532 T-Tests Differenc
21、e DF t Value Pr|t|exam2-exam1 19 1.04 0.311647非参数检验非参数检验l 独立组的秩和检验独立组的秩和检验(利用利用nparlway过程过程例例2.3.3,分析,分析员系统员系统 statisticsANOVA Nonparametric one-way ANOVA)l 成对组的符号秩检验和符号检验成对组的符号秩检验和符号检验(利用利用univariate过程过程例例2.3.2,分析员系统分析员系统 statisticsDescriptive Distributions)48秩和检验法秩和检验法(1945年年)例:对用甲乙两种材料制成的产品进例:对用甲
22、乙两种材料制成的产品进行寿命试验,得:行寿命试验,得:甲甲 1610 1650 1680 1700 1750 1720 1800 乙乙 1580 1600 1640 1640 1700问两种材料对产品质量的影响有无显问两种材料对产品质量的影响有无显著差异著差异?49解解:把上述数据从小到大排列成下表把上述数据从小到大排列成下表:秩秩1 2 3 4 5 6 7 8 9 10 11 12 甲甲乙乙 1610 1650 1680 1700 1720 1750 1800 1580 1600 1640 1640 1700 50 上表中第一行秩表示从小到大上表中第一行秩表示从小到大排列的序数,数据排列的序
23、数,数据1700甲乙均有,甲乙均有,排在排在8,9两个序位,其秩按平均秩两个序位,其秩按平均秩取为取为(8+9)/2=8.551甲的秩甲的秩:3+6+7+8.5+10+11+12=57.5:3+6+7+8.5+10+11+12=57.5乙的秩:乙的秩:1+2+4+5+8.5=20.51+2+4+5+8.5=20.5S=min(S=min(甲的秩、乙的秩甲的秩、乙的秩)S S太小拒绝两者均值相同太小拒绝两者均值相同.若若S=max(S=max(甲的秩、乙的秩甲的秩、乙的秩)S S太大拒绝两者均值相同太大拒绝两者均值相同.SASSAS中取两组中观测个数少的那组的秩和中取两组中观测个数少的那组的秩和
24、.若两组观测个数相同,取第若两组观测个数相同,取第1 1组的秩和组的秩和.521.正态近似正态近似2.t近似近似3.卡方近似卡方近似近似分布近似分布知道知道S服从什么分布,或近似服从什么服从什么分布,或近似服从什么分布,才能做检验分布,才能做检验.临界值应与样本容临界值应与样本容量量n1和和n2有关有关.53正态近似正态近似近似分布近似分布000.5(0,1)var()SE SzNS)注:注:如果如果 则减则减0.5,否则加,否则加0.5.0(SE S)选项选项correct=No表示不用加修正表示不用加修正.54120(1)var()12n n nS10(1)(2n nE S)=如果没有结点
25、,则如果没有结点,则55565758 符号检验符号检验 设设Y表示变量取值中正号的个数,表示变量取值中正号的个数,符号检验的统计量为符号检验的统计量为 M=|Y-n/2|=|15-20/2|=5太大拒绝太大拒绝H0.单个总体,检验是否关于0点对称,即检验中位数是否为0,.一共有20个观测,假设大于0的观测有15个.59成对组的符号秩检验法成对组的符号秩检验法 是对符号检验的修正。是对符号检验的修正。R=maxn+,n-太大拒绝两组的均值相等的假设太大拒绝两组的均值相等的假设.取绝对值后排序,得到每个观测的秩取绝对值后排序,得到每个观测的秩.n+表示大于表示大于0 的观测的秩和,的观测的秩和,n
26、-表示表示小于小于0的观测的秩和的观测的秩和.600(1)(21)var()24n nnRR=maxn+,n-可以证明可以证明0(1)()4n nE R其中n为去掉0后观测个数.614)1(nnRS注:注:n 20,利用,利用S的精确分布求临界值;的精确分布求临界值;n20,利用,利用S的近似分布求临界值的近似分布求临界值.(1)4(0,1)(1)(21)24n nRNn nn62student exam1 exam2 scordiffstudent exam1 exam2 scordiff 1 93 98 5 1 93 98 5 2 88 74 -14 2 88 74 -14 3 89 67
27、 -22 3 89 67 -22 4 88 92 4 4 88 92 4 5 67 83 16 5 67 83 16 6 89 90 1 6 89 90 1 7 83 74 -9 7 83 74 -9 8 94 97 3 8 94 97 3 9 89 96 7 9 89 96 7 10 55 81 26 10 55 81 26 11 88 83 -5 11 88 83 -5 12 91 94 3 12 91 94 3 13 85 89 4 13 85 89 4 14 70 78 8 14 70 78 8 15 90 96 6 15 90 96 6 16 90 93 3 16 90 93 3 1
28、7 94 81 -13 17 94 81 -13 18 67 81 14 18 67 81 14 19 87 93 6 19 87 93 6 20 83 91 8 20 83 91 8 63 Tests for Location:Mu0=0 Tests for Location:Mu0=0 Test -Statistic-p Value-Test -Statistic-p Value-Students t t 1.03945 Pr|t|0.3116 Students t t 1.03945 Pr|t|0.3116 Sign Sign(符号检验)符号检验)M 5 Pr=|M|0.0414M 5
29、Pr=|M|0.0414 Signed Rank S 33 Pr=|S|0.2265 Signed Rank S 33 Pr=|S|0.2265检验检验0是不是数据集的中位数。是不是数据集的中位数。646566NPAR1WAY过程过程(单因子非参数方差分析过程单因子非参数方差分析过程)1.作用:用于检验同一个变量在不同组内的分布作用:用于检验同一个变量在不同组内的分布位置参数是否一致位置参数是否一致.2.基本语句基本语句 PROC NPAR1WAY ;(过程名字)(过程名字)BY variables;CLASS variable;(作比较,要先用(作比较,要先用class排序从小到大)排序从小
30、到大)EXACT statistic-options ;(模拟的方法)(模拟的方法)FREQ variable;OUTPUT ;VAR variables;67小结:两组均值比较的统计检验小结:两组均值比较的统计检验组的类型组的类型检检验验的的类类型型独立组独立组成对组成对组参数检验参数检验(正态分布正态分布)两样本两样本t检验检验成对差值成对差值t检验检验非参数检验非参数检验Wilcoxon秩和检验秩和检验Wilcoxon符号秩检验符号秩检验68一维数据的一维数据的正态性检验正态性检验H0:总体服从一维正态分布:总体服从一维正态分布H1:总体不服从:总体不服从一维一维正态分布正态分布69(一
31、)、检验的方法及统计量(一)、检验的方法及统计量1.偏度:偏度:|g1|太大拒绝原假设太大拒绝原假设(总体总体为正态分布为正态分布).2.峰度:峰度:|g2|太大拒绝原假设太大拒绝原假设(总体总体为正态分布为正态分布).3.Shapiro-wilk的的w统计量统计量(1965年年)参考书:参考书:Applied Statistics:Analysis of Variance and Regression,Olive Jean Dunn&Virginia A.Clark.P39770 )(122 niixxbw将将n个观测值个观测值x1,x2,xn从小到大排序为从小到大排序为x(1),x(2),
32、x(n),kiiininxxab1)()1(1其中:其中:为奇数为奇数为偶数为偶数nnknn212W太小拒绝原太小拒绝原假设假设(正态分布正态分布)系数系数an-i+1可以可以查表得到查表得到710w1注:注:The distribution of W is highly skewed.Seemingly large values of W(such as 0.90)may be considered small and lead you to reject the null hypothesis.724.Kolmogorov-Smirnov(科尔莫戈罗科尔莫戈罗夫夫-斯米尔诺夫,斯米尔诺夫,
33、1933年年)统计量统计量)()(sup0 xFxFDnx Dn20世纪世纪50年代我国统计学家张千里给出年代我国统计学家张千里给出 的精确分布及其渐进展开的精确分布及其渐进展开.735.Cramer-von Mises(克拉默克拉默-冯冯米西斯米西斯)统计量统计量 )()()(0202xdFxFxFnwn746.Anderson-Darling(安德森安德森-达林达林)统计量统计量 )()(1)()()(0100202xdFxFxFxFxFnAn7.Q-Q图检验法图检验法(分位数分位数分位数分位数)8.P-P图检验法图检验法(正态概率图正态概率图)75Q-Q图的坐标:图的坐标:*)(,iix
34、qnippqiii5.0 ,)(1其中:其中:是标准正态分布的是标准正态分布的 分位数,分位数,是样本的是样本的 分位数分位数.iqip*)(ixip76*)(iixpiiiqpx1*)(若总体近似正态分布,则若总体近似正态分布,则Q-Q图应近似图应近似为一条直线为一条直线.Ex1.2.1的h的Q-Q图Ex1.2.1w的的Q-Q图图79P-P图的坐标:图的坐标:*)(,iixp *)(*)(1*)(,),(,iiiiiixpxpxq 注意:注意:横坐标不等距横坐标不等距.Qq图是等距的。但两个图是一样图是等距的。但两个图是一样的只是横坐标不一样。的只是横坐标不一样。例例1.2.1的的h正态概率
35、图正态概率图Ex1.2.1的的w正态概率图正态概率图82h的Q-Q图h的的P-P图图w的的Q-Q图图w的的P-P图图839.分布的拟合优度检验分布的拟合优度检验(x2检验法检验法)npnnnpnpnxkiiikiiii 121221分组分组SAS中没有这个统计量中没有这个统计量84(二)、在(二)、在SAS中实现正态分布的检验中实现正态分布的检验1.利用利用univariate过程可以进行;过程可以进行;(加加normal选项,选项,probplot语句,语句,qqplot语句语句)2.利用利用“分析员应用分析员应用”系统;系统;3.利用交互数据分析系统利用交互数据分析系统.85利用利用“分析
36、员应用分析员应用”系统系统statisticsdescriptiveDistributions(1)用用 plots 按钮可以选择画按钮可以选择画P-P图和图和Q-Q图图(2)用用 fit 按钮可以选择欲拟合的分布,即可按钮可以选择欲拟合的分布,即可以检验数据是否服从这个分布以检验数据是否服从这个分布(正态、对正态、对数正态、指数和数正态、指数和Weibull分布分布).86利用交互数据分析系统利用交互数据分析系统analyzeDistribution(Y)(1)用用 output 按钮可以选择画正态按钮可以选择画正态Q-Q图,图,正态性检验,密度估计等正态性检验,密度估计等.(2)在在Cur
37、ves下拉菜单下可以增加新内容下拉菜单下可以增加新内容(密密度估计、经验分布函数、特殊分布的检验度估计、经验分布函数、特殊分布的检验等等).871、交互数据分析系统可以画累积分布图、交互数据分析系统可以画累积分布图和经验分布图,而且增加新的内容也比较和经验分布图,而且增加新的内容也比较方便,但它不能画方便,但它不能画P-P图;图;2、输出形式不同、输出形式不同.三种方式的比较三种方式的比较88100人的人的h的正态检验的正态检验Tests for Normality Test -Statistic-p Value-Shapiro-Wilk W 0.991352 Pr D 0.1500Crame
38、r-von Mises W-Sq 0.045983 Pr W-Sq 0.2500Anderson-Darling A-Sq 0.295065 Pr A-Sq 0.250089 Tests for NormalityTests for NormalityTest -Statistic-p Value-Test -Statistic-p Value-Shapiro-WilkShapiro-Wilk W 0.987383 Pr W 0.4639 W 0.987383 Pr D 0.1500-Smirnov D 0.050658 Pr D 0.1500Cramer-von MisesCramer-vo
39、n Mises W-Sq 0.037406 Pr W-Sq 0.2500 W-Sq 0.037406 Pr W-Sq 0.2500Anderson-Darling A-Sq 0.275028 Pr A-Sq 0.2500Anderson-Darling A-Sq 0.275028 Pr A-Sq 0.2500100人的人的w的正态检验的正态检验90身高身高h体重体重w偏度偏度(对称性)(对称性)0.00928262 0.11113381峰度峰度0.40173429-0.309206291100人人中身高中身高h h的正态性检验的正态性检验(1)(1)峰度比较大,说明数据的尾部与正态分峰度比较大
40、,说明数据的尾部与正态分布有一定的差异;布有一定的差异;(2)(2)偏度很小说明对称性较好;偏度很小说明对称性较好;(3)(3)从从P-PP-P图或图或Q-QQ-Q图可以看出,两端与正态图可以看出,两端与正态分布有一些差异;分布有一些差异;(4)(4)四种检验的结果都是没有理由拒绝原假四种检验的结果都是没有理由拒绝原假设设.结论:结论:可以认为是近似正态分布的可以认为是近似正态分布的.92小结小结一、单个总体一、单个总体(单个变量单个变量)1.简单描述统计量简单描述统计量2.各种统计图表各种统计图表3.正态分布的检验正态分布的检验4.总体为正态分布时均值与方差的总体为正态分布时均值与方差的假设
41、检验与区间估计假设检验与区间估计5.均值的非参数检验均值的非参数检验(符号检验、符符号检验、符号秩检验号秩检验)93二、两组数据的比较二、两组数据的比较成对组:均值是否相等的检验成对组:均值是否相等的检验独立组:均值、方差、分布是否相等的检验独立组:均值、方差、分布是否相等的检验94本讲学习的本讲学习的SAS过程过程1.Ttest过程;过程;2.Npar1way过程(两个独立组均值过程(两个独立组均值是否相等的秩和检验)是否相等的秩和检验).95Ttest过程可以完成以下检验过程可以完成以下检验:1.单个总体,方差未知的单个总体,方差未知的t检验;检验;2.两个独立组均值比较的两个独立组均值比
42、较的t检验检验(方差相等方差相等或方差不等的结果同时给出或方差不等的结果同时给出,同时给出方同时给出方差是否相等的差是否相等的F检验的结果检验的结果);3.两个成对组均值比较的两个成对组均值比较的t检验检验.假设条件:总体服从正态分布假设条件:总体服从正态分布.96proc ttest语句的常用的选项:语句的常用的选项:l h0=m 指定三种检验下是否等于指定三种检验下是否等于m,缺省时缺省时m=0.(单个总体的均值是否等于(单个总体的均值是否等于m,两个总体均值的差是否等于两个总体均值的差是否等于m)l ci=equal|umpu|none 指定给出方差的指定给出方差的置信区间,缺省是置信区
43、间,缺省是 none,不给出方,不给出方差置信区间差置信区间.条件:条件:总体服从正态分布总体服从正态分布.97小结:两组均值比较的统计检验小结:两组均值比较的统计检验组的类型组的类型检检验验的的类类型型独立组独立组成对组成对组参数检验参数检验(正态分布正态分布)两样本两样本t检验检验(ttest过程过程)成对差值成对差值t检验检验(ttest过程过程)非参数检验非参数检验秩和检验秩和检验(npar1way过程过程)符号秩或符号符号秩或符号检验检验(univariate过过程程)98练习练习3 用分析员系统,由用分析员系统,由100个人身高的数据,个人身高的数据,求身高均值和方差的求身高均值和方差的90%的置信区间,的置信区间,及显著水平为及显著水平为0.05的检验结果;的检验结果;在申请者数据中选择两个特征变量,在申请者数据中选择两个特征变量,用用ttest进行成对组的比较;进行成对组的比较;用非参数的方法比较案例用非参数的方法比较案例3.3中对照组中对照组和患胃溃疡病人的溶菌酶是否有显著和患胃溃疡病人的溶菌酶是否有显著差异;差异;