1、t 检验邓 伟2012.121 t检验简介l均数的抽样分布规律:l来自正态总体或来自偏态总体但样本量比较大的样本其均数服从正态分布l标准变换后u统计量:uN(0,1),l以样本标准差s代替总体标准差,此时变换后的统计量称为t统计量,t统计量服从自由度为-1的t分布lt检验的种类l单样本均数的比较:样本所代表的总体均数和某已知总体均数比较l配对设计两样本的比较:每对差值的总体均数是否为0l完全随机设计两样本:两样本所代表的总体均数是否相等/xxxtSSn/xxxun2(,)xxN 2配对t检验l原理:检验差值d的总体均数是否为0l假设:公式:l常见配对的情况l同一对象治疗(或处理)前后的比较l同
2、一样本接受不同处理的比较l配对的两个受试对象分别给予两种处理01:0:0ddHH0/ddddtsnsn3 data ttest1;input x1 x2;/*输入治疗前、后的血红蛋白值*/d=x1-x2;/*计算治疗前后的差值*/cards;113 140 150 138 150 140 135 135 128 135 100 120 110 147 120 114 130 138 123 120 ;proc means mean stderr t prt;/*输出对均数是否为0的t检验及其p值*/var d;run;配对t检验4 Analysis Variable:D Mean Std Er
3、ror T Prob|T|-6.8000000 5.2042717 -1.3066189 0.2237 -配对t检验5成组成组t检验检验 l原理:两样本所代表的总体均数是否相等,检验两个样本均数的差是否为0l假设:l公式121201:0:0 xxxxHH121201:xxxxHH12121212()0 xxxxxxxxtSS6成组成组t检验检验 l应用条件l独立性l正态性univariate 正态性检验l方差齐性齐性检验t检验7data ttest3;do c=1 to 2;/*c循环开始,循环次数为2*/input n;/*输入n值*/do i=1 to n;/*i循环开始,循环次数为n*/
4、input x;/*输入x 值*/output;/*将x输出 */end;/*i循环结束*/end;/*c循环结束*/cards;5 279 334 303 338 198 3 229 274 310;proc print;proc ttest;class c;var x;run;成组成组t检验检验 8循环语句的应用 do ;/*循环1开始*/do ;/*循环2开始*/input ;output;end;/*循环2结束*/end;/*循环1结束*/注意:1)的合理应用 2)output的作用:9/*循环的结果*/OBS C N I X 1 1 5 1 279 2 1 5 2 334 3 1 5
5、 3 303 4 1 5 4 338 5 1 5 5 198 6 2 3 1 229 7 2 3 2 274 8 2 3 3 310成组成组t检验检验 10 TTEST PROCEDUREVariable:XC N Mean Std Dev Std Error-1 5 290.40000000 56.99385932 25.488428752 3 271.00000000 40.58324778 23.43074903Variances T DF Prob|T|-Unequal 0.5603 5.6 0.5971Equal 0.5099 6.0 0.6284For H0:Variances a
6、re equal,F=1.97 DF=(4,2)ProbF=0.7272成组成组t检验检验 11单样本t testl原理:检验某样本所来自的总体均数与已知总体均数是否相等l假设假设:公式公式:l例例:某疾病的平均住院天数是否是某疾病的平均住院天数是否是80天?天?xxtS01:xxHH12/*程序程序1 1*/data time;input time;cards;43 90 84 87 116 95 86 99 93 92121 71 66 98 79 102 60 112 105 98;proc ttest h0=80;var time;run;/*程序2*/Data time;Set ti
7、me;D=time-80;Proc means stderr t prt;Run;单样本t test13SAS程序程序:proc ttestProc ttest options;/*过程名 */Class ;/*分组变量名,决定哪两组进行比较 */Var;/*反应变量列表*/PAIRED var1*var2;/*专用于配对变量检验,class和var语句在使用该语句时无效*/By variables;/*指明分层变量,按该变量分别分析,需先排序*/Freq variable;/*指明频数变量 */Run;14loptionslAlpha 定义可信区间的alpha水平,默认为0.05lH0 定义
8、特定的总体均数值,默认为0lby:根据by变量分别计算分析结果,要求事先根据by变量排序lclass:定义分组变量,决定进行哪两组比较。在ttest中只允许有两组SAS程序程序:proc ttest15lFreqweightl非常接近lFreq 频数,只能是整数lWeight可以是小数SAS程序程序:proc ttest16l Paired定义配对变量SAS程序程序:proc ttest17l例1的分析用ttest过程解决:Proc ttest data=ttest1;Paired x1*x2;Run;Lower CL Upper CL Lower CL Upper CLDifference
9、N Mean Mean Mean Std Dev Std Dev Std Dev Std Err x1-x2 10 -18.57 -6.8 4.9729 11.32 16.457 30.045 5.2043 T-Tests Difference DF t Value Pr|t|x1-x2 9 -1.31 0.223718SAS的循环语句介绍l记数循环语法 do 记数变量起始值记数变量起始值 to 终止值终止值 by 增减值增减值 .end;l条件循环语句 Do while(条件);(条件);End;Do until(条件);(条件);End;19记数循环语法data a;amount=1000;rate=0.08;year_int=amount*rate;do i=1 to 12;mont_int+(mont_int+amount)*rate/12;end;run;proc print;run;20条件循环语句data b;amount=1000;rate=0.08;year_int=amount*rate;i=0;do while(i=12);i=i+1;mont_int+(mont_int+amount)*rate/12;end;proc print;run;22