1、一、一、假设检验的基本原理假设检验的基本原理第四节第四节 t t检验检验 假设检验的基本原理假设检验的基本原理反证法:反证法:当一件事情的发生只有两种可能当一件事情的发生只有两种可能A A和和B B,为了肯定,为了肯定一种情况一种情况A A,但又不能直接证实,但又不能直接证实A A,这时否定另一种可能,这时否定另一种可能B B,则间接肯定了,则间接肯定了A A。概率论(小概率):概率论(小概率):如果一件事情发生的概率很小,那么在一次试验如果一件事情发生的概率很小,那么在一次试验时,我们说这个事件是时,我们说这个事件是”不会发生的不会发生的”。从一般的常识。从一般的常识可知,这句话在大多数情况
2、下是正确的,但有犯错误的可知,这句话在大多数情况下是正确的,但有犯错误的时候,因为概率小也是有可能发生的。时候,因为概率小也是有可能发生的。假设检验的基本原理假设检验的基本原理假设检验是利用小概率反证法思想,从问题的对立面假设检验是利用小概率反证法思想,从问题的对立面(H H0 0)出发间接判断要解决的问题出发间接判断要解决的问题(H H1 1)是否成立。然后是否成立。然后在在H H0 0成立的条件下计算检验统计量,最后获得成立的条件下计算检验统计量,最后获得P P值来值来判断。判断。问题实质上都是希望通过样本统计量与总体参数的差问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计
3、量的差别,来推断总体参数是否别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验不同。这种识别的过程,就是本章介绍的假设检验(hypothesis test)hypothesis test)。例例 15.13 15.13 根据大量调查,已知一般健根据大量调查,已知一般健康成年男子的脉搏均数为康成年男子的脉搏均数为7272次次/min/min。某。某医生在某山区随机抽查医生在某山区随机抽查100100名健康成年名健康成年男子,求得其脉搏均数为男子,求得其脉搏均数为76.276.2次次/min/min,标准差为标准差为4.04.0次次/min,/min,能否认
4、为该山区的能否认为该山区的健康成年男子脉搏均数高于一般健康成健康成年男子脉搏均数高于一般健康成年男子的脉搏均数?年男子的脉搏均数?0 0=7272次次/min/min 山区健康山区健康成年男子成年男子 一般健康一般健康成年男子成年男子 可能原因有二:可能原因有二:1)由于抽样误差造成的由于抽样误差造成的.(实际上实际上=0 0)2)2)本质差异造成的本质差异造成的,总体间固有差异总体间固有差异(实际上实际上 0 0)0X0=72一般健康男子一般健康男子山区男子山区男子=76.2,n=100X?判断差别属于哪一种情况的统计学检验,就是假设检验,假设检验的目的判断样本与总体,样本与样本的差异是由抽
5、样误差引起,还是由本质差别造成的统计推断方法假设检验的基本思想假设检验的基本思想 据专业知识,有两种可能:据专业知识,有两种可能:0 0或或 0 0 直接证明是哪种结果都很困难,利用反证法。直接证明是哪种结果都很困难,利用反证法。假设假设 0 0,然后借助一定的分布,观察实测,然后借助一定的分布,观察实测 样本情况是否属于小概率事件。样本情况是否属于小概率事件。如果如果实测样本情况属于小概率事件,则认为原先的假实测样本情况属于小概率事件,则认为原先的假设是错的,拒绝这个假设;设是错的,拒绝这个假设;如果如果实测样本情况不属于小概率事件,则不拒绝原来实测样本情况不属于小概率事件,则不拒绝原来的假
6、设。的假设。二、假设检验的一般步骤二、假设检验的一般步骤(一)建立检验假设(一)建立检验假设(hypothesis test),),确定检验水准(确定检验水准(size of test),),无效假设或零假设(无效假设或零假设(null hypothesis)H0:0 差别是由抽样误差所致差别是由抽样误差所致备择假设或对立假设(备择假设或对立假设(alternative hypothesis)H1:0或或 0(0)即差别不仅仅是由于抽样误差所致。即差别不仅仅是由于抽样误差所致。注意:注意:假设针对的是总体;假设针对的是总体;H0和和 H1是互斥的;是互斥的;单侧、双侧的选择(单侧、双侧的选择(
7、由设计决定由设计决定)。)。1010单双侧检验的确定单双侧检验的确定:首先根据专:首先根据专业知识,其次根据所要解决的问题业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。果,此时应该用单侧检验。一般认一般认为双侧检验较保守和稳妥为双侧检验较保守和稳妥。1.1.样本均数所代表的未知总体均数样本均数所代表的未知总体均数 与已知总体均数与已知总体均数 0 0的比较的比较目的目的 双侧检验是否双侧检验是否 单侧检验是否单侧检验是否 是否是否 0 0 d d 0 0 d d 0
8、0 是否是否 d d 0 0 d d 0 0 d d 0 2 2 1 1 2 2 1 1 2 2 是否是否 1 1 2 2 1 1 2 2 1 1 2 2 检验水准检验水准(size of test)size of test)也称显著性水准也称显著性水准(significance level)significance level),符符号为号为,常取常取0.050.05或或0.010.01。是小概率事件的概率标准,也是假设检验是小概率事件的概率标准,也是假设检验时发生第一类错误的概率。时发生第一类错误的概率。(二二)选定检验方法和计算检验统计量)选定检验方法和计算检验统计量根据根据资料类型、研
9、究设计的类型及分析目资料类型、研究设计的类型及分析目的选用适当的检验方法,计算相应的检验的选用适当的检验方法,计算相应的检验统计量统计量。具体有具体有t t检验和检验和u u检验。检验。(三)确定(三)确定P P值,做出推断结论值,做出推断结论 用计算得的检验统计量与相应界值表中的用计算得的检验统计量与相应界值表中的界值比较,确定界值比较,确定P P值。值。P P值是指在值是指在H H0 0所规定的总体中做随机抽样,获所规定的总体中做随机抽样,获得等于及大于(或等于及小于)现有统计量得等于及大于(或等于及小于)现有统计量的概率。的概率。如果如果PP,则按,则按水准拒绝水准拒绝H H0 0,接受
10、接受H H1 1,称差异有显著性,或,称差异有显著性,或差异有统计学差异有统计学意义意义;如果如果P P,则按,则按水准不能拒绝水准不能拒绝H H0 0。称差异无显著性或无统计学意义。称差异无显著性或无统计学意义。假设检验的基本原理与假设检验的基本原理与t t检验检验 假设检验的基本原理假设检验的基本原理3.3.确定确定P P值,作出结论值,作出结论0XXtSP值是指在值是指在H0所规定的总体所规定的总体中作随机抽样,获得等于中作随机抽样,获得等于及大于(或小于)现有统及大于(或小于)现有统计量计量t值的概率。值的概率。3.3.确定概率确定概率P P值作出结论值作出结论)24(05.0tt 0
11、5.0p21211 1、样本均数、样本均数 与已知某总体均数与已知某总体均数 比较的比较的t t检验检验 目的:推断一个未知总体均数目的:推断一个未知总体均数 与已知总体均与已知总体均 数数 是否有差别,是否有差别,用单样本设计。用单样本设计。2 2、两个样本均数、两个样本均数 与与 比较的比较的t t检验检验目的:推断两个未知总体均数目的:推断两个未知总体均数 与与 是否有差是否有差 别别,用成组设计。用成组设计。3 3、配对设计资料均数比较的、配对设计资料均数比较的t t检验检验目的:推断两个未知总体均数目的:推断两个未知总体均数 与与 是否有差是否有差别别用配对设计用配对设计。X1X2X
12、01212t t 检验,亦称检验,亦称student student t t 检验检验,有下述情况有下述情况:1.t检验应用条件检验应用条件:样本含量样本含量n较小时较小时(如如n 2.145 t=11.667 2.145,所以,所以,P 0.05P 3.499t=4.5823.499,P0.01 P0.01 按按=0.05=0.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,可认,可认为不同药物治疗后病人血沉水平不同。为不同药物治疗后病人血沉水平不同。34.5821.852/8ddtSn两种类型:两种类型:n 选择一定数量的观察单位,将它们随机分为两组或多组,选择一定数量的观察
13、单位,将它们随机分为两组或多组,分别给予不同处理;分别给予不同处理;n 从两组或多组具有不同特征的人群中,分别随机抽取一定从两组或多组具有不同特征的人群中,分别随机抽取一定 数量的样本,比较某一指标在不同特征人群中是否相等。数量的样本,比较某一指标在不同特征人群中是否相等。比较目的:推断两样本各自代表的总体均数比较目的:推断两样本各自代表的总体均数1 和和2 是否是否 相同。相同。(三)完全随机设计两个样本均数的比较完全随机设计两个样本均数的比较(Two independent sample t-test)3838 t 检验条件:检验条件:两样本含量两样本含量 n1、n2 较小时,较小时,要求
14、样本来自正态分布总体,且要求两总要求样本来自正态分布总体,且要求两总体差相等(又称方差齐性)。体差相等(又称方差齐性)。两独立样本两独立样本t t检验原理检验原理n两独立样本两独立样本t t检验的检验假设是两总体均数相检验的检验假设是两总体均数相等等,即即HH0 0:1 1=2 2,也可表述为,也可表述为 1 1 2 2=0,=0,这里这里可将两样本均数的差值看成一个变量样本可将两样本均数的差值看成一个变量样本,差差值的标准误是?值的标准误是?n则在则在HH0 0条件下两独立样本均数条件下两独立样本均数t t检验可视为样检验可视为样本与已知总体均数本与已知总体均数 1 1 2 2=0=0的单样
15、本的单样本t t检验检验,统统计量计算公式为计量计算公式为 4040121212222112211212121212212()(),2 11(1)(1)11()()2 CXXXXXXnSnSSSnnXXXnnnnXtnnSS式中式中 为两样本均数之差的标准误为两样本均数之差的标准误;为两样本合并方差。为两样本合并方差。21XXS2cS4141 例例15-16 某医师分别抽取原发性高血压病人某医师分别抽取原发性高血压病人25例和脑卒中病人例和脑卒中病人27例,测定其尿酸的含量,例,测定其尿酸的含量,结果见表结果见表15-9。问原发性高血压病人和脑卒中。问原发性高血压病人和脑卒中病人的尿酸含量有无
16、差别?病人的尿酸含量有无差别?4242表表 15 9 原发性高血压病人与脑卒中病人的尿酸含量(原发性高血压病人与脑卒中病人的尿酸含量(mmol/L)组别组别 例数例数 均数均数 标准差标准差原发性高血压原发性高血压 25 221.7 86.1 脑卒中脑卒中 27 246.5 96.943431.建立假设,确定检验水准建立假设,确定检验水准 H0:1=2 H1:12 =0.054444973.05.255.2467.2212121 XXSXXt5.25272527259.84402121221nnnnSScXX9.8440127259.961271.8612521122212222112nnSn
17、SnSc2.选定检验方法,计算统计量选定检验方法,计算统计量45453.确定确定 P 值,作出推断结论值,作出推断结论 v=(n1-1)+(n2-1)=(25-1)+(27-1)=50查查 t 界值表,界值表,t0.05,50=2.009,t=0.973 t0.05,50 所以,所以,P0.05。结论:在结论:在 a=0.05 水准上,不拒绝水准上,不拒绝H0,尚不能认为,尚不能认为原发性高血压和脑卒中病人的尿酸含量不同。原发性高血压和脑卒中病人的尿酸含量不同。4646表 3-4 试验组和对照组空腹血糖下降值(mmol/L)-0.70-5.60 2.00 2.80 0.70 3.50 4.00
18、 5.80 7.10-0.50 试验组 X1(n1=20)2.50-1.60 1.70 3.00 0.40 4.50 4.60 2.50 6.00-1.40 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60-1.10 对照组 X2(n2=20)6.00 3.80 2.00 1.60 2.00 2.20 1.20 3.10 1.70-2.00 t 检验的应用条件是正态总体且方差齐性;检验的应用条件是正态总体且方差齐性;配对配对t 检验则要求每对数据差值的总体为正检验则要求每对数据差值的总体为正态总体。态总体。进行两小样本进行两小样本t检验时,一般应对资料进行检验时,一般应对资料进行方差齐性检验,尤其两样本方差悬殊时。方差齐性检验,尤其两样本方差悬殊时。若方差齐,采用一般的若方差齐,采用一般的t 检验;若方差不检验;若方差不齐,则采用齐,则采用t检验。检验。4747小结小结大样本也可近似用大样本也可近似用u u检验检验谢谢 谢!谢!