1、 医学统计学医学统计学 第四章第四章 抽样误差与假设检验抽样误差与假设检验 t t检验检验 第一节第一节 假设检验的意义和步骤假设检验的意义和步骤 ( (H Hypothesis ypothesis T Test)est) 一、假设检验的意义一、假设检验的意义 假设检验是通过两组或多组的样本统计量假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;他们相应的总体参数是否相同; 实例分析实例分析 例例1 1 以往通过大规模调查已知某地新生以往通过大规模调查已知某地新生儿出生体重为儿出生体重为3.30kg.
2、3.30kg.从该地难产儿中随从该地难产儿中随机抽取机抽取3535名新生儿作为研究样本名新生儿作为研究样本, ,平均出平均出生体重为生体重为3.42kg,3.42kg,标准差为标准差为0.40kg,0.40kg,问该地问该地难产儿出生体重是否与一般新生儿体重不难产儿出生体重是否与一般新生儿体重不同同? ?0 0=3.3=3.3已知总体X=3.42已知样本均数未知总体x0 0抽样误差=0 0非同一总体0 0?假设检验的基本思想假设检验的基本思想 假设总体参数相等,即假设总体参数相等,即= =0 0 则样本差异是由于抽样误差造成则样本差异是由于抽样误差造成,这种这种可能性有多可能性有多大?大? 小
3、概率原理: 若事件发生的概率小于若事件发生的概率小于或等于或等于0.050.05,视为小,视为小概率事件,在一次抽样中发生的可能性很小,概率事件,在一次抽样中发生的可能性很小,等同于不可能发生。等同于不可能发生。则拒绝原有假设。则拒绝原有假设。 若事件发生的概率若事件发生的概率大于大于0.050.05,则没有理由拒,则没有理由拒绝原假设,即接受假设。绝原假设,即接受假设。 利用利用t t 分布进行假设检验原理示意图分布进行假设检验原理示意图 假定难产儿的出生体重与一般新生儿体重相同,即假定难产儿的出生体重与一般新生儿体重相同,即 =0 ,则则 服从服从t 分布。分布。XSX根据根据 t 分布能
4、够计算出有如此大差异的概率分布能够计算出有如此大差异的概率P ,如果,如果P 值很小,即计算出的值很小,即计算出的t 值超出了给定的界限,则倾向于值超出了给定的界限,则倾向于拒绝拒绝H0,认为难产儿体重与一般新生儿体重有差别。,认为难产儿体重与一般新生儿体重有差别。假设检验的步骤假设检验的步骤(1)建立假设和检验水准)建立假设和检验水准 检验假设或者称无效假设(检验假设或者称无效假设(null hypothesis)null hypothesis) 用用H H0 0表示,表示,H H0 0假设是假设两总体均数相等。假设是假设两总体均数相等。 备择假设备择假设(alternative hypot
5、hesis)(alternative hypothesis) 用用H H1 1表示。表示。H H1 1是与是与H H0 0相反的假设,假设两总体均数相反的假设,假设两总体均数不相等。不相等。 检验水准检验水准( ( ) )就是我们用来区分大概率事件和小就是我们用来区分大概率事件和小概率事件的标准,是人为规定的。当某事件发生概率事件的标准,是人为规定的。当某事件发生的概率小于的概率小于 时,则认为该事件为小概率事件,时,则认为该事件为小概率事件,是不太可能发生的事件。通常是不太可能发生的事件。通常 取取0.05 0.05 。(2)计算统计量)计算统计量 根据资料类型与分析目的选择适当的公式计算出
6、统计量,比如计算出 t 值。 注意:在检验假设成立的情况下,才会出现的分布类型或公式。xsxt (3)确定概率值()确定概率值(P) 将计算得到的t值与查表得到或t,,比较 ,得到 P值的大小。根据t分布我们知道,如果| t | t/2 ,则 P ;如果| t | 。利用利用t t 分布进行假设检验原理示意图分布进行假设检验原理示意图 第二节第二节 t 检验检验 医疗卫生实践中最常见的是计量资料两组比较医疗卫生实践中最常见的是计量资料两组比较的问题;的问题;t t检验检验 ( (t t test, student test, student t t test) test)和和u u检验检验(
7、(u u test)test)是用于计量资料两组比较的最常用的假设是用于计量资料两组比较的最常用的假设检验方法检验方法 如两种疗法治疗糖尿病的疗效比较如两种疗法治疗糖尿病的疗效比较t 检验检验问题提出问题提出 根据研究设计根据研究设计t t检验可由三种形式:检验可由三种形式:单个样本的单个样本的t t检验检验配对样本均数配对样本均数t t检验检验( (非独立两样本均数非独立两样本均数t t检验检验) )两个独立样本均数两个独立样本均数t t检验检验t t检验是以检验是以t t分布为基础的分布为基础的t t分布分布tt值与值与t t分布的引入分布的引入Xu1.961.960.0250.025X0
8、N(,2)N(0,1)2XN (,) XuXXu XXtS样本均数正态分布样本均数正态分布观察值正态分布观察值正态分布t分布分布标准正态分布标准正态分布S代替代替 t t分布特征分布特征 不服从标准正态分布,小样本时服从自不服从标准正态分布,小样本时服从自 由度由度= =n n-1-1的的t t分布分布 t t分布曲线是以分布曲线是以0 0为中心的对称分布为中心的对称分布 自由度较小时自由度较小时, ,曲线峰的高度低于标准正态曲线曲线峰的高度低于标准正态曲线, ,且曲线峰的宽度也较标准正态分布曲线峰狭,且曲线峰的宽度也较标准正态分布曲线峰狭,尾部面积大于标准正态曲线尾部面积尾部面积大于标准正态
9、曲线尾部面积, ,而且自由而且自由度越小,度越小,t t分布的这种特征越明显分布的这种特征越明显 (翘尾低狭(翘尾低狭峰)峰)XSXt t分布特征分布特征 自由度自由度越大,越大,t t分布分布越接近于正态分布;越接近于正态分布;当自由度当自由度逼近逼近时,时,t t分布趋向于标准正态分布趋向于标准正态分布。分布。 自由度自由度不同,曲线不同,曲线形态不同,形态不同, t t分布是分布是一簇曲线。一簇曲线。 概率概率 、自由度、自由度 与与t t值关系值关系 tt界值界值 在在t t分布中,分布中,t t值与值与 、 的大小有关;的大小有关; 自由度一定时,自由度一定时, 越小,越小,|t|t
10、|越大;越大; 在单侧时(尾部面积取单侧)在单侧时(尾部面积取单侧)t t 界值表示为界值表示为t t , , , ,双侧时表示为双侧时表示为t t /2,/2, ,其意义为,其意义为 一定自由度一定自由度 和概率和概率 下的下的 t t值值t t , , , t t /2,/2, 可通可通过查过查t t界值表获得。界值表获得。 单侧 ,()P tt 或 ,()P tt 一、单样本一、单样本t检验检验 适用于样本均数与已知总体均数适用于样本均数与已知总体均数0 0的比较的比较, ,其比较其比较目的是检验样本均数所代表的总体均数目的是检验样本均数所代表的总体均数是否与已是否与已知总体均数知总体均
11、数0 0有差别。有差别。 已知总体均数已知总体均数0 0一般为标准值、理论值或经大量观一般为标准值、理论值或经大量观察得到的较稳定的指标值。察得到的较稳定的指标值。 单样单样t t检验的应用条件是总体标准检验的应用条件是总体标准 未知的小样本资未知的小样本资料料( ( 如如n n50), t t0.01(11)0.01(11), P P 0.01 t t t t0.05(23)0.05(23),0.01 0.01 F F0.05(11,12)0.05(11,12),P P 0.052.179,t t t0.05(12)0.05(12), , P P 0.05 0.05 按按Cochran &
12、CoxCochran & Cox法计算校正界值法计算校正界值, ,先查先查t t界值表界值表 得得t t0.05(11)0.05(11)2.2012.201,t t0.05(12)0.05(12)2.179, 2.179, 再按公式计算再按公式计算 198. 2251. 0472. 1179. 2251. 0201. 2472. 1SStStSt2X2X)(2X)(2X05. 0212211t t 检验实例分析步骤检验实例分析步骤 确定值:得确定值:得P P 0.05 0.05 两种检验方法所获得的界值虽略有差异两种检验方法所获得的界值虽略有差异, , 但结论是一致的。但结论是一致的。 按按
13、0.050.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1, , 差异有统计学意义。差异有统计学意义。 可认为两种饲料饲养后小白鼠增重的均数可认为两种饲料饲养后小白鼠增重的均数不同,高蛋白组高于低蛋白组不同,高蛋白组高于低蛋白组。05.0tt第四节第四节 t t 检验中的注意事项检验中的注意事项 1. 1. 假设检验结论正确的前提假设检验结论正确的前提 作假设检验用的样本资料,必须能代表相应的作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性总体,同时各对比组具有良好的组间均衡性, ,才能得出有意义的统计结论和有价值的专业才能得出有意义的统计结论和有价
14、值的专业结论。这要求有严密的实验设计和抽样设计结论。这要求有严密的实验设计和抽样设计, ,如样本是从同质总体中抽取的一个随机样本如样本是从同质总体中抽取的一个随机样本, ,试验单位在干预前随机分组试验单位在干预前随机分组, ,有足够的样本量有足够的样本量等。等。 2. 2. 检验方法的选用及其适用条件检验方法的选用及其适用条件 应根据分析目的、研究设计、资料类型、样应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。本量大小等选用适当的检验方法。 t t 检验是以正态分布为基础的,资料的正态检验是以正态分布为基础的,资料的正态性可用正态性检验方法检验予以判断。若资料为性可用正态
15、性检验方法检验予以判断。若资料为非正态分布,可采用数据变换的方法,尝试将资非正态分布,可采用数据变换的方法,尝试将资料变换成正态分布资料后进行分析。料变换成正态分布资料后进行分析。3.3.双侧检验与单侧检验的选择双侧检验与单侧检验的选择 需根据研究目的和专业知识予以选择。单需根据研究目的和专业知识予以选择。单侧检验和双侧检验中的侧检验和双侧检验中的t t值计算过程相同,只值计算过程相同,只是是t t界值不同,对同一资料作单侧检验更容易界值不同,对同一资料作单侧检验更容易获得显著的结果。单双侧检验的选择,应在统获得显著的结果。单双侧检验的选择,应在统计分析工作开始之前就决定,若缺乏这方面的计分析
16、工作开始之前就决定,若缺乏这方面的依据,一般应选用双侧检验。依据,一般应选用双侧检验。 4. 4.假设检验的结论不能绝对化假设检验的结论不能绝对化 假设检验统计结论的正确性是以概率作保证的,假设检验统计结论的正确性是以概率作保证的,作统计结论时不能绝对化。在报告结论时,最好列作统计结论时不能绝对化。在报告结论时,最好列出概率出概率 P P 的确切数值或给出的确切数值或给出P P值的范围,如写成值的范围,如写成0.020.02P P0.050.05,同时应注明采用的是单侧检验还是,同时应注明采用的是单侧检验还是双侧检验,以便读者与同类研究进行比较。当双侧检验,以便读者与同类研究进行比较。当 P
17、P 接近临界值时,下结论应慎重。接近临界值时,下结论应慎重。5.5.正确理解正确理解P P值的统计意义值的统计意义 P P 是指在无效假设是指在无效假设 H H0 0 的总体中进行的总体中进行随机抽样随机抽样, ,所观察到的等于或大于现有统所观察到的等于或大于现有统计量值的概率。其推断的基础是小概率事计量值的概率。其推断的基础是小概率事件的原理件的原理, ,即概率很小的事件在一次抽样即概率很小的事件在一次抽样研究中几乎是不可能发生的,如发生则拒研究中几乎是不可能发生的,如发生则拒绝绝H H0 0。因此,只能说明统计学意义的。因此,只能说明统计学意义的“显显著著” ” 。 6. 6.假设检验和可
18、信区间的关系假设检验和可信区间的关系 假设检验用以推断总体均数间是否相假设检验用以推断总体均数间是否相同,而可信区间则用于估计总体均数所同,而可信区间则用于估计总体均数所在的范围,两者既有联系又有区别。在的范围,两者既有联系又有区别。第五节第五节 假设检验中两类错误假设检验中两类错误 假设检验是针对假设检验是针对H H0 0,利用小概率事件的原,利用小概率事件的原理对总体参数做出统计推论。无论拒绝理对总体参数做出统计推论。无论拒绝H H0 0还是接受还是接受H H0 0,都可能犯错误。,都可能犯错误。 对于一般的假设检验,对于一般的假设检验, 定为定为0.050.05,b b的大小取决于的大小
19、取决于H H1 1。通常情况下,比较总。通常情况下,比较总体间有无差异并不知道,即体间有无差异并不知道,即H H1 1不明确,不明确, b b值的大小无法确定,也就是说,对于一般值的大小无法确定,也就是说,对于一般的假设检验,我们并不知道犯的假设检验,我们并不知道犯型错误的型错误的概率概率b b有多大有多大。通常情况下通常情况下型错误未知型错误未知 b b减少(增加)减少(增加)I型错误型错误,将会,将会增加(减少)增加(减少)II型错误型错误增大增大n 同时降低同时降低 与与 b b 与与 b b 间的关系间的关系 假设检验假设检验有三个有三个基本步骤基本步骤: 建立假设和确定检验水准,通常选建立假设和确定检验水准,通常选 选择检验方法和计算检验统计量选择检验方法和计算检验统计量 确定确定P P 值和做出统计推断结论值和做出统计推断结论 所有的假设检验都按照这三个步骤进行,各种检所有的假设检验都按照这三个步骤进行,各种检验方法的差别在于第步计算的检验统计量不同。验方法的差别在于第步计算的检验统计量不同。050.
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。