1、抽样误差与假设检验t检验1 统计推断:用样本信息推论总体特征的过程。统计推断:用样本信息推论总体特征的过程。包括:包括:参数估计参数估计:运用统计学原理,用从样本计算出运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差在的差别对样本所代表的总体间是否存在着差别做出判断。别做出判断。方法:均数的参数估计、均数方法:均数的参数估计、均数t 检验检验2一、抽样误差与标准误一、抽样误差与标准误(一)概念(一)概念 1、抽
2、样误差抽样误差:是伴随抽样所产生的样本统是伴随抽样所产生的样本统计量与参数之间的差别。计量与参数之间的差别。2、标准误标准误:符号:符号 ,表示抽,表示抽样误差大小的指标;也称为样本均数的标准样误差大小的指标;也称为样本均数的标准差;反映了用样本均数代替总体均数的可靠差;反映了用样本均数代替总体均数的可靠性程度的大小,增加样本容量可以降低抽样性程度的大小,增加样本容量可以降低抽样误差。误差。)xxs、(抽样误差与抽样分布抽样误差与抽样分布3(二)、表达式与计算(二)、表达式与计算nsxnxs 样本均数的标准差,也称为标准样本均数的标准差,也称为标准误,反映了样本均数间的离散程误,反映了样本均数
3、间的离散程度,也反映了样本均数与总体均度,也反映了样本均数与总体均数的差异。数的差异。例例4.1 某市随机抽查某市随机抽查12岁男孩岁男孩100人,得身高均数人,得身高均数139.6cm,标标准差准差6.85cm,计算标准误。计算标准误。)(685.010085.6cmnsxs4标准差与标准误联系与区别标准差与标准误联系与区别标准差标准差标准误标准误含含义义测量值的离散程度测量值的离散程度样本均数的离散程度样本均数的离散程度(统计量对参数的散度)(统计量对参数的散度)计计算算大大小小大大小小用用途途描述测量值离散程度、描述测量值离散程度、计算计算cv、计算正常值范、计算正常值范围、计算标准误围
4、、计算标准误参数可信区间的估计参数可信区间的估计假设检验,表达误差的内涵假设检验,表达误差的内涵联联系系都是离散程度的指标都是离散程度的指标,标准误是通过标准差来计算标准误是通过标准差来计算1)()(22nxxnxsnsnxsx5二、抽样分布、抽样分布从正态总体中抽样,样本均数(从正态总体中抽样,样本均数()的抽样分布:)的抽样分布:1.n较大时(较大时(n50),服从正态分布服从正态分布,经过标准化转换经过标准化转换 服从标准正态分布即服从标准正态分布即 u分布分布2.n较小时(较小时(n50),),是非正态的单峰对称分布是非正态的单峰对称分布 就有小样本统计量就有小样本统计量()的转换值服
5、从的转换值服从t分布分布(是一组曲线)。(是一组曲线)。xxxuxxxsxt6抽样分布抽样分布7事先给定的概率1-称为可信度,常取95%或99%(1)统计意义:从总体中作大数次随机抽样,有95%求得的可信区间包含总体均数。1、建立检验假设,确定检验水准(2)同一受试对象或同一样本的两个部分,分别接受两种不同处理:5次/分,n=30,由于已知 ,故选用单样本t检验()2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。如:把服用两种降糖药的病人配成对(1)t分布法(未知,n50)1 16.(2)可得到一个样本均数及该样本标准误;根据大量调查,已知健康成年男子脉搏的均数为72
6、次/分,某医生在一山区随机调查了30名健康成年男子,求得脉搏均数为74.男 193 3.()2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。查表2,可得 t 0.本例中:n=100,=139.自由度:对子数-1假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。概率论:事件的发生不是绝对的,只是可能性大小而已。单个样本t检验:是样本均数 代表的总体均数 和已知总体均数 的比较.3 1.英国统计学家:哥塞德在英国统计学家:哥塞德在1908年以笔名年以笔名“student”提出了著名的提出了著名的t分布,故也称为分布,故也称为stu
7、dent t分布。分布。t分布是描述小样本均值转换度的分布。分布是描述小样本均值转换度的分布。1、从正态总体中抽样,大样本均数的转换值服从、从正态总体中抽样,大样本均数的转换值服从标准正太分布标准正太分布2、小样本均数的转换值服从、小样本均数的转换值服从t分布分布8(1)tu(n)(2)和)和N(0,1)一样都是单峰分布,以一样都是单峰分布,以0为中心对为中心对称称(3)越小,则越小,则 越大,越大,t值越分散,和值越分散,和N(0,1)相比,集中在这部分的比例越少,尾部相比,集中在这部分的比例越少,尾部翘得越高。翘得越高。sx 2、t分布的特征分布的特征910t 分布(与分布(与u 分布分布
8、 比较的特点)比较的特点)11 横坐标为自由度横坐标为自由度 ,纵坐标为概率,纵坐标为概率p,表中数字表示自由度为表中数字表示自由度为 、p为为 、t的界值,的界值,记记 如单侧如单侧 =0.05,=20可查得可查得 =1.725 表示表示p(t1.725)=0.05 由由t分布的对称性分布的对称性p(t-1.725)=0.05 t,以外尾部面积的百分数是以外尾部面积的百分数是 3、t界值表界值表1 n)(t)(t12 的界值的界值)(2/05.0t13与u分布比较 U的临界值小于的临界值小于t曲线相应的临界值的绝对曲线相应的临界值的绝对值值当当n时,临界值相近。时,临界值相近。自由度越小,自
9、由度越小,t的临界点越偏离的临界点越偏离u的临界点。的临界点。14总体均数的参数估计总体均数的参数估计 参数估计:是指由样本指标值(统计参数估计:是指由样本指标值(统计量)估计总体指标值(参数)量)估计总体指标值(参数),即用即用样本均数估计总体均数,有两种估计样本均数估计总体均数,有两种估计方法:方法:(1)、点估计、点估计(近似值)(近似值)(2)、区间估计、区间估计(近似范围)(近似范围)15一、点估计一、点估计 点估计点估计:用样本均数直接作为总体均数的估计用样本均数直接作为总体均数的估计值值,未考虑抽样误差。未考虑抽样误差。如用如用 估计相应的估计相应的 当当 时时,样本均值趋近于总
10、体均样本均值趋近于总体均值值.如果如果 ,则则 更可靠更可靠.x)(n21xxss 2xs16二、区间估计二、区间估计 1、概念、概念 可信区间:也称为置信区间(可信区间:也称为置信区间(confidence interval,CI),是按预先给定的概率估计未知总体是按预先给定的概率估计未知总体均数的可能范围均数的可能范围.事先给定的概率事先给定的概率1-称为可信度,常取称为可信度,常取95%或或99%总体均数的总体均数的95%(或(或99%)可信区间:表示该)可信区间:表示该区间包括总体均数区间包括总体均数的概率为的概率为95%(或(或99%).17 根据总体标准差根据总体标准差是否已知,以
11、及样本含量是否已知,以及样本含量n的大小而异。的大小而异。(1)t分布法(n50)2、计算方法、计算方法18(1)t分布法(分布法(未知,未知,n50)总体均数的可信区间总体均数的可信区间.已知已知:未知但未知但n足够大足够大:),(2/2/nuxnux),(2/2/nsuxnsux21差别无显著性,或无统计意义,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。参数估计:运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。单个样本t检验:是样本均数 代表的总体均数 和已知总体均数 的比较.例 某医师测得40名老年慢性支气管炎病人中17-酮类固醇排
12、除量均数为15.=n1+n2-2=12+13-2=23;7 -0.统计显著性与其它专业上的显著性的意义不同6 0 02、标准误:符号 ,表示抽样误差大小的指标;(1)当 p ,拒绝 H0,接受H1,按接受H1下结论,可能犯错误;所代表的总体均数间有无差别。3 13.可信区间比假设检验可提供更多的信息t,以外尾部面积的百分数是根据大量调查,已知健康成年男子脉搏的均数为72次/分,某医生在一山区随机调查了30名健康成年男子,求得脉搏均数为74.(统计量对参数的散度)山区成年男子平均脉搏数与一般成年男子不同。单个样本t检验:是样本均数 代表的总体均数 和已知总体均数 的比较.01),区分大小概率事件
13、的标准.t,以外尾部面积的百分数是H1:12,即不同性别健康人群 脂蛋白有差别;u可以查表可以查表 某地某地12岁男孩身高均数的岁男孩身高均数的95%的可信区间的可信区间.本例中本例中:n=100,=139.6,s=6.85,u0.05=1.96 该地该地12岁男孩身高均数的岁男孩身高均数的95%可信区间为可信区间为:138.3(cm)141.0(cm)x),即(0.1413.138)10085.696.16.139,10085.696.16.139(22注意(1)统计意义:从总体中作大数次随机抽)统计意义:从总体中作大数次随机抽样,有样,有95%求得的可信区间包含总体均数。求得的可信区间包含
14、总体均数。并不是做一次抽样求得可信区间包括并不是做一次抽样求得可信区间包括的概的概率是率是0.95,对一次抽样而言只有两种可能,对一次抽样而言只有两种可能,要么可信区间包含要么可信区间包含,要么不包含,要么不包含。(2)与医学正常值范围不同)与医学正常值范围不同23正常值范围估计与可信区间估计正常值范围估计与可信区间估计正常值范围正常值范围概念:绝大多数正常人的某概念:绝大多数正常人的某指标范围。(指标范围。(95%,99%,指绝大多数正常人)指绝大多数正常人)计算公式:计算公式:用途:判断观察对象的用途:判断观察对象的某项指标是否正常某项指标是否正常.可信区间可信区间概念:总体均数所在的数概
15、念:总体均数所在的数值值范围(范围(95%,99%指可信指可信度)度)计算公式:计算公式:用途:估计总体均数用途:估计总体均数24 假设检验(假设检验(hypothesis test)也称显著性检验)也称显著性检验(significance test)。二十世纪二、三十年代。二十世纪二、三十年代Neyman和和Pearson建立了统计假设检验问题的建立了统计假设检验问题的数学模型。数学模型。假设检验假设检验:建立在统计抽样分布建立在统计抽样分布,小概率事件原理小概率事件原理基础上的对差别性质进行风险推断的一种逻辑思基础上的对差别性质进行风险推断的一种逻辑思维方法维方法.25假设检验:假设检验:
16、1、原因2、目的3、原理4、过程(步骤)、过程(步骤)5、结果261、假设检验的原因、假设检验的原因 由于个体差异的存在,即使从同一总体中由于个体差异的存在,即使从同一总体中严格的随机抽样,严格的随机抽样,X1、X2、X3、X4、,、,不同。不同。因此,因此,X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性造成了样本均数的差别。差别无显著性。(2)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。27 根据大量调查,已
17、知健康成年男子脉搏的根据大量调查,已知健康成年男子脉搏的均数为均数为72次次/分,某医生在一山区随机调查分,某医生在一山区随机调查了了30名健康成年男子,求得脉搏均数为名健康成年男子,求得脉搏均数为74.2次次/分分,标准差为标准差为6.5次次/分,能否据此认分,能否据此认为该山区成年男子的脉搏均数高于一般人为该山区成年男子的脉搏均数高于一般人?283、确定P值,作出推断结论05的水准拒绝H0,接受H1,差异有统计学意义。5次/分,n=30,由于已知 ,故选用单样本t检验(1)t分布法(n,不能拒绝 H0,不能接受H1,按不能接受H1下结论,也可能犯错误;(95%,99%,指绝大多数正常人)山
18、区成年男子平均脉搏数与一般成年男子不同。我们当然不能强求脉搏均数恰为我们当然不能强求脉搏均数恰为72次次/分时,分时,才认为山区成年男子的脉搏均数和一般人一才认为山区成年男子的脉搏均数和一般人一样,因为即使一样由于抽样误差的存在,样样,因为即使一样由于抽样误差的存在,样本均数未必等于本均数未必等于72,造成山区健康成年男子,造成山区健康成年男子的脉搏样本均数与一般人不同的原因有的脉搏样本均数与一般人不同的原因有:抽样误差抽样误差 环境因素的影响环境因素的影响要回答这一问题就是假设检验问题要回答这一问题就是假设检验问题292、假设检验的目的、假设检验的目的l判断是由于何种原因造成的不同,以做判断
19、是由于何种原因造成的不同,以做出决策。出决策。(推断参数是否相等推断参数是否相等)0100:H:H无效假设无效假设备择假设备择假设30 反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可能A和和B,为了肯定其中的一种情况为了肯定其中的一种情况A,但又不能直接证实,但又不能直接证实A,这时否定另一种可能这时否定另一种可能B,则间接的肯定了,则间接的肯定了A。小概率事件原理小概率事件原理:小概率事件在一次抽样中不可小概率事件在一次抽样中不可能发生能发生.概率论:事件的发生不是绝对的,只是可能性大概率论:事件的发生不是绝对的,只是可能性大小而已。即小而已。即,带有风险性的推断带有
20、风险性的推断.31 建立一对假设建立一对假设(注意单双侧注意单双侧)确定显著性水准(确定显著性水准():无效假设无效假设(H0):两个总体均数相等;:两个总体均数相等;备择假设备择假设(H1):与与 H0 相反相反;预先给定的概率值预先给定的概率值(0.05或或0.01),区分大小概率事件的标准区分大小概率事件的标准.如上例,如上例,H0:1=72 H1:172 =0.05 计算统计量:计算统计量:(选择不同的统计方法:选择不同的统计方法:u检验检验,t检验检验,F检验等检验等)确定概率值确定概率值p和做出统计推断结论和做出统计推断结论:(p值实际得到犯一类错误的可能性值实际得到犯一类错误的可
21、能性,p,则统计推断为按则统计推断为按检验水准检验水准,接受接受H0,拒绝拒绝H1)325、假设检验的结果、假设检验的结果 接受无效假设无效假设 拒绝无效假设拒绝无效假设 正确理解结论的概率性(都隐含着犯错误的可能正确理解结论的概率性(都隐含着犯错误的可能性)。性)。33六、均数的假设检验 t检验(t test)也称student t检验,是计量资料中最常用的假设检验方法,它以t分布为基础.本章将要介绍 单个样本的单个样本的t检验检验 (样本均值与总体均值的比较样本均值与总体均值的比较)配对样本配对样本t检验检验 两独立样本的两独立样本的t检验检验 (两样本均值的比较两样本均值的比较,方差方差
22、一致一致)340 12.范围(95%,99%指可信度)横坐标为自由度 ,纵坐标为概率p,表中数字表示自由度为 、p为 、t的界值,记3、确定P值 不必查表,双侧检验以u1.两独立样本的t检验 (两样本均值的比较,方差一致)该地12岁男孩身高均数的95%可信区间为:7 -0.如:把服用两种降糖药的病人配成对配对设计资料主要有三种类型:就有小样本统计量()的转换值服从t分布查表2,可得 t 0.单个样本t检验:是样本均数 代表的总体均数 和已知总体均数 的比较.反映了用样本均数代替总体均数的可靠性程度的大小,增加样本容量可以降低抽样误差。男 193 3.(2)、区间估计(近似范围)(2)同一受试对
23、象或同一样本的两个部分,分别接受两种不同处理:1、从正态总体中抽样,大样本均数的转换值服从标准正太分布(2)可得到一个样本均数及该样本标准误;3 1.3 1.单个样本单个样本t检验检验 单个样本单个样本t检验检验:是样本均数是样本均数 代表的总体均代表的总体均数数 和已知总体均数和已知总体均数 的比较的比较.适用条件:适用条件:(1)已知一个总体均数;已知一个总体均数;(2)可得到一个样本均数及该样本标准误;可得到一个样本均数及该样本标准误;(3)样本量小于样本量小于50;(4)样本来自正态或近似正态总体。样本来自正态或近似正态总体。x035 例例:根据大量调查根据大量调查,已知健康成年男子的
24、脉已知健康成年男子的脉搏均数为搏均数为72次次/分分.某医生在某山区随机调查某医生在某山区随机调查30名健康男子名健康男子,求得脉搏均数为求得脉搏均数为74.2次次/分分,标准差为标准差为6.5次次/分分.能否认为该山区的成年能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏男子的脉搏均数高于一般成年男子的脉搏均数均数?36因本例已知因本例已知 =72次次/分分,=74.2次次/分分,s=6.5次次/分分,n=30,由于已知由于已知 ,故选用单样本故选用单样本t检验检验0 x0 1 1、建立检验假设,确定概率水准、建立检验假设,确定概率水准 山区成年男子平均脉搏数与一般成年男子相同。山区
25、成年男子平均脉搏数与一般成年男子相同。山区成年男子平均脉搏数与一般成年男子不同。山区成年男子平均脉搏数与一般成年男子不同。2 2、计算检验统计量、计算检验统计量 在=0成立的条件下,计算统计量为:05.0:0100HH85.1305.6722.7400nsxsxtx373 3、确定、确定p p值,做出推断结论值,做出推断结论1301 n查表查表2,可得,可得 t 0.05/2(29)=2.045 今今t0.05,无统计学意义,按无统计学意义,按水准,不拒绝水准,不拒绝H0,尚不能认为该山区成年男,尚不能认为该山区成年男子平均每分钟脉搏数高于一般成年男子。子平均每分钟脉搏数高于一般成年男子。38
26、配对样本配对样本t检验检验 配对样本配对样本t检验实际上是配对设计的差值均数检验实际上是配对设计的差值均数与总体均数与总体均数0比较的比较的t检验检验 配对样本配对样本t检验的基本原理是假设两种处理的检验的基本原理是假设两种处理的效应相同效应相同,即即1=2,则则1-2=0(即即,已知总体均已知总体均数数d=0),即检验差数的样本均数即检验差数的样本均数 所代表的所代表的未知总体均数未知总体均数d 与与0的比较的比较.d39 公式:公式:自由度:对子数自由度:对子数-1 适用条件:两组配对计量资料。适用条件:两组配对计量资料。nsdsdsdtdddd040(1 1)两种同质受试对象分别接受两种
27、处理:)两种同质受试对象分别接受两种处理:如:把同窝、同性别和体重相近的动物配成一对。(2 2)同一受试对象或同一样本的两个部分,分)同一受试对象或同一样本的两个部分,分别接受两种不同处理:别接受两种不同处理:如:把服用两种降糖药的病人配成对(3 3)同一受试对象处理(实验或治疗)前后的)同一受试对象处理(实验或治疗)前后的结果比较:结果比较:如:对高血压患者治疗前后 配对设计资料主要有三种类型:配对设计资料主要有三种类型:41患者编号(1)舒张压(Kpa)治疗前后差数d(4)(2)(3)d2(5)=(4)*(4)手术前(2)手术后(2)1 16.0 12.0 4.0 16.002 12.0
28、13.3 -1.3 1.693 14.6 10.6 4.0 16.00 4 13.3 12.0 1.3 1.695 12.0 12.0 0 06 12.0 10.6 1.4 1.967 14.6 10.6 4.0 16.008 14.6 14.6 0 09 12.0 12.7 -0.7 0.4910 13.3 13.3 0 0合计 12.7 53.83d2d42例例15-11 15-11 某医院在研究肾动脉成形术前后血液动力学某医院在研究肾动脉成形术前后血液动力学的的 改变中,观察了改变中,观察了1010例病人手术前后的例病人手术前后的 血压变化情血压变化情况见表况见表15-615-6,试问手
29、术前后舒张压有无变化?,试问手术前后舒张压有无变化?1 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准H H0 0:d d=0,=0,即假设手术前后舒张压无变化,样本即假设手术前后舒张压无变化,样本 是从差数均数为是从差数均数为0 0的总体中抽得。的总体中抽得。H1H1:d d 0 0,即手术前后舒张压有变化。,即手术前后舒张压有变化。=0.05=0.0543 2 2、计算检验统计量、计算检验统计量 先计算差值先计算差值d d及及d d2 2,得得 计算差值均数计算差值均数 计算差值的标准差计算差值的标准差 计算差值的标准误得计算差值的标准误得83.53,7.122dd27.110
30、7.12ndd05.21)(22nnddds65.0464.34909.2nsdds446、可信区间与假设检验的联系与区别差别有显著性,或有统计意义,指我们有很大的把握认为原假设不正确,并非是说它们有较大的差别。0 12.1、建立检验假设,确定概率水准3、假设检验的原理/思想可信区间比假设检验可提供更多的信息7 -0.建立一对假设(注意单双侧)确定显著性水准():性别 人数 均值 标准差预先给定的概率值(0.05/2(29)故,p0.自由度越小,t的临界点越偏离u的临界点。7 -0.1、建立检验假设,确定检验水准配对样本t检验实际上是配对设计的差值均数与总体均数0比较的t检验如单侧 =0.3
31、25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L)如表5-2 所示,问两种疗法治疗后患者血糖值是否相同?0 16.2选用的假设检验方法应符合其应用条件(2)可得到一个样本均数及该样本标准误;计算计算t t值值95.165.027.1dsdt、确定、确定p p值,作出推断结论值,作出推断结论 自由度自由度n-1=10-1=9,n-1=10-1=9,t t 0.05(9)0.05(9)=2.262=2.262本例本例t t t t0.05(11)0.05(11),p,p0.05,0.05,按按0.050.05检验水检验水准,不拒绝准,
32、不拒绝H H0 0,即还不能认为手术前后的舒即还不能认为手术前后的舒张压不同。张压不同。45两独立样本的两独立样本的t检验检验 目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。计算公式及意义:计算公式及意义:公式:公式:2121xxxxts2)1()1(2)()()11(112222112212222212121221212nnsnsnnnnxxnxxnnsxxcccsss46 应用条件应用条件:(1 1)已知)已知/可计算两个样本均数及它们的标可计算两个样本均数及它们的标准差准差 ;(2 2)两个样本之一的例数
33、少于)两个样本之一的例数少于5050;(3 3)样本来自正态或近似正态总体;样本来自正态或近似正态总体;(4 4)方差齐方差齐。自由度:自由度:n1+n2 2 47两独立样本两独立样本t t检验检验实例分析实例分析 例例5.3 255.3 25例糖尿病患者随机分成两组,例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖合并饮食疗法,二个月后测空腹血糖(mmol/L)(mmol/L)如表如表5-2 5-2 所示,问两种疗法治疗所示,问两种疗法治疗后患者血糖值是否相同?后患者血糖值是否相同?48表 5-2 25 名糖尿
34、病患者两种疗法治疗后二个月血糖值(mmol/L)编号 甲组血糖值(X2)编号 乙组血糖值(X2)1 8.4 1 5.4 2 10.5 2 6.4 3 12.0 3 6.4 4 12.0 4 7.5 5 13.9 5 7.6 6 15.3 6 8.1 7 16.7 7 11.6 8 18.0 8 12.0 9 18.7 9 13.4 10 20.7 10 13.5 11 21.1 11 14.8 12 15.2 12 15.6 13 18.7 49两独立样本两独立样本t t检验检验检验步骤检验步骤 1 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准H H0 0:1 1=2 2,两种疗
35、法治疗后患者血糖值的总体,两种疗法治疗后患者血糖值的总体均数相同均数相同;H H1 1:1 1 2 2,两种疗法治疗后患者血糖值的总体,两种疗法治疗后患者血糖值的总体均数不同;均数不同;0.050.05。2 2、计算检验统计量、计算检验统计量50两独立样本两独立样本t t检验检验检验步骤检验步骤由 原 始 数据 算 得:n1=12,X1=182.5,X12=2953.43,n2=13,X2=141.0,X22=1743.16,1X=X1/n1=182.5/12=15.21,2X=X2/n2=14.16/13=10.85 代入公式,得代入公式,得:51两独立样本两独立样本t t检验检验实例分析实
36、例分析按公式计算,算得按公式计算,算得:3 3、确定、确定P P值,作出推断结论值,作出推断结论两独立样本两独立样本t t检验自由度为检验自由度为 =n n1 1+n n2 2-2-2=12+13-2=23=12+13-2=23;查查t t界值表,界值表,t t0.05(23)0.05(23)=2.069=2.069,t t0.01(23)0.01(23)=2.807.=2.807.639.2652.185.1021.15t52两独立样本两独立样本t t检验检验实例分析实例分析由于由于 t t0.01(23)0.01(23)t t t t0.05(23)0.05(23),0.01 0.01 P
37、 P 0.050.05,按按 0.050.05的水准拒绝的水准拒绝H H0 0,接受,接受H H1 1,差异有统计学意义。,差异有统计学意义。故可认为该地两种疗法治疗糖尿病患者二个月后测得故可认为该地两种疗法治疗糖尿病患者二个月后测得的空腹血糖值的均数不同。的空腹血糖值的均数不同。几何均数资料几何均数资料 t t 检验,服从对数正态分布,先作对数变检验,服从对数正态分布,先作对数变换,再作换,再作 t t 检验。检验。53配对配对两样本两样本随机分配随机分配多次对间随机多次对间随机完全随机完全随机计算方法计算方法误差内涵误差内涵测量误差测量误差抽样误差抽样误差误差大小误差大小小小大大效率效率高
38、高低低ddsdt2121xxxxts54两样本含量较大时均数的比较 当样本含量较大时,可用u检验法某医院对4050岁年龄组的男、女不同性别的健康人群测定了 脂蛋白有无差别?性别 人数 均值 标准差男 193 3.97 1.04女 128 3.58 0.9055 1、建立假设并确定检验水准、建立假设并确定检验水准 H H0 0:1 1=2 2,即不同性别健康人群即不同性别健康人群 脂蛋白无脂蛋白无差别;差别;H H1 1:1 1 2 2,即不同性别健康人群即不同性别健康人群 脂蛋白有脂蛋白有差别;差别;=0.05=0.0556 2、计算、计算u值值 57.322212121222121nsnsx
39、xssxxuxx57 3、确定、确定P值值 不必查表,双侧检验以不必查表,双侧检验以u u1.961.96时、时、P P0.050.05,今,今u u3.753.751.961.96,故,故p p0.050.05。按。按=0.05=0.05的水准,拒绝的水准,拒绝H0H0,接受,接受H1H1。认为男性。认为男性 脂蛋白含量高于女性脂蛋白含量高于女性 脂蛋白含量。脂蛋白含量。58t检验中的注意事项检验中的注意事项 1.1.要有严密的抽样研究计划要有严密的抽样研究计划 要保证样本是从同质总体中随机抽取。要保证样本是从同质总体中随机抽取。除了对比的因素外,其它影响结果的因素应一致。除了对比的因素外,
40、其它影响结果的因素应一致。2 2选用的假设检验方法应符合其应用条件选用的假设检验方法应符合其应用条件要了解变量的类型是计量的还是计数的,设计类型是配对设要了解变量的类型是计量的还是计数的,设计类型是配对设计还是成组设计,是大样本还是小样本。计还是成组设计,是大样本还是小样本。59假设检验的结论是根据概率推断的,所以不是绝假设检验的结论是根据概率推断的,所以不是绝对正确的:对正确的:(1)当 p ,不能拒绝不能拒绝 H0,不能接受不能接受H1,按,按不能接受不能接受H1下结论,也可能犯错误;下结论,也可能犯错误;3.3.正确理解假设检验的结论(概率性)正确理解假设检验的结论(概率性)604.4.
41、正确理解差别有无显著性的统计意义正确理解差别有无显著性的统计意义差别有显著性,或有统计意义,指我们有很大的把握认为差别有显著性,或有统计意义,指我们有很大的把握认为原假设不正确,并非是说它们有较大的差别。原假设不正确,并非是说它们有较大的差别。差别无显著性,或无统计意义,我们只是认为以很大的把差别无显著性,或无统计意义,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相握拒绝原假设的理由还不够充分,并不意味着我们很相信它。信它。5.5.统计显著性与其它专业上的显著性的意义不统计显著性与其它专业上的显著性的意义不同同616 6、可信区间与假设检验的联系与区别、可信区间与假设检
42、验的联系与区别 1.1.可信区间也可以回答假设检验的问题可信区间也可以回答假设检验的问题 2.2.可信区间比假设检验可提供更多的信息可信区间比假设检验可提供更多的信息根据研究的目的和专业知识来决定单双侧,根据研究的目的和专业知识来决定单双侧,在没有特别说明的情况下通常采取双侧。在没有特别说明的情况下通常采取双侧。7.7.单侧检验与双侧检验单侧检验与双侧检验62自由度:对子数-14 1.6 14.01),区分大小概率事件的标准.事先给定的概率1-称为可信度,常取95%或99%H0:1=2,两种疗法治疗后患者血糖值的总体均数相同;8 14.2选用的假设检验方法应符合其应用条件05的水准,拒绝H0,
43、接受H1。计算差值的标准差 计算差值的标准误得()2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。3 25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L)如表5-2 所示,问两种疗法治疗后患者血糖值是否相同?合计 12.在没有特别说明的情况下通常采取双侧。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。6 10.()1标准误是一种特殊的标准差,其表示抽样误差的大小。4、假设检验的一般步骤9mol/d,标准差为5.()2N一定时,测量值的离散程度越小,用样本均数估计
44、总体均数的抽样误差就越小。1 16.假设检验中两类错误假设检验中两类错误假设检验的结果有两种。假设检验的结果有两种。(1)当拒绝拒绝 H0 时时,可能犯错误,可能可能犯错误,可能拒绝了实际上成立的拒绝了实际上成立的H0,称为称为 类错误(类错误(“弃真弃真”的错误的错误),其概率大小用),其概率大小用 表示。表示。(2)当)当不能拒绝不能拒绝 H0 时,也可能犯错误,时,也可能犯错误,没有拒绝实际上没有拒绝实际上不成立的不成立的H0,这类称为这类称为 II 类错误(类错误(“存伪存伪”的错误)的错误),其其概率大小用概率大小用 表示表示,值一般不能确切的知道。值一般不能确切的知道。63是非判断:()1标准误是一种特殊的标准差,其表示抽样误差的大小。()2N一定时,测量值的离散程度越小,用样本均数估计总体均数的抽样误差就越小。()3假设检验的目的是要判断两个样本均数的差别有多大。64