1、医疗统计学总体均数的估计与假设检验第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误2医疗统计学总体均数的估计与假设检验统计推断:由样本信息推断总体特征统计推断:由样本信息推断总体特征。样本统计指标样本统计指标(统计量)(统计量)总体统计指标总体统计指标(参数)(参数)正态(分布)总体:正态(分布)总体:推断推断 !说明!说明!为说明抽样误差规律,先用一个实例,后为说明抽样误差规律,先用一个实例,后引出理论。引出理论。2(,)N 3医疗统计学总体均数的估计与假设检验 jjXS 167.41,2.74 165.56,6.57 168.20,5.36 165.69,5.09 nj=10 1
2、00 个 =167.7cm =5.3cm X1,X2,X3,Xi,例例 3-1 若若某某市市 1999 年年 18岁岁男男生生身身高高服服从从均均数数=167.7cm、标标准准差差 =5.3cm 的的正正态态分分布布。对对该该总总体体进进行行随随机机抽抽样样,每每次次抽抽 10 人人,(jn=10),共共抽抽得得 100 个个样样本本(g=100),计计算算得得每每个个样样本本均均数数jX及及标标准准差差jS如如图图 3-1 和和表表 3-1 所所示示。图图3-1 1999年某市年某市18岁男生身高岁男生身高N(167.7,5.32)的抽样示意图的抽样示意图 4医疗统计学总体均数的估计与假设检
3、验见见P3436表表3-15 将此将此100个样本均数看成个样本均数看成新变量值新变量值,则这,则这100个样本均数构成一个样本均数构成一新分布新分布,绘制直方图。,绘制直方图。图图3-2 从正态分布总体从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布随机抽样所得样本均数分布6医疗统计学总体均数的估计与假设检验 ,各样本均数各样本均数 未必等于总体均数;未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样本均数的分布为中间多,两边少,左右基本样本均数的分布为中间多,两边少,左右基本对称。对称。样本均数的变异范围较之原变量的变异范围大样本均数的变异范围较之原变量的变异
4、范围大大缩小。大缩小。可算得这可算得这100个样本均数的均数为个样本均数的均数为167.69cm、标准、标准差为差为1.69cm。XX 样本均数的抽样分布具有如下样本均数的抽样分布具有如下特点:特点:7医疗统计学总体均数的估计与假设检验1、抽样误差:、抽样误差:由个体变异产生的、抽样造成的样由个体变异产生的、抽样造成的样本统计量与总体参数的差别本统计量与总体参数的差别 均数的抽样误差:均数的抽样误差:由于抽样造成的由于抽样造成的样本均数与总体均数的差别样本均数与总体均数的差别 原因:原因:1 1)抽样)抽样 2 2)个体差异)个体差异8医疗统计学总体均数的估计与假设检验同理,在非正态分布总体中
5、也可进行类似的抽样同理,在非正态分布总体中也可进行类似的抽样研究。研究。若若iX服从正态分布服从正态分布 则则 jX服从正态分布服从正态分布 n大:大:则则 jX近似服从正态分布近似服从正态分布 若若iX不服从正态分布不服从正态分布 n小:小:则则 jX为非正态分布为非正态分布 本书以本书以n=60n=60为界限为界限9医疗统计学总体均数的估计与假设检验表示表示样本统计量样本统计量抽样误差大小的统计抽样误差大小的统计指标。指标。均数标准误:均数标准误:说明均数抽样误差的说明均数抽样误差的大小,总体计算公式大小,总体计算公式(3-1)Xn2、标准误标准误(standard error,SE)实质
6、:样本均数的标准差实质:样本均数的标准差10医疗统计学总体均数的估计与假设检验XX;XX。数理统计证明:数理统计证明:11医疗统计学总体均数的估计与假设检验若用样本标准差若用样本标准差S 来估计来估计 ,(3-2)降低抽样误差的途径有降低抽样误差的途径有:通过增加样本含量通过增加样本含量n;通过设计减少通过设计减少S。XSSn12医疗统计学总体均数的估计与假设检验第二节第二节 t 分布分布(t-distribution)13医疗统计学总体均数的估计与假设检验1 若若 某某 一一 随随 机机 变变 量量X 服服 从从 总总 体体 均均 数数 为为、总总 体体标标 准准 差差 为为的的 正正 态态
7、 分分 布布2(,)N,则则 可可 通通 过过u变变 换换(X)将将 一一 般般 正正 态态 分分 布布 转转 化化 为为 标标 准准 正正 态态 分分 布布 N(0,12),即即 u 分分 布布;一、一、t 分布分布的概念的概念 14医疗统计学总体均数的估计与假设检验2若样本均数若样本均数X服从总体均数为服从总体均数为、总体标准差为总体标准差为X的正态分布的正态分布2(,)XN,则通则通过同样方式的过同样方式的 u 变换变换(XX)也可将其转换为也可将其转换为标准正态分布标准正态分布 N(0,12),即,即 u 分布分布。15医疗统计学总体均数的估计与假设检验,1XXXtnSSn 式中式中
8、为自由度为自由度(degree of freedom,df)3实际工作中,由于实际工作中,由于 未知,用未知,用 代替,代替,则则 不再服从标准正态分布,而不再服从标准正态分布,而服从服从t t 分布。分布。XXS()/XXS16医疗统计学总体均数的估计与假设检验t 分分 布布 是是 一一 簇簇 曲曲 线线。当当 自自 由由 度度不不 同同 时时,曲曲 线线的的 形形 状状 不不 同同。当当 时时,t 分分 布布 趋趋 近近 于于 标标 准准 正正态态 分分 布布,但但 当当 自自 由由 度度较较 小小 时时,与与 标标 准准 正正 态态 分分 布布 差差异异 较较 大大。其其 图图 形形 如
9、如 下下:二、二、t 分布的图形与特征分布的图形与特征 分布只有一个参数,即自由度t17医疗统计学总体均数的估计与假设检验 t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0(标准正态曲线)=5=1f(t)图3-3 不同自由度下的t 分布图18医疗统计学总体均数的估计与假设检验 单峰分布,以单峰分布,以 0 为中心,左右对称;为中心,左右对称;自由度自由度越小,则越小,则 t 值越分散,值越分散,t 分布的峰部分布的峰部越矮而尾部翘得越高;越矮而尾部翘得越高;当当逼近逼近,XS逼近逼近X,t 分布逼近分布逼近 u分布,故标分布,故标准正态分布是准正态分布是 t 分布
10、的特例。分布的特例。1特征:特征:19医疗统计学总体均数的估计与假设检验2 参参 数数(on ly on e):3 t界界 值值 表表:详详 见见 附附 表表 2,可可 反反 映映 t分分 布布 曲曲 下下 的的 面面 积积。单单 侧侧 概概 率率 或或 单单 尾尾 概概 率率:用用,t表表 示示;双双 侧侧 概概 率率 或或 双双 尾尾 概概 率率:用用/2,t 表表 示示。2 t界值表:详见附表界值表:详见附表2,可反映,可反映t分布曲分布曲线下的面积。线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用 表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用 表示。表示。2参数参数
11、(only one):3t 界界值表:详见附表值表:详见附表 2,可反映,可反映 t 分布曲下的面积。分布曲下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用,t 表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用/2,t表示。表示。20医疗统计学总体均数的估计与假设检验-tt021医疗统计学总体均数的估计与假设检验举举例例:0.05,10101.812t,单=0.05,则有(1.812)0.05 (1.812)0.05P tP t 或 0.05/2,10102.228t,双=0.05,则有(2.228)(2.228)0.05P tP t 22医疗统计学总体均数的估计与假设检验第三节
12、第三节 总体均数的估计总体均数的估计23医疗统计学总体均数的估计与假设检验一、参数估计一、参数估计 用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:总体均数估计:用样本均数(和用样本均数(和标准差)推断总体均数。标准差)推断总体均数。24医疗统计学总体均数的估计与假设检验 1点点估估计计(point estimation):就就是是用用相相应应样样本本统统计计量量直直接接作作为为其其总总体体参参数数的的估估计计值值。如如用用X估估计计、S 估估计计等等。其其方方法法虽虽简简单单,但但未未考考虑虑抽抽样样误误差差的的大大小小。25医疗统计学总体均数的估计与假设检验 按预先给定的
13、概率按预先给定的概率(1 )所确定的包含所确定的包含未知总体参数的一个范围。未知总体参数的一个范围。总体均数的区间估计:总体均数的区间估计:按预先给定的按预先给定的概率概率(1 )所确定的包含未知总体均数的一所确定的包含未知总体均数的一个范围。个范围。如给定如给定=0.05,该范围称为参数的该范围称为参数的95%可信区可信区间或置信区间;间或置信区间;如给定如给定=0.01,该范围称为参数的该范围称为参数的99%可信区可信区间或置信区间。间或置信区间。2区间估计区间估计(interval estimation):26医疗统计学总体均数的估计与假设检验二、总体均数可信区间的计算二、总体均数可信区
14、间的计算27医疗统计学总体均数的估计与假设检验 (1)未未知知:按按 t 分分布布。双双侧侧1可可信信区区间间则则为为:2,2,6 0,故故 可可 采采 用用 正正 态态 近近 似似 的的 方方 法法 按按 公公 式式(3-8)计计 算算 可可 信信 区区 间间。今今 X=3.6 4、S=1.2 0、n=2 0 0、XS=0.0 8 4 9,取取 双双 尾尾0.0 5 得得0.0 5/21.9 6u。3.6 41.9 60.0 8 4 9(3.4 7,3.8 1)(m m o l/L)34医疗统计学总体均数的估计与假设检验2.两两 总总 体体 均均 数数 之之 差差 的的 可可 信信 区区 间
15、间:从从 相相等等,但但不不 等等 的的 两两 个个 正正 态态 总总 体体N(1,2)和和N(2,2)进进 行行 随随 机机 抽抽 样样。则则 两两 总总 体体 均均 数数 之之 差差(12)的的 双双 侧侧1可可 信信 区区 间间 为为 1212/2,()XXXXtS1212(1)(1)2nnnn35医疗统计学总体均数的估计与假设检验36医疗统计学总体均数的估计与假设检验同同理理,两两总总体体均均数数之之差差(12)的的单单侧侧1可可信信区区间间为为 121212,()()XXXXtS 121212,()()XXXXtS 当当两两样样本本的的样样本本含含量量均均较较大大时时(如如 n1和和
16、 n2均均大大于于 60),可可按按正正态态分分布布处处理理。37医疗统计学总体均数的估计与假设检验 例例3-4 为了解氨甲喋呤为了解氨甲喋呤(MTX)对外周血对外周血IL-2水平的影响,某医生将水平的影响,某医生将61名哮喘患者随机分为名哮喘患者随机分为两组。其中对照组两组。其中对照组29例例(),采用安慰剂;实验,采用安慰剂;实验组组32例例(),采用小剂量氨甲喋呤,采用小剂量氨甲喋呤(MTX)进行治进行治疗。测得对照组治疗前疗。测得对照组治疗前IL-2的均数为的均数为20.10 IU/ml(),标准差为,标准差为7.02 IU/ml();试验组;试验组治疗前治疗前IL-2的均数为的均数为
17、16.89 IU/ml(),标准差,标准差为为8.46 IU/ml()。问两组治疗前基线的。问两组治疗前基线的IL-2总总体均数相差有多大?体均数相差有多大?1n2n1X2X2S1S38医疗统计学总体均数的估计与假设检验第一步:第一步:1222(29 1)7.02(32 1)8.4611()2.002329 32 229 32XXS 39医疗统计学总体均数的估计与假设检验第第二二步步:以以0.05,2932259查查 t 界界值值表表 查查附附表表 2 得得,0.05/2,602.000t,代代入入公公式式(3-11),则则 两两总总体体 IL-2 均均数数之之差差(12)的的双双侧侧 95%
18、可可信信区区间间为为(20.1016.89)2.0002.00230.79,7.21(IU/ml)故故两两组组治治疗疗前前基基线线的的 IL-2 总总体体均均数数之之差差的的 95%可可信信区区间间为为(-0.79,7.21)(IU/mL)。能否下两组能否下两组IL-2的总体均数的总体均数“不同不同”或或“有差别有差别”的结的结论?论?40医疗统计学总体均数的估计与假设检验三、可信区间的确切涵义三、可信区间的确切涵义41医疗统计学总体均数的估计与假设检验 观察观察p25p25表表3-13-1:当当1 =95%时,在算得的时,在算得的100个个可信区间中,有可信区间中,有95个可信区间包含了个可
19、信区间包含了总体均数,而另外总体均数,而另外5个个(表表3-1中第中第20号、号、31号、号、54号、号、76号和号和82号号)不包括。不包括。42医疗统计学总体均数的估计与假设检验 如果能够进行重复抽样试验,平均有如果能够进行重复抽样试验,平均有1 (如如95%)的可信区间包含了总体参数,的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为而不是总体参数落在该范围的可能性为1 。但在实际工作中,只能根据一次试。但在实际工作中,只能根据一次试验结果估计可信区间,如例验结果估计可信区间,如例3-3,95%的可的可信区间为信区间为3.47 3.81mmol L,就认为该区,就认为该区间包含
20、了总体均数间包含了总体均数 。可信区间的确切涵义:43医疗统计学总体均数的估计与假设检验 一是可信度一是可信度1 ,愈接近,愈接近1愈好,如愈好,如99%的可的可信度比信度比95%的可信度要好;的可信度要好;二是区间的宽度,区间愈窄愈好。二是区间的宽度,区间愈窄愈好。当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。在可信度确定的情况下,增加样本含量可减在可信度确定的情况下,增加样本含量可减小区间宽度。小区间宽度。可信区间估计的优劣取决于两个方面可信区间估计的优劣取决于两个方面:44医疗统计学总体均数的估计与假设检验四、总体均数可信区间四、总体均数可信区间与参考值范围
21、的区别与参考值范围的区别45医疗统计学总体均数的估计与假设检验*也可用对应于双尾概率时也可用对应于双尾概率时),*也可用对应于双尾概率时也可用对应于双尾概率时)表表3-2 总体均数的可信区间与参考值范围的区别总体均数的可信区间与参考值范围的区别 区 别 点 总 体 均 数 可 信 区 间 参 考 值 范 围 含 义 按 预 先 给 定 的 概 率,确 定 的 未 知 参 数 的 可 能 范 围。实 际 上 一 次抽 样 算 得 的 可 信 区 间 要 么 包 含 了 总 体 均 数,要 么 不 包 含。但 可 以 说:当=0.05 时,95%CI 估 计 正 确 的 概 率 为 0.95,估
22、计 错 误 的 概 率 小 于 或等 于 0.05,即 有 95%的 可 能 性 包 含 了 总 体 均 数。“正 常 人”的 解 剖,生 理,生 化 某 项 指 标 的 波动 范 围。总 体 均 数 的 可 能 范 围 个 体 值 的 波 动 范 围 计 算 公 式 未 知:,XXtS*已 知 或未 知 但 n60:XXu或XXu S*正 态 分 布:Xu S*偏 态 分 布:PXP100X 用 途 总 体 均 数 的 区 间 估 计 绝 大 多 数(如95%)观 察 对 象 某 项 指 标 的 分 布 范围 46医疗统计学总体均数的估计与假设检验第四节第四节 t 检验检验47医疗统计学总体
23、均数的估计与假设检验1 1、样本均数、样本均数 与已知某总体均数与已知某总体均数 比较的比较的t t检验检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。2 2、两个样本均数、两个样本均数 与与 比较的比较的t t检验检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3 3、配对设计资料均数比较的、配对设计资料均数比较的t t检验检验目的:推断两个未知总体均数 与 是否有差别用配对设计。X1X2X01212 t t 检验,亦称检验,亦称student student t t 检验检验,有有下述情况下述情况:48医疗统计学总体均数的估计与假设检验 对于大样
24、本对于大样本,也可以近似也可以近似用用u u检验检验49医疗统计学总体均数的估计与假设检验1.样样本本为为来来自自正正态态分分布布总总体体的的随随机机样样本本;2.两两总总体体方方差差相相等等(方方差差齐齐性性,即即2212)。t 检验的应用条件:检验的应用条件:50医疗统计学总体均数的估计与假设检验 假设检验过去称显著性检验。它是利假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题出发间接判断要解决的问题(H1)是否是否成立。然后在成立。然后在H0成立的条件下计算检验成立的条件下计算检验统计量,最后获得统计量,
25、最后获得P值来判断值来判断。假设检验基本思想及步骤基本思想及步骤51医疗统计学总体均数的估计与假设检验 例例3-5 某医生测量了某医生测量了36名从事铅名从事铅作业男性工人的血红蛋白含量,算得作业男性工人的血红蛋白含量,算得其 均 数 为其 均 数 为 1 3 0.8 3 g/L,标 准 差 为,标 准 差 为25.74g/L。问从事铅作业工人的血红。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值蛋白是否不同于正常成年男性平均值140g/L?52医疗统计学总体均数的估计与假设检验 假设检验的目的假设检验的目的就是判断差别就是判断差别是由哪种情况造成的是由哪种情况造成的单纯单纯 抽样误差
26、造成的抽样误差造成的 抽样误差和本质差异造成的抽样误差和本质差异造成的53医疗统计学总体均数的估计与假设检验正常成年男性正常成年男性血红蛋白血红蛋白 140g/L 130.83g/L男性铅作业工人男性铅作业工人血红蛋白血红蛋白 140g/LX 一种假设一种假设H0另一种假设另一种假设H1抽样误差抽样误差总体不同总体不同54医疗统计学总体均数的估计与假设检验1.建建立立检检验验假假设设,确确定定检检验验水水准准(选选用用单单侧侧或或双双侧侧检检验验)(1)无无效效假假设设又又称称零零假假设设,记记为为H0;(2)备备择择假假设设又又称称对对立立假假设设,记记为为H1。对对于于检检验验假假设设,须
27、须注注意意:检检验验假假设设是是针针对对总总体体而而言言,而而不不是是针针对对样样本本;H0和和H1是是相相互互联联系系,对对立立的的假假设设,后后面面的的结结论论是是 根根据据H0和和H1作作出出的的,因因此此两两者者不不是是可可有有可可无无,而而是是 缺缺一一不不可可;55医疗统计学总体均数的估计与假设检验 H1的内容直接反映了检验单双侧。若的内容直接反映了检验单双侧。若H1中只是中只是 0 或或 0,则此检验为单侧检验。,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,单双侧检验的确定,首先根据专
28、业知识,其次根据所要解决的问题来确定。若从专业上其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。验较保守和稳妥。56医疗统计学总体均数的估计与假设检验(3)检验水准检验水准,过去称显著性水准,是预,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的先规定的概率值,它确定了小概率事件的标准。在实际工作中常取标准。在实际工作中常取 =0.05。可根据可根据不同研究目的给予不同设置。不同研究目的给予不同设置。57医疗统计学总体
29、均数的估计与假设检验 根据变量和资料类型、设计方根据变量和资料类型、设计方案、统计推断的目的、是否满足特案、统计推断的目的、是否满足特定条件等(如定条件等(如数据的分布类型数据的分布类型)选)选择相应的检验统计量。择相应的检验统计量。2.计算检验统计量计算检验统计量58医疗统计学总体均数的估计与假设检验 P的含义是指从的含义是指从H0规定的总体随机抽样,抽得规定的总体随机抽样,抽得等于及大于等于及大于(或或/和等于及小于和等于及小于)现有样本获得的检验现有样本获得的检验统计量统计量(如如t、u等等)值的概率。值的概率。例例 3-5 的的 P 值 可 用 图值 可 用 图 3-5 说 明,说 明
30、,P 为 在为 在=0=140g/L的前提条件下随机抽样,其的前提条件下随机抽样,其t小于及等小于及等于于2.138和大于及等于和大于及等于2.138的概率。的概率。3.确定确定P值值59医疗统计学总体均数的估计与假设检验图图3-5 例例3-5中中P值示意图值示意图60医疗统计学总体均数的估计与假设检验若若P,按所取检验水准,按所取检验水准 ,拒绝,拒绝0H,接受接受1H,下“有差别”的结论。其统计学依,下“有差别”的结论。其统计学依据是,在据是,在0H成立的条件下,得到现有检验结成立的条件下,得到现有检验结果的概率小于果的概率小于,因为小概率事件不可能在,因为小概率事件不可能在一次试验中发生
31、,所以拒绝一次试验中发生,所以拒绝0H。61医疗统计学总体均数的估计与假设检验不不能能。正正确确的的说说法法是是按按所所取取检检验验水水准准 ,接接受受1H的的统统计计证证据据不不足足。其其统统计计学学依依据据是是,在在1H成成立立的的条条件件下下,如如果果试试验验样样本本少少,也也同同样样可可以以得得到到P的的检检验验结结果果,我我们们不不知知道道下下“无无差差别别”或或“相相等等”的的结结论论犯犯错错误误的的概概率率有有多多大大,也也就就是是说说,假假设设检检验验方方法法不不能能为为我我们们提提供供相相信信“无无差差别别”结结论论正正确确的的概概率率保保证证。若若 ,是否也能下,是否也能下
32、“无差别无差别”或或“相等相等”的结论?的结论?P62医疗统计学总体均数的估计与假设检验一、单样本一、单样本 t 检验检验 (one sample/group t-test)即样本均数即样本均数 (代表未知总体均数(代表未知总体均数)与)与已知总体均数已知总体均数 0(一般为理论值、标准值或一般为理论值、标准值或经过大量观察所得稳定值等经过大量观察所得稳定值等)的比较。其检的比较。其检验统计量按下式计算验统计量按下式计算0,1XXXXtnSSnSnX63医疗统计学总体均数的估计与假设检验 例例3-5 某医生测量了某医生测量了36名从事铅作业男性工人的血名从事铅作业男性工人的血红蛋白含量,算得其
33、均数为红蛋白含量,算得其均数为130.83g/L,标准差为,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值常成年男性平均值140g/L?(1)建立检验假设,确定检验水准建立检验假设,确定检验水准H0:=0=140g/L,即铅作业男性工人平均血红,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值相等蛋白含量与正常成年男性平均值相等H1:0=140g/L,即铅作业男性工人平均血红,即铅作业男性工人平均血红 蛋白含量与正常成年男性平均值不等蛋白含量与正常成年男性平均值不等 =0.0564医疗统计学总体均数的估计与假设检验
34、 本例 n=36,X=130.83g/L,S=25.74g/L,0140g/L。按公式(3-15)130.83 1402.138,36 13525.7436t (2)计算检验统计量计算检验统计量 65医疗统计学总体均数的估计与假设检验以=35、2.1382.138t 查附表2的t 界值表,因0.05/2,35t 2.138 0.02/2,35t,故双尾概率0.02P0.05。按=0.05水准,拒绝H0,接受 H1,有统计学意义。结合本题可认为从事铅作业的男性工人平均血红蛋白含量低于正常成年男性。(3)确定确定P值,作出推断结论值,作出推断结论 66医疗统计学总体均数的估计与假设检验 式式中中,
35、d 为为每每对对数数据据的的差差值值,d为为差差值值的的样样本本均均数数,dS为为差差值值的的标标准准差差,dS为为差差值值样样本本均均数数的的标标准准误误,n 为为对对子子数数。配对配对t 检验适用于配对设计的计量资料。检验适用于配对设计的计量资料。配对设计类型:配对设计类型:两同质受试对象分别接受两种不两同质受试对象分别接受两种不同的处理;同的处理;同一受试对象分别接受两种不同处理;同一受试对象分别接受两种不同处理;同一受试对象同一受试对象(一种一种)处理前后。处理前后。0,1dddddddtnSSnSn二、配对二、配对t 检验检验(paired/matched t-test)67医疗统计
36、学总体均数的估计与假设检验 例例3-6 为比较两种方法对乳酸饮料中为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机脂肪含量测定结果是否不同,某人随机抽取了抽取了10份乳酸饮料制品,分别用脂肪份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定其结果酸水解法和哥特里罗紫法测定其结果如表如表3-3第第(1)(3)栏。问两法测定结果是栏。问两法测定结果是否不同?否不同?68医疗统计学总体均数的估计与假设检验编 号(1)哥特里罗紫法(2)脂肪酸水解法(3)差值d(4)=(2)(3)1 0.840 0.580 0.260 2 0.591 0.509 0.082 3 0.674 0.500 0
37、.174 4 0.632 0.316 0.316 5 0.687 0.337 0.350 6 0.978 0.517 0.461 7 0.750 0.454 0.296 8 0.730 0.512 0.218 9 1.200 0.997 0.203 10 0.870 0.506 0.364 2.724 表表3-3 两种方法对乳酸饮料中脂肪含量的测定结果两种方法对乳酸饮料中脂肪含量的测定结果(%)69医疗统计学总体均数的估计与假设检验(1)建立检验假设,确定检验水准建立检验假设,确定检验水准H0:d0,即两种方法的测定结果相同,即两种方法的测定结果相同H1:d0,即两种方法的测定结果不同,即两种
38、方法的测定结果不同=0.05 (2)计算检验统计量计算检验统计量本例本例n=10,d=2.724,d2=0.8483,/2.724/100.2724dd n 222()(2.724)0.8483100.1087110 1dddnSn70医疗统计学总体均数的估计与假设检验按公式按公式(3-16)(3)确定确定P值,作出推断结论值,作出推断结论 查附表查附表2的的t界值表得界值表得P0.50。按=0.05 水准,不拒绝 H0,无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同。(3)确定确定P值,作出推断结论值,作出推断结论 78医疗统计学总体均数的估计与假设检验 若变量变换
39、后总体方差齐性若变量变换后总体方差齐性 可采用可采用t 检验检验(如两样本几何均数的如两样本几何均数的t 检验,就是将检验,就是将原始数据取对数后进行原始数据取对数后进行t 检验检验);若变量变换后总体方差仍然不齐若变量变换后总体方差仍然不齐 可可采用采用t 检验或检验或Wilcoxon秩和检验。秩和检验。2221若两总体方差不等(),?79医疗统计学总体均数的估计与假设检验1211222212121 1nXXtnSSnn12121222,22XXXXStSttSS 2.Cochran&Cox近似近似t 检验(检验(t 检验)检验)80医疗统计学总体均数的估计与假设检验注意:当 n1=n2=n
40、 时,1=2=,t=t,t=t,=n-1(不是 2n2);用双尾概率时,t为 t/2,12,tt 和取122,2,tt和。81医疗统计学总体均数的估计与假设检验 例例3-8 在上述例在上述例3-7国产四类新药阿卡国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用波糖胶囊的降血糖效果研究中,测得用拜唐苹胶囊的对照组拜唐苹胶囊的对照组20例病人和用阿卡例病人和用阿卡波糖胶囊的试验组波糖胶囊的试验组20例病人,其例病人,其8周时周时糖化血红蛋白糖化血红蛋白HbA1c(%)下降值下降值如表如表3-5。问用两种不同药物的病人其问用两种不同药物的病人其HbA1c下降下降值是否不同?值是否不同?82医疗统计
41、学总体均数的估计与假设检验分 组 n X S 对照组 20 1.46 1.36 试验组 20 1.13 0.70 表3-5 对照组和试验组HbA1c下降值(%)对照组方差是试验组方差的对照组方差是试验组方差的3.77倍,经方差齐性检倍,经方差齐性检验,认为两组的总体方差不等,故采用验,认为两组的总体方差不等,故采用近似近似 t 检验检验。83医疗统计学总体均数的估计与假设检验(1)建立检验假设,确定检验水准建立检验假设,确定检验水准(略略)(2)计算检验统计量计算检验统计量 22121.46 1.13 0.965,1.360.70202020 119,20 119t 84医疗统计学总体均数的估
42、计与假设检验220.05/2221.360.702.0932.09320202.0931.360.702020t(3)确定确定P值,作出推断结论。值,作出推断结论。查查t界值表界值表t0.05/2,19=2.093。由由t=0.9650.05。按。按=0.05水准,不拒绝水准,不拒绝H0,无统计学意义。还不能认为,无统计学意义。还不能认为用两种不同药物的病人其用两种不同药物的病人其HbA1c下降值不同。下降值不同。85医疗统计学总体均数的估计与假设检验1212222122221244222212121212()(),()()1111XXXXSSSSnnttSSSSnnnnnn 3.Satter
43、thwaite近似近似t检验检验:Cochran&Cox法是对临界值校正法是对临界值校正 而而Satterthwaite法法则是对自由度校正。则是对自由度校正。86医疗统计学总体均数的估计与假设检验22222221.360.70()202028.41.360.70(202020 120 1()以=28.428、t=0.965查附表2的t界值表得0.20P0.40。结论同前。按按Satterthwaite法法对例对例3-8做检验,得做检验,得87医疗统计学总体均数的估计与假设检验1212222122221244222212121212()(),22()()1111XXXXSSSSnnttSSSS
44、nnnnnn 3.Welch法近似t检验 Welch法也是对自由度进行校正。校正公式为88医疗统计学总体均数的估计与假设检验对例3-8,如按Welch法,则2222222(1.36 20)(0.7020)229.41.36 20(0.70 2020 120 1()以=29.429、t=0.965查附表2的t界值表得0.20P0.40。结论同前。89医疗统计学总体均数的估计与假设检验 第五节第五节 假设检验注意事项假设检验注意事项90一、一、I型错误和型错误和II型错误型错误 假设检验是利用小概率反证法思想,根假设检验是利用小概率反证法思想,根据据P值判断结果,此推断结论具有概率性,值判断结果,
45、此推断结论具有概率性,因而无论因而无论拒绝拒绝还是还是不拒绝不拒绝H0,都可能犯错,都可能犯错误。见表误。见表3-8。91医疗统计学总体均数的估计与假设检验假设检验的结果假设检验的结果 客观实际客观实际 拒绝拒绝 H0“接受”“接受”H0 H0成立成立 I 型错误型错误()推断正确推断正确(1 )H0不成立不成立 即即 H1成立成立 推断正确推断正确(1 )II 型错误型错误()表表3-8 可能发生的两类错误可能发生的两类错误92医疗统计学总体均数的估计与假设检验 I I 型错误:型错误:“实际无差别,但下了有差别实际无差别,但下了有差别的结论的结论”,假阳性错误假阳性错误。犯这种错误的概率。
46、犯这种错误的概率是是(其值等于检验水准其值等于检验水准)IIII型错误型错误:“实际有差别,但下了不拒绝实际有差别,但下了不拒绝H H0 0的结论的结论”,假阴性错误假阴性错误。犯这种错误的概率。犯这种错误的概率是是(其值未知其值未知)。但但 n n 一定时,一定时,增大,增大,则减少则减少 。1-1-:检验效能检验效能(powerpower):当当两总体确有差两总体确有差别,按别,按检验水准检验水准 所能发现这种差别的能力。所能发现这种差别的能力。93医疗统计学总体均数的估计与假设检验图图3-6 I型错误与型错误与II型错误示意图型错误示意图(以单侧以单侧u检验为例检验为例)H1:0 成立
47、界值 0 1 1 94减少减少I型错误型错误的主要方法:假设检验时设定的主要方法:假设检验时设定 值值。减少减少II型错误型错误的主要方法:的主要方法:提高提高检验效能检验效能。提高提高检验效能的最有效方法:检验效能的最有效方法:增加样本量增加样本量。如何如何选择合适的样本量:选择合适的样本量:实验设计实验设计。95医疗统计学总体均数的估计与假设检验三、假设检验应三、假设检验应注意注意的问题的问题 1.要有严密的研究设计,尤其是下要有严密的研究设计,尤其是下因果因果结论。结论。2.不同的资料应选用不同检验方法。不同的资料应选用不同检验方法。3.正确理解正确理解“显著性显著性”一词的含义一词的含
48、义(用用统计统计学意义学意义一词一词替代替代)。96医疗统计学总体均数的估计与假设检验4.结论不能绝对化结论不能绝对化,提倡使用精确提倡使用精确P值值。5.注意统计注意统计“显著性显著性”与医学与医学/临床临床/生生物物 学学“显著性显著性”的区别的区别 97医疗统计学总体均数的估计与假设检验 6.可信区间与假设检验各自不同的可信区间与假设检验各自不同的作用,要结合使用。作用,要结合使用。一方面一方面,可信区间可信区间亦可回答亦可回答假设检验假设检验的问题,算得的可信区间若包含了的问题,算得的可信区间若包含了H0,则按则按 水准,不拒绝水准,不拒绝H0;若不包含;若不包含H0,则,则按按 水准
49、,拒绝水准,拒绝H0,接受,接受H1。98医疗统计学总体均数的估计与假设检验 另一方面另一方面,可信区间不但能回,可信区间不但能回答差别有无统计学意义,而且还能答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提比假设检验提供更多的信息,即提示差别有无实际的专业意义。示差别有无实际的专业意义。99医疗统计学总体均数的估计与假设检验 有实际专业意义的值 H0 (2)(3)(4)(5)(1)有实际 可能有实际 无实际 样本例数 可接受 专业意义 专业意义 专业意义 太少 H0 有统计学意义 无统计学意义 图图3-7 可信区间在统计推断上提供的信息可信区间在统计推断上提供的信息 100医疗统
50、计学总体均数的估计与假设检验 虽然虽然可信区间可信区间亦可回答亦可回答假设检验假设检验的的问题,并能提供更多的信息,但并不意问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率可信区间只能在预先规定的概率 检验检验水准水准 的前提下进行计算,而假设检验的前提下进行计算,而假设检验能够获得一较为确切的概率能够获得一较为确切的概率P值。值。101医疗统计学总体均数的估计与假设检验第六节第六节正态性检验正态性检验和两样本方差比较的和两样本方差比较的F检验检验102 t 检验的应用条件是正态总体且方差齐性;检验的应用条件是正