1、第十五章第十五章 数值变量的统数值变量的统计推断计推断20232023年年2 2月月6 6日星期一日星期一2回顾上一章内容:集中趋势指标:集中趋势指标:算术均数、中位数、几何均数算术均数、中位数、几何均数离散趋势指标:离散趋势指标:全距、四分位数间距、全距、四分位数间距、方差、标准差、变异系数方差、标准差、变异系数正态分布:正态分布:概念、特征、面积规律、应用概念、特征、面积规律、应用医学参考值估计:医学参考值估计:步骤、估计方法步骤、估计方法计量资料的统计描述:计量资料的统计描述:20232023年年2 2月月6 6日星期一日星期一3v均数的抽样误差与标准误均数的抽样误差与标准误v总体均数的
2、估计总体均数的估计v假设检验的基本原理与步骤假设检验的基本原理与步骤vt t检验与检验与u u检验检验v方差分析方差分析v两类错误假设及假设检验的注意事项两类错误假设及假设检验的注意事项本次讲授内容本次讲授内容20232023年年2 2月月6 6日星期一日星期一4统计推断(统计推断(Statistical inference):用样本信息推论总体特征的过程。用样本信息推论总体特征的过程。即采用样本统计量即采用样本统计量 对相应总体参数对相应总体参数 所做的所做的非确定性的推估非确定性的推估。主要包括:参数估计主要包括:参数估计 假设检验假设检验第一节第一节 均数的抽样误差与标准误均数的抽样误差
3、与标准误px S p S、p、20232023年年2 2月月6 6日星期一日星期一5第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误v参数估计参数估计:运用统计学原理,用从样本计算出来的统运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。计指标量,对总体统计指标量进行估计。v假设检验:假设检验:又称显著性检验,是指由样本间存在的差又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。别对样本所代表的总体间是否存在着差别做出判断。方法:方法:均数的参数估计、均数均数的参数估计、均数u u检验、均数检验、均数t t检验检验总体参数:总体参
4、数:=155.4=155.4,=5.3=5.3 X XN N(155.4(155.4,(5.3(5.3)2 2)12100n=30 x1=156.7n=30 x2=158.1n=30 x100=156.613岁女学生身高第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误从正态总体从正态总体N N(155.4155.4,5.35.32 2)抽样得到)抽样得到100100个样本均数的频数分个样本均数的频数分布布组段(组段(cmcm)频数频数频率()频率()152.6152.61 11.01.0153.2153.24 44.04.0153.8153.84 44.04.0154.4154.42
5、22222.022.0155.0155.0252525.025.0155.6155.6212121.021.0156.2156.2171717.017.0156.8156.83 33.03.0157.4157.42 22.02.0158.0158.0159.6159.61 11.01.0合计合计100100100.0100.0100个样本平均数的频数分布图个样本平均数的频数分布图(直方图直方图)理论上可以证明:若从正态总体理论上可以证明:若从正态总体 中,反中,反复多次随机抽取样本含量固定为复多次随机抽取样本含量固定为n n 的样本,那么的样本,那么这些样本均数这些样本均数 也服从正态分布,即
6、也服从正态分布,即 的总体均的总体均数仍为数仍为 ,样本均数的标准差为,样本均数的标准差为 。2N(,)XX/n抽样分布抽样分布 抽样分布示意图抽样分布示意图 一一.抽样误差:抽样误差:由于抽样而引起的样本均数与总体均数之由于抽样而引起的样本均数与总体均数之间、样本均数与样本均数之间的差异称为抽样间、样本均数与样本均数之间的差异称为抽样误差。误差。v特点特点:不可避免!可以计算或估计其大小。:不可避免!可以计算或估计其大小。20232023年年2 2月月6 6日星期一日星期一11xnxSSn通过增加样本含通过增加样本含量量n n来降低抽样来降低抽样误差。误差。某一个样某一个样本的标准本的标准差
7、差该样本的该样本的个体例数个体例数二二.标准误标准误(standard error,SE)(standard error,SE)及其计算及其计算即样本均数的标准差,可用于衡量抽样误差的大小。即样本均数的标准差,可用于衡量抽样误差的大小。因通常因通常未知,用未知,用S来估计。来估计。计算标准误采用下式:计算标准误采用下式:第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误20232023年年2 2月月6 6日星期一日星期一4 4个抽样实验结果比较个抽样实验结果比较5;0.3654XnS10;0.2584xnS20;0.1827XnS30;0.1492xnS20232023年年2 2月月6
8、 6日星期一日星期一13标准误的特点:标准误的特点:当样本例数当样本例数n一定时,标准误与标准差呈正比;一定时,标准误与标准差呈正比;当标准差一定时,标准误与样本含量当标准差一定时,标准误与样本含量n的平方根的平方根呈反比。呈反比。v意义:意义:反映样本均数间离散程度。反映样本均数间离散程度。反映抽样误差的反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估大小。标准误越小,抽样误差越小,用样本均数估计总体均数的可靠性越大。计总体均数的可靠性越大。第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误20232023年年2 2月月6 6日星期一日星期一14例例15-115-1:某地某
9、地150150名名3 3岁女孩平均身高为岁女孩平均身高为92.8CM92.8CM,标,标准差为准差为4.6CM4.6CM,求其标准误。,求其标准误。4.60.38150 xxSScmnn 未知未知S S 代替代替第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误20232023年年2 2月月6 6日星期一日星期一15三三.标准误的应用标准误的应用反映样本均数的可靠性,衡量抽样误差反映样本均数的可靠性,衡量抽样误差大小大小估计总体均数的可信区间估计总体均数的可信区间用于假设检验用于假设检验第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误20232023年年2 2月月6 6日星期
10、一日星期一16区别:区别:标准误标准误 标准差标准差定义反映抽样误差定义反映抽样误差 反映个体变异反映个体变异公式公式用途总体均数可信区间用途总体均数可信区间 医学参考值范围医学参考值范围进行统计学检验进行统计学检验 计算标准误、计算标准误、CVCV联系:联系:当当n n一定时标准差大,标准误也大一定时标准差大,标准误也大 nssx22-()/-1xxnsn补充内容:补充内容:标准误与标准差的区别与联系标准误与标准差的区别与联系第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误20232023年年2 2月月6 6日星期一日星期一17第二节第二节 总体均数的估计总体均数的估计随机变量随机
11、变量x xN(N(,2 2)标准正态分布标准正态分布 N N(0 0,1 12 2)抽抽 样样x 样本均数样本均数 N(N(,2 2/n/n)xuxxu 标准正态分布标准正态分布 N N(0 0,1 12 2)未知未知 S S 代替代替1/nnSxSxtxu变换变换Student Student t t分布自分布自由度:由度:n n-1-1t 变换变换20232023年年2 2月月6 6日星期一日星期一18 m个样本的均数个样本的均数 标准误标准误t t值值1x2xmx1xs2xsmxs1t2tmtl总体为总体为N N的的m m个样本(样本大小为个样本(样本大小为n n)的)的 t t 值值x
12、sxtt t 分布分布v 图图15-1 15-1 自由度分别为自由度分别为1 1、5 5、的的t t分布分布v 5v 1v()f t标准正态分布20232023年年2 2月月6 6日星期一日星期一20t t 分布的图形与特征分布的图形与特征以以0 0为中心,左右对称的单峰分布;为中心,左右对称的单峰分布;t t分布曲线是一簇曲线,其形态变化与自由度的大小有关。分布曲线是一簇曲线,其形态变化与自由度的大小有关。n自由度越小,则自由度越小,则t 值越分散,值越分散,t分布分布曲线曲线的峰部越矮而尾的峰部越矮而尾部翘得越高;说明尾部面积(概率部翘得越高;说明尾部面积(概率P)就越大;与)就越大;与u
13、分布分布曲线相比,曲线相比,t 分布分布低平;低平;n自由度逐渐增大时,自由度逐渐增大时,t 分布逐渐逼近分布逐渐逼近u 分布分布(标准正态分标准正态分布布);当趋于;当趋于时,时,逼近逼近 ,t 分布即为分布即为u分布。分布。xsxt t 分布分布20232023年年2 2月月6 6日星期一日星期一21 概率P 双侧:0.10 0.05 0.02 0.01 自由度 单侧:0.05 0.025 0.01 0.005 1 6.314 12.706 31.821 63.657 2 2.920 4.303 6.965 9.925 3 2.353 3.182 4.541 5.841 4 2.132 2
14、.776 3.747 4.604 5 2.015 2.571 3.365 4.032 6 1.943 2.447 3.143 3.707 7 1.895 2.365 2.998 3.499 8 1.860 2.306 2.896 3.355 9 1.833 2.262 2.821 3.250 10 1.812 2.228 2.764 3.169 11 1.796 2.201 2.718 3.106 12 1.782 2.179 2.681 3.055 附表附表 t 界值表界值表 (228页)自由度自由度概率概率P P单侧单侧0.250.250.200.200.100.100.050.050.0
15、250.0250.010.01双侧双侧0.500.500.400.400.200.200.100.100.050.050.020.021 11.001.001.3761.3763.0783.0786.3146.31412.70612.70631.8231.822 20.8160.8161.0611.0611.8861.8862.9202.9204.3034.3036.9656.96510100.700.700.8790.8791.3721.3721.8121.8122.2282.2282.7642.76450500.6790.6790.8490.8491.2991.2991.6761.6762
16、.0092.0092.4032.4031001000.6770.6770.8450.8451.291.291.6601.6601.9841.9842.3642.364 0.6750.6750.8420.8421.2821.2821.6451.6451.9601.9602.3262.32620232023年年2 2月月6 6日星期一日星期一23v 如左图所示,图中的阴影部分表示如左图所示,图中的阴影部分表示 以外尾部面积占总面积的百分数,即以外尾部面积占总面积的百分数,即概率。概率。v 如查表单侧如查表单侧 ,表示从正态,表示从正态总体作样本例数总体作样本例数n n为为1111的随机抽样,其的随
17、机抽样,其t t值服从值服从=n-1=11-1=10的的t分布。分布。,t 1.8120.05,101.812t理论上:理论上:v=10,v=10,单单=0.05=0.05,则有则有 :一般表示:一般表示:,0.05,101.812tt(1.812)0.05 (1.812)0.05P tP t 或,()()P ttP tt 或 t t 分布分布20232023年年2 2月月6 6日星期一日星期一24v 如图所示:如图所示:v 相同自由度下,双侧相同自由度下,双侧P P值为单侧值为单侧P P值得两倍。值得两倍。v t t界值表中,界值表中,2.228-2.2282,0.05/2,10102.22
18、8(2.228)(2.228)0.05ttP tP t,双=0.05,则有0.05/2,100.025,10tt2.228双 侧单 侧 t t 分布分布20232023年年2 2月月6 6日星期一日星期一25v参数估计:用样本均数估计总体均数。参数估计:用样本均数估计总体均数。参数的估计参数的估计点值估计:点值估计:由样本统计量由样本统计量 直接估计总体参数直接估计总体参数区间估计:区间估计:获得一个获得一个可信区间可信区间(confidence interval,CI)(confidence interval,CI)由样由样本数据估计得到的、本数据估计得到的、100100(1(1 )可能包可
19、能包含未知总体参数的一个范围值。含未知总体参数的一个范围值。xSp、第二节第二节 总体均数的估计总体均数的估计20232023年年2 2月月6 6日星期一日星期一26 1 1、点、点(值值)估计:估计:用相应样本统计量直接作为总体参数的估计值。用相应样本统计量直接作为总体参数的估计值。即用即用 估计估计 其方法虽简单,但未考虑抽样误差的大小其方法虽简单,但未考虑抽样误差的大小x一、可信区间的概念一、可信区间的概念20232023年年2 2月月6 6日星期一日星期一272 2、区间估计、区间估计v概念:概念:按照按照预先给定的概率(预先给定的概率(可信度可信度)估计估计的未知总体参数的范围。的未
20、知总体参数的范围。v可信区间(可信区间(confidence interval,CIconfidence interval,CI)是是根据一定的可信度估计得到的区间。根据一定的可信度估计得到的区间。一、可信区间的概念一、可信区间的概念20232023年年2 2月月6 6日星期一日星期一28v总体均数的可信区间总体均数的可信区间(1)已知,已知,按按 u 分布,分布,95%和和99%可信区间:可信区间:(2)未知,且未知,且n 较小,较小,按按t分布分布(3)未知但未知但n足够大,足够大,按按 u 分布分布二、总体均数可信区的计算二、总体均数可信区的计算 XXXX58.2,96.1XStX205
21、.0XStX201.0 XXSXSX58.2,96.120232023年年2 2月月6 6日星期一日星期一29二、总体均数可信区的计算二、总体均数可信区的计算例例15-2 随机抽取某地随机抽取某地10名男孩出生体重,测得其平均体重名男孩出生体重,测得其平均体重为为3.21kg,标准差,标准差S为为0.47kg,试估计该地男孩出生体重的总体均,试估计该地男孩出生体重的总体均数的数的95%置信区间。置信区间。20232023年年2 2月月6 6日星期一日星期一30/,)(.)(.,.)xxuS292 81 96 0 3892 1 93 5(20232023年年2 2月月6 6日星期一日星期一31v
22、95%95%的可信区间表示:的可信区间表示:如果从同一总体中重复抽取如果从同一总体中重复抽取100100个独立样本,将可能有个独立样本,将可能有9595个可信区间包括总体个可信区间包括总体均数,有均数,有5 5个可信区间不包括总体均数。个可信区间不包括总体均数。v对于一次估计的可信区间,可能有对于一次估计的可信区间,可能有95%95%的正确率,的正确率,但仍有但仍有5%5%的可信区间估计错误。的可信区间估计错误。三、可信区间的涵义三、可信区间的涵义模拟抽样成年男子红细胞数模拟抽样成年男子红细胞数100100次的次的95%95%可信区间示意图可信区间示意图 )14039.075.4(n,*202
23、32023年年2 2月月6 6日星期一日星期一33四、总体均数可信区间与参考值范围的区别四、总体均数可信区间与参考值范围的区别第三节第三节 假设检验的基本原理与步骤假设检验的基本原理与步骤v一、假设检验(一、假设检验(Hypothesis TestingHypothesis Testing)的基本原理)的基本原理例例15.4:15.4:根据大量调查,已知一般健康成年男子的根据大量调查,已知一般健康成年男子的脉博均数为脉博均数为7272次次/min,/min,某医生在某山区随机调查某医生在某山区随机调查100100名健康男子,得其脉搏均数为名健康男子,得其脉搏均数为76.276.2次次/min/
24、min,标准差标准差为为4.04.0次次/min/min。能否认为该山区的健康成年男子脉。能否认为该山区的健康成年男子脉搏均数高于一般成年男子脉搏均数?搏均数高于一般成年男子脉搏均数?20232023年年2 2月月6 6日星期一日星期一35072/min次n=100n=10076.2/min4.0/minxS次次已知总体已知总体一般成年男性脉搏一般成年男性脉搏未知总体未知总体山区成年男子脉搏山区成年男子脉搏20232023年年2 2月月6 6日星期一日星期一36差异的原因:差异的原因:(1)由于抽样误差造成的由于抽样误差造成的.(实际上实际上 =0 0 ,但由,但由于抽样误差于抽样误差 不能很
25、好代表不能很好代表 0 0 )(2)可能由于地区等环境因素的影响,样本所代表的可能由于地区等环境因素的影响,样本所代表的总体与已知总体确实不同:总体与已知总体确实不同:0 0 x下面我们用一例说明这个原则:下面我们用一例说明这个原则:两个盒子,各装有两个盒子,各装有100个球个球.小概率事件在一次试验中不会发生小概率事件在一次试验中不会发生.一个盒子中的白球和红球数一个盒子中的白球和红球数99个白球个白球一个红球一个红球99个个另一盒中的白球和红球数另一盒中的白球和红球数99个红球个红球一个白球一个白球99个个将盒子密封,现从两盒中随机取出一个盒子,将盒子密封,现从两盒中随机取出一个盒子,问这
26、个盒子里是白球问这个盒子里是白球99个还是红球个还是红球99个?个?我们不妨先假设:我们不妨先假设:这个盒子里有这个盒子里有99个白球个白球.现在我们从中随机摸出一个球,发现是现在我们从中随机摸出一个球,发现是此时你如何判断这个假设是否成立呢?此时你如何判断这个假设是否成立呢?假设其中真有假设其中真有99个白球,个白球,摸出红球的概率只有摸出红球的概率只有1/100,这是小概率事件这是小概率事件.小概率事件在一次试验中竟然发生了,不小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设能不使人怀疑所作的假设.小概率反证法小概率反证法.小概率事件在一次试验中不会发生小概率事件在一次试验中不会
27、发生.20232023年年2 2月月6 6日星期一日星期一41假设检验的基本步骤假设检验的基本步骤1.1.建立假设,确定检验水准建立假设,确定检验水准2.2.选定检验统计方法,计算检验统计量选定检验统计方法,计算检验统计量3.3.确定确定P P值,作出推断结论值,作出推断结论无效假设无效假设(null hypothesis),记为记为H0,又称又称原原假设假设,表示目前的差异是由于抽样误差引起的。,表示目前的差异是由于抽样误差引起的。备择假设备择假设(alternative hypothesis),记为记为H1,又称又称对立假设对立假设,表示目前的差异是主要由于本,表示目前的差异是主要由于本质
28、上的差别引起。质上的差别引起。两个假设既有联系又互相独立,应该包括两两个假设既有联系又互相独立,应该包括两种(也是所有)可能的判断。要做出抉择。种(也是所有)可能的判断。要做出抉择。1、建立检验假设,确定检验水准1、建立检验假设,确定检验水、建立检验假设,确定检验水准准20232023年年2 2月月6 6日星期一日星期一43(1 1)根据专业知识)根据专业知识 事先不知道会出现什么结果事先不知道会出现什么结果 双侧双侧 事先知道只能出现某种结果事先知道只能出现某种结果 单侧单侧 如:难产儿的出生体重与一般婴儿出生体重大如:难产儿的出生体重与一般婴儿出生体重大 -单侧单侧 一般预实验有探索性质,
29、对结果的考虑思路应宽些,多双一般预实验有探索性质,对结果的考虑思路应宽些,多双侧侧v(2 2)问题的提法)问题的提法 如:可否据此认为该山区成年男子的脉搏数高于一般成年如:可否据此认为该山区成年男子的脉搏数高于一般成年男子的脉搏均数?男子的脉搏均数?*通常用双侧通常用双侧(除非有充足的理由选用单侧之外除非有充足的理由选用单侧之外,一般选用保一般选用保守的双侧较稳妥守的双侧较稳妥)单、双侧检验的选择:单、双侧检验的选择:20232023年年2 2月月6 6日星期一日星期一44v检验水准检验水准(size of a test)亦称显著性水准亦称显著性水准(significance level),用
30、),用表示,表示,在实际工作中在实际工作中常取常取0.05。意义:意义:假设检验时,根据研究的目的或要求预先规定的假设检验时,根据研究的目的或要求预先规定的概率值,是判定小概率事件发生的标准(概率值,是判定小概率事件发生的标准(H0)或阈值;)或阈值;亦是允许结果出现第一类错误的概率。亦是允许结果出现第一类错误的概率。取值并非一成不变,可根据研究目的给予不同设置。取值并非一成不变,可根据研究目的给予不同设置。1.1.建立假设,确定检验水准建立假设,确定检验水准20232023年年2 2月月6 6日星期一日星期一45注意:注意:vH H0 0,H H1 1和和的确定,以及单双侧检验的选择,都的确
31、定,以及单双侧检验的选择,都应结合研究设计,在未获得样本结果之前决定,应结合研究设计,在未获得样本结果之前决定,而不要受样本结果的影响。而不要受样本结果的影响。v假设检验是针对总体而不是针对样本。假设检验是针对总体而不是针对样本。1.1.建立假设,确定检验水准建立假设,确定检验水准20232023年年2 2月月6 6日星期一日星期一46要根据研究设计的类型和统计推断的目的选用不同要根据研究设计的类型和统计推断的目的选用不同的检验方法,如:两样本均数的比较用的检验方法,如:两样本均数的比较用t检验,检验,两样本率的比较用卡方检验两样本率的比较用卡方检验 所有检验统计量都是在所有检验统计量都是在H
32、0成立的前提条件下计算的。成立的前提条件下计算的。2 2、选定检验方法,计算检验统计量、选定检验方法,计算检验统计量0100,76.2/min,4.0/min,72/min76.27210.5,99/4.0/100次次次nxSxtSn 20232023年年2 2月月6 6日星期一日星期一47 P值是指在值是指在H0所规定的总体作随机抽样,获得等所规定的总体作随机抽样,获得等于及大于(或等于及小于)现有样本获得的检验于及大于(或等于及小于)现有样本获得的检验统计量值的概率。统计量值的概率。v例如例如 求得求得t=10.5,v=99t=10.5,v=99,=0.05=0.05,P P是在是在=0
33、0的前的前 提条件下随机抽样,得到提条件下随机抽样,得到 t-10.5t-10.5和和t10.5t10.5的概率的概率-10.5 10.5 P P3 3、确定、确定P P值,作出推断结论值,作出推断结论20232023年年2 2月月6 6日星期一日星期一480-t0.05/2,t0.05/2,95%2.5%2.5%拒绝域拒绝域拒绝域拒绝域假假 设设 检检 验验20232023年年2 2月月6 6日星期一日星期一49如何下结论?如何下结论?v P P0.050.05,按,按=0.05=0.05检验水准,不拒绝检验水准,不拒绝H H0 0,差异无统计学意,差异无统计学意义义(差异无显著性差异无显著
34、性),尚不能认为,尚不能认为不同或不等。不同或不等。v P0.05 P0.05,按,按=0.05=0.05检验水准,拒绝检验水准,拒绝H H0 0,接受,接受H H1 1,差异有,差异有统计学意义统计学意义(差异有显著性差异有显著性),可以认为,可以认为不同或不等。不同或不等。v 推断结论推断结论=统计结论统计结论+专业结论。专业结论。统计结论只说明有无统计统计结论只说明有无统计学意义学意义(statistical significance)(statistical significance),而不能说明专业上,而不能说明专业上的差异大小。它必须同专业结论有机结合,才能得出恰如的差异大小。它必
35、须同专业结论有机结合,才能得出恰如其分、符合客观实际的最终结论。其分、符合客观实际的最终结论。3 3、确定、确定P P值,作出推断结论值,作出推断结论20232023年年2 2月月6 6日星期一日星期一50注意:注意:不拒绝不拒绝H H0 0不等于接受不等于接受H H0 0,因为此时证据不足。,因为此时证据不足。可暂时可暂时“接受接受”它,或它,或“阴性待诊阴性待诊”。推断结论时,对推断结论时,对H H0 0只能说:拒绝或不拒绝;对只能说:拒绝或不拒绝;对H H1 1只能说:接受只能说:接受H H1 1。正确理解结论的概率性正确理解结论的概率性 (都隐含着犯错误的可能性)。(都隐含着犯错误的可
36、能性)。3 3、确定、确定P P值,作出推断结论值,作出推断结论20232023年年2 2月月6 6日星期一日星期一51第四节第四节 t t 检验与检验与u u检验检验v 样本均数与总体均数比较(单样本样本均数与总体均数比较(单样本u u检验、检验、t t 检验)检验)v 配对设计的差值均数与总体均数配对设计的差值均数与总体均数0 0的比较的比较v (配对样本(配对样本t t 检验)检验)v 完全随机设计的两个样本均数的比较(两样本完全随机设计的两个样本均数的比较(两样本u u检验、检验、t t 检验)检验)20232023年年2 2月月6 6日星期一日星期一52第四节第四节 t t 检验与检
37、验与u u检验检验vt t 检验应用条件:检验应用条件:总体标准差总体标准差未知且未知且n较小时(较小时(n100)(n100)20232023年年2 2月月6 6日星期一日星期一53v 即样本均数代表的未知总体均数即样本均数代表的未知总体均数和已知总体均和已知总体均数数0的比较的比较已知的总体均数:一般为理论值、标准值或经过已知的总体均数:一般为理论值、标准值或经过大量观察所得的稳定值大量观察所得的稳定值一、一、样本均数与总体均数的比较样本均数与总体均数的比较20232023年年2 2月月6 6日星期一日星期一54000000,1xxxxxtnSSnxxuSSnxxun 计算检验统计量计算检
38、验统计量u u值或值或t t值值一、样本均数与总体均数的比较一、样本均数与总体均数的比较20232023年年2 2月月6 6日星期一日星期一55例例15-5:15-5:某市某年抽查了某市某年抽查了150150名名2 2岁男孩的体重,得岁男孩的体重,得平均体重为平均体重为11.18kg11.18kg,标准差为,标准差为1.23kg.1.23kg.而同期全国而同期全国九城市大量调查得同龄男孩的平均体重为九城市大量调查得同龄男孩的平均体重为11kg.11kg.问该问该市市2 2岁男孩的平均体重与全国的同期水平有无差别?岁男孩的平均体重与全国的同期水平有无差别?一、样本均数与总体均数的比较一、样本均数
39、与总体均数的比较解题思路:解题思路:0 0 11kg11kg一个已知总体,一个大样本一个已知总体,一个大样本 单样本单样本u u检验检验根据题目问题和专业知识根据题目问题和专业知识双侧检验双侧检验150,11.18,1.23nxs20232023年年2 2月月6 6日星期一日星期一56(1)(1)建立假设、确定检验水准建立假设、确定检验水准H H0 0:=0 0H H1 1:0 0=0.05一、样本均数与总体均数的比较一、样本均数与总体均数的比较20232023年年2 2月月6 6日星期一日星期一57(2 2)选定检验方法,计算检验统计量)选定检验方法,计算检验统计量 已知已知0150,11.
40、18,1.23,11nxs011.18 111.792/1.23/150 xusn一、样本均数与总体均数的比较一、样本均数与总体均数的比较v(3 3)确定)确定P P值和做出推断结论值和做出推断结论v 本例本例u=1.792u=1.792,查,查u u界值表,界值表,u u0.05/20.05/2=1.96.=1.96.vu=1.7921.96,u=1.7920.05P0.05v 故在故在 =0.05=0.05的水准,不拒绝的水准,不拒绝H H0 0,差别没有统计,差别没有统计学意义。学意义。v专业的结论:专业的结论:尚不能认为该市尚不能认为该市2 2岁男孩的平均体重与岁男孩的平均体重与全国的
41、同期水平不同。全国的同期水平不同。v例例15.615.6 15 15例长期服用某种避孕药的妇女,其例长期服用某种避孕药的妇女,其血清胆固醇含量的均数为血清胆固醇含量的均数为6.5mmol/L,6.5mmol/L,标准差为标准差为0.7mmol/L0.7mmol/L,一般健康妇女血清胆固醇含量的均,一般健康妇女血清胆固醇含量的均数为数为4.4mmol/L4.4mmol/L,问长期服用该种避孕药的妇女,问长期服用该种避孕药的妇女其血清胆固醇含量的均数与一般健康妇女有无其血清胆固醇含量的均数与一般健康妇女有无差别?差别?20232023年年2 2月月6 6日星期一日星期一60(1)(1)建立假设、确
42、定检验水准建立假设、确定检验水准H H0 0:=0 0H H1 1:0 0=0.05一、样本均数与总体均数的比较一、样本均数与总体均数的比较20232023年年2 2月月6 6日星期一日星期一61(2 2)选定检验方法,计算检验统计量)选定检验方法,计算检验统计量 已知已知015,6.5,0.7,4.4nxs06.54.411.667/0.7/15115 114xtsnn 一、样本均数与总体均数的比较一、样本均数与总体均数的比较20232023年年2 2月月6 6日星期一日星期一62(3)(3)确定确定P P值,作出推断结论值,作出推断结论查查t t界值表界值表 t0.05/2,14=2.14
43、5 Pt0.052.145P11.667 P0.05,P0.05,按按=0.05检验水准,拒绝检验水准,拒绝H H0 0 ,接受,接受H H1 1;可认为可认为长长期服用该种避孕药的妇女其血清胆固醇含量的均数与一般健期服用该种避孕药的妇女其血清胆固醇含量的均数与一般健康妇女的差别有统计学意义,康妇女的差别有统计学意义,服用该种避孕药的妇女其血清服用该种避孕药的妇女其血清胆固醇含量的均数高于一般健康妇女胆固醇含量的均数高于一般健康妇女.一、样本均数与总体均数的比较一、样本均数与总体均数的比较20232023年年2 2月月6 6日星期一日星期一63 假阴性假阴性假阳性假阳性 第六节第六节 I I类
44、错误和类错误和IIII类错误类错误20232023年年2 2月月6 6日星期一日星期一64 A B D C 判 断 正 确 (1 )1 0 1 1 判 断 错 误(型 错 误,)判 断 错 误(型 错 误,)判 断 正 确(1 )类类错误与错误与类类错误的关系错误的关系(以单侧检验为例)(以单侧检验为例)不拒绝不拒绝H H0 0,假设检验的结果,假设检验的结果 拒绝拒绝H H0 020232023年年2 2月月6 6日星期一日星期一65I I类错误和类错误和II类错误类错误 类错误类错误-拒绝了成立的无效假设拒绝了成立的无效假设H H0 0所犯的错误所犯的错误称称为为类错误类错误(“弃真弃真”
45、)。其概率大小用其概率大小用表示。常称之为检验水准表示。常称之为检验水准 类错误类错误-接受了不成立的无效假设接受了不成立的无效假设H H0 0所犯的错误所犯的错误称为称为类错误类错误(“存伪存伪”),其概率大小用,其概率大小用表示。表示。20232023年年2 2月月6 6日星期一日星期一66 是预先规定允许犯是预先规定允许犯I I型错误概率的最大值,由研究者确定,可型错误概率的最大值,由研究者确定,可取单尾亦可取双尾。取单尾亦可取双尾。IIII类错误的概率大小用类错误的概率大小用 表示表示,值需要估算。值需要估算。1 1 称检验效能称检验效能(power of a test)(power
46、of a test),过去称把握度。意义是,过去称把握度。意义是当两总体确有差别,按检验水准当两总体确有差别,按检验水准 所能检出其差异的能力。通所能检出其差异的能力。通常要求达到常要求达到0.80.8以上。以上。样本含量固定前提下,样本含量固定前提下,愈小,愈小,愈大;愈大;愈大,愈大,愈小愈小。若要同时减小若要同时减小 和和,唯一方法是,唯一方法是增加样本含量增加样本含量n n。I I类错误和类错误和II类错误类错误20232023年年2 2月月6 6日星期一日星期一67 若重点减少若重点减少(如一般假设检验如一般假设检验),一般取一般取=0.05=0.05;若重点减少若重点减少(如方差齐
47、性检验,正态性检验等如方差齐性检验,正态性检验等),一般取,一般取=0.10=0.10或或0.200.20甚至更高。甚至更高。拒绝拒绝H H0 0,只可能犯,只可能犯I I类错误,不可能犯类错误,不可能犯IIII类错误;类错误;“接受接受”H H0 0,只可能犯,只可能犯IIII类错误,不可能犯类错误,不可能犯I I类错误。类错误。I I类错误和类错误和IIII类错误类错误20232023年年2 2月月6 6日星期一日星期一68二、配对设计的差值均数与总体均数二、配对设计的差值均数与总体均数0 0的比较的比较常见的配对设计主要有以下情形:常见的配对设计主要有以下情形:异体配对:异体配对:将条件
48、近似的观察对象两两配成对子,对子中将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。的两个个体分别给予不同的处理。(目的是比较不同方法之间的差异目的是比较不同方法之间的差异)自身配对自身配对:同一受试对象处理前后或不同部位测定值的比同一受试对象处理前后或不同部位测定值的比较。较。(目的是判断此处理有无作用目的是判断此处理有无作用)自身配对:自身配对:同一受试对象同一受试对象(或样品或样品)分别接受两种不同方法分别接受两种不同方法的处理。的处理。(目的是比较不同方法之间的差异目的是比较不同方法之间的差异)对子号对子号A A药药B B药药d dd d2 21 110106 64
49、 416162 213139 94 416163 36 63 33 39 94 4111110101 11 15 5101010100 00 06 67 74 43 39 97 78 82 26 636368 88 85 53 39 9d=d=2424dd2 2=9696例例15.7 按性别相同、年龄相近、病情相近把按性别相同、年龄相近、病情相近把16例某病患者配成例某病患者配成8对,每对分别给予对,每对分别给予A药和药和B药治疗,现测得治疗后的血沉(药治疗,现测得治疗后的血沉(mm/h)结果如下,问:不同药物治疗后病人血沉水平是否有差异?结果如下,问:不同药物治疗后病人血沉水平是否有差异?表
50、表15-3 不同药物治疗后某病患者的血沉值(不同药物治疗后某病患者的血沉值(mm/h)二、配对设计的差值均数与总体均数二、配对设计的差值均数与总体均数0 0的比较的比较20232023年年2 2月月6 6日星期一日星期一70自身配对举例:自身配对举例:表表1 1 克矽平治疗前后血清粘蛋白(克矽平治疗前后血清粘蛋白(mg/Lmg/L)患者号患者号 治疗前治疗前 治疗后治疗后 差值差值 d d (1 1)(2 2)(3 3)(4 4)=(2 2)-(3 3)1 1 6565 3434 3131 2 2 7373 3636 3737 3 3 7373 3737 3636 4 4 3030 2626