1、尹家祥大理学院公共卫生学院 普查普查(overall survey)是了解总体特征的最好方法。抽样研究抽样研究(sampling study)的目的就是要用样本信息来推断相应总体的特征,这一过程称为统计推断(statistical inference)。统计推断统计推断包括两方面的内容:总体参数的估计和假设检验(显著性检验)。三类误差 系统误差(系统误差(systematic error):由于受试对象、研究者、:由于受试对象、研究者、仪器设备、研究方法、非实验因素影响等确定性原因造成,仪器设备、研究方法、非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差。可以避免。有一定倾向性或规律
2、性的误差。可以避免。随机误差(随机误差(random error):由于多种无法控制的偶然因:由于多种无法控制的偶然因素引起,对同一样品多次测量数据的不一致。无倾向性,素引起,对同一样品多次测量数据的不一致。无倾向性,不可避免。不可避免。抽样误差(抽样误差(sampling error):由个体变异产生的、由于抽:由个体变异产生的、由于抽样而造成的样本均数与样本均数及样本均数与总体均数之样而造成的样本均数与样本均数及样本均数与总体均数之间的差异称为均数的抽样误差。间的差异称为均数的抽样误差。抽样误差的概念抽样误差的概念 总体总体样本样本统计推断统计推断抽样抽样抽样误差抽样误差 抽样误差产生的根
3、本原因是个体变异、产生的直接原因是抽样。只要有抽样,抽样误差就不可避免。抽样抽样误差。sxxi,Normal distribution样本均数的分布特点样本均数的分布特点 各样本均数未必等于总体均数;各样本均数间存在各样本均数未必等于总体均数;各样本均数间存在差异。差异。样本均数分布很有规律,在正态总体中随机抽取例样本均数分布很有规律,在正态总体中随机抽取例数为数为n的样本,样本均数服从正态分布。的样本,样本均数服从正态分布。样本均数间相差较小,其变异范围较原变量值的变样本均数间相差较小,其变异范围较原变量值的变异范围缩小。异范围缩小。在偏态总体中随机抽样,当在偏态总体中随机抽样,当n足够大时
4、(足够大时(n60),),也近似正态分布。也近似正态分布。l该资料是一个正偏峰的分布,用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图。PERCENT030 x MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0 原始数据原始数据n=5PERCENT030mm MIDPOIN
5、T0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0 n=10PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.9
6、4.04.14.24.34.44.54.64.74.84.95.0 n=30PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0 n=50PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.
7、02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0 (b)n=5(c)n=10 (d)n=30 (e)n=50 1)从正态总体)从正态总体N(,2)中,随机抽取例数为中,随机抽取例数为n的多个的多个样本,样本均数样本,样本均数 服从正态分布;即使是从偏态总体服从正态分布;即使是从偏态总体中随机抽样,当中随机抽样,当n足够大时足够大时(如如n30),也近似正态也近似正态分布。分布。数理统计推理和中心极限定理表明:数理统计推理和中心极限定理表明:2)从均数为)从均数为
8、,标准差为,标准差为的正态或偏态总体中抽取的正态或偏态总体中抽取例数为例数为n的样本,样本均数的标准差即标准误为的样本,样本均数的标准差即标准误为 。XnX/XX标准误的概念标准误的概念 用于表示均数抽样误差的指标叫样本用于表示均数抽样误差的指标叫样本均数的标准差,根据其实际意义,常称作均数的标准差,根据其实际意义,常称作样本均数的标准误(样本均数的标准误(standard error)。标准误的大小与标准误的大小与的大小成正比,与的大小成正比,与n的平方根成反的平方根成反比,而比,而为定值,说明可以通过增加样本例数来减少标为定值,说明可以通过增加样本例数来减少标准误,以降低抽样误差。准误,以
9、降低抽样误差。未知,用样本标准差未知,用样本标准差S来估计来估计总体标准差总体标准差。用用 来表示均数抽样误差的大小。来表示均数抽样误差的大小。nX/nSSX/XS(标准误的理论值)(标准误的理论值)(标准误的估计值)(标准误的估计值)随着随着 n S 稳定稳定 Sx 0均数的标准误与标准差成正比,与样本例均数的标准误与标准差成正比,与样本例数数n n的平方根成反比。的平方根成反比。因此,减少抽样误差因此,减少抽样误差最有效最有效的办法:的办法:增加样本例增加样本例数数nSSX/2000年某研究所随机调查某地健康成年男年某研究所随机调查某地健康成年男子子27人,得到血红蛋白的均数为人,得到血红
10、蛋白的均数为125g/L,标准差,标准差为为15g/L。试估计该样本均数的抽样误差。试估计该样本均数的抽样误差。LgnSSX/89.227/15/标准误的应用标准误的应用 反映抽样误差大小反映抽样误差大小:标准误越大,抽样误差越大;反映均数的可靠性反映均数的可靠性:越大,样本均数的抽样误差越大,(用样本均数推算总体均数的)可靠性差;反之,越小,均数抽样误差越小,(用样本均数推算总体均数的)可靠性好。用于进行假设检验用于进行假设检验。标准差和标准误的区别和联系标准差和标准误的区别和联系 区别区别:概念不同:概念不同:标准差是描述观察值标准差是描述观察值(个体值个体值)之间的变异程度,之间的变异程
11、度,S越小,均数的代表性越好;标准误是描述样本均数的抽越小,均数的代表性越好;标准误是描述样本均数的抽样误差,样误差,Sx越小,均数的可靠性越高;越小,均数的可靠性越高;用途不同:用途不同:标准差与均数结合估计参考值范围,计算变标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用于估计参数的可信区异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。间,进行假设检验等。与样本含量的关系不同与样本含量的关系不同:当样本含量当样本含量 n 足够大时,标准差足够大时,标准差趋向稳定;而标准误随趋向稳定;而标准误随n的增大而减小,甚至趋于的增大而减小,甚至趋于0。联系联系
12、:标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。t 分布分布 在统计应用中,可以把任何一个均数为在统计应用中,可以把任何一个均数为,标准差为标准差为的正态分布的正态分布N(,2)转变为转变为=0,=1的的标准正态分布,即将正态变量值标准正态分布,即将正态变量值X用用 来代替。来代替。由于由于 服从正态分布,故服从正态分布,故服从标准正态分布服从标准正态分布N(0,1)。XZXXXZXSXt 实际资料的分析中,由于实际资料的分析中,由于 往往未往往未知,故标准化转换演变为:知,故标准化转换演变为:/XXXSSn转换值服从服从=n-1的的t分布,即:分布,即:t-分布(f)-
13、degree of freedom自由度自由度=n-1 t 分布曲线下面积规律:分布曲线下面积规律:t 分布曲线下总面积仍为分布曲线下总面积仍为1或或100%t 分布曲线下面积以分布曲线下面积以0为中心左右对称。为中心左右对称。t 分布是一簇曲线,故分布是一簇曲线,故t分布曲线下固定面分布曲线下固定面积积(如如95%或或99%)的界值不是一个常量,的界值不是一个常量,而是随自由度的大小而变化而是随自由度的大小而变化。t 分布曲线特点:分布曲线特点:1)t 分布曲线是单峰分布,它以分布曲线是单峰分布,它以0为中心,左为中心,左右对称。右对称。2)t 分布的形状与样本例数分布的形状与样本例数n有关
14、。自由度越有关。自由度越小,则小,则 越大,越大,t 值越分散,曲线的峰部越矮,尾部值越分散,曲线的峰部越矮,尾部则偏高。则偏高。3)当当 n时,则时,则S逼近逼近,t 分布逼近标准分布逼近标准正态分布。正态分布。t 分布不是一条曲线,而是一簇曲线。分布不是一条曲线,而是一簇曲线。t 分布的图形和分布的图形和 t 分布表分布表XS 统计推断包括参数估计和假设检验。参数估计就是统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。用样本指标(统计量)来估计总体指标(参数)。参数估计参数估计:点估计点估计(point estimation):用相应样本统计量直接作
15、:用相应样本统计量直接作为其总体参数的估计值。如用为其总体参数的估计值。如用 估计估计、S估计估计等。等。其方法虽简单,但未考虑抽样误差的大小。其方法虽简单,但未考虑抽样误差的大小。区间估计区间估计(interval estimation):按一定的概率(按一定的概率(1)估计总体均数所在范围(置信区间)。估计总体均数所在范围(置信区间)。X ,即认为即认为20002000年该地所有健康成年男性血红年该地所有健康成年男性血红蛋白量的总体均数为蛋白量的总体均数为125125g/L。1.点估计点估计:用样本统计量直接作为总体参数的估计值用样本统计量直接作为总体参数的估计值。2000年某研究所测得某
16、地年某研究所测得某地2727例健康成年男性血例健康成年男性血红蛋白量的样本均数为红蛋白量的样本均数为125125g/L,试估计其总体均数。,试估计其总体均数。X2.区间估计区间估计:按预先给定的置信水平按预先给定的置信水平(1)估计总估计总体参数的可能位置体参数的可能位置,该范围就称为该范围就称为。预先给定的概率预先给定的概率(1)称为称为,常取,常取95%或或99%。如无特别说明,一般取双侧。如无特别说明,一般取双侧95%。置信区间由两个数值即置信区间由两个数值即下限下限上限上限构构成。成。通式:通式:(双侧)(双侧)由由z z分布,分布,标准标准正态曲线下有正态曲线下有95%95%的的z
17、z值在值在1.961.96之间之间。96.1X96.1X 95%的双侧置信区间:的双侧置信区间:99%的双侧置信区间:的双侧置信区间:XzX2/XX96.1X96.1X XX96.1X,96.1X XX58.2X,58.2X 总体均数总体均数可信区间的计算可信区间的计算 0 0 2.52.5-t-t0.050.05t t0.050.05通式:通式:(双侧)(双侧)由由t t分布可知,自由度越大,分布可知,自由度越大,t t分布越逼近标准正态分布越逼近标准正态分布,此时分布,此时t t曲线下曲线下约约有有95%95%的的t t值在值在1.96之间,即95%的双侧置信区间:99%的双侧置信区间:9
18、6.1sX96.1X X2/SZX XXS96.1XS96.1X XXS96.1X,S96.1X XXS96.1X,S96.1X 某市某市20002000年随机测量了年随机测量了9090名名1919岁健康男大学生岁健康男大学生的身高,其均数为的身高,其均数为172.2cm172.2cm,标准差为,标准差为4.5cm,4.5cm,,试估,试估计该地计该地1919岁健康男大学生的身高的岁健康男大学生的身高的95%95%置信区间。置信区间。XSzX2/9612050.Z/.1.173,3.171905.496.12.172S96.1XX 该市该市1919岁健康男大学生的身高的岁健康男大学生的身高的9
19、5%95%置信区间置信区间(171.3,173.1)cm(171.3,173.1)cm,此时此时 某自由度的某自由度的t t曲线下曲线下约约有有95%95%的的t t值在值在t0.05/2()之间,通式:95%的双侧置信区间:的双侧置信区间:99%的双侧置信区间的双侧置信区间:2/05.0X2/05.02/05.02/05.0tsXtttt XstX,2/t t/2,/2,是按自由度是按自由度=n-1=n-1,由附表,由附表2 2查得的查得的t t值值。X2/05.0X2/05.0StXStX X2/05.0X2/05.0StX,StX X2/05.0X2/05.0StX,StX 已知某地已知
20、某地2727例健康成年男性血红蛋白量的均数例健康成年男性血红蛋白量的均数为为 ,标准差,标准差S S=15g/L=15g/L,试问该地试问该地健康成年男健康成年男性血红蛋白量的性血红蛋白量的95%95%和和99%99%置信区间。置信区间。本例本例n n=27=27,S S=15=15 94.130,06.11938.2056.21252715tX262/05.0 LgX/12595%CI:02.133,98.11638.2779.21252715tX262/01.0 99%CI:可信区间的确切涵义可信区间的确切涵义 从总体中作随机抽样,进行重复抽样的试验中,平均有1a的可信区间包含了总体参数,
21、有a的可信区间不包括总体均数。即犯错误的概率为a,而a是小概率事件,对一次试验的可能性小,因此,实际应用中就认为总体均数在算得的可信区间内。95%95%的可信区间的理解的可信区间的理解(1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数。可信区间的两个要素可信区间的两个要素 准确度(准确度(accuracy):反映在可信度(1)的大小。1越接近1,就越准确。
22、如可信度99%比95%准确。精确度(精确度(precision):反映在区间的长度。长度越小越好,在例数n确定的情况下,二者呈反比关系:准确度,精确度(范围变宽)。要兼顾准确度和精确度,一般取95%可信区间。可信区间与参考值范围区别可信区间与参考值范围区别 意义不同意义不同 正常值范围是指绝大多数观察值在某个范围正常值范围是指绝大多数观察值在某个范围 可信区间是指按一定的可信度估计总体均数(参数)的可信区间是指按一定的可信度估计总体均数(参数)的所在范围所在范围 计算公式不同计算公式不同 可信区间可信区间 参考值范围参考值范围 应用不同应用不同 可信区间可信区间:估计总体均数估计总体均数 参考
23、值范围:判断某项指标是否正常参考值范围:判断某项指标是否正常SX96.1XSX96.1 假设检验(hypothesis test)也称显著性检验(significance test),是用来判断样本与样本,样本与总体的差异是由抽样误差抽样误差引起的?还是本质本质差别差别造成的?由于存在抽样误差,从总体中随机抽样所得的样本均数与总体均数之间存在误差,从同一总体中抽取的样本均数之间也有误差。假设检验原理假设检验原理 某医生测量了某医生测量了3636名从事铅作业的血红蛋名从事铅作业的血红蛋白含量,算得其均数为白含量,算得其均数为130.83g/L130.83g/L,标准差为,标准差为25.74g/L
24、25.74g/L。问从事铅作业工人的血红蛋白是否。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值不同于正常成年男性平均值140g/L140g/L?0=140g/L已知总体已知总体X=130.83g/LS=25.74g/L未知总体未知总体=完全由抽样误差引起,比较的均数完全由抽样误差引起,比较的均数来源于同一总体;来源于同一总体;_x2_1_xx 的原因的原因假设检验计算假设检验计算 的概率判断。的概率判断。来自于不同的总体,均数之间存在本来自于不同的总体,均数之间存在本质差别。质差别。0X差异完全由抽样误差引起差异完全由抽样误差引起0X差异完全由抽样误差引起差异完全由抽样误差引起0X来
25、自于不同的总体来自于不同的总体0X来自于不同的总体来自于不同的总体假设检验的基本思想u小概率思想:小概率思想:u小概率事件:在一次试验中认为基本上不可能发生。小概率事件:在一次试验中认为基本上不可能发生。小概率事件的概率是相对的,统计分析时就是预先小概率事件的概率是相对的,统计分析时就是预先规定检验水准(规定检验水准(size of a test),用),用 表示,表示,u反证法思想:反证法思想:u当检验假设当检验假设H0成立时,用合适的统计方法获得现在成立时,用合适的统计方法获得现在样本的概率大小(样本的概率大小(P值)。如果是小概率事件,则值)。如果是小概率事件,则推断假设是假的,因此拒绝
26、它;如果不是小概率事推断假设是假的,因此拒绝它;如果不是小概率事件,则不能认为假设是假的,也因此不能拒绝它。件,则不能认为假设是假的,也因此不能拒绝它。假设检验的基本步骤假设检验的基本步骤 1 1、建立假设和确定检验水准、建立假设和确定检验水准 2 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 3 3、确定、确定P P值和作出推断结论值和作出推断结论 1、建立假设和确定检验水准、建立假设和确定检验水准(1)两个假设)两个假设 无效假设:无效假设:H0:u=u0 备择假设:备择假设:H1:uuuu0 0对于假设检验,对于假设检验,须注意:须注意:检验的假设是针对总体而言,而不是
27、针对样本;检验的假设是针对总体而言,而不是针对样本;H H0 0和和H H1 1是相互联系、对立的假设,后面的结论是是相互联系、对立的假设,后面的结论是根据根据H H0 0和和H H1 1作出的,因此,两者不是可有可无,而作出的,因此,两者不是可有可无,而是缺一不可;是缺一不可;H H0 0是无效假设,其假设通常是:某两个总体参数是无效假设,其假设通常是:某两个总体参数相等,或两个总体参数之差等于相等,或两个总体参数之差等于0 0等等。等等。H H1 1的内容反映了检验的单双侧。的内容反映了检验的单双侧。单侧检验:单侧检验:在比较两种药物的疗效时,根据专业知在比较两种药物的疗效时,根据专业知识
28、可认为新药不会比旧药差,只关心新药是否比旧识可认为新药不会比旧药差,只关心新药是否比旧药好(至多相同,绝对排除出现相反的可能性),药好(至多相同,绝对排除出现相反的可能性),可用单侧检验。可用单侧检验。(2)确定单侧或双侧检验确定单侧或双侧检验 根据专业知识和研究目的而定根据专业知识和研究目的而定双侧检验:双侧检验:在比较两种药物的疗效时,事先不能确在比较两种药物的疗效时,事先不能确定哪种药的疗效较好,只关心两药的疗效有无差别,定哪种药的疗效较好,只关心两药的疗效有无差别,要用双侧检验。要用双侧检验。双侧检验若有差别,单侧检验肯定有差别;反之,双侧检验若有差别,单侧检验肯定有差别;反之,单侧检
29、验若有差别,双侧检验不一定有差别。单侧检验若有差别,双侧检验不一定有差别。甲均数与乙均数相比甲均数与乙均数相比:可能高可能高,也可能低也可能低 双侧检验双侧检验 肯定不会低(或高)肯定不会低(或高)单侧检验单侧检验H H1 1:0 0 0 0 1 1 2 2 1 1 2 2(3)确定检验水准(显著性水准)确定检验水准(显著性水准)一般一般0.05,发生第一类错误的概率,发生第一类错误的概率,即即H H0 0实际成立,但拒绝实际成立,但拒绝H H0 0的概率的概率。2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 不同设计、不同的资料类型和不同的推不同设计、不同的资料类型和不同的推
30、断目的,选用不同的检验方法。断目的,选用不同的检验方法。3、确定、确定P值值 P值值是指由所规定的总体作随机抽样,是指由所规定的总体作随机抽样,获得等于及大于(或等于及小于)现有样本获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。获得的检验统计量值的概率。手工计算:手工计算:一般是通过查界值表获得。一般是通过查界值表获得。统计软件:统计软件:直接给出精确的直接给出精确的P P值值4、作出推断结论、作出推断结论(含统计结论和专业结论)(含统计结论和专业结论)统计结论:统计结论:拒绝拒绝H0,接受,接受H1,差异有统计学意义。差异有统计学意义。专业结论:专业结论:可认为可认为 不同
31、或不等。不同或不等。当当 P时,时,将获得的事后概率将获得的事后概率P P与事先规定的概率与事先规定的概率进行比较。进行比较。当当P时,时,统计结论:统计结论:不拒绝不拒绝H0,差异无统计学意义,差异无统计学意义专业结论:专业结论:还不能认为还不能认为 不同或不等。不同或不等。假设检验的特点:假设检验的特点:1、统计检验的假设是关于总体特征的假设;、统计检验的假设是关于总体特征的假设;2、用于检验的方法是以检验统计量的抽样分布为、用于检验的方法是以检验统计量的抽样分布为理论根据的;理论根据的;3、作出的结论是概率性的,不是绝对的肯定或绝、作出的结论是概率性的,不是绝对的肯定或绝对的否定。(无论
32、是拒绝对的否定。(无论是拒绝H0或不拒绝或不拒绝H0,都有可能发都有可能发生错误)生错误)假设检验中假设检验中值与值与P值的区别:值的区别:1、假设检验中、假设检验中值是检验水准,是拒绝或不拒绝值是检验水准,是拒绝或不拒绝H0的概率标准。的概率标准。的大小是人为选定的,一般取的大小是人为选定的,一般取0.05。2、P值是指在值是指在H0所规定的总体中作随机抽样所规定的总体中作随机抽样,获得等获得等于或大于于或大于(等于或小于等于或小于)现有样本统计量的概率。通过现有样本统计量的概率。通过P值与值与值的比较来确定拒绝或不拒绝值的比较来确定拒绝或不拒绝H0。未知未知 两样本较小(两样本较小(n n
33、1 1与与n n2 25050)两样本均数比较时,两样本的总体方差相两样本均数比较时,两样本的总体方差相等(即方差齐)等(即方差齐)上述都要求:资料服从对称或正态分布。上述都要求:资料服从对称或正态分布。t t检验适用条件检验适用条件 已知已知,x x与与比较比较 两大样本(两大样本(n n1 1与与n n2 25050)均数比较)均数比较 上述两种情况都要求:资料服从对称上述两种情况都要求:资料服从对称或正态分布。或正态分布。u u检验适用条件检验适用条件t t检验和检验和u u检验类型检验类型 1、样本均数与总体均数的比较、样本均数与总体均数的比较t检验检验 2、配对设计差值均数与总体均数
34、、配对设计差值均数与总体均数0的比较的比较t检验检验 3、两样本均数的比较、两样本均数的比较t检验检验 4、两样本几何均数的比较、两样本几何均数的比较t检验检验 5、两大样本均数比较、两大样本均数比较u检验检验 1 1、单样本、单样本t t检验检验 样本均数代表的未知总体均数样本均数代表的未知总体均数和已和已知总体均数知总体均数0的比较的比较0理论值、标准值、理论值、标准值、稳定值稳定值X 样本均数与已知样本均数与已知总体均数总体均数(一般为(一般为理理论值、标准值或大量观测所得的稳定值论值、标准值或大量观测所得的稳定值)的比较,目的是推断样本所代表的总体与的比较,目的是推断样本所代表的总体与
35、已知总体是否相等。根据已知总体是否相等。根据是否已知和样是否已知和样本含量本含量n n的大小的大小,选用选用u u检验或检验或t t检验。检验。nsXSXtXt t检验计算公式为检验计算公式为:某医生测量了某医生测量了3636名从事铅作业的血红蛋名从事铅作业的血红蛋白含量,算得其均数为白含量,算得其均数为 =130.83g/L =130.83g/L,标准,标准差为差为25.74g/L25.74g/L。问从事铅作业工人的血红蛋白。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值是否不同于正常成年男性平均值140g/L140g/L?X0=140g/L已知总体已知总体 =130.83g/LS=
36、25.74g/L未知总体未知总体=X检验步骤:检验步骤:建立假设和确定检验水准建立假设和确定检验水准 H0:=0=140g/L H1:0=140g/L 双侧双侧=0.05选定检验方法和计算检验统计量选定检验方法和计算检验统计量本例本例n=36n=36,=130.83g/L =130.83g/L,S=25.74g/LS=25.74g/L,0 0=140g/L=140g/L,按下式按下式 138.236/74.2514083.130ns/xt0v=n-1=36-1=35X例 5确定确定P值值 以以v=35查附表查附表2,t界值表,得:界值表,得:(v一定时,一定时,t值越大,值越大,P值越小值越小
37、)。ptttt05.002.0138.2438.2;030.235,02.035,05.035,02.035,05.0故双尾概率因为 查查t t值表时,先查值表时,先查P=0.05P=0.05时的界值。时的界值。当当P0.05P0.05P0.05时,需继续往时,需继续往P P更大的一侧查,更大的一侧查,直到最大的直到最大的P P值为止。值为止。如使用统计软件,会给出确切的概率值。如使用统计软件,会给出确切的概率值。注意注意 今今0.02P0.50。按=0.05 水准,不拒绝 H0,无统计学意义。还不能认为阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同。(3)(3)确定确定P P值,作出推断结
38、论值,作出推断结论 U U检验检验-两个大样本均数的比较两个大样本均数的比较 当两个大样本含量较大(均100)时,可用u检验。2221212_1_222_1_2_1_2_1_2_1_nSnSxxSSxxSxxuxxxx两种职业的血清胆固醇水平(mmol/L)职业类型职业类型 人数人数 均值均值 标准差标准差 教师教师 537 4.8 0.72 537 4.8 0.72 工人工人 643 4.6 0.81 643 4.6 0.81 某医生研究血清胆固醇水平与职业的关系,得调查资料如下表,问两种职业的血清胆固醇水平是否不同?假设假设:H0:12 H1:12 0.050.05计算计算u u值值448
39、.464381.053772.06.48.4222221212_1_nSnSxxu-确定确定P P值值 u u 2.58 P 2.58 P 0.01 0.01 统计推断结论统计推断结论 P P 0.01 0.01,在,在0.050.05水准上拒绝水准上拒绝H H0 0,接受,接受H H1 1,差异有统计学意义。可认为差异有统计学意义。可认为教师教师的血清胆固醇水平高于工人。的血清胆固醇水平高于工人。1.96 0.05 不拒绝不拒绝H0 无无1.96 0.05 拒绝拒绝H0,接受,接受H1 有有2.58 0.01 拒绝拒绝H0,接受,接受H1 有高度有高度u u值、值、P值与统计结论的关系(值与
40、统计结论的关系(0.050.05)u u值值*P值值 结论结论 差异的统计学意义差异的统计学意义*为双侧,单侧为双侧,单侧u界值为界值为1.645、2.326。两个样本几何均数比较两个样本几何均数比较 1、应用条件:a.两样本的对数值均来自正态总体 b.两样本的对数值的方差齐 2、检验公式 与两样本均数的t检验和u检验公式相同,只是原始数据要作对数变换,用对数值的均数和标准差代公式。3、检验步骤、检验步骤 在使用统计软件进行分析时,先将原始数据取对数,然后用对数值对数值作一般的t检验。注意啦!注意啦!检验步骤同两样本均数比较的t检验可信区间与假设检验的关系可信区间与假设检验的关系(1)可信区间
41、亦可用于回答假设检验问题。(2)可信区间比假设检验还可提供更多的信息。但这并不意味着可以完全用可信区间代替假设检验。假设检验得到的P值可以较精确地说明结论的概率保证,而可信区间只能告诉我们在水准上有无统计意义,却不能象P值那样提供精确的概率。某医生测量了某医生测量了3636名从事铅作业的血红蛋名从事铅作业的血红蛋白含量,算得其均数为白含量,算得其均数为130.83g/L130.83g/L,标准差为,标准差为25.74g/L25.74g/L。问从事铅作业工人的血红蛋白是否。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值不同于正常成年男性平均值140g/L140g/L?95%CI 95%C
42、I为(为(122.12,139.54122.12,139.54)g/Lg/L 140g/L有实际意义有实际意义有统计意义,可能有统计意义,可能有实际意义有实际意义有统计意义,无有统计意义,无实际意义实际意义无统计意义,样本例数无统计意义,样本例数太少太少确实无差别确实无差别有实际意义值有实际意义值H0变量变换变量变换 实际资料若不满足正态性或/和方差齐性的假定,尤其当是小样本资料时,这时如用一般的t检验可能会导致偏离真实结果较远。对于明显偏离上述应用条件的资料,可通过变量变换的方法加以改善。变量变换是将原始数据作某种函数转换,如转换为对数值,以达到某种分析的目的。(一)变量变换的定义适当的函数
43、转换可使适当的函数转换可使 目的同时达到。目的同时达到。(二)变量变换的目的(二)变量变换的目的 使各组达到方差齐性;使资料转换为正态分布,以满足方差分析和t检验的应用条件。直线化。通过变换后,使曲线关系变成直线关系,常用于曲线拟合。(三)常用的变量变换(三)常用的变量变换 1.对数变换对数变换 2.平方根变换平方根变换 3.倒数变换倒数变换 4.平方根反正弦变换平方根反正弦变换 轻度偏态、方差不齐轻度偏态、方差不齐Poisson分布资料分布资料两端波动较大的资料两端波动较大的资料二项分布资料二项分布资料假设检验的两类错误假设检验的两类错误第类错误:如果实际情况与H0一致,仅仅由于抽样的原因,
44、使得统计量的观察值落到拒绝域,拒绝原本正确的H0,导致推断结论错误。这样的错误称为第类错误。犯第类错误的概率大小为。第类错误:如果实际情况与H0不一致,也仅仅由于抽样的原因,使得统计量的观察值落到非拒绝域,不能拒绝原本错误的H0,导致了另一种推断错误。这样的错误称为第类错误。犯第类错误的概率为。实际情况检验结果拒绝H0不拒绝H0H0为真第类错误()假阳性(误诊)结论正确(1-)置信度H0不真结论正确(1-)检验效能第类错误()假阴性(漏诊)当样本含量当样本含量n一定时,一定时,越小,越小,越大;若越大;若想同时减少想同时减少和和,只有增大样本含量。只有增大样本含量。1-称为假设检验的效能称为假
45、设检验的效能 当所研究的总体与H0确有差别时,按检验水准能够发现它(拒绝H0)的概率。一般情况下对同一检验水准,效能大的检验方法更可取。在医学科研设计中,检验效能(1-)不宜低于0.75,否则检验结果很可能反映不出总体的真实差异,出现非真实的阴性结果。假设检验的检验效能假设检验的检验效能 1.1.要有严密的研究设计要有严密的研究设计 在抽样研究中,研究设计、搜集数据和统计分析是一个整体。每一种假设检验方法都是与相应的研究设计相联系的。2.2.应用检验方法必需符合其适用条件应用检验方法必需符合其适用条件 如一般t 检验要求样本取自正态总体,而且各总体方差齐同。3.3.适当选择检验水准适当选择检验
46、水准 当样本量一定时,越小,越大;反之亦然。若想同时减少和,只有增大样本含量。应用假设检验需要注意的问题应用假设检验需要注意的问题4.4.正确理解正确理解P P值的意义值的意义 P值很小时“拒绝H0,接受H1”,但是不要把很小的P值误解为总体参数间差异很大。如果P,宜说差异“有统计学意义”,同时写出P的数值或相应的不等式。5.5.统计统计“显著性显著性”与专业与专业“显著性显著性”假设检验是为各专业服务的,统计结论必须和专业结论有机的相结合,才能得出恰如其分、符合客观实际的最终结论。小小 结结o总体均数的估计n标准误(SE)和标准差(SD)nt分布的特点n总体参数估计n可信区间和参考值范围o假设检验n基本思想和基本步骤n几种t检验类型n假设检验的两型错误及应注意的问题尹家祥博士联系方式:尹家祥博士联系方式:Email: 手机:手机:5