1、第第9 9章章 计量资料的统计推断计量资料的统计推断主要内容第第1节节 均数的抽样误差和标准误均数的抽样误差和标准误抽取部分观察单位抽取部分观察单位统计量统计量参数参数推断推断总体总体样本样本?包括以下两个方面包括以下两个方面2.假设检验假设检验 亦称显著性检验,先对未知总体的参数或亦称显著性检验,先对未知总体的参数或分布作出某种假设,再用适当的方法根据样本对总体提供分布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。的信息,推断此假设应当拒绝或不拒绝。 二二、均数的抽样误差和标准误均数的抽样误差和标准误1.均数的抽样误差:由于抽样造成的样本均数与总体均数间的
2、差异。均数的抽样误差:由于抽样造成的样本均数与总体均数间的差异。 总体总体样本样本抽取部分观察单位抽取部分观察单位x推断推断x与与之差即为均数的抽样误差之差即为均数的抽样误差2.标准误标准误 样本均数的标准差称为均数的标准误,样本均数的标准差称为均数的标准误,简称标准误,符号为简称标准误,符号为 。nXxnSSX实例实例例例9-1 某市随机调查了某市随机调查了120名名13岁健岁健康女生的身高情况,得身高均数为康女生的身高情况,得身高均数为155.52cm,标准差为,标准差为5.67cm,试计,试计算其标准误。算其标准误。 )(52. 012067. 5cmnssx标准误的用途标准误的用途 反
3、映抽样误差的大小。反映抽样误差的大小。 用于估计总体均数的可用于估计总体均数的可信区间。信区间。 用于均数的假设检验用于均数的假设检验 。标准差和标准误的区别三、t值及t分布t值是样本均数值是样本均数 与总体均数与总体均数 之差除以标准之差除以标准误估计值误估计值 所得的商。公式为:所得的商。公式为:xsxxsxsxtx 如果从一个正态总体中,随机抽取例数为如果从一个正态总体中,随机抽取例数为n 的许多样本,分别计算其样本均数和标准误,然的许多样本,分别计算其样本均数和标准误,然后据上式求出每一个后据上式求出每一个t值,这样可得到许多个值,这样可得到许多个t值值,其频数分布是一种连续型分布,这
4、些,其频数分布是一种连续型分布,这些t值的分布值的分布就是就是t分布。分布。 t分布是分布是t检验的理论基础。检验的理论基础。xt分布的特征 自由度分别为自由度分别为1、5、时的时的t分布分布t分布曲线下面积分布规律v t t分布中理论上有分布中理论上有95%95%的的t t值值满足满足有有99%99%的的t t值满足:值满足:v tt值越大,其两侧或单值越大,其两侧或单侧以外的面积占曲线下总面侧以外的面积占曲线下总面积的百分比就越小,说明抽积的百分比就越小,说明抽样获得此样获得此tt值以及更大值以及更大tt值的机会就越小,其值的机会就越小,其大小用概率大小用概率P P来表示。来表示。v 在同
5、一自由度下,在同一自由度下,t t t t,则则P P ; 反之,反之,ttt t,则则P P。0.05/2,0.05/2,ttt0.01/2,0.01/2,tttt t分布曲线下单双尾面积与分布曲线下单双尾面积与t t值值的关的关系系四四、总体均数的估计总体均数的估计(一)点(值)估计(一)点(值)估计 是直接用样本均数作为总体均数的是直接用样本均数作为总体均数的估计值。估计值。 计算简便,但由于存在抽样误差,计算简便,但由于存在抽样误差,不能准确地估计出总体均数大小,不能准确地估计出总体均数大小,也无法确定总体均数的可靠程度,也无法确定总体均数的可靠程度,故实际工作中不常用。故实际工作中不
6、常用。(二(二)区间估计区间估计是按一定的概率是按一定的概率(1-)(1-)估计包含未知总体均估计包含未知总体均数可能的范围,亦称总体均数的可信区间数可能的范围,亦称总体均数的可信区间(confidence interval(confidence interval缩写为缩写为CI)。)。1-1-称为可信度,常取称为可信度,常取1-1-为为95%95%和和99%99%,即,即总体均数的总体均数的95%95%可信区间和可信区间和99%99%可信区间。可信区间。1-(1-(如如9595) )可信区间的含义是:总体均数可信区间的含义是:总体均数被包含在该区间内的可能性是被包含在该区间内的可能性是1-(
7、1-(如如9595) ),未被包含的可能性为未被包含的可能性为(如(如5 5)。)。可信区间的计算可信区间的计算1. 样本含量样本含量n较小较小(n 2 或或1100),可用可用u检验。不同的统计检验检验。不同的统计检验方法,可得到不同的统计量,如方法,可得到不同的统计量,如t 值和值和u值。值。3. 确定概率确定概率P值,作出推断结论值,作出推断结论 确定概率确定概率P值:值:根据自由度,查相应统计量根据自由度,查相应统计量的界值表的界值表(如如 t值表值表),确定现有统计量的概率,确定现有统计量的概率P值,再与检验水准值,再与检验水准进行比较作出拒绝或不拒进行比较作出拒绝或不拒绝绝H0的推
8、断结论。的推断结论。 推断结论:推断结论:若若 P P ,结论为,结论为按所取检验水准不按所取检验水准不拒拒H H0 0;若若PP ,结论为按所取检验水准拒绝,结论为按所取检验水准拒绝H H0 0,接受接受H1。 两均数比较时常用的判断标准如下表:两均数比较时常用的判断标准如下表:二、样本均数与总体均数比较的t检验推断样本均数所代表的未知总体均数推断样本均数所代表的未知总体均数与与已知总体均数已知总体均数0有无差别有无差别(0 一般为理论值、标一般为理论值、标准值或经过大量观察所得的稳定值等准值或经过大量观察所得的稳定值等)要求资料来自正态或近似正态分布总体。要求资料来自正态或近似正态分布总体
9、。nSxt0 = n 1 例9-4 已知健康成年男性白细胞均值为已知健康成年男性白细胞均值为7.0109/L。现某医生随。现某医生随机抽取某厂机抽取某厂20名苯作业男工,白细胞均数为名苯作业男工,白细胞均数为5.2109/L,标准差为,标准差为1.9109/L。问苯作业男工白细胞均数与健康成年男性有无差别?。问苯作业男工白细胞均数与健康成年男性有无差别? 检验步骤如下:检验步骤如下: 三、两样本均数比较的t检验和u检验2121xxSxxt = n1+n2-2其中两均数之差的标准误为:其中两均数之差的标准误为:212122121121nnnnSnnSSccxx合并方差为:合并方差为:2/)(/)
10、(2122222121212nnnXXnXXSc当当s1和和s2已知时:已知时:2)1()1(212222112nnSnSnSc 例例9-5 某市妇产科医院随机抽查了某市妇产科医院随机抽查了13例出生后存活及例出生后存活及12例出例出生后死亡婴儿,体重测量结果如下。试问出生后存活婴儿与死生后死亡婴儿,体重测量结果如下。试问出生后存活婴儿与死亡婴儿的体重有无不同?亡婴儿的体重有无不同? 存活婴儿体重(存活婴儿体重(kg):):2.015 1.715 1.130 3.160 2.550 2.090 1.720 1.575 3.400 2.570 2.600 2.040 1.680 死亡婴儿体重(死
11、亡婴儿体重(kg):):1.050 1.770 1.295 1.940 1.185 1.600 1.175 2.275 1.300 2.200 1.225 2.730 检验步骤如下:检验步骤如下:(1)建立假设,确定检验水准)建立假设,确定检验水准 H0:12 H1:12 =0.05(2)选择检验方法、计算统计量)选择检验方法、计算统计量t值值X1=28.245,X12=66.482, =2.173, n1=13 X2=19.745,X22=35.680,n2=12, =1.645,计算合并方差得:计算合并方差得:计算两均数之差的标准误得:计算两均数之差的标准误得:1x2x3611. 0212
12、1312745.19680.3513245.28482.66222cs2406. 01211313611021xxS19. 22406. 0645. 1173. 22121xxsxxt计算计算t值得:值得: (3)确定)确定P值,作出推断结论:值,作出推断结论:2.两大样本均数比较的两大样本均数比较的u检验检验 22212121nSnSXXu两种劳动类型的人血清胆固醇水平(两种劳动类型的人血清胆固醇水平(mmol/L) 例例9-6 某医院为了研究血清胆固醇水平与劳动类某医院为了研究血清胆固醇水平与劳动类型的关系,调查资料如下表。问两种劳动类型的型的关系,调查资料如下表。问两种劳动类型的人血清胆
13、固醇水平是否不同?人血清胆固醇水平是否不同? 检验步骤如下:检验步骤如下: (1)建立假设,确定检验水准)建立假设,确定检验水准劳动类型劳动类型人数人数均值均值标准差标准差脑力劳动组脑力劳动组5374.80.72体力劳动组体力劳动组6434.60.81 H0:1=2 H1:1=2 =0.05=0.05。(2)选择检验方法、计算)选择检验方法、计算u值:本例两样本含量值:本例两样本含量均大于均大于50,故选两个样本均数比较的,故选两个样本均数比较的u检验。检验。 本例本例u值为:值为:488. 464381. 053772. 06 . 48 . 422u(3)确定)确定P值,作出推断结论:双侧值
14、,作出推断结论:双侧u0.05/21.96,u0.01/22.58,现,现u4.488,uu0.01/2,所以,所以P0.01。按。按=0.05检验水准,结论为拒绝检验水准,结论为拒绝H0,接受,接受H1,可以认为脑力劳动者血清胆固醇水平高于体力劳,可以认为脑力劳动者血清胆固醇水平高于体力劳动者。动者。四、配对计量资料比较的t检验1.同源配对同源配对(1)同一批受试对象处理(如治疗)前后某些同一批受试对象处理(如治疗)前后某些生理、生化指标的比较。生理、生化指标的比较。(2 2)同一种样品(如尿铅)用两种不同方法测同一种样品(如尿铅)用两种不同方法测试结果的比较。试结果的比较。2.异源配对异源
15、配对 每个对子中的两个受试对象分别接每个对子中的两个受试对象分别接受不同的处理受不同的处理 所得结果的比较。如按同窝别、所得结果的比较。如按同窝别、同体重、同性别等条件配对同体重、同性别等条件配对 的动物实验。的动物实验。 目的:推断两种处理的效果有无差别或推断某目的:推断两种处理的效果有无差别或推断某种处理有无作用。种处理有无作用。特点:特点: 减少了个体差异,提高了检验效率;减少了个体差异,提高了检验效率;资料成对,每对数据不可拆分。资料成对,每对数据不可拆分。思路:先求出各对子的差值思路:先求出各对子的差值d的均值的均值, 若两种处若两种处理的效应无差别,理论上差值理的效应无差别,理论上
16、差值d 的总体均数应的总体均数应为为0,故这类资料的比较可看作是样本均数与总,故这类资料的比较可看作是样本均数与总体均数为体均数为0的比较。的比较。条件:要求差值的总体分布为正态分布。条件:要求差值的总体分布为正态分布。 公式:公式:nSdnSdSdtdddd|0| 例例9-7 为研究女性服用某避孕新药后是否影为研究女性服用某避孕新药后是否影响其血清总胆固醇含量,将响其血清总胆固醇含量,将20名女性按年龄配成名女性按年龄配成10对。每队中随机抽取一人服用新药,另一人服对。每队中随机抽取一人服用新药,另一人服用安慰剂。经过一定时间后,测得血清总胆固醇含用安慰剂。经过一定时间后,测得血清总胆固醇含
17、量(量(mmol/L),结果见下表第(),结果见下表第(1)()(3)栏。)栏。问该新药是否影响女性血清总胆固醇含量?问该新药是否影响女性血清总胆固醇含量? 实例:实例:配对号配对号(1)新药组新药组(2)安慰剂组安慰剂组(3)差值差值d(4)=(2)()(3)1234564.45.05.84.64.94.86.25.25.55.04.45.4-1.8-0.20.3-0.40.5-0.6789106.05.94.35.15.06.45.86.21.0-0.5-1.5-1.1新药组与安慰剂组血清总胆固醇含量(新药组与安慰剂组血清总胆固醇含量(mmol/L) 检验步骤如下:检验步骤如下:(1)建立
18、假设,确定检验水准)建立假设,确定检验水准 H0:d0H1:d0=0.05。(2)选择检验方法、计算统计量)选择检验方法、计算统计量t值值 :本例为配:本例为配对设计资料,可选用配对对设计资料,可选用配对t检验。检验。 43. 0103 . 4ndd882. 011010) 3 . 4(85. 81)(222nnddsd542. 110882. 043. 0nsdtd (3) 确定确定P值,作出推断结论值,作出推断结论 =n-1=10-1=9,查,查t界值表得界值表得t0.20/2,9 =1.383 ,t0.10/2,9=1.833,本例,本例t0.20/2,9t t0.10/2,9, 所以所
19、以0.10P0.20,按,按=0.05检检验水准,不拒绝验水准,不拒绝H0,差别无统计学意义,还,差别无统计学意义,还不能认为该避孕新药对女性血清总胆固醇含不能认为该避孕新药对女性血清总胆固醇含量有影响。量有影响。第第3节节 t检验应用时应注意的问题检验应用时应注意的问题一、正确理解差别的统计意义一、正确理解差别的统计意义 资料经资料经t t检验,若检验,若P0.05P0.05时,按时,按=0.05=0.05检验水检验水准,拒绝准,拒绝H H0 0,接受,接受H H1 1,结论为差别有统计学意义,结论为差别有统计学意义,习惯上也称差别有显著性,可认为两总体均数有习惯上也称差别有显著性,可认为两
20、总体均数有差别,但不能据此误解为实际差别很大。当差别,但不能据此误解为实际差别很大。当P P0.050.05时,则不拒绝时,则不拒绝H H0 0,即所谓差别无统计意义,即所谓差别无统计意义(差别无显著性),亦不应误解为两总体均数一(差别无显著性),亦不应误解为两总体均数一定相等或相差不大。定相等或相差不大。二、二、t t检验的应用条件检验的应用条件t t检验的前提是要有严密的抽样设计,以保检验的前提是要有严密的抽样设计,以保证对比组之间具有可比性。在此基础上,作证对比组之间具有可比性。在此基础上,作t t检验的资料应满足以下条件:若样本含量检验的资料应满足以下条件:若样本含量n n较较小(如小
21、(如n n5050),要求样本取自正态或近似正),要求样本取自正态或近似正态总体,若为两个小样本均数比较时还要求两态总体,若为两个小样本均数比较时还要求两样本所属的总体方差相等,即方差齐。样本所属的总体方差相等,即方差齐。三、正确选择三、正确选择t t检验的方法检验的方法 在作在作t t检验时,具体选择何种方法来计算检检验时,具体选择何种方法来计算检验统计量验统计量t t值,主要取决于资料的设计方案、值,主要取决于资料的设计方案、分析的目的、变量的分布、样本含量的大小等分析的目的、变量的分布、样本含量的大小等方面。如配对设计的计量资料要采用配对方面。如配对设计的计量资料要采用配对t t检检验。
22、验。四、正确理解四、正确理解t t检验结论的概率性检验结论的概率性 t t检验结论的概率性,是指检验结论的概率性,是指t t检验的推断结论不检验的推断结论不是绝对的正确,也就是说不论是拒绝是绝对的正确,也就是说不论是拒绝H H0 0,还是不,还是不拒绝拒绝H H0 0,都有可能发生推断错误,都有可能发生推断错误 。因此在报告结。因此在报告结论时,不宜用论时,不宜用“肯定肯定”、“必定必定”、“一定一定”等等词,且最好列出词,且最好列出t t值的确切数值、尽量写出值的确切数值、尽量写出P P值的值的确切范围,如确切范围,如0.020.02P P0.050.05,以便读者与同类研,以便读者与同类研
23、究进行比较究进行比较。五、正确理解五、正确理解类错误和类错误和类错误类错误 假设检验的结论有可能发生两类错误,即假设检验的结论有可能发生两类错误,即类错误和类错误和类错误。类错误。 类错误类错误 是指拒绝了实际上成立的是指拒绝了实际上成立的H H0 0,即,即“弃真弃真”的错误,类似于把阴性错误地判断为阳的错误,类似于把阴性错误地判断为阳性(假阳性),这种错误在统计学上称为性(假阳性),这种错误在统计学上称为类类错误,发生这类错误的概率用错误,发生这类错误的概率用表示。表示。亦称亦称检验水准,常取检验水准,常取=0.05=0.05。类错误类错误 是指接受了实际上不成立的是指接受了实际上不成立的
24、H H0 0,即即“存伪存伪”的错误,类似于把阳性错误地判断的错误,类似于把阳性错误地判断为阴性(假阴性),这种错误在统计上称为为阴性(假阴性),这种错误在统计上称为类错误,发生这类错误的概率用类错误,发生这类错误的概率用表示,表示,值值的大小在假设检验时一般并不知道。的大小在假设检验时一般并不知道。 假设检验中可能发生的两类错误假设检验中可能发生的两类错误客观实际客观实际假设检验的结果假设检验的结果拒绝拒绝H0 0不拒绝不拒绝H0 0H0 0成立成立H0 0不成立不成立类错误(类错误()推断正确(推断正确(1-1-)推断正确(推断正确(1-1-)类错误(类错误()与与的大小应根据实际情况适当
25、取值,可通过的大小应根据实际情况适当取值,可通过 来控制来控制 的大小。的大小。1-1-为检验效能或把握度,其意义是两总体确有差为检验效能或把握度,其意义是两总体确有差别,按别,按水准能发现它们有差别的能力。水准能发现它们有差别的能力。 类错误和类错误和类错误示意图类错误示意图与与的联系与区别的联系与区别联系:联系:当当n n固定时,固定时,增大,则增大,则减小;减小;减小,则减小,则增大;增增大;增大大n n ,可,可 同时降低同时降低 与与 。区别:区别:(1 1)一般)一般为已知,为已知,可取单侧或双侧,如可取单侧或双侧,如0.050.05或或0.010.01。 (2 2)一般)一般为未
26、知为未知,只取单侧,如取,只取单侧,如取0.10.1或或0.20.2。1 1 (把握把握度度) )不小于不小于0.750.75。六、统计分析不能代替专业分析六、统计分析不能代替专业分析 差别有无统计学意义是统计结论,说明差别有无统计学意义是统计结论,说明由抽样误差引起的可能性大小,并不代表专由抽样误差引起的可能性大小,并不代表专业上差别大小的实际意义,而差别的实际意业上差别大小的实际意义,而差别的实际意义则对应的是专业结论,专业结论只能根据义则对应的是专业结论,专业结论只能根据专业知识来确定,故统计结论必须与专业结专业知识来确定,故统计结论必须与专业结论有机的结合,才能得出符合客观实际的最论有
27、机的结合,才能得出符合客观实际的最终结论。当样本含量足够大或标准差特别小终结论。当样本含量足够大或标准差特别小时,即使两样本均数相差很小,也能得出足时,即使两样本均数相差很小,也能得出足以拒绝以拒绝H H0 0的检验统计量值和的检验统计量值和P P值,但在专业值,但在专业上可能被认为无实际意义。上可能被认为无实际意义。 七、正确地确定单侧检验或双侧检验七、正确地确定单侧检验或双侧检验 如何选择单侧检验或双侧检验,应事先如何选择单侧检验或双侧检验,应事先根据专业知识和问题的目的要求,在实验设根据专业知识和问题的目的要求,在实验设计时做出规定,而不能在计算出检验统计量计时做出规定,而不能在计算出检
28、验统计量(如(如t t值)之后任意选择。若根据专业知识判值)之后任意选择。若根据专业知识判断一种方法的结果不可能低于或高于另一种断一种方法的结果不可能低于或高于另一种方法的结果,选用单侧检验。若还不能根据方法的结果,选用单侧检验。若还不能根据专业知识判断两种结果谁高谁低时,则用双专业知识判断两种结果谁高谁低时,则用双侧检验。一般认为双侧检验较保守和稳妥。侧检验。一般认为双侧检验较保守和稳妥。对同一资料,单侧检验比双侧检验更易得到对同一资料,单侧检验比双侧检验更易得到差别有显著性的结论。差别有显著性的结论。 思考题思考题1.标准差和标准误有何区别和联系?标准差和标准误有何区别和联系?2.可信区间和参考值范围有何不同?可信区间和参考值范围有何不同?3. 类错误和类错误和类错误有何区别类错误有何区别与联系?与联系? 谢谢收看!