1、2023-2-5广西医科大学卫统黄高明编第三章第三章 总体均数的估计和假设检验总体均数的估计和假设检验 统计分析:统计描述、统计推断统计分析:统计描述、统计推断统计推断:参数估计、假设检验统计推断:参数估计、假设检验2023-2-5广西医科大学卫统黄高明编第一节第一节 抽样误差与总体均数的估计抽样误差与总体均数的估计 总体总体样本样本统计推断统计推断抽样抽样抽样误差抽样误差一、抽样误差的概念一、抽样误差的概念 2023-2-5广西医科大学卫统黄高明编误差:误差:观察值与真值之差观察值与真值之差产生误差的产生误差的原因原因:1 1、人为误差:、人为误差:人员没有经过培训、标准掌人员没有经过培训、
2、标准掌握不统一握不统一2 2、系统误差:、系统误差:仪器、设备未经校正仪器、设备未经校正3 3、随机误差:、随机误差:偶然因素偶然因素4 4、抽样误差:、抽样误差:抽样造成抽样造成2023-2-5广西医科大学卫统黄高明编 由于总体中存在个体变异,(所以)由于总体中存在个体变异,(所以)由由抽样抽样得到的得到的样本指标样本指标与与总体指标总体指标之间之间存在存在差异差异,这种由这种由抽样造成抽样造成的的差异差异称称抽抽样误差样误差。在抽样研究中,在抽样研究中,抽样误差抽样误差是是不可避不可避免的免的,但其大小可以,但其大小可以控制控制和和估计估计的。的。2023-2-5广西医科大学卫统黄高明编总
3、体均数总体均数=标准差=1,xn2,xn3,xn样本均数样本均数=100321x.x,x,x标准差=x2023-2-5广西医科大学卫统黄高明编中心极限定理中心极限定理 1、在正态总体中,随机抽取例数为、在正态总体中,随机抽取例数为n的的样本,样本均数服从正态分布;样本,样本均数服从正态分布;2、在偏态总体中随机抽样,当、在偏态总体中随机抽样,当n足够大足够大时(时(n30),也近似正态分布;),也近似正态分布;3、从均数为、从均数为,标准差为,标准差为的正态或偏的正态或偏态总体中,抽取例数为态总体中,抽取例数为n的样本,样本均的样本,样本均数的均数仍为数的均数仍为,标准差为,标准差为 。x20
4、23-2-5广西医科大学卫统黄高明编标准误意义及其计算方法标准误意义及其计算方法 1、标准误意义、标准误意义:说明抽样误差大小的:说明抽样误差大小的指标。均数抽样误差用表示;率的抽样指标。均数抽样误差用表示;率的抽样误差用误差用p 表示。表示。2023-2-5广西医科大学卫统黄高明编nx 2、计算公式:、计算公式:.(理论值)(理论值)nSSx .(估计值)(估计值)2023-2-5广西医科大学卫统黄高明编随着 n S 稳定 Sx 0均数的标准误与标准差成正比,与样本均数的标准误与标准差成正比,与样本例数例数n n的平方根成反比。的平方根成反比。nSSx因此,减少抽样误差最有效的办法:因此,减
5、少抽样误差最有效的办法:增加样本增加样本例数例数2023-2-5广西医科大学卫统黄高明编例例3.1 已知已知n=200,S=4.8cm,x=124.0cm,求其标准误。求其标准误。33.02006.4nSSxcm2023-2-5广西医科大学卫统黄高明编例例4.1 已知已知n=144,=5.381012/L,S=0.441012/L。求其标准误。求其标准误。037.014444.0nSSx(1012/L)2023-2-5广西医科大学卫统黄高明编3、标准误的应用、标准误的应用(1)反映抽样误差大小:标准误越大,)反映抽样误差大小:标准误越大,抽样误差越大;抽样误差越大;(2)反映均数的可靠性:越大
6、,样本均)反映均数的可靠性:越大,样本均数的抽样误差越大,(用样本均数推算数的抽样误差越大,(用样本均数推算总体均数的)可靠性差;反之,越小,总体均数的)可靠性差;反之,越小,均数抽样误差越小,(用样本均数推算均数抽样误差越小,(用样本均数推算总体均数的)可靠性好。总体均数的)可靠性好。(3)用于进行假设检验(见下节)用于进行假设检验(见下节)2023-2-5广西医科大学卫统黄高明编标准差,标准误有何区别和联系标准差,标准误有何区别和联系?标准差和标准误都是变异指标,但它们之标准差和标准误都是变异指标,但它们之间有区别,也有联系。间有区别,也有联系。区别区别:概念不同:概念不同:标准差是描述观
7、察值标准差是描述观察值(个体值个体值)之间的变异程度,之间的变异程度,S越小,均数的代表性越好;越小,均数的代表性越好;标准误是描述样本均数的抽样误差,标准误是描述样本均数的抽样误差,Sx越小,越小,均数的可靠性越高;均数的可靠性越高;2023-2-5广西医科大学卫统黄高明编与样本含量的关系不同与样本含量的关系不同:当样本含量当样本含量 n 足足够大时,标准差趋向稳定;而标准误随够大时,标准差趋向稳定;而标准误随n的增的增大而减小,甚至趋于大而减小,甚至趋于0。联系联系:标准差、标准误均为变异指标,当样标准差、标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。本含量不变时,标准误与标
8、准差成正比。用途不同:用途不同:标准差与均数结合估计参考值范标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误用围,计算变异系数,计算标准误等。标准误用于估计参数的可信区间,进行假设检验等。于估计参数的可信区间,进行假设检验等。2023-2-5广西医科大学卫统黄高明编二、二、t 分分 布布 t 分布的概念分布的概念 t值分布称值分布称t分布。分布。nsxSxtx/u变换:变换:xuxxuu值的分布称值的分布称u分布(标准正态分布)分布(标准正态分布)2023-2-5广西医科大学卫统黄高明编t分布特征分布特征 1、以、以0为中心,左右对称的单峰分布;为中心,左右对称的单峰分布;2
9、、t分布的形态与自由度分布的形态与自由度有关,有关,越小,越小,t分布曲线越低平分布曲线越低平,尾部的面积尾部的面积较大;较大;逐渐增大,逐渐增大,t分布逼近标准正态分布;分布逼近标准正态分布;,t分布标准正态分布。分布标准正态分布。2023-2-5广西医科大学卫统黄高明编2023-2-5广西医科大学卫统黄高明编注:所有的注:所有的t分布的曲线均比正态曲线低。分布的曲线均比正态曲线低。说明在同样的曲线下面积,说明在同样的曲线下面积,t值值u值。例值。例如,中间如,中间95%面积,在横轴上的区间:面积,在横轴上的区间:|u|=1.96;而而|t|1.96 t值的表示方法:值的表示方法:t,为界值
10、以外的面积;为界值以外的面积;自由度自由度2023-2-5广西医科大学卫统黄高明编t界值表(附表界值表(附表2)对应每一自由度取值,就有一条对应每一自由度取值,就有一条t分布曲线,每条曲线都有自身曲线下分布曲线,每条曲线都有自身曲线下t值的分布规律,因此,计算值的分布规律,因此,计算t值较为繁值较为繁杂。为此,统计学家已制成杂。为此,统计学家已制成t值表,通值表,通过查表即获得相应的过查表即获得相应的t值。值。2023-2-5广西医科大学卫统黄高明编查表须注意:查表须注意:(1)t值有正负值,由于值有正负值,由于t分布是以分布是以0为中心的对称分布,故表中只列正值,为中心的对称分布,故表中只列
11、正值,查表时,不管查表时,不管t值正负只用绝对值;值正负只用绝对值;(2)t值表中插图阴影部分,表示值表中插图阴影部分,表示t,以外尾部面积占总面积的百分比,以外尾部面积占总面积的百分比,即即概率;概率;2023-2-5广西医科大学卫统黄高明编(3)当)当一定时,越小,一定时,越小,t值越大;值越大;(4)当一定时,)当一定时,越大,越大,t值越小;值越小;(5)当当时,时,tu;单侧:单侧:t0.025,10=2.228双侧:双侧:t0.05/2,10=2.228二者相等二者相等另外:表示双侧,不是除表示双侧,不是除2 22023-2-5广西医科大学卫统黄高明编/2/22(/2)双侧双侧单侧
12、单侧95%95%1.961.6452023-2-5广西医科大学卫统黄高明编三、总体均数的可信区间估计三、总体均数的可信区间估计 可信区间的概念可信区间的概念统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计区间估计用样本指标用样本指标来估计总体来估计总体指标指标 2023-2-5广西医科大学卫统黄高明编参数估计的参数估计的估计方法:估计方法:1、点、点值值估计估计:用样本均数来估计总体均数:用样本均数来估计总体均数 缺点:没有考虑抽样误差(可靠性)缺点:没有考虑抽样误差(可靠性)2、区间估计、区间估计:按一定的概率按一定的概率估计总体均数所估计总体均数所在范围。在范围。1称可
13、信度称可信度。习惯上,常取习惯上,常取1=0.95,即,即95%可信区间可信区间 或取或取1=0.99,即,即99%可信区间可信区间 若无特别说明,一般取双侧若无特别说明,一般取双侧95%可信区间可信区间2023-2-5广西医科大学卫统黄高明编总体均数的可信区间估计方法总体均数的可信区间估计方法(1)当当未知,且未知,且n较小较小(n30或或n50)时,按)时,按正态分布正态分布原理处理:原理处理:)sux,sux(xx例 3.3 已知:已知:n=200,X=124.0,S=4.6(3)当当已知已知58.2,96.101.005.0uu2023-2-5广西医科大学卫统黄高明编可信区间的两个要素
14、:可信区间的两个要素:准确度:准确度:反映在反映在可信度可信度(1(1)的大小。的大小。1越接近越接近1,就越准确。如可信度,就越准确。如可信度99%比比95%准准确。确。精确度:精确度:反映在区间的长度。长度越小越好。反映在区间的长度。长度越小越好。在例数在例数n确定的情况下,二者呈反比关系:确定的情况下,二者呈反比关系:准确度准确度,精确度精确度(范围变宽范围变宽)。要兼顾准确度和精确度,一般取要兼顾准确度和精确度,一般取95%可可信区间。信区间。2023-2-5广西医科大学卫统黄高明编可信区间与参考值范围区别可信区间与参考值范围区别(1)意义不同)意义不同 正常值范围是指绝大正常值范围是
15、指绝大多数观察值在某个范围;多数观察值在某个范围;可信区间是可信区间是指按一定的可信度估计总体均数(参数)指按一定的可信度估计总体均数(参数)的所在范围;的所在范围;(2)计算公式不同)计算公式不同 可信区间可信区间 xsux正常值范围正常值范围 sux2023-2-5广西医科大学卫统黄高明编(3 3)应用不同)应用不同可信区间可信区间:估计总体均数参考值范围:参考值范围:判断某项指标是否正常判断某项指标是否正常2023-2-5广西医科大学卫统黄高明编第二节第二节 假设检验的基本原理和步骤假设检验的基本原理和步骤 假设检验原理假设检验原理 例例 3.40=72次次/分分已知总体已知总体X=74
16、.2S=6.0未知总体未知总体2023-2-5广西医科大学卫统黄高明编假设检验思想假设检验思想 根据研究目的,对样本所属总体特根据研究目的,对样本所属总体特征提出一个假设,根据样本提供的信息征提出一个假设,根据样本提供的信息,然后用适当方法,了解在假设条件下差异然后用适当方法,了解在假设条件下差异由抽样误差引起的可能性大小。推断此假由抽样误差引起的可能性大小。推断此假设应当拒绝或不拒绝(设应当拒绝或不拒绝(P0.05,不拒绝;,不拒绝;P0.05,拒绝)。,拒绝)。2023-2-5广西医科大学卫统黄高明编假设检验的一般步骤假设检验的一般步骤 1、建立假设和确定检验水准、建立假设和确定检验水准
17、2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 3、确定、确定P值和作出推断结论值和作出推断结论 2023-2-5广西医科大学卫统黄高明编1、建立假设和确定检验水准、建立假设和确定检验水准 基本步骤基本步骤(1)两个假设)两个假设 无效假设:无效假设:H0 备择假设:备择假设:H1(2)确定单侧或双侧检验确定单侧或双侧检验 根据专业知识和研究目的而定根据专业知识和研究目的而定2023-2-5广西医科大学卫统黄高明编单侧检验单侧检验:在比较两种药物的疗效时,在比较两种药物的疗效时,根据专业知识可认为新药不会比旧药差,根据专业知识可认为新药不会比旧药差,只关心新药是否比旧药好(至多
18、相同,绝只关心新药是否比旧药好(至多相同,绝对排除出现相反的可能性),可用单侧检对排除出现相反的可能性),可用单侧检验。验。A组:组:磺胺磺胺B组:组:磺胺磺胺+增效剂增效剂B组疗效是否高于组疗效是否高于A组?组?2023-2-5广西医科大学卫统黄高明编双侧检验:双侧检验:在比较两种药物的疗效时,在比较两种药物的疗效时,事先不能确定哪种药的疗效较好,只关事先不能确定哪种药的疗效较好,只关心两药的疗效有无差别,要用双侧检验。心两药的疗效有无差别,要用双侧检验。2023-2-5广西医科大学卫统黄高明编(3)确定检验水准确定检验水准 一般取一般取0.05 双侧检验若有差别,单侧检验肯定有差别;双侧检
19、验若有差别,单侧检验肯定有差别;反之,单侧检验若有差别,双侧检验不一定反之,单侧检验若有差别,双侧检验不一定有差别。有差别。2023-2-5广西医科大学卫统黄高明编 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 不同设计、不同的资料类型和不同的不同设计、不同的资料类型和不同的推断目的,选用不同的检验方法;推断目的,选用不同的检验方法;(对症下药)(对症下药)2023-2-5广西医科大学卫统黄高明编3、确定、确定P值值 P值是指由所规定的总体作随机抽值是指由所规定的总体作随机抽样,样,获得等于及大于(或等于及小于)获得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
20、现有样本获得的检验统计量值的概率。手工计算:手工计算:一般是通过查界值表获得。一般是通过查界值表获得。统计软件:统计软件:直接给出精确的直接给出精确的P P值值2023-2-5广西医科大学卫统黄高明编4、作出推断结论、作出推断结论(含统计结论和专业含统计结论和专业结论)结论)统计结论:统计结论:拒绝拒绝H0,接受,接受H1,差差异有统计学意义)异有统计学意义)专业结论专业结论:可认为:可认为 不同或不等。不同或不等。当当 P时,时,将获得的事后概率将获得的事后概率P与事先规定的概率与事先规定的概率进行比较。进行比较。要正确表达!要正确表达!2023-2-5广西医科大学卫统黄高明编当当P时,时,
21、统计结论:统计结论:不拒绝不拒绝H0,差异无统计学意义,差异无统计学意义专业结论专业结论:还不能认为还不能认为 不同或不等。不同或不等。2023-2-5广西医科大学卫统黄高明编假设检验的特点:假设检验的特点:1、统计检验的假设是关于总体特征的、统计检验的假设是关于总体特征的假设;假设;2、用于检验的方法是以检验统计量的、用于检验的方法是以检验统计量的抽样分布为理论根据的;抽样分布为理论根据的;3、作出的结论是概率性的,不是绝对、作出的结论是概率性的,不是绝对的肯定或绝对的否定。的肯定或绝对的否定。2023-2-5广西医科大学卫统黄高明编假设检验中假设检验中值与值与P值的区别:值的区别:1、假设
22、检验中、假设检验中值是检验水准,是拒绝值是检验水准,是拒绝或不拒绝或不拒绝H0的概率标准。的概率标准。的大小是人为的大小是人为选定的,一般取选定的,一般取0.05。2、P值是指有值是指有H0所规定的总体中作随机所规定的总体中作随机抽样抽样,获得等于或大于获得等于或大于(等于或小于等于或小于)现有现有样本统计量的概率。通过样本统计量的概率。通过P值与值与值的比值的比较来确定拒绝或不拒绝较来确定拒绝或不拒绝H0。2023-2-5广西医科大学卫统黄高明编第三节第三节 t检验和检验和u检验检验 t检验和检验和u检验类型检验类型 1、样本均数与总体均数比较、样本均数与总体均数比较 2、配对设计的均数比较
23、、配对设计的均数比较 3、成组设计的两样本均数的比较、成组设计的两样本均数的比较 4、成组设计的两样本几何均数的比较、成组设计的两样本几何均数的比较 5、两大样本均数比较、两大样本均数比较u检验检验 2023-2-5广西医科大学卫统黄高明编应用条件应用条件 1、t检验检验应用条件应用条件:(1)样本来自正态总体样本来自正态总体 (2)两样本均数比较,还要求样本的总体两样本均数比较,还要求样本的总体方差相等方差相等 2、u检验检验应用条件应用条件:样本例数样本例数n较大,或较大,或n虽小而总体标准差虽小而总体标准差已知。已知。2023-2-5广西医科大学卫统黄高明编一、样本均数与总体均数比较样本
24、均数与总体均数比较样本均数代表的未知总体均数和已知总体均数0的比较0理论值、标准值、理论值、标准值、稳定值稳定值X2023-2-5广西医科大学卫统黄高明编公式公式:ns/xt0=n-12023-2-5广西医科大学卫统黄高明编例例3.5(对例(对例3.4进行进行t检验)检验)例例 3.50=72次次/分分已知总体已知总体X=74.2S=6.5未知总体未知总体2023-2-5广西医科大学卫统黄高明编检验步骤:检验步骤:例3.5建立假设和确定检验水准建立假设和确定检验水准 H0:=72次次/分分 H1:72次次/分分 单侧单侧=0.05今今n=25,=74.2次次/分,分,s=6.5次次/分,分,0
25、=72次次/分分 2023-2-5广西医科大学卫统黄高明编例3.5选定检验方法和计算检验统计量选定检验方法和计算检验统计量按式按式(3.3)6921.25/56.7274.2ns/xt0v=n-1=25-1=242023-2-5广西医科大学卫统黄高明编例3.5确定确定P值值 以以v=24查附表查附表2,t界值表,得:界值表,得:t0.05,24=1.771,t0.025,24=2.064 t0.1,24=1.318tP0.05(v一定时,一定时,t值越大,值越大,P值越小值越小)2023-2-5广西医科大学卫统黄高明编 查查t值表时,先查值表时,先查P=0.05时的界值。时的界值。当当P0.0
26、5时时,需继续往,需继续往P更大的一侧更大的一侧查,直到最大的查,直到最大的P值为止。值为止。?如使用统计软件,会给出确切的概率值。如使用统计软件,会给出确切的概率值。注意注意为什么?为什么?2023-2-5广西医科大学卫统黄高明编例3.5作出推断结论作出推断结论(两个结论:统计结论和两个结论:统计结论和专业结论专业结论)今今0.05P0.10,按,按=0.05水准,不水准,不拒绝拒绝H0(统计结论统计结论),尚不能认为该山区健,尚不能认为该山区健康成年男子脉搏均数高于一般健康成年男康成年男子脉搏均数高于一般健康成年男子脉搏均数子脉搏均数(专业结论专业结论)。2023-2-5广西医科大学卫统黄
27、高明编二、二、配对设计的均数比较配对设计的均数比较(paired t-test)(1)同对的两个受试对象分别给予两种处同对的两个受试对象分别给予两种处理理(见后见后)(2)同一受试对象分别给予两种处理同一受试对象分别给予两种处理(同一同一标本用两种方法检测标本用两种方法检测)(例例3.6)(3)同一受试对象处理前后比较同一受试对象处理前后比较(见后见后)2023-2-5广西医科大学卫统黄高明编例例 随机选择随机选择9窝中年大鼠,每窝中取两只雌性大鼠随窝中年大鼠,每窝中取两只雌性大鼠随机地分入甲、乙两组,甲组大鼠不接受任何处理机地分入甲、乙两组,甲组大鼠不接受任何处理(即即空白对照空白对照),乙
28、组中的每只大鼠接受,乙组中的每只大鼠接受3mg/Kg的内毒素。的内毒素。分别测得两组大鼠的肌酐分别测得两组大鼠的肌酐(mg/L)测定结果如下。测定结果如下。窝别编号:窝别编号:1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 甲甲(对照对照)组:组:6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 6.2 3.7 5.8 2.7 3.9 6.1 6.7 7.8 3.8 乙乙(处理处理)组:组:7.5 3.8 6.3 4.3 5.3 7.3 5.6 7.9 7.27.5 3.8 6.3 4.3 5.3 7.3 5.6 7.9 7.2 (模拟双胞胎,(模
29、拟双胞胎,目的:目的:减少组间差异,提高可比性)减少组间差异,提高可比性)2023-2-5广西医科大学卫统黄高明编例例 检验血磷含量有甲、乙两种方法,其中,检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。法检测相同的血液样品,所得结果如下表。问:检验甲乙两法检出血磷是否相同,用问:检验甲乙两法检出血磷是否相同,用何统计方法?何统计方法?样本号样本号 1 2 3 4 5 6 7 乙乙 法法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲甲 法法 4.49 1.21 2.
30、13 7.52 5.81 3.35 9.61(双胞胎?)(双胞胎?)2023-2-5广西医科大学卫统黄高明编某脑电图室观察家兔注射某脑电图室观察家兔注射AT3前后脑电图波形前后脑电图波形的变化,观测结果如下。试分析注射的变化,观测结果如下。试分析注射AT3前后前后脑电图波形是否发生了显著性变化。脑电图波形是否发生了显著性变化。注射注射AT3前后脑电图波形的变化率(前后脑电图波形的变化率(%)家兔编号家兔编号 注射前注射前 注射后注射后 1 29 37 2 28 44 3 38 52 4 29 35 5 34 41 6 41 432023-2-5广西医科大学卫统黄高明编检验公式检验公式:n/sd
31、n/s0dtdd2023-2-5广西医科大学卫统黄高明编例3.62023-2-5广西医科大学卫统黄高明编检验步骤检验步骤 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准 H0:d0 H1:d 0 0.052、本例为配对计量资料,用配对、本例为配对计量资料,用配对t检验检验12/3355.01717.0n/dsdt=1.7728n-1=12-1=112023-2-5广西医科大学卫统黄高明编3、确定、确定P值值以以t=1.7728,=12,查附表查附表2,得得 0.10P0.204、作出推断结论、作出推断结论 按按0.05水准,不拒绝水准,不拒绝H0,差异,差异无统计学意义。还不能认为
32、两种方法检无统计学意义。还不能认为两种方法检查的结果有影响。查的结果有影响。2023-2-5广西医科大学卫统黄高明编确切的确切的P值值查表结果:查表结果:0.10P0.05,齐;齐;P50)2、方法:、方法:样本均数与总样本均数与总体均数比较体均数比较两样本均数比较:两样本均数比较:ns/xu022212121xx21nsnsxxsxxu212023-2-5广西医科大学卫统黄高明编例例3.82023-2-5广西医科大学卫统黄高明编检验步骤检验步骤 1、建立检验假设,确定检验水准、建立检验假设,确定检验水准 H0:1 2 H1:d 0 0.052、本例为两样本均数比较且例数较大,用两均数比、本例为两样本均数比较且例数较大,用两均数比较较u检验检验2023-2-5广西医科大学卫统黄高明编58.430.8007.7310583.1110075.102122222121nSnSXXu已知已知:X1=73.07,S1=10.75,n1=100X2=80.30,S2=11.83,n1=1052023-2-5广西医科大学卫统黄高明编(3)确定)确定P 值,作推断结论值,作推断结论查附表2,v=时,u 0.001=3.2905今 u=4.58 u 0.001=3.2905,P0