医学统计学第三章-总体均数的估计与假设检验-课件.ppt

上传人(卖家):晟晟文业 文档编号:5143741 上传时间:2023-02-14 格式:PPT 页数:85 大小:729.50KB
下载 相关 举报
医学统计学第三章-总体均数的估计与假设检验-课件.ppt_第1页
第1页 / 共85页
医学统计学第三章-总体均数的估计与假设检验-课件.ppt_第2页
第2页 / 共85页
医学统计学第三章-总体均数的估计与假设检验-课件.ppt_第3页
第3页 / 共85页
医学统计学第三章-总体均数的估计与假设检验-课件.ppt_第4页
第4页 / 共85页
医学统计学第三章-总体均数的估计与假设检验-课件.ppt_第5页
第5页 / 共85页
点击查看更多>>
资源描述

1、第三章 总体均数的估计与假设检验几个概念几个概念:1、抽样研究、抽样研究2、统计描述、统计描述3、统计推断、统计推断 统计推断统计推断(Statistical inference):用样本信息推用样本信息推 论总体特征的过程。论总体特征的过程。包括:包括:参数估计参数估计:运用统计学原理,用从样本计算出来的运用统计学原理,用从样本计算出来的统计指标量,对总体指标量进行估计。统计指标量,对总体指标量进行估计。假设检验:假设检验:又称显著性检验,是指由样本间存在的又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。差别对样本所代表的总体间是否存在着差别做出判断。基本内

2、容基本内容 统计描述统计描述统计推断统计推断(1)统计推断统计推断(2)计量资料计量资料 频数分布集中趋势离散趋势统计图表抽样误差标准误 t u F检验秩和检验直线相关与回归偏相关多元线性回归计数资料计数资料相对数统计图表u、2检验秩和检验Logistic回归第一节 均数的抽样误差与标准误 抽样误差:样本统计量与参数之间的差异,抽样误差:样本统计量与参数之间的差异,称抽样误差。称抽样误差。样本统计量是一个随机变量,在随机的原则样本统计量是一个随机变量,在随机的原则下从同一总体抽取不同的样本,即使每个样下从同一总体抽取不同的样本,即使每个样本的样本含量本的样本含量n相同相同,它们的结果也会不同。

3、它们的结果也会不同。样本统计量与参数之间的差异有何特点呢?样本统计量与参数之间的差异有何特点呢?二个特点:二个特点:A、其值互不相同,有些样本统计量与总其值互不相同,有些样本统计量与总体参数之间差异大,有些小;有些为正体参数之间差异大,有些小;有些为正数,有些为负数。数,有些为负数。B、这些差异虽然客观存在,但却未知,这些差异虽然客观存在,但却未知,因为总体参数的具体值我们往往未知。因为总体参数的具体值我们往往未知。由于以上特点,我们该如何去考虑抽样由于以上特点,我们该如何去考虑抽样误差的大小呢?误差的大小呢?X 1S1X 2 S2 X ISiX nSnxX服从什么分布?例3-1 若某市199

4、9年18岁男生身高服从均数=167.7cm、标准差 =5.3cm的正态分布。从该正态分布N(167.7,5.32)总体中随机抽样100次即共抽取样本g=100个,每次样本含量nj=10人,得到每个样本均数 及标准差Sj 如图3-1和表3-1所示。xjX个100jXjX个100 x1703616557162651610053931916651163281920169651656527916765181733016511572169201717380166784911702916169551643536416695151730616618481169621416947164193691668313

5、17292164445931686812172311631264216771111698716238524166131017308161278261671791731916502571169118169051632740416616716958163144501663661687616102541164895170111632448116667417203164375361682031702616086657165562169371654527416741195%CLSjj样本号 x171.03168.20162.15163.106.203.56 166.59 165.653940168.02

6、162.294.01165.1638172.84166.824.20169.8337168.86159.386.63164.1236169.59161.955.34165.7735169.88163.664.34166.7734170.05163.744.41166.9033170.13162.715.19166.4232167.33161.174.30164.2531173.13162.367.53167.7530170.86165.953.43168.4129169.83166.142.58167.9928174.30163.317.68168.8027168.34162.044.4116

7、5.1926169.59163.704.12166.6525178.15167.707.74172.6124170.94164.354.61167.6423171.42163.885.27167.6522169.84162.754.95166.292195%CLSjj样本号x171.91173.37165.45163.434.526.95168.68168.405960169.97162.914.93166.4458175.98165.027.66170.5057170.47163.944.56167.2056170.10162.115.58166.1055171.00168.052.0716

8、9.5354173.00164.745.77168.8753171.27165.673.91168.4751173.35167.424.15170.3950170.45164.993.82167.7249171.89165.394.54168.6448173.15164.366.14168.7647173.10165.035.65169.0646169.92161.465.91165.6945170.99163.505.24167.2544172.09163.336.12167.7143171.54160.907.44166.2242168.71162.744.17165.724195%CLS

9、jj样本号 x171.90168.88164.27162.145.334.71168.08165.517980171.04165.963.55168.5078171.58165.144.50168.3677174.84167.714.99171.2776175.14163.188.36169.1675172.94165.795.00169.3774171.53 164.53 4.89168.0373171.56159.808.22165.6872169.40161.975.19165.6871172.00164.865.05168.4770172.52164.885.48168.6069171

10、.90165.024.81168.4668173.11165.515.31169.3167170.83166.852.78168.8466171.04166.273.33168.6665170.90164.364.58167.6364174.31163.757.38169.0363173.44167.234.34170.3362175.72166.706.30171.216195%CLSjj样本号 x173.39169.33165.42162.065.575.09 169.40 165.4999100173.37166.504.80169.9398171.79163.166.03167.489

11、7172.23163.546.07167.8996173.69164.656.32169.1795173.45165.945.26169.7094169.76 162.834.84166.3093169.54163.704.08166.6292169.21163.663.87166.4391171.48162.896.00167.1890173.32161.498.27167.4089171.03164.454.60167.7488171.12163.066.33167.5987172.28163.516.13167.9086171.83163.036.15167.4385171.04164.

12、694.44167.8684169.58162.265.11165.9283174.27167.984.40171.1282170.26164.933.73167.598195%CLSjj样本号 样本统计量的标准差样本统计量的标准差(方差方差),从平均的,从平均的意义上说明了样本统计量与总体参数的意义上说明了样本统计量与总体参数的差异状况,故常用它来衡量抽样误差的差异状况,故常用它来衡量抽样误差的大小。大小。为区别一般变量的标准差,常把样本统为区别一般变量的标准差,常把样本统计量的标准差称为计量的标准差称为标准误标准误(standard error)在此,我们只讨论样本均数的分布及其在此,我们

13、只讨论样本均数的分布及其抽样误差的计算。抽样误差的计算。nXX22nSSXXnXX?的关系又如何与的关系如何与SSXX 样本均数的抽样分布特点:样本均数的抽样分布特点:1)来自正态总体的样本均数,其分布为)来自正态总体的样本均数,其分布为正态分布,其均数为原变量的均数,其正态分布,其均数为原变量的均数,其方差为原变量方差的方差为原变量方差的 1/n 倍。倍。2)来自偏态总体的样本均数,若)来自偏态总体的样本均数,若n大,则大,则样本均数近似于正态分布。否则,样本样本均数近似于正态分布。否则,样本均数为偏态分布。均数为偏态分布。若若 X X N(N(,),)则则 N(N(,),)若若X X服从偏

14、态分布,服从偏态分布,n n小,小,服从偏态分布;服从偏态分布;均数为均数为方差为方差为 ;当当n n大时,大时,近似服从正态分布。近似服从正态分布。即即 N(N(,),)2x2xXXXX2x2x问题:问题:已知健康成年男性身高(厘米)已知健康成年男性身高(厘米)X N(170,6 N(170,62 2),现从该总体进行现从该总体进行n=36n=36的抽样,求样本均数落在的抽样,求样本均数落在 168.04 168.04171.96171.96间的概率?间的概率?第二节 t 分布哥塞特(W.S.Gosset,18761937)1908年,哥塞特首次以“学生”(Student)为笔名,在生物计量

15、学杂志上发表了“平均数的概率误差”。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。n戈塞特:t分布与小样本n由于“有些实验不能多次地进行”,从而“必须根据少数的事例(小样本)来判断实验结果的正确性”小样本思想小样本思想 N(N(,),)故:故:X2xxXu N(0,1)当x未知是,如用来代替xSxSXt t分布,=n-1t分布图形:分布图形:1)t值的分布与自由度有关,值的分布与自由度有关,t分布是一簇曲线。分布是一簇曲线。2)单峰分布,以)单峰分布,以0为中心,形状类似标准正态分布。为中心,形状类似标准正态分布。3)自由度越小,曲线

16、的峰部越矮,尾部越粗。)自由度越小,曲线的峰部越矮,尾部越粗。4)当自由度为无穷大时,)当自由度为无穷大时,t分布即为标准正态分布。分布即为标准正态分布。)(12)21()(212ttntf)()()()(111tdtftFttPtt0f(t1)F(t1)t1t分布分布函数分布示意图05.0)729.1(,05.0,19,)(19,05.0,ttPttP则如05.01)093.2(,05.0,19,1)(19,05.019,2/05.0,2/,2/tttPtttP则如单侧界值单侧界值双侧界值双侧界值。uttt界值界值等于时当值越小越大自由度下在相同的界值值越大越小在相同的自由度下,;,;,t界

17、值表的规律界值表的规律第三节 总体均数的估计 参数估计的概念:参数估计的概念:指用样本指标(统计量)估计总体指标(参数);有点估计有点估计和区间估计区间估计两种。这种估计通常是在信息不完全、结果不确定的情况下作出的。参数估计提供了一套在满足一定精确度要求下根据部分信息来估计总体参数的真值,并作出同这个估计相适应的误差说明的科学方法。参数估参数估计问题计问题假设检假设检验问题验问题点点 估估 计计区间估区间估 计计统计统计推断推断 DE基本基本问题问题什么是参数估计?什么是参数估计?参数是刻画总体某方面概率特性的数量参数是刻画总体某方面概率特性的数量.当此数量未知时当此数量未知时,从总体抽出一个

18、样本,从总体抽出一个样本,用某种方法对这个未知参数进行估计就用某种方法对这个未知参数进行估计就是参数估计是参数估计.例如,例如,X N(,2),点估计点估计区间估计区间估计若若,2未知未知,通过构造样本的函数通过构造样本的函数,给出给出它们的估计值或取值范围就是参数估计它们的估计值或取值范围就是参数估计的内容的内容.参数估计的类型参数估计的类型点估计点估计 估计未知参数的值估计未知参数的值区间估计区间估计 估计未知参数的取值范围,估计未知参数的取值范围,并使此范围包含未知参数并使此范围包含未知参数 真值的概率为给定的值真值的概率为给定的值.总体均数的估计量:总体均数的估计量:样本平均数样本平均

19、数 point estimation:Interval estimation:考虑抽样误差考虑抽样误差 X总体均数可信区间的计算总体均数可信区间的计算A、单个正态总体均数的可信区间单个正态总体均数的可信区间)(,2/,2/XXStXStP11)(,2/,2/XXStXStXP的可信区间的均数分布求出的总体此即利用1t1)(,2/,2/tttP总体均数可信区间的计算总体均数可信区间的计算XXStXStX,2/,2/,例3-2 在例3-1中抽得第15号样本的均数 =166.95,标准差S=3.64cm,求其总体均数的95%可信区间。n=10人,S =1.1511(cm)=n-1=10-1=9,t0

20、.05/2,9=2.262。其95%可信区间:(166.95-2.262 1.1511,166.95+2.262 1.1511)即(164.35,169.55)(cm)。xx1064.3XSSn例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的双侧95%可信区间。本例n60,故可采用正态近似法 今n=200,=3.64、S=1.20、S =0.0849,u0.05/2=1.96。(3.64-1.96 0.0849,3.64+1.96 0.0849)即(3.47,3.81)(mmol/L)。/2/2

21、()()XXXuXuS或xXB、两总体均数之差的可信区间两总体均数之差的可信区间 从总体标准差相等,但总体均数不等的两个正态总体进从总体标准差相等,但总体均数不等的两个正态总体进行随机抽样。两总体均数之差的双侧可信区间为:行随机抽样。两总体均数之差的双侧可信区间为::121的可信区间的21,2/21)(XXStXX分布的服从tnnnnSYXtc211)()(2121221则有且它们彼此独立的样本和分别是取自总体和设。NNYYYXXXnn,),(),(,.,.,22212121212)1()1(212222112nnsnsnsc2121121nnSScXX221nn例3-4 为了解甲氨蝶呤(MT

22、X)对外周血IL-2水平的影响,某医生将61名哮喘患者随机分为两组。其中对照组29(n1),采用安慰剂;试验组32例(n2),采用小剂量甲氨蝶呤(MTX)进行治疗。测得对照组治疗前IL-2的均数为20.10IU/ml(1),标准差为7.02IU/ml(S1);试验组治疗前IL-2的均数为16.89IU/ml(2),标准差为8.46IU/ml(S2)。问两组治疗前基线的IL-2总体均数相差有多大?=2.0023 =n1+n2-2=29+32-2=59,以 =60 t0.05/2,60=2.000,1-2的双侧95%可信区间:(20.10-16.89)2.000 2.0023 即(-0.79,7.

23、21)(IU/ml)321291(2322946.8)132(02.7)129(22xx1221211()CXXSSnn222112212(1)(1)2CnSnSSnn12XXS可信区间的特点及其确切涵义:可信区间的特点及其确切涵义:1、随机性:、随机性:因为样本具有随机性2、确定性:、确定性:样本实现后,可信区间也就确定 总体参数总体参数95%的可信区间的涵义:若进行的可信区间的涵义:若进行重复多次抽样,则可构建多个可信区间,重复多次抽样,则可构建多个可信区间,在这些可信区间中,理论上有在这些可信区间中,理论上有95%的可信的可信区间包含了总体参数,还有区间包含了总体参数,还有5%的可信区的

24、可信区间未包含总体参数。间未包含总体参数。可信区间的两个要素:可信区间的两个要素:准确性:准确性:又称可靠性,即区间的可信度,也即其概率保证程度,如95%、99%。精确性:精确性:可信区间的长度(CU CL)/2衡量。第四节 t检验假设检验假设检验假设检验是统计学的核学内容,具有独特的逻辑,并包括诸多方法。总的来说是先对总体的某一特征进行假设假设,然后根据样本统计量的分布规律分析样本数据,判断样本信息是否支持这种假设样本信息是否支持这种假设,最后作出拒绝这种假设的取舍抉择。这种通过对假设作出取舍抉择达到解决问题的方法,称为假设检验假设检验。总体A1a1a211,sx22,sx总体B2b2ysy

25、,2假设检验所解决的问题:样本统计量的差异是由何种因素造成的?假设检验的推理逻辑:小概率反证法假设检验的推理逻辑:小概率反证法 先对总体的某个特征进行假设(先对总体的某个特征进行假设(H0),),即检验假设(零假设)。在即检验假设(零假设)。在H0正确的假正确的假定下,看看能由此推出什么结果。如果定下,看看能由此推出什么结果。如果导致一种不合理的现象出现,则推论事导致一种不合理的现象出现,则推论事先先“H0正确的假定正确的假定”不正确,即不正确,即H0不正不正确。反之,如没有导致一种不合理现象确。反之,如没有导致一种不合理现象出现,则不能作出拒绝出现,则不能作出拒绝H0的判断结论。的判断结论。

26、不合理现象的判定规则?不合理现象的判定规则?小概率事件原理是判定的依据。在H0为真的假定下,看看获得现有样本(X1Xn)及其更极端情况的概率P,若P,则认为合理,反之P0.50。按 =0.05水准,不拒绝H0,无统计学意义。还不能认为阿卡波糖胶囊与拜糖平胶囊对空腹血糖的降糖效果不同。1X)11(2)1()1(212122221121nnnnSnSnXXnSSXX222121204205.20601.36250.20650.22211222X2)1()1(212221212nnnsnssc2)()(2122222121212nnnxxnxxsc B、两正态总体方差不齐时两正态总体方差不齐时的近似

27、的近似t检验检验 注意:注意:当样本含量较大时,均数比较的假设检验对资料的正态性和方差齐性要求不高。例3-8 在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜糖平胶囊的对照组20例病人和用阿卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-7.问用两种不同药物的病人其HbA1c下降值是否不同?2121x1.361.360.700.701.461.461.131.1320202020对照组对照组试验组试验组S Sn n分组分组表表3-7 3-7 对照组和试验组对照组和试验组HbAHbA1 1c c下降值下降值(%)(%)对照组方差是试验组方差的对照

28、组方差是试验组方差的3.77倍倍,两样本方差齐性的两样本方差齐性的F检验检验认为两组的总体方差不等认为两组的总体方差不等,故采用近似故采用近似t检验检验.(1)建立检验假设建立检验假设,确定检验水准确定检验水准H0:,即对照组和试验组病人即对照组和试验组病人HbA1c下降值的总体均数相等下降值的总体均数相等H1:,即对照组和试验组病人即对照组和试验组病人HbA1c下降值的总体均数不等下降值的总体均数不等 =0.05(2)计算检验统计量计算检验统计量按公式按公式(3-19)(3)(3)确定确定P P值值,作出推断结论。作出推断结论。查查t t界值表界值表t t0.05/2,19 0.05/2,1

29、9=2.093=2.093。:由由0.9650.9652.0932.093得得P P0.050.05。按。按 =0.05 =0.05水准水准,不拒绝不拒绝H H0 0,无统计,无统计学意义学意义.还不能认为用两种不同药物的病人其还不能认为用两种不同药物的病人其HbAHbA1 1c c下降值不同下降值不同.965.02070.02036.113.146.122,t191201191202093.22070.02036.1093.22070.0093.22036.12222,205.0t12121222,22XXXXStSttSS 3、假设检验的两类错误、假设检验的两类错误一型错误:拒绝了实际成立

30、的一型错误:拒绝了实际成立的H0。二型错误:不拒绝实际上不成立的二型错误:不拒绝实际上不成立的H0。/26062.56567.57072.5750.020.040.060.080.10.1267.57072.57577.58082.50.020.040.060.080.10.12/2H0 真真H0 不真不真正确正确正确正确第一类错误第一类错误 (弃真弃真)第二类错误第二类错误 (取伪取伪)假设检验的两类错误假设检验的两类错误 H0 为真为真H0 为假为假真实情况真实情况所作判断所作判断接受接受 H0拒绝拒绝 H0 第一类错误通常称为第一类错误通常称为 类错误类错误 第二类错误通常称为第二类错误

31、通常称为 类错误类错误问题:问题:第二类错误第二类错误 的大小和哪些因素有关?的大小和哪些因素有关?4、假设检验应注意的问题假设检验应注意的问题1)要有严密的研究设计:组间应均衡2)不同资料应选用不同的检验方法:分析目的;资料类型、特点;设计。3)正确理解“显著性”的含义:现多用“有无统计学意义”4)结论不能绝对化:其结论具有概率性质5)统计“显著性”与临床“显著性”的区别6)可信区间与假设检验的区别和联系第六节 正态性检验和两样本方 差比较的F检验 正态性检验正态性检验 1、概率图(、概率图(p-p图)图)2、偏度系数与峰度系数法、偏度系数与峰度系数法Normal P-P Plot of 血

32、糖下降值Observed Cum Prob1.00.75.50.250.00Expected Cum Prob1.00.75.50.250.00例3-9 试用矩法对表3-1中计算机模拟抽样所得100个样本均数进行正态性检验.(1)建立检验假设建立检验假设,确定检验水准确定检验水准H0:=0且且 =0H1:0或或/和和 0,=0.10(欲不拒绝欲不拒绝H0,宜稍大以减少宜稍大以减少型错误型错误)(2)计算检验统计量计算检验统计量 f=1,X为每次抽样算得的均数。今为每次抽样算得的均数。今 =16768.64,=2812156.3640,=471655519.5407,=79114166838.6

33、615。)1122fX2fX3fX4fX4X3X2XX323)1100/(100/)64.16768(3640.2812156)2100)(1100(100/)64.16768(23640.281215664.1676835407.47165551910022242)1100100/)64.16768(3640.2812156)(3100)(2100)(1100(100)64.16768(31003640.2812156)64.16768(65407.47165551964.1676846615.87911416683100)1100(1g2g =0.1104 故有故有(3)确定确定P值值,作

34、出推断结论作出推断结论 查查u界值表界值表,得双尾概率得双尾概率:峰度峰度P0.50,偏度偏度P 0.50。按。按 =0.10水准水准,不拒绝不拒绝H0,无统计学意义无统计学意义.还不能认为这些样本均数的总体不服还不能认为这些样本均数的总体不服从正态分布。从正态分布。)3100)(2100()1100(322414.0)3100)(1100)(2100()1100(10061g4783.0)5100)(3100)(2100)(3100()1100(1002422g231.04783.01104.0,599.02414.01445.0222111gggggugu16(1)(2)(1)(3)gn

35、nnnn2224(1)(3)(2)(3)(5)gn nnnnn7、两样本方差齐性检验、两样本方差齐性检验这里介绍这里介绍F检验:检验:2221)(SSF大现多用不依赖总体分布的Levene检验分组例数均数标准差对照201.461.36试验201.130.70对照组与试验组HbA1c下降值(%)F=1.362/0.702=3.775df1=19 df2=190057.0)(,19,19,775.321双侧PF例3-10 对例3-7,用F检验判断两总体空腹血糖下降值的方差是否不等。(1)建立检验假设建立检验假设,确定检验水准确定检验水准H0:,H1:,(2)计算检验统计量计算检验统计量(3)确定确

36、定P值值,作出推断结论作出推断结论 以以 (表中无表中无19)、查查F界值表界值表,得得F0.10/2,(20,19)=2.15,因因1.598 F0.10/2,(20,19),故故P0.10。按按 水准水准,不拒绝不拒绝H0,无统计学意义。无统计学意义。还不能认为阿卡波糖胶囊组与拜糖平胶囊组空腹血糖下降值的总体方差不等。还不能认为阿卡波糖胶囊组与拜糖平胶囊组空腹血糖下降值的总体方差不等。598.14205.20601.322F19120119120220119210.02221222110.02122()()SFS较大较小111n221n例3-11 对例3-8,用F检验判断对照组和试验组病人

37、HbA1c(%)下降值的总体方差是否不等。(1)建立检验假设建立检验假设,确定检验水准确定检验水准H0:H1:(2)计算检验统计量计算检验统计量(3)确定确定P值值,作出推断结论作出推断结论以以 、查附表、查附表3的的F界值表,因界值表,因3.775 F0.10/2,(20,19),故故P0.10。按按 水准,拒绝水准,拒绝H0,接受接受H1,有统计学意义。可认为有统计学意义。可认为对照组和试验组病人对照组和试验组病人HbA1c(%)下降值的总体方差不等。下降值的总体方差不等。2221222110.0775.370.036.122F19120119120210.0201变量变换变量变换当原始资料不满足假设检验的条件时,可通过变量变换的方法加以改善,使资料满足正态性或等方差的要求。1、对数变换2、平方根变换3、平方根反正弦变换4、倒数变换

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(医学统计学第三章-总体均数的估计与假设检验-课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|