卫生统计学教学课件参数估计基础.ppt

上传人(卖家):晟晟文业 文档编号:4207909 上传时间:2022-11-20 格式:PPT 页数:43 大小:650.54KB
下载 相关 举报
卫生统计学教学课件参数估计基础.ppt_第1页
第1页 / 共43页
卫生统计学教学课件参数估计基础.ppt_第2页
第2页 / 共43页
卫生统计学教学课件参数估计基础.ppt_第3页
第3页 / 共43页
卫生统计学教学课件参数估计基础.ppt_第4页
第4页 / 共43页
卫生统计学教学课件参数估计基础.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

1、第五章第五章 参数估计基础参数估计基础 抽样研究:用样本信息推断总体特征抽样研究:用样本信息推断总体特征 常用统计推断方法:参数估计和假设检验常用统计推断方法:参数估计和假设检验 本章:本章:l参数估计的基本概念参数估计的基本概念l样本统计量的分布规律;样本统计量的分布规律;l总体均数和总体概率的估计方法。总体均数和总体概率的估计方法。第第一一节节抽抽样样分分l从总体中随机抽取一份样本,计算均数。从总体中随机抽取一份样本,计算均数。这个均数不同于总体均数!为什么?这个均数不同于总体均数!为什么?l再从该总体中随机抽取一份样本,再计算均再从该总体中随机抽取一份样本,再计算均数。数。前后两个均数不

2、等,为什么?前后两个均数不等,为什么?-抽样误差!抽样误差!实验实验5-1 假定某年某地所有假定某年某地所有13岁女学生身高服从岁女学生身高服从总体均数总体均数 =155.4cm,总体标准差总体标准差 =5.3cm的正的正态分布态分布N(,2)。在这样一个总体中随机抽)。在这样一个总体中随机抽样,每次均抽取样,每次均抽取30例组成一份样本;例组成一份样本;共抽共抽100次;次;算出每一份样本的平均身高:算出每一份样本的平均身高:153.6,153.1,154.9,157.7 样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 样本号样本号 均数均数 标准误标准误 95%置信区间置信区

3、间 1 156.7 0.91 154.8 158.6 51 155.7 0.97 153.7 157.7 2 158.1*0.95 156.2 160.1 52 153.7*0.80 152.1 155.4 3 155.6 1.16 153.3 158.0 53 154.8 0.89 153.0 156.6 4 155.2 1.03 153.1 157.3 54 155.6 0.92 153.7 157.5 5 155.0 1.01 152.9 157.0 55 154.8 0.83 153.1 156.5 6 156.4 1.08 154.2 158.6 56 155.6 0.96 153.

4、6 157.6 7 154.9 1.12 152.6 157.1 57 158.2*0.97 156.2 160.2 8 156.5 0.74 154.9 158.0 58 154.9 1.06 152.7 157.1 9 155.0 1.09 152.8 157.2 59 153.4*0.91 151.5 155.3 10 155.9 0.98 153.9 157.9 60 156.4 0.98 154.4 158.4 11 156.9 0.98 155.0 158.9 61 153.6 0.94 151.6 155.5 12 154.0 0.94 152.1 156.0 62 155.6

5、0.96 153.6 157.5 13 154.4 0.93 152.4 156.3 63 155.2 0.91 153.4 157.1 14 156.5 1.03 154.3 158.6 64 156.7 1.06 154.5 158.8 15 155.9 1.07 153.7 158.1 65 154.7 1.02 152.6 156.8 16 155.5 0.96 153.6 157.5 66 155.1 0.97 153.1 157.1 17 156.9 0.88 155.1 158.7 67 155.7 0.86 153.9 157.5 表表5-1从从N(155.4,5.32)抽到的

6、抽到的100份随机样本的计算结果(份随机样本的计算结果(n=30)样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 18 156.9 1.04 154.8 159.1 68 156.4 0.69 155.0 157.8 19 153.4 1.04 151.3 155.5 69 155.1 0.91 153.2 156.9 20 154.8 0.99 152.8 156.8 70 154.9 1.09 152.7 157.2 21 156.1 1.00 154.0 158.1 71 155.8 1.11 153.5 158

7、.1 22 155.0 1.09 152.7 157.2 72 153.9 0.95 152.0 155.9 23 154.7 1.25 152.2 157.3 73 156.2 0.94 154.2 158.1 24 154.5 1.22 152.0 157.0 74 156.0 0.86 154.3 157.8 25 155.2 0.92 153.3 157.1 75 154.2 0.93 152.3 156.1 26 154.6 0.93 152.7 156.5 76 155.4 0.90 153.5 157.2 27 156.1 1.14 153.8 158.5 77 156.6 1.

8、05 154.4 158.7 28 155.7 0.97 153.7 157.7 78 155.6 0.83 153.9 157.4 29 155.1 1.08 152.9 157.3 79 156.8 1.03 154.7 158.9 30 156.1 0.93 154.2 158.0 80 155.3 0.80 153.7 156.9 31 156.3 1.16 153.9 158.6 81 154.9 0.85 153.2 156.6 32 155.2 1.07 153.0 157.4 82 154.6 1.05 152.4 156.7 33 156.0 1.10 153.7 158.3

9、 83 154.6 0.72 153.1 156.1 34 155.6 0.88 153.8 157.4 84 157.5 1.07 155.3 159.7 样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 35 156.5 0.88 154.7 158.3 85 155.9 0.85 154.2 157.7 36 155.3 0.88 153.5 157.1 86 156.5 0.72 155.0 158.0 37 155.2 0.87 153.4 157.0 87 156.4 1.04 154.3 158.6 38

10、155.5 1.19 153.1 158.0 88 154.7 1.08 152.4 156.9 39 155.0 0.70 153.5 156.4 89 156.2 0.82 154.5 157.8 40 155.5 1.02 153.4 157.6 90 154.6 1.05 152.5 156.8 41 155.1 1.00 153.1 157.2 91 155.1 0.90 153.2 156.9 42 155.3 1.00 153.2 157.3 92 156.6 1.03 154.5 158.7 43 156.3 0.97 154.4 158.3 93 156.0 1.08 153

11、.8 158.2 44 156.6 0.88 154.8 158.4 94 155.8 0.93 153.9 157.7 45 155.4 0.83 153.7 157.1 95 156.1 0.83 154.4 157.8 46 155.9 1.03 153.8 158.0 96 152.7*0.75 151.1 154.2 47 155.3 0.89 153.5 157.1 97 155.1 0.93 153.2 157.0 48 154.6 1.09 152.3 156.8 98 155.3 0.90 153.5 157.2 49 156.1 0.81 154.5 157.8 99 15

12、4.6 0.71 153.2 156.1 50 154.7 1.04 152.6 156.8 100 156.6 1.16 154.2 159.0 表表5-2 从正态总体从正态总体N(155.4,5.32)抽样得到的抽样得到的100个样本个样本 均数的频数分布(均数的频数分布(ni=30)组段下限值组段下限值(cm)频数频数 频率频率%152.6 153.2 153.8 154.4 155.0 155.6 156.2 156.8 157.4 158.0 1 4 4 22 25 21 17 3 2 1 1.0 4.0 4.0 22.0 25.0 21.0 17.0 3.0 2.0 1.0 合计合

13、计 100 100.0 1.各样本均数未必等于总体均数各样本均数未必等于总体均数;2.样本均数之间存在差异样本均数之间存在差异;3.样本均数的分布很有规律,围绕着总体均数样本均数的分布很有规律,围绕着总体均数(155.4cm),中间多、两边少,左右基本对),中间多、两边少,左右基本对称,也服从正态分布。称,也服从正态分布。4样本均数的变异较之原变量的变异大大缩样本均数的变异较之原变量的变异大大缩小小(见表见表5-1第第3栏栏)。若随机变量若随机变量 X X 服从正态分布服从正态分布 ,则,则 (1)(1)样本均数的总体均数仍等于原来的总体均样本均数的总体均数仍等于原来的总体均数数 (2)(2)

14、样本均数的标准误样本均数的标准误 实践中,实践中,表示均数抽样误差的指标:表示均数抽样误差的指标:样本均数的标准差样本均数的标准差 (standard deviation of mean),也称为也称为 样本均数的标准误样本均数的标准误 (standard error of mean,SE或或SEM)nXnSSX),(2NX从非正态分布重复抽样,从非正态分布重复抽样,样本均数的分布如何?样本均数的分布如何?从均数为从均数为 ,方差为,方差为 2 2 的一般总体抽样,当样的一般总体抽样,当样本量本量 n 较小时,样本均数的分布当然并非正较小时,样本均数的分布当然并非正态分布;态分布;实验实验5-

15、2 图图5-1(a)是一个正偏峰的分布,用)是一个正偏峰的分布,用电脑从中随机抽取样本含量分别为电脑从中随机抽取样本含量分别为5,10,30和和50的样本各的样本各1000次,计算样本均数并绘制次,计算样本均数并绘制4个直方图。个直方图。PERCENT030 x MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0(a)原始数据

16、原始数据n=5PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0 n=10PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.0

17、3.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0 n=30PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0 n=50PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.

18、11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0 (b)n=5(c)n=10 (d)n=30 (e)n=502 2(1)样本均数的总体均数仍等于原来的总体均样本均数的总体均数仍等于原来的总体均数数 ,样本均数的标准误,样本均数的标准误仍满足仍满足(2)(2)当样本量当样本量n较小时,样本均数的分布并非较小时,样本均数的分布并非正态分布;正态分布;(3)(3)样本量足够大时样本量足够大时(例如,(例如,n 50

19、),),样本样本均数的分布近似于正态分布均数的分布近似于正态分布2 2 nX),(2nNX 实验实验5.3 样本率样本频率抽样分布的实验样本率样本频率抽样分布的实验 在一在一口袋内装有形状、重量完全相同的黑球和白球,口袋内装有形状、重量完全相同的黑球和白球,已知黑球比例为已知黑球比例为20%(总体概率(总体概率=20%),),从口袋中每摸一次看清颜色后放回去,搅匀后从口袋中每摸一次看清颜色后放回去,搅匀后再摸,重复摸球再摸,重复摸球35次(次(n=35),计算摸到黑球计算摸到黑球的百分比(样本频率的百分比(样本频率p i);这样的实验重复这样的实验重复100次次.每次得到每次得到100个黑球的

20、比例分别为个黑球的比例分别为 14.4%,19.8%,20.2%,22.5%,黑黑球球比比例例%样样本本频频数数 样样本本频频率率%5.0 3 3.0 8.0 7 7.0 11.0 5 5.0 14.0 8 8.0 17.0 16 16.0 20.0 22 22.0 22.0 15 15.0 25.0 7 7.0 28.0 7 7.0 31.0 5 5.0 34.0 3 3.0 40.0 2 2.0 合合计计 100 100.0 根据二项分布原理,若随机变量根据二项分布原理,若随机变量 X B(n,),则样本频率则样本频率 p 的的 总体均数为总体均数为 总体标准误为总体标准误为 当总体概率当

21、总体概率未知时,可用样本频率未知时,可用样本频率 p 近似地代近似地代替替,若增加样本含量若增加样本含量n可以减小样本频率的抽样误差。可以减小样本频率的抽样误差。np)1(nppnppSp)1(1)1(%77.10177.0776585.0415.0)1(1)1(nppnppSp 从正态分布从正态分布N N(,2 2)抽得样本的均数也服从)抽得样本的均数也服从正态分布正态分布,记为记为 N N(,)对正态变量作对正态变量作Z Z 变换,便有变换,便有在实际工作中,在实际工作中,未知,采用未知,采用2X)1,0(NXZXXSXt2X一、一、t 分布的概念分布的概念W.S.Gosset(1908)

22、证明证明 t 分布,分布,=n 1 又称又称Student t分布分布(Students t-distribution)理论上理论上,t t 分布与自由度分布与自由度 有关有关 XSXtFREQUENCY0200t3 MIDPOINT-12.0-11.5-11.0-10.5-10.0-9.5-9.0-8.5-8.0-7.5-7.0-6.5-6.0-5.5-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.50.00.51.01.52.02.53.03.54.04.55.05.56.06.57.07.58.08.59.09.510.010.511.011.512.0 F

23、REQUENCY0200t50 MIDPOINT-5.0-4.5-4.0-3.5-3.0-2.5-2.0-1.5-1.0-0.50.00.51.01.52.02.53.03.54.04.55.0=(=(标准正态分布标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3(1)类似标准正态分布类似标准正态分布.单峰,单峰,0为中心,左右对称。为中心,左右对称。(2)自由度自由度 越小,越小,t 值越分散,峰越矮,尾越高;值越分散,峰越矮,尾越高;(3)增大,增大,t 分布逼近标准正态分布;分布逼近标准正态分布;趋于趋于 时,时,t 分布完全成为标准正态分布分布完全成为标准

24、正态分布 -标准正态分布是标准正态分布是t 分布的特例。分布的特例。附表附表2:不同自由度不同自由度 下的下的t界值(界值(p.434)横标目横标目:自由度自由度 ,纵标目,纵标目:概率概率P 表中数字表中数字:当当 和和P 确定时,对应的确定时,对应的t 临界值临界值 t,t/2,相同自由度相同自由度,t t值越大,尾部概率越小值越大,尾部概率越小相同相同t t 值,双侧尾部概率为单侧尾部概率的两倍值,双侧尾部概率为单侧尾部概率的两倍例例 当当 =16,表中查得表中查得 单侧单侧0.05的临界值的临界值 t0.05,16=1.746,P(t t0.05,16)=0.05 P(t t0.05,

25、16)=0.05 双侧双侧0.05的临界值的临界值 t0.05/2,16=2.120 P(t t0.05/2,16)P(t t0.05/2,16)=0.05 一、参数估计的概念一、参数估计的概念参数估计参数估计:用样本统计量估计总体参数用样本统计量估计总体参数点估计(点估计(point estimation)区间估计(区间估计(interval estimation)(一)点估计(一)点估计用样本统计量直接作为总体参数的点估计值用样本统计量直接作为总体参数的点估计值点估计没有考虑抽样误差,无法评价其可信度点估计没有考虑抽样误差,无法评价其可信度估计值与真值之间的差距估计值与真值之间的差距!例例

26、5-1 27例健康成年男性血红蛋白量的样本均数作为总例健康成年男性血红蛋白量的样本均数作为总体均数的点估计值体均数的点估计值-认为认为20002000年该地所有健康成年男性血红蛋白量的总年该地所有健康成年男性血红蛋白量的总体均数体均数 约为约为125 g/L125 g/L例例5-2 776名名50岁以上的中老年妇女骨质疏松症的样本岁以上的中老年妇女骨质疏松症的样本患病率作为总体患病率的点估计值患病率作为总体患病率的点估计值-认为该市所有认为该市所有5050岁以上的中老年妇女骨质疏松症的岁以上的中老年妇女骨质疏松症的总体患病率总体患病率 约为约为41.5%41.5%。(二)区间估计(二)区间估计

27、 总体参数的置信区间(总体参数的置信区间(confidence interval,CI)置信水平:置信水平:1 一般取一般取0.05或或0.01,故,故1 为为0.95或或0.99 正态总体正态总体N(,2)的样本均数的)的样本均数的t 变换变换1n-tSXtX分布XSX,2/05.0,2/05.0tSXtXXXStXStX,2/05.0,2/05.0注意:有注意:有5%5%的情形,上式不对!的情形,上式不对!故可信程度为故可信程度为95%95%!样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 1 156.7 0.91

28、 154.8 158.6 51 155.7 0.97 153.7 157.7 2 158.1*0.95 156.2 160.1 52 153.7*0.80 152.1 155.4 3 155.6 1.16 153.3 158.0 53 154.8 0.89 153.0 156.6 4 155.2 1.03 153.1 157.3 54 155.6 0.92 153.7 157.5 5 155.0 1.01 152.9 157.0 55 154.8 0.83 153.1 156.5 6 156.4 1.08 154.2 158.6 56 155.6 0.96 153.6 157.6 7 154.

29、9 1.12 152.6 157.1 57 158.2*0.97 156.2 160.2 8 156.5 0.74 154.9 158.0 58 154.9 1.06 152.7 157.1 9 155.0 1.09 152.8 157.2 59 153.4*0.91 151.5 155.3 10 155.9 0.98 153.9 157.9 60 156.4 0.98 154.4 158.4 11 156.9 0.98 155.0 158.9 61 153.6 0.94 151.6 155.5 12 154.0 0.94 152.1 156.0 62 155.6 0.96 153.6 157

30、.5 13 154.4 0.93 152.4 156.3 63 155.2 0.91 153.4 157.1 14 156.5 1.03 154.3 158.6 64 156.7 1.06 154.5 158.8 15 155.9 1.07 153.7 158.1 65 154.7 1.02 152.6 156.8 16 155.5 0.96 153.6 157.5 66 155.1 0.97 153.1 157.1 17 156.9 0.88 155.1 158.7 67 155.7 0.86 153.9 157.5 表表5-1从从N(155.4,5.32)抽到的抽到的100份随机样本的计算

31、结果(份随机样本的计算结果(n=30)样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 18 156.9 1.04 154.8 159.1 68 156.4 0.69 155.0 157.8 19 153.4 1.04 151.3 155.5 69 155.1 0.91 153.2 156.9 20 154.8 0.99 152.8 156.8 70 154.9 1.09 152.7 157.2 21 156.1 1.00 154.0 158.1 71 155.8 1.11 153.5 158.1 22 155.0 1.

32、09 152.7 157.2 72 153.9 0.95 152.0 155.9 23 154.7 1.25 152.2 157.3 73 156.2 0.94 154.2 158.1 24 154.5 1.22 152.0 157.0 74 156.0 0.86 154.3 157.8 25 155.2 0.92 153.3 157.1 75 154.2 0.93 152.3 156.1 26 154.6 0.93 152.7 156.5 76 155.4 0.90 153.5 157.2 27 156.1 1.14 153.8 158.5 77 156.6 1.05 154.4 158.7

33、 28 155.7 0.97 153.7 157.7 78 155.6 0.83 153.9 157.4 29 155.1 1.08 152.9 157.3 79 156.8 1.03 154.7 158.9 30 156.1 0.93 154.2 158.0 80 155.3 0.80 153.7 156.9 31 156.3 1.16 153.9 158.6 81 154.9 0.85 153.2 156.6 32 155.2 1.07 153.0 157.4 82 154.6 1.05 152.4 156.7 33 156.0 1.10 153.7 158.3 83 154.6 0.72

34、 153.1 156.1 34 155.6 0.88 153.8 157.4 84 157.5 1.07 155.3 159.7 样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 样本号样本号 均数均数 标准误标准误 95%置信区间置信区间 35 156.5 0.88 154.7 158.3 85 155.9 0.85 154.2 157.7 36 155.3 0.88 153.5 157.1 86 156.5 0.72 155.0 158.0 37 155.2 0.87 153.4 157.0 87 156.4 1.04 154.3 158.6 38 155.5 1.19 153

35、.1 158.0 88 154.7 1.08 152.4 156.9 39 155.0 0.70 153.5 156.4 89 156.2 0.82 154.5 157.8 40 155.5 1.02 153.4 157.6 90 154.6 1.05 152.5 156.8 41 155.1 1.00 153.1 157.2 91 155.1 0.90 153.2 156.9 42 155.3 1.00 153.2 157.3 92 156.6 1.03 154.5 158.7 43 156.3 0.97 154.4 158.3 93 156.0 1.08 153.8 158.2 44 15

36、6.6 0.88 154.8 158.4 94 155.8 0.93 153.9 157.7 45 155.4 0.83 153.7 157.1 95 156.1 0.83 154.4 157.8 46 155.9 1.03 153.8 158.0 96 152.7*0.75 151.1 154.2 47 155.3 0.89 153.5 157.1 97 155.1 0.93 153.2 157.0 48 154.6 1.09 152.3 156.8 98 155.3 0.90 153.5 157.2 49 156.1 0.81 154.5 157.8 99 154.6 0.71 153.2

37、 156.1 50 154.7 1.04 152.6 156.8 100 156.6 1.16 154.2 159.0 当我们据一份样本对总体均数只作一次区间估计当我们据一份样本对总体均数只作一次区间估计时,我们宣布时,我们宣布 “总体均数总体均数 在范围内在范围内”-这句话未必正确,可信的程度为这句话未必正确,可信的程度为95%95%!若将置信度定为若将置信度定为(1-),则总体均数,则总体均数 的的(1-)置信区间的一般计算式为置信区间的一般计算式为 或缩写为或缩写为 ),(:,2/,2/XXStXStXXStX,2/n=27,=27 1=26双侧双侧 t0.05/2,26=2.056,t

38、0.01/2,26=2.77995%置信区间:置信区间:99%置信区间:置信区间:)94.130,06.119(2715056.2125,2/05.0XStX)02.133,98.116(2715779.2125,2/01.0XStX均均数数的的单单侧侧(1XStX,XStX,2.正态分布方法正态分布方法(1)总体标准差总体标准差 已知时,已知时,总体均数的双侧置信区间为总体均数的双侧置信区间为(2)未知、未知、n足够大时(足够大时(n 50)),(:2/2/XXZXZXXZX2/),(:2/2/XXSZXSZXn=90 50)1.173,3.171(905.496.12.17296.12/0

39、5.0XXSXSZX当样本含量当样本含量n较小(较小(n 50),),p很接近很接近0或或100%时,可时,可以查附表以查附表6(p.445)确定百分率总体概率的置信区间。确定百分率总体概率的置信区间。例例5-6 某医院对某医院对39名前列腺癌患者实施开放手术治名前列腺癌患者实施开放手术治疗,术后有合并症者疗,术后有合并症者2人,试估计该手术合并症发生概人,试估计该手术合并症发生概率的率的95%置信区间。置信区间。点估计点估计=5.13%,=5.13%,而概率的真值却有可能在而概率的真值却有可能在1%1%和和17%17%之间之间,甚至还要小或还要大甚至还要小或还要大!%13.5392p注意注意

40、:附表:附表6中仅列出中仅列出X n/2部分;当部分;当X n/2时,时,应以应以n X值查表,值查表,然后从然后从100100中减去查得的数值。中减去查得的数值。本例本例n=31,X=25 n/2,所以用,所以用n X=6查附表查附表6,得,得8 38,再用,再用100减去所查的数值减去所查的数值得到得到95%置信区间为置信区间为 62%92%。点估计点估计=80.65%,=80.65%,而概率的真值却有可能在而概率的真值却有可能在62%62%和和92%92%之间之间,甚至还要小或还要大甚至还要小或还要大!2.正态近似法正态近似法 当当n足够大,且样本频率足够大,且样本频率p和(和(1 p)

41、均不太小时)均不太小时(np与与n(1 p)均大于均大于5),总体概率的置信区间),总体概率的置信区间例例5-8 用某种仪器检查已确诊的乳腺癌患者用某种仪器检查已确诊的乳腺癌患者120名,检名,检出乳腺癌患者出乳腺癌患者94例,检出率为例,检出率为78.3%。估计该仪器乳腺。估计该仪器乳腺癌总体检出率的癌总体检出率的95%置信区间。置信区间。np=94及及n(1 p)=26均大于均大于5,可用近似公式估计,可用近似公式估计),(:2/2/ppSZpSZp)857.0,709.0(120)783.01(783.096.1783.0)1(2/05.02/nppZpSZpp1.从同一总体中反复多次地

42、随机抽取若干份样从同一总体中反复多次地随机抽取若干份样本,各样本统计量之间以及样本统计量与总体本,各样本统计量之间以及样本统计量与总体参数之间存在差异参数之间存在差异,此现象称抽样误差。此现象称抽样误差。l反映抽样误差大小的指标是标准误。反映抽样误差大小的指标是标准误。l来自正态总体的样本均数,其分布仍服从正态来自正态总体的样本均数,其分布仍服从正态分布分布l从偏峰分布总体抽样,只要从偏峰分布总体抽样,只要n足够大,样本均足够大,样本均数的分布也近似于正态分布。数的分布也近似于正态分布。l要注意均数的标准误与原变量的标准差之间的要注意均数的标准误与原变量的标准差之间的区别,不能混淆其意义。区别

43、,不能混淆其意义。2.当当X服从正态分布服从正态分布N(,2)时时,统计量统计量 服从自由度为服从自由度为 =n 1的的 t 分布分布 l自由度自由度 不同不同,t 分布的形状不同分布的形状不同;l自由度自由度 小,变异大;小,变异大;大,变异小大,变异小l自由度自由度 很大很大时,很大很大时,t 分布近似标准正态分分布近似标准正态分布。布。XSXt3.参数估计有两种方法:参数估计有两种方法:l点估计:直接用样本统计量估计总体参数,点估计:直接用样本统计量估计总体参数,称为;称为;l区间估计:按一定的置信度估计总体参数所区间估计:按一定的置信度估计总体参数所在范围,最常用的是在范围,最常用的是

44、 95%置信区间和置信区间和99%置置信区间。信区间。由于考虑了抽样误差的大小,区间估计比点由于考虑了抽样误差的大小,区间估计比点估计更有用。估计更有用。4.总体均数的区间估计和总体概率的区间估计总体均数的区间估计和总体概率的区间估计 (1)根据资料已知的条件及样本含量)根据资料已知的条件及样本含量n的大小,的大小,总体均数置信区间的计算公式不同总体均数置信区间的计算公式不同l 要注意总体均数的置信区间与参考值范围的要注意总体均数的置信区间与参考值范围的区别区别 (2)根据样本量)根据样本量n和样本频率和样本频率p的大小,总体的大小,总体概率置信区间的计算有两种方法:概率置信区间的计算有两种方法:n 50、p很接近很接近0或或100%时,用查表法;时,用查表法;n足够大,且足够大,且np与与n(1 p)均大于均大于5时,用正时,用正态近似法。态近似法。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(卫生统计学教学课件参数估计基础.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|