ImageVerifierCode 换一换
格式:PPT , 页数:89 ,大小:1.19MB ,
文档编号:2773285      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-2773285.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(参数估计基础-PPT课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

参数估计基础-PPT课件.ppt

1、参数参数估计计基础础2022-5-252了解总体特征的最好方法是对总体的每一个体进行观察、了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。试验,但这在医学研究实际中往往不可行。对对无限总体无限总体不可能对所有个体逐一观察不可能对所有个体逐一观察. . 对对有限总体有限总体限于人力、财力、物力、时间或个体过多等原限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究因,不可能也没必要对所有个体逐一研究( (如对一批罐头质如对一批罐头质量检查量检查) )。借助借助抽样研究抽样研究。 2022-5-253 抽样研样研究的目的是用样样本信息

2、推断总断总体特征,即用样样本资资料计计算的统计统计指标标推断总断总体参数参数 常用的统计统计推断断方法有参数参数估计计(总总体均数数和总总体概概率的估计计)和假设检验设检验 2022-5-254内内容复习复习参数估计参数估计假设检验假设检验研究总体研究总体统计描述统计描述样本样本统计推断统计推断随机抽样统计表统计表统计图统计图统计指标统计指标2022-5-255第五章总总体均数数估计计 抽样样分布与与抽样误样误差分布 总总体均数数的估计计 案例讨论讨论2022-5-256复习一些概念 参数参数(parameter)与统计与统计量(statistics)参数获参数获取的途径径 对总对总体进进行研

3、研究 抽样研样研究 抽样误样误差(sampling error)1.抽样误样误差的概概念:由个个体变异产变异产生的,随随机抽样样引起的样样本统计统计量与总与总体参数间参数间的差异异。(抽样误样误差=总总体参数参数样样本统计统计量)2.抽样误样误差产产生的原因:3.抽样误样误差的特点:随随机,不可避免,有规规律可循。4.在大量重复复抽样样的情况况下,可以展示其规规律性2022-5-257第一节节抽样样分布与与抽样误样误差 样样本均数数的抽样样分布与与抽样误样误差 样样本频频率的抽样样分布与与抽样误样误差2022-5-258一、均数数的抽样误样误差 样样本均数数的抽样样分布 举举例1x总体总体样本

4、样本1样本样本2样本样本3样本样本2x3xnx2022-5-259一、均数数的抽样误样误差 样样本均数数的抽样样分布 抽样样模拟实验拟实验 假定总总体:某年某地13岁岁女学学生身高值值 XN(155.4,5.3) 随随机抽样样:n30,K1002022-5-2510一、均数数的抽样误样误差=155.4=5.3113 0,1 5 2 .3nX223 0,1 5 5 .2nX1 0 01 0 03 0,1 5 4 .8nX 实验实验5-1从已知的从已知的13岁女生身高总体中随机抽样示意图岁女生身高总体中随机抽样示意图2022-5-2511样样本号号均数数样样本号号均数数1156.751155.72

5、158.152153.73155.653154.84155.254155.65155.055154.86156.456155.67154.957158.245155.495156.146155.996152.747155.397155.148154.698155.349156.199154.650154.7100156.62022-5-2512一、均数数的抽样误样误差表5-2 5-2 从从总总体N N(155.4155.4,5.35.32 2)抽样样得到100100个样个样本均数数的频数频数分布组组段(cm)(cm)频数频数频频率( (%)%)152.611.0153.244.0153.844

6、.0154.42222.0155.02525.0155.62121.0156.21717.0156.833.0157.422.0 158.0158.611.0合计计100100.02022-5-2513 将此将此100个样本均数看成个样本均数看成新变量值新变量值,则这,则这100个样本均数构成一个样本均数构成一新分布新分布,绘制直方图。,绘制直方图。图图3-2 从正态分布总体从正态分布总体N(155.4,5.3)随机抽样所得样本均数分布随机抽样所得样本均数分布2022-5-2514一、均数数的抽样误样误差1、样样本均数数的抽样样分布特点|各样样本均数数未必等于总总体均数数;|样样本均数数之间间

7、存在差异异;|样样本均数数的分布规规律:围绕围绕着总总体均数数155.4cm,中间间多,两边两边少,左右基本对称对称,服从从正态态分布;|样样本均数数的变异较变异较原变变量的变异减变异减小。2022-5-2515一、均数数的抽样误样误差 抽样误样误差 概概念:由于抽样样造成的样样本统计统计量与统计与统计量以及样样本统统计计量与总与总体参数参数之间间的差异异叫作抽样误样误差。 抽样误样误差产产生的基本条条件 抽样研样研究 个个体差异异 表现现形式 样样本统计统计量与样与样本统计统计量之间间的差异异 样样本统计统计量与总与总体参数参数之间间的差异异2022-5-2516一、均数数的抽样误样误差2、

8、均数数的抽样误样误差(1)概概念:由个个体变异产变异产生的,随随机抽样样引起的样样本均数与总数与总体均数间数间的差异异。(均数数的抽样误样误差=总总体均数数样样本均数数)(2)表现现形式:样样本均数与总数与总体均数间数间存在差异异样样本均数与样数与样本均数间数间存在差异异 m mXm6X5X4X3X2X1X.X2022-5-2518均数数的抽样误样误差可表现为现为样样本均数与总数与总体均数数的差值值均数数的抽样误样误差也可表现为现为多个样个样本均数间数间的离散程度 在实际科研中,上述二者都难以得到。2022-5-2519 如何度量抽样误样误差的大小? 如何揭示抽样样分布的规规律? 中心极极限定

9、理为为我们们提供解决办决办法:2022-5-2520 中心极极限定理(central limit theorem)从从均数为数为m m、标标准差为为 的总总体中独独立随随机抽样样,当样当样本含量n n增加时时,样样本均数数的分布将趋将趋于正态态分布,此分布的均数为数为m m,标标准差为为 。X(,)m x(,)Xm 2022-5-2521 标标准误误(standard error,SE)样样本统计统计量的标标准差称为标称为标准误误,用来来衡量抽样误样误差的大小。样样本均数数的标标准差称为标称为标准误误。此标标准误与个误与个体变异变异 成正比,与样与样本含量n n的平方根成反比。2022-5-2

10、5223、均数数的标标准误误 (standard error)(1)(1)概概念:将样将样本均数数的标标准差称为称为均数数的标标准误误, , 它它是描述均数数抽样误样误差大小的指标标(2)(2)计计算:实际实际工作中, 往往是未知的,一般可用样样本标标准差s s代替 :一、均数数的抽样误样误差XnXSSn2022-5-25233、均数数的标标准误误 (standard error)(3)(3)统计学统计学意义义均数数的标标准误误越大,样样本均数数的分布越分散,样样本均数数离总总体均数数就越远远,样样本均数与总数与总体均数数的差别别越大,抽样误样误差越大;抽样误样误差越大,由样样本均数数估计总计

11、总体均数数的可靠性越差。反之,亦然。(4)(4)影响响抽样误样误差大小的因素标标准差样样本含量n n 实际实际工作中,可通过过适当当增加样样本含量来减来减少均数数的标标准误误,从从而降低抽样误样误差。3 3个抽样实验结果图示个抽样实验结果图示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002

12、503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数2212. 0; 5XSn0920. 0;30XSn1580. 0;10XSn2022-5-25254、总总体分布非正态态分布时时,样样本均数数的分布规规律中心极极限定理表明,即使从从非正态总态总体中随随机抽样样,只要样样本含量足够够大,样样本均数数的分布也趋趋于正态态分布. .样样本均数数的总总体均数数仍等于;样样本均数数的标标准误误仍满满足均数标数标准误误的计计算式;当当较较小时时,样样本均数数的分布是偏态态的;当当足够够大(50)样样本均数数的分布近

13、似正态态分布一、均数数的抽样误样误差2022-5-2526 非正态总态总体样样本均数数的抽样实验样实验 图图5-1(a)是一个个正偏峰的分布, 用电脑从电脑从中随随机抽取样样本含量分别为别为5,10,30和50的样样本各1000次,计计算样样本均数并绘数并绘制4个个直方图图 0.002.505.007.5010.0012.5005001,0001,5002,0002,500FrequencyMean = 0.9922Std. Dev. = 1.01146N = 10,0000.001.002.003.004.00n=50100200300400500600FrequencyMean = 0.9

14、993Std. Dev. = 0.44341N = 10,0000.000.501.001.502.002.503.00n=100100200300400500600700FrequencyMean = 0.9988Std. Dev. = 0.31365N = 10,0000.501.001.502.00n=300100200300400500600FrequencyMean = 0.9997Std. Dev. = 0.18276N = 10,0000.500.751.001.251.501.75n=500100200300400500600700FrequencyMean = 0.999St

15、d. Dev. = 0.14125N = 10,0002022-5-2532 当原分布当原分布N(155.40,5.3)为正态分布时,则样本为正态分布时,则样本均数的分布均数的分布N(155.38,1.71)也为正态分布;也为正态分布; 当原分布为偏态分布时,当样本含量足够大时,当原分布为偏态分布时,当样本含量足够大时,样本均数的分布也为近似正态分布。样本均数的分布也为近似正态分布。 所以,不论原分布的分布类型如何,样本均数的所以,不论原分布的分布类型如何,样本均数的分布均为正态分布。分布均为正态分布。 原分布可以用原分布可以用和和来描述其分布特征;来描述其分布特征; 同样,样本均数的分布也可

16、以用样本均数的均数同样,样本均数的分布也可以用样本均数的均数和样本均数的标准差表示其分布特征。和样本均数的标准差表示其分布特征。 2022-5-2533 将样本均数的标准差称为均数的标准误。标将样本均数的标准差称为均数的标准误。标准误反映样本抽样误差的大小,是说明样本准误反映样本抽样误差的大小,是说明样本均数可靠性的一个指标,均数可靠性的一个指标, 常用常用 的形式来表示样本均数的可的形式来表示样本均数的可 靠程度。靠程度。XX2022-5-2534 影响抽样误差大小的因素有:影响抽样误差大小的因素有: 样本标准差。样本标准差。S越大,越大, 也就越大。也就越大。 样本含量。样本含量。n 越大

17、,抽样误差越小越大,抽样误差越小。 因此如在一定标准差条件下,加大样本含量,可减少因此如在一定标准差条件下,加大样本含量,可减少抽样误差,以保证的样本均数的代表性和可靠性。抽样误差,以保证的样本均数的代表性和可靠性。 Xs2022-5-2535 例6-1 20006-1 2000年某研研究者随随机调查调查某地健康成年男子2727人,得到血红红蛋白量的均数为数为125 g /L125 g /L,标标准差为为15 15 g /Lg /L。试试估计该样计该样本均数数的抽样误样误差。 = = =Xs/ sn15/ 272.89g /L2022-5-2536样样本频频率的抽样样分布与与抽样误样误差 在一

18、口袋内内装有形状状、重量完全相同的黑球和白球,已知黑球比例为为20%(总总体概概率=20%),从从口袋中每摸一次看清颜清颜色后放回去,搅搅匀匀后再摸,重复复摸球35次(n=35),计计算摸到黑球的百分比(样样本频频率p i)。重复这样复这样的实实验验100次,每次得到100个个黑球的比例分别为别为14.4%, 19.8%, 20.2%, 22.5%,等,将将其频数频数分布列于表6-3。 2022-5-2537黑球比例%样样本频数频数样样本频频率(%) 5.0 3 3.0 8.0 7 7.011.0 5 5.014.0 8 8.017.0 1616.020.0 2222.022.0 1515.0

19、25.0 7 7.028.0 7 7.031.0 5 5.034.0 3 3.040.0 2 2.0合计计100 100.0 表表6-3 总体概率为总体概率为20%时的随机抽样结果(时的随机抽样结果(ni = 35)2022-5-2538抽样样分布与与抽样误样误差 频频率的抽样误样误差:这种样这种样本率样样本频频率与样与样本率样样本频频率之间间、样样本率样样本频频率与总与总体率总总体概概率之间间的差异异。 频频率的标标准误误:表示频频率的抽样误样误差的指标标2022-5-2539 样本频率样本频率 的总体均数参数为的总体均数参数为, 率的标准误计算公式(率的标准误计算公式(5-3):): 公式

20、(公式(6-4) nXp 1pnnppnppSp)1 (1)1 (2022-5-2540例6-2 某市随随机调查调查了50岁岁以上的中老年妇妇女776人,其中患有骨质质疏松症者322人,患病率为为41.5%,试试估计该样计该样本频频率的抽样误样误差。 p = 41.5% = 0.415,n = 776(1)pppns0.415 0.585.77%7760.01771=2022-5-2541思考题题: 什么么是抽样误样误差?决决定抽样误样误差大小的因素有哪哪些? 抽样误样误差能避免么么?抽样误样误差有规规律么么? 标标准误误和标标准差有何区别与联区别与联系?2022-5-2542标标准误误和标标

21、准差有何区别与联区别与联系2022-5-2543第二节节分布分布的概概念分布的特征界值值表2022-5-2544一、分布的概念XZm随机变量随机变量X XN N(m m, 2 2)标准正态分布N(0,1)变换1,nvSXnSXtXmmt t分布(分布(=n n-1-1)标准正态分布标准正态分布N N(0 0,1 1)XZnm2( ,)XXNm 样本均数2022-5-2545t分布设从设从正态态分布N(m m, 2)中随随机抽取含量为为n的样样本,样样本均数数和标标准差分别为别为 和s,设设: 则则t 值值服从从自由度为为n-1的t 分布(t-distribution)。Gosset于1908年

22、在生物统计统计杂杂志上发发表该论该论文时时用的是笔笔名“Student”,故t分布又称称Student t分布。 nsXsXtXmmX2022-5-2546二、值与分布 学习学习t 分布的意义义 事实实上,任何一个样个样本统计统计量均有其分布的特点和规规律。统计统计量的抽样样分布规规律是进进行统计统计推断断的理论论基础础。 t 分布是十分有用的,它它是总总体均数数的区间区间估计计和假设检验设检验的理论论基础础。 2022-5-2547 从从前述实验实验的13岁岁女学学生身高这个这个正态总态总体中分别别作样样本量为为 3和50的随随机抽样样,各抽取1000份样份样本,并并分别别得到1000个样个

23、样本均数数及其标标准误误。对它们对它们分别别作t变换变换,并将并将t值绘值绘制相应应的直方图图,可得到t值值分布曲线图线图2022-5-2549三、分布的特征分布的图图形分布的参数参数:=n n-1-1 自由度对图对图形的影响响分布的极极限是标标准正态态分布分布曲线线下的尾部面积积(概概率)界值值表2022-5-2550t分布t值值的分布与与自由度 有关关(实际实际是样样本含量n不同)。t 分布的图图形不是一条条曲线线,而是一簇曲线线。 =(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3图5-3 不同自由度下的t分布图2022-5-2551t分布的特征t分布为

24、为一簇单单峰分布曲线线t分布以0为为中心,左右对称对称 t 分布只有一个个特征参数参数,即为为自由度()。 t分布与与自由度 有关关,自由度越小,t分布的峰越低,而两侧两侧尾部翘翘得越高,;自由度逐渐渐增大时时,t分布逐渐渐逼近标标准正态态分布;当当自由度为为无穷穷大时时,t分布就是标标准正态态分布。 2022-5-2552 =(标准正态曲线) =5 =10.10.2-4-3-2-1012340.3 图5.2 自由度分别为1、5、时的t分布 2022-5-2553t 分布曲线线下的面积规积规律 同标标准正态态分布一样样,统计应统计应用中最关关心的是t 分布曲线线下的尾部面积积(即概概率)与横轴

25、与横轴t 值间值间的关关系。 每一自由度下的t分布曲线线都有其自身分布规规律2022-5-2554界值值表 (t critical value)统计学统计学家将将t分布曲线线下的尾部面积积(即概概率P)与横轴与横轴t值间值间的关关系编编制了不同自由度 下的t界值值表(附表2)(467467页页)横标横标目为为自由度(-1-1) 纵标纵标目为概为概率(即曲线线下尾部阴阴影部分面积积)表中的数数字为为相应应的t t界值值( (t t0)0)单侧概单侧概率(one-tailed probabilityone-tailed probability)所对应对应的t t界值记为值记为,双侧概双侧概率(tw

26、o-tailed probability two-tailed probability )所对应对应的t t界值记为值记为/2,/2,2022-5-25552022-5-25562022-5-2557界值值表 (t critical value)不同自由度下的界值值表:附表2 2 查查t t0.05,160.05,16 =1.746 =1.746(单侧单侧) P P( (t t1.746)=0.051.746)=0.05或P P( (t t-1.746)=0.05-1.746)=0.05 查查t t0.05/2,160.05/2,16 =1.746 =1.746(双侧双侧) P P( (t t

27、1.746)1.746)P P( (t t-1.746)=0.05-1.746)=0.05或P P(-1.746(-1.746t t1.746)=0.95100,故可以用标标准正态态分布代替t分布,u0.10=1.64 即该该地12岁岁男孩平均身高的90可信区间为区间为:141.77143.57(cm),可认为该认为该地12岁岁男孩平均身高在141.77143.57(cm)之间间。 )(77.1415477. 064. 167.14210. 0cmsuXX)(57.1435477. 064. 167.14210. 0cmsuXX2022-5-2572附 表 2 t 界 值 表 概 率 , P

28、单 侧 0.25 0.20 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 自 由 度 双 侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 1 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 2 0.816 1.061 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599 3 0.765 0.978 1.638 2.353 3.182 4.541 5.

29、841 7.453 10.215 12.924 4 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 5 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 100 0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390 200 0.676 0.843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340 500 0.675 0.842 1.283 1.

30、648 1.965 2.334 2.586 2.820 3.107 3.310 1000 0.675 0.842 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300 0.6745 0.8416 1.2816 1.6449 1.9600 2.3264 2.5758 2.8070 3.0902 3.2905 2022-5-2573三、应应注意的一些问题问题 置信区间区间和置信限的关关系 准确度与与精密度的关关系2022-5-2574正确理解可信区间区间的涵义义 可信区间区间一旦形成,它它要么么包含总总体参数参数,要么么不包含总总体参数参数,二者必居其一,

31、无概概率可言。所谓谓95的可信度是针对针对可信区间区间的构构建方法而言的。 以均数数的95%可信区间为区间为例,其涵义义是:如果重复复100次抽样样,每100个样个样本所算得的100个个可信区间区间,则则在此100个个可信区间内区间内,理论论上有95个个包含总总体均数数,而有5个个不包含总总体均数数。2022-5-2575可信区间和可信限的关系可信区间和可信限的关系 可信限:分别指两个点值,分别称为下限值和上限值。可信限:分别指两个点值,分别称为下限值和上限值。 可信区间可信区间:是指以上、下可信限为界的一个范围。是指以上、下可信限为界的一个范围。 用公式用公式 表示可信限;表示可信限; 用用

32、 表示可信区间。表示可信区间。,XXts / 2 ,(,)XXXtsXts/2/2置信区间的解释 总体均数的95%置信区间:如果如果从总体中重复抽取从总体中重复抽取100份样本含量相同的独立样本,每份样本可分别计算一个置信区间,份样本含量相同的独立样本,每份样本可分别计算一个置信区间,那么在那么在100个置信区间中,大约有个置信区间中,大约有95个置信区间包括个置信区间包括(估计正估计正确确),只有,只有5个置信区间不包括个置信区间不包括(估计错误估计错误)。 或者说或者说对于某一个区间而言,它包含总体均数的可能性为对于某一个区间而言,它包含总体均数的可能性为95%,而不包含总体均数的可能性仅

33、为,而不包含总体均数的可能性仅为5%。因此在实际应用。因此在实际应用中,以这种方法估计总体均数犯错误的概率仅为中,以这种方法估计总体均数犯错误的概率仅为5%。 2022-5-2577 -2 -1 0 1 2 图图4.1 100个来自个来自N(0,1)的样本所估计的可信区间示意的样本所估计的可信区间示意 2022-5-2578可信区间区间意义义:虽然不能知道某校全体女大学生身高均数的确切数虽然不能知道某校全体女大学生身高均数的确切数值,全体女大学生身高均数在值,全体女大学生身高均数在163.0 - 164.5cm之间的可之间的可能性是能性是95%,在,在 162.7 164.7cm之间的可能性是

34、之间的可能性是99%。 换句话说,做出校全体女大学生身高均数为换句话说,做出校全体女大学生身高均数为163.0 - 164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错的概率是,说错的概率是5%;做;做出校全体女大学生身高均数为出校全体女大学生身高均数为162.7 164.7cm的结论,说对的结论,说对的概率是的概率是99%,说错的概率是,说错的概率是1%。2022-5-2579可信区间区间的两个两个要素 准确度 反映为为可信度1- 的大小 ,即区间区间包含总总体均数数的概概率大小,越接近1越好 精密度 反映为区间为区间的宽宽度,区间区间越窄越好 在可信度确定的情况况下,增加样样

35、本含量可减减小可信区间区间的宽宽度2022-5-2580 95可信区间区间 99可信区区间间 公式 区间区间范围围 窄 宽宽估计错误计错误的概概率 大(0.05) 小(0.01)XXStXStX ,2/05. 0,2/05. 0, XXStXStX ,2/01. 0,2/01. 0, 可信区间区间的两个两个要素当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。2022-5-2581 求参数置信区间保 证准确度先 提 高精 度再处理处理“准确度与精密度准确度与精密度”关系的原则关系的原则在置信度确定的情况下,增加在置信度确定的情况下,增加样本含量样本含量可减小区间宽度。

36、可减小区间宽度。2022-5-2582可信区间与参区间与参考值值范围围的区别区别可信区间区间用于估计总计总体参数参数,总总体参数参数只有一个个 。参参考值值范围围用于估计变计变量值值的分布范围围,变变量值值可能很多甚至无限 。95%的可信区间区间中的95%95%是可信度,即所求可信区间区间包含总总体参参数数的可信程度为为95%95%95%95%的参参考值值范围围中的95%95%是一个个比例,即所求参参考值值范围围包含了95%95%的正常人。2022-5-2583总体均数置信区间与参考值范围的区别总体均数置信区间与参考值范围的区别2022-5-2584总总体概概率的置信区间区间 根据样样本含量n

37、和样样本频频率p的大小,可以采用查查表法和正态态近似法计计算总总体概概率的置信区间区间。1、查查表法 当样当样本含量n较较小,比如n 50,特别别是p很接近0或100%时时,可以通过查过查相应统计应统计用表(附表6),确定总总体概概率的置信区间区间。 2022-5-2585例 某医医院对对39名前列腺癌患者实实施开开放手术术治疗疗,术术后有合并并症者2人,试试估计该计该手术术合并并症发发生概概率的95%置信区间区间。 解:查概查概率的置信区间区间表(附表3),在n = 39的横横行,X=2的纵纵列交叉处处的数值为数值为117 即该该手术术合并并症发发生概概率的95%置信区间区间为为1% 17%

38、 2022-5-2586注意:附表6中仅仅列出X n/2部分;当当X n/2时时,应应以n X值查值查表,然后从从100中减减去查查得的数值数值即为为所求的置信区间区间。例652022-5-2587 2、正态态近似法 当当n足够够大,且样样本频频率p和(1 p)均不太小时时,如np与与n(1 p) 均大于5时时,p的抽样样分布接近正态态分布,此时总时总体概概率的置信区间区间 p z /2Sp 2022-5-2588例 用某种仪种仪器检查检查已确诊诊的乳腺癌患者120名,检检出乳腺癌患者94例,检检出率为为78.3%。估计该仪计该仪器乳腺癌总总体检检出率的95%置信区间区间。 解: 本例n比较较

39、大,且np = 94及n(1 p) = 26均大于5, p z/2 Sp= p z0.05/2 = 0.783 1.96 = 0.709 0.857 即该仪该仪器乳腺癌总总体检检出率的95%可信区间区间置信区间为区间为(70.9% , 85.7% )。 (1)ppn0.783(10.783)1202022-5-2589 在某地随机抽取在某地随机抽取329人,作血清登革热血凝抑人,作血清登革热血凝抑制抗体反应检验,结果制抗体反应检验,结果29人阳性,问人阳性,问(1)调查的)调查的329人的抗体阳性率是多少?人的抗体阳性率是多少?(2)抗体阳性率的抽样误差是多少?)抗体阳性率的抽样误差是多少?(3)试估计该地人群血清登革热血凝抑制抗体)试估计该地人群血清登革热血凝抑制抗体阳性率?阳性率?

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|