ImageVerifierCode 换一换
格式:PPT , 页数:66 ,大小:858.50KB ,
文档编号:3598305      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3598305.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文((卫生统计学)第5章-参数估计基础2课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

(卫生统计学)第5章-参数估计基础2课件.ppt

1、(卫生统计学)第5章 参数估计基础2统计分析:统计分析:统计描述统计描述(statistical description)统计推断统计推断(statistical inference)参数估计参数估计(estimation of parameter)1.假设检验假设检验(hypothesis test)统计描述:统计描述:选用恰当的统计量、合适选用恰当的统计量、合适的统计表与统计图,测定、的统计表与统计图,测定、描述资料的数量特征及其描述资料的数量特征及其分布规律。分布规律。统计推断:统计推断:在一定的可信程度下,由在一定的可信程度下,由样本信息推断总体特征。样本信息推断总体特征。参数估计:参

2、数估计:由由样本统计量样本统计量(statistic)估估计计总体参数总体参数(parameter)。假设检验:假设检验:由由样本差异样本差异推断推断总体总体之间之间是否可能存在是否可能存在差异差异。第一章第一章 绪论绪论第二章第二章 定量变量的定量变量的统计描述统计描述第三章第三章 定性变量的统计描述定性变量的统计描述第四章第四章 常用概率分布常用概率分布第五章第五章 参数估计参数估计基础基础第六章第六章 假设检验假设检验基础基础总体往往是无穷大的抽象概念,个体总体往往是无穷大的抽象概念,个体之间存在差异,以样本为基础,进行之间存在差异,以样本为基础,进行关于总体特征或参数的推断或估计。关于

3、总体特征或参数的推断或估计。已经学习了已经学习了描述性统计描述性统计,实际研究,实际研究中,中,统计推断更有价值统计推断更有价值。美国专栏作家美国专栏作家Ann Landers问她的读者:问她的读者:“如果如果可以重新选择,你还要孩子吗?可以重新选择,你还要孩子吗?”,她收到了近,她收到了近1万份读者来信。于是,万份读者来信。于是,Landers在她的专栏中写在她的专栏中写下了下了“将近将近70%的父母后悔要孩子的父母后悔要孩子”的标题。的标题。Newsday针对同样的问题开展了全美范围的专业针对同样的问题开展了全美范围的专业调查,获得了一份包含调查,获得了一份包含1373对父母的随机样本,对

4、父母的随机样本,发现,发现,91%的父母对当初的选择无怨无悔。的父母对当初的选择无怨无悔。美国的父母们对孩子的态度究竟是什么?美国的父母们对孩子的态度究竟是什么?只要只要样本样本能够能够代表代表全美全美5 491.7万个家庭万个家庭这个这个总体总体,就可以用就可以用样本样本的的“事实事实”估计总估计总体体的真实信息。的真实信息。Landers获得的只是一份自发性回获得的只是一份自发性回应的应的便利样本便利样本,有,有高度偏差高度偏差(对某(对某个议题有强烈感觉尤其是有负面感个议题有强烈感觉尤其是有负面感觉的人更容易不厌其烦地回应),觉的人更容易不厌其烦地回应),导致她的导致她的样本中宁愿不要孩

5、子的百样本中宁愿不要孩子的百分比远高于全体父母(总体)分比远高于全体父母(总体)中宁中宁愿不要孩子的百分比。愿不要孩子的百分比。Newsday的的简单随机样本(简单随机样本(SRS,simple random sample)既不受既不受抽样者偏好左右,也没有回应者抽样者偏好左右,也没有回应者的自行加入,且每个家庭都有相的自行加入,且每个家庭都有相同的中选机会。同的中选机会。虽然重新抽取一份虽然重新抽取一份1 373对父母对父母的随机样本,几乎可以肯定不会的随机样本,几乎可以肯定不会再获得再获得91%,但如果重复抽取同,但如果重复抽取同样大小的样大小的随机样本随机样本,所有样本的,所有样本的变异

6、将会遵循某种规律,借此,变异将会遵循某种规律,借此,可以实现对总体的可以实现对总体的无偏估计无偏估计。第一节第一节 抽样分布抽样分布与与抽样误差抽样误差 由于个体变异的存在,从某一总体由于个体变异的存在,从某一总体中随机抽取一个样本,所得样本统中随机抽取一个样本,所得样本统计量与相应的总体参数之间的差异计量与相应的总体参数之间的差异称为称为抽样误差抽样误差(sampling error)。从同一总体中随机抽取若干份样本,从同一总体中随机抽取若干份样本,所得样本统计量之间也不尽相同,所得样本统计量之间也不尽相同,这也是抽样误差的表现。这也是抽样误差的表现。在医学抽样研究中,在医学抽样研究中,抽样

7、误差抽样误差是是不可避免不可避免的,但抽样误差是有规的,但抽样误差是有规律的,而且是律的,而且是可以被认识可以被认识的。的。一、一、样本均数样本均数的的抽样分布抽样分布与与抽样误差抽样误差 实验实验5-1 正态分布总体样本均数抽样分布正态分布总体样本均数抽样分布假定某年某地所有假定某年某地所有13岁女生的身高服从岁女生的身高服从 。计算机模拟在该总体中随机。计算机模拟在该总体中随机抽样,共抽抽样,共抽100次次。每次抽取每次抽取30例例组成一组成一份样本,计算每份份样本,计算每份样本的平均身高样本的平均身高并绘制并绘制样本均数样本均数的的频率分布表频率分布表。23.5,4.155N样本号样本号

8、(1)样本均数样本均数(2)标准误标准误(3)95%置信区间置信区间(4)1156.70.91154.8158.6 *2158.10.95156.2160.13155.61.16153.3158.04155.21.03153.1157.35155.01.01152.9157.06156.41.08154.2158.67154.91.12152.6157.18156.50.74154.9158.09155.01.09152.8157.210155.90.98153.9157.9表表5-1 从从正态总体正态总体 抽出的抽出的100份随机样本份随机样本的计算结果的计算结果 23.5,4.155N30

9、in组段组段(cm)频数频数频率频率(%)152.6153.2153.8154.4155.0155.6156.2156.8157.4158.0158.6 1 4 319252318 4 1 2 1.0 4.0 3.019.025.023.018.0 4.0 1.0 2.0合计合计 100 100.0表表5-2 从从正态总体正态总体 中随机抽样求得的中随机抽样求得的100个个 样本均数样本均数(平均身高平均身高cm)的的频率分布频率分布23.5,4.155N30in正态分布总体,样本均数抽样分布的特点:正态分布总体,样本均数抽样分布的特点:样本均数恰好等于总体均数是极其罕见的;样本均数恰好等于总

10、体均数是极其罕见的;样本均数之间存在差异;样本均数之间存在差异;样本均数围绕总体均数,中间多、两边少,样本均数围绕总体均数,中间多、两边少,左右基本对称,呈近似正态分布;左右基本对称,呈近似正态分布;样本均数之间的变异明显小于原始变量值之样本均数之间的变异明显小于原始变量值之间的变异(间的变异(cm)。)。3.5样本均数的标准差,称样本均数的标准差,称均数的标准误均数的标准误(standard error of mean,SEM或或SE),用于反映用于反映均数抽样误差均数抽样误差的大小。的大小。nX均数标准误的估计值:均数标准误的估计值:nSSX均数标准误与原变量的标准差成正均数标准误与原变量

11、的标准差成正比,与样本含量的平方根成反比。比,与样本含量的平方根成反比。可通过可通过增加样本含量增加样本含量来来减小减小均数的均数的标准误标准误,从而,从而降低抽样误差降低抽样误差。实验实验5-2 非正态总体非正态总体样本均数样本均数抽样分布抽样分布图图5-1(a):总体的原始数据呈:总体的原始数据呈正偏峰分正偏峰分布布,从中抽取,从中抽取n=5,10,30和和50的样本的样本各各1 000份,计算其样本均数并绘制相应份,计算其样本均数并绘制相应的频率分布图。的频率分布图。图图5-1(b)(e)显示:当显示:当n较小较小时,时,样本均样本均数数的分布呈的分布呈非正态分布非正态分布,当,当n足够

12、大足够大时时(如如 ),样本均数样本均数的的分布分布就就近似近似服服从从正态分布正态分布了。了。30nPERCENT030 x MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0n=5PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.6

13、1.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0n=10PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0n=30PERCENT030mm MID

14、POINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0n=50PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.8

15、3.94.04.14.24.34.44.54.64.74.84.95.0(a)(a)原始数据原始数据 (b)(b)(c)(c)(d)(d)(e)(e)5n10n 30n50n图5-1 从正偏峰总体随机抽样,样本均数的分布 对对任意分布任意分布,在,在样本含量足够大样本含量足够大时,其时,其样本均数的分布样本均数的分布近似于近似于正正态分布态分布,且,且样本均数的均数样本均数的均数等于等于原分布的均数原分布的均数,均数的标准误均数的标准误为为 。nX图图5-2 非正态分布非正态分布的总体的总体:总体总体A:均匀分布均匀分布;总体总体B:双峰分布双峰分布;总体总体C:指数分布指数分布;总体总体D:

16、三角分布三角分布。从各总体中抽取若干个从各总体中抽取若干个n2,5,30的样本,计算各样本的均数并绘的样本,计算各样本的均数并绘制样本均数的抽样分布图。制样本均数的抽样分布图。2nX 时2341234123412341X 的分布的分布 的分布的分布 的分布的分布 的分布的分布 总体总体总体总体 总体总体 总体总体 n=2时n=5时n=30时5nX 时30nX时图5-2 四种总体分布、不同样本含量时样本均数的抽样分布均数的均数的抽样分布的均数抽样分布的均数与与原分布均数原分布均数是是相同相同的,的,抽抽样分布的变异样分布的变异随随样本含量样本含量的的增加增加而而减少减少。二、二、样本频率样本频率

17、的的抽样分布抽样分布与与抽样误差抽样误差 实验实验5-3 二项分布总体二项分布总体样本频率样本频率的的分布特征分布特征摸球实验摸球实验:一个口袋内装有形状、重量完:一个口袋内装有形状、重量完全相同的黑球和白球,已知黑球的比例为全相同的黑球和白球,已知黑球的比例为20%(总体概率总体概率 )。从口袋中每摸。从口袋中每摸一次看清颜色后放回去,搅匀后再摸,重一次看清颜色后放回去,搅匀后再摸,重复摸球复摸球50次次(),计算摸到黑球的百分,计算摸到黑球的百分比(比(样本频率样本频率 )。重复这样的)。重复这样的实验实验100次次,每次得到黑球的比例见表每次得到黑球的比例见表5-3。%2050inip样

18、本频率样本频率 (%)频数频数百分比百分比(%)82 2.00 104 4.00128 8.00147 7.0016 1111.0018 1313.0020 1919.0022 1111.0024 1111.00266 6.00283 3.00304 4.00321 1.00 合计合计 100 100.00表表5-3 时的随机抽样结果时的随机抽样结果()%2050inip在在100份样本中份样本中,黑球比例为黑球比例为20%的频率最大,其次是黑球的频率最大,其次是黑球比例为比例为18%;样本频率样本频率围绕围绕总总体概率体概率呈呈近似对称分布,近似对称分布,多数多数样本频率离样本频率离20%较

19、近,少数样较近,少数样本频率离本频率离20%较远。较远。样本频率样本频率与与样本频率样本频率之间、之间、样本频率样本频率与与总体概率总体概率之间的之间的差异差异是由是由抽样抽样造成的。造成的。若随机变量若随机变量 ,则则样本频率样本频率 的的总体概率总体概率为为 ,频率的标准误频率的标准误:,nBXnXp 1pn频率的标准误愈小,用样本频率频率的标准误愈小,用样本频率估计总体概率的可靠性愈好;估计总体概率的可靠性愈好;频率的标准误愈大,用样本频率频率的标准误愈大,用样本频率估计总体概率的可靠性愈差。估计总体概率的可靠性愈差。实际工作中,总体概率一般未知,实际工作中,总体概率一般未知,常用常用样

20、本频率样本频率来近似地代替。来近似地代替。频率标准误的估计值:频率标准误的估计值:nppnppSp)1(1)1(频率的标准误与样本含量的平频率的标准误与样本含量的平方根成反比,方根成反比,增加样本含量增加样本含量可可以以减少样本频率的抽样误差减少样本频率的抽样误差。例例5-1 某研究组随机调查了某市某研究组随机调查了某市50岁岁以上的中老年妇女以上的中老年妇女776人人,其中患有骨其中患有骨质疏松症者质疏松症者322人人,患病率为患病率为41.5%,试试估计估计该该样本频率样本频率的的抽样误差抽样误差。p=0.415,n=776,频率标准误的估计值频率标准误的估计值:(1)0.4150.585

21、0.01771.77%776pppnS第二节第二节 t 分布分布(学生学生 t 分布分布)(Students t distribution)0,1XXZN/XXXtSSn,1/XXXttnSSn分布(:正态变量):正态变量)X(未知未知时)时)X)(tt二、二、t 分布分布的的图形图形与与特征特征 实验实验5-4 t 分布分布的的计算机模拟实验计算机模拟实验。从前述的从前述的13岁女生身高岁女生身高这个这个正态总体正态总体中分别作中分别作n=3和和50的随机抽样,各抽的随机抽样,各抽取取1000份份样本,分别得到样本,分别得到1000个样本个样本均数均数和和1000个均数的标准误个均数的标准误

22、,再对其,再对其分别作分别作 t 变换变换,并将,并将 t 值值绘制成绘制成2个个频频率分布图率分布图。图图5-3 不同样本含量不同样本含量时时 t 值值的的频率分布图频率分布图(a)n=3 (b)n=50 (标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3图5-4 不同自由度下的 t 分布图t 分布的特征:分布的特征:单峰分布,以单峰分布,以0 0为中心,左右对称;为中心,左右对称;越小,越小,t 值越分散,曲线的峰部越值越分散,曲线的峰部越矮,尾部越高;矮,尾部越高;随着随着 逐渐增大,逐渐增大,t 分布逐渐接近标分布逐渐接近标准正态分布;准正态分布;当当

23、趋向趋向 时,时,t 分布分布趋近标准正态分布趋近标准正态分布,故标准正态分布,故标准正态分布是是 t 分布的特例。分布的特例。t 界值表界值表:横标目横标目-自由度自由度 ;纵标目纵标目-概率概率,P(t 分布曲线下的尾部分布曲线下的尾部面积面积);表中数字表中数字-当当 和和 P 确定时确定时,单侧概单侧概率率(one-tailed probability)和和双侧概率双侧概率(two-tailed probability)所对应的所对应的 t 临临界值界值(critical value)或或 。,t,2/t当当 ,单侧检验水准单侧检验水准 时,时,查得查得单侧单侧 ,即,即1605.07

24、46.116,05.0t当当 ,双侧检验水准双侧检验水准 时,查时,查得得双侧双侧 ,即即 05.0746.1,05.0746.1tPtP1605.0120.216,2/05.0t05.0120.2120.2)120.2(tPtPtP(a)(b)图图5-5 单、双侧单、双侧 t 分布示意图分布示意图(a)为为单侧临界值单侧临界值;(b)为为双侧临界值双侧临界值,t,2/t对于对于单侧临界值单侧临界值,t,ttP,ttP对于对于双侧临界值双侧临界值,2/t,2/,2/,2/)(ttPttPttP在在自由度相同自由度相同时,时,值越大值越大,t 分分布布的的尾部概率越小尾部概率越小;在在 t 值相

25、同值相同时,时,双侧尾部概率双侧尾部概率为为单侧尾部概率单侧尾部概率的的两倍两倍:t746.116,05.016,2/10.0tt第三节第三节 总体均数总体均数及及总体概率总体概率的的估计估计 一、参数估计的基础理论一、参数估计的基础理论参数估计参数估计分为:分为:点估计点估计和和区间估计区间估计。(一一)点估计点估计(point estimation)是直接利用是直接利用样本统计量样本统计量的一个的一个数值数值来来估计估计总体参数总体参数。如,根据例。如,根据例5-1求得的样本患病求得的样本患病率,认为该市率,认为该市50岁以上中老年妇女骨质疏岁以上中老年妇女骨质疏松症的总体患病率约为松症的

26、总体患病率约为41.5%。优点优点:方法简单方法简单;缺点缺点:没有考虑到抽样没有考虑到抽样误差的大小误差的大小,故,故难以反映难以反映参数的估计值参数的估计值对对其真值的代表性其真值的代表性。(二二)区间估计区间估计(interval estimation)总体参数的置信区间总体参数的置信区间(confidence interval,CI):是将是将样本统计量样本统计量与与标准误标准误结合起结合起来,确定一个具有较大来,确定一个具有较大置信度置信度的的包含总体参数包含总体参数的的范围范围。置信度置信度:记为记为 或或 ,值由值由研究者预先规定研究者预先规定,一般取,一般取0.1,0.05或或

27、0.01。在医学研究中,。在医学研究中,最常用最常用的置信度是的置信度是95%。100(1)%-1置信区间由置信区间由置信下限置信下限(lower limit)和和置信上限置信上限(upper limit)构成,是一个构成,是一个开区间开区间,不包括,不包括2个个置信限置信限(confidence limit,CL)的数值。无的数值。无特殊说明,估计特殊说明,估计双侧置信区间双侧置信区间。报告报告参数估计参数估计结果结果时,应同时给出时,应同时给出点估计值点估计值和和置信区间。置信区间。二、二、总体均数总体均数及及总体概率总体概率的的区间估计区间估计(一一)总体均数总体均数的的置信区间置信区间

28、1.t 分布法:分布法:当当 未知且未知且 n 较小较小(如如 )时,时,总体均数总体均数 的双侧的双侧 置信区间:置信区间:50n-1),(,2/,2/XXStXStXXStX,2/置信区间宽度的一半置信区间宽度的一半 反映了估计的反映了估计的精度精度。XSt,2/表表5-1第第(4)列,列,5个置信区间估计错误。个置信区间估计错误。只有在只有在 的场合下,上述推导才的场合下,上述推导才成立,而我们并不知道所研究的样成立,而我们并不知道所研究的样本是否属于这种场合,所以只能讲本是否属于这种场合,所以只能讲上述公式的上述公式的置信程度置信程度为为 。-1-1总体均数总体均数 的单侧的单侧 置信

29、区间:置信区间:-1,XXtS,XXtS 总体均数的总体均数的95%置信区间的含置信区间的含义:义:如果重复如果重复100次抽样,每次抽样,每次样本含量均为次样本含量均为n,每个样本,每个样本均按均按 构建置信区间,构建置信区间,则在此则在此100个置信区间中,平个置信区间中,平均有均有95个包含总体均数,个包含总体均数,5个个不包含总体均数。不包含总体均数。XStX,2/05.0例例5-2 已知某地已知某地27名健康成年男子血红蛋白含量名健康成年男子血红蛋白含量的的 g/L,g/L。试估计该地健康成年男。试估计该地健康成年男子血红蛋白平均含量的子血红蛋白平均含量的95%和和99%置信区间。置

30、信区间。125X15S0.05/2,26151252.056119.06,130.9427SXtn0.01/2,26151252.779116.98,133.0227SXtn故该地健康成年男子血红蛋白平均含量的故该地健康成年男子血红蛋白平均含量的95%置信区间为置信区间为 g/L,99%置信区间为置信区间为 g/L。130.94,119.06133.02 116.98,若若n不变,置信度由不变,置信度由95%提高到提高到99%,置信区间变宽,估计的精度下降。置信区间变宽,估计的精度下降。估计的精度与估计的精度与S和和n有关,但有关,但S反映生物反映生物固有的个体差异,对某个总体而言,固有的个体差异,对某个总体而言,其个体变异无法人为地增加或减少,其个体变异无法人为地增加或减少,故若想提高估计的精度,只能考虑增故若想提高估计的精度,只能考虑增加加n,从而减小,从而减小 和和 。,2/tXS

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|