参数估计基础-课件.ppt

上传人(卖家):ziliao2023 文档编号:5962755 上传时间:2023-05-19 格式:PPT 页数:96 大小:2.53MB
下载 相关 举报
参数估计基础-课件.ppt_第1页
第1页 / 共96页
参数估计基础-课件.ppt_第2页
第2页 / 共96页
参数估计基础-课件.ppt_第3页
第3页 / 共96页
参数估计基础-课件.ppt_第4页
第4页 / 共96页
参数估计基础-课件.ppt_第5页
第5页 / 共96页
点击查看更多>>
资源描述

1、参数估计基础2023-5-192了解总体特征的最好方法是对总体的每一个体进行观察、了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。试验,但这在医学研究实际中往往不可行。对对无限总体无限总体不可能对所有个体逐一观察不可能对所有个体逐一观察.对对有限总体有限总体限于人力、财力、物力、时间或个体过多等原限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究因,不可能也没必要对所有个体逐一研究(如对一批罐头质如对一批罐头质量检查量检查)。借助借助抽样研究抽样研究。2023-5-192023-5-193抽样研究的目的是用样本信息推断总体特征,

2、即用样本资料计算的统计指标推断总体参数常用的统计推断方法有参数估计(总体均数和总体概率的估计)和假设检验 2023-5-192023-5-194内容复习参数估计参数估计假设检验假设检验研究总体研究总体统计描述统计描述样本样本统计推断统计推断随机抽样统计表统计表统计图统计图统计指标统计指标2023-5-192023-5-195第六章总体均数估计抽样误差与标准误分布总体均数及总体概率的估计案例讨论2023-5-192023-5-196教学目的与要求 掌握:均数和率抽样误差的概念;均数和率标准误的掌握:均数和率抽样误差的概念;均数和率标准误的意义和计算;总体均数和总体率区间估计的意义、计意义和计算;

3、总体均数和总体率区间估计的意义、计算及其适用条件。算及其适用条件。熟悉:总体均数的点估计;熟悉:总体均数的点估计;t 0.05,()的概念,标准误和的概念,标准误和标准差的区别;置信区间与医学参考值范围的区别。标准差的区别;置信区间与医学参考值范围的区别。了解:了解:t值、值、t分布、分布、t值表及其应用。值表及其应用。2023-5-192023-5-197复习一些概念参数(parameter)与统计量(statistics)参数获取的途径 对总体进行研究对总体进行研究 抽样研究抽样研究抽样误差(sampling error)1.抽样误差的概念:由个体变异产生的,随机抽样引起的样本统计量与总体

4、参数间的差异。(抽样误差=总体参数样本统计量)2.抽样误差产生的原因:3.抽样误差的特点:随机,不可避免,有规律可循。4.在大量重复抽样的情况下,可以展示其规律性2023-5-192023-5-198第一节抽样误差与标准误2023-5-19一、抽样试验 从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每次随机抽取样本)中,每次随机抽取样本含量含量n n5 5,并计算其均数与标准差;重复抽取,并计算其均数与标准差;重复抽取10001000次,获得次,获得10100000份样本;计算份样本;计算10001000份样本的均数与标准差,并对份样本的均数与标准差,并对

5、10001000份样本份样本的均数作直方图。的均数作直方图。按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含量、样本含量n n3030的抽样实的抽样实验;比较计算结果。验;比较计算结果。2023-5-19抽样试验(n=5)2023-5-19抽样试验(n=10)2023-5-19抽样试验(n=30)2023-5-191000份样本抽样计算结果总体的均总体的均数数总体标准总体标准差差s s均数的均均数的均数数均数标准差均数标准差n n=5=55.005.000.500.504.994.990.22120.2212n n=10=105.005.000.500.505.005.000

6、.15800.1580n n=30=305.005.000.500.505.005.000.09200.09202023-5-192023-5-1914一、均数的抽样误差 样本均数的抽样分布 举例举例1x总体总体样本样本1样本样本2样本样本3样本样本2x3xnx2023-5-192023-5-1915一、均数的抽样误差样本均数的抽样分布 抽样模拟实验抽样模拟实验 假定总体:某年某地假定总体:某年某地13岁女学生身高值岁女学生身高值 XN(155.4,5.3)随机抽样:随机抽样:n30,K1002023-5-192023-5-1916一、均数的抽样误差=155.4=5.3113 0,1 5 2.

7、3nX223 0,1 5 5.2nX1 0 01 0 03 0,1 5 4.8nX 实验实验6-1从已知的从已知的13岁女生身高总体中随机抽样示意图岁女生身高总体中随机抽样示意图2023-5-192023-5-1917样本号均数样本号均数1156.751155.72158.152153.73155.653154.84155.254155.65155.055154.86156.456155.67154.957158.245155.495156.146155.996152.747155.397155.148154.698155.349156.199154.650154.7100156.62023-

8、5-192023-5-1918一、均数的抽样误差表6-2 6-2 从总体N N(155.4155.4,5.35.32 2)抽样得到100100个样本均数的频数分布组段(cm)(cm)频数频率(%)(%)152.611.0153.244.0153.844.0154.42222.0155.02525.0155.62121.0156.21717.0156.833.0157.422.0 158.0158.611.0合计100100.02023-5-192023-5-1919 将此将此100个样本均数看成个样本均数看成新变量值新变量值,则这,则这100个样本均数构成一个样本均数构成一新分布新分布,绘制直

9、方图。,绘制直方图。图图6-2 从正态分布总体从正态分布总体N(155.4,5.3)随机抽样所得样本均数分布随机抽样所得样本均数分布2023-5-192023-5-1920一、均数的抽样误差1、样本均数的抽样分布特点|各样本均数未必等于总体均数;各样本均数未必等于总体均数;|样本均数之间存在差异;样本均数之间存在差异;|样本均数的分布规律:围绕着总体均数样本均数的分布规律:围绕着总体均数155.4cm155.4cm,中间多,中间多,两边少,左右基本对称,服从正态分布;两边少,左右基本对称,服从正态分布;|样本均数的变异较原变量的变异减小。样本均数的变异较原变量的变异减小。2023-5-1920

10、23-5-1921一、均数的抽样误差抽样误差 概念:由于抽样造成的样本统计量与统计量以及样本统计概念:由于抽样造成的样本统计量与统计量以及样本统计量与总体参数之间的差异叫作量与总体参数之间的差异叫作抽样误差抽样误差。抽样误差产生的基本条件抽样误差产生的基本条件 抽样研究抽样研究 个体差异个体差异 表现形式表现形式 样本统计量与样本统计量之间的差异样本统计量与样本统计量之间的差异 样本统计量与总体参数之间的差异样本统计量与总体参数之间的差异2023-5-192023-5-1922一、均数的抽样误差2、均数的抽样误差(1 1)概念:由个体变异产生的,随机抽样引起的样本均数与)概念:由个体变异产生的

11、,随机抽样引起的样本均数与总体均数间的差异。总体均数间的差异。(均数的抽样误差(均数的抽样误差=总体均数样本均数)总体均数样本均数)(2 2)表现形式:)表现形式:样本均数与总体均数间存在差异样本均数与总体均数间存在差异样本均数与样本均数间存在差异样本均数与样本均数间存在差异2023-5-19 m mXm6X5X4X3X2X1X.X2023-5-1924 均数的抽样误差可表现为均数的抽样误差可表现为样本均数与总体均数的差值样本均数与总体均数的差值 均数的抽样误差也可表现为多个样本均数间的离散程度均数的抽样误差也可表现为多个样本均数间的离散程度 在实际科研中,上述二者都难以得到。2023-5-1

12、92023-5-1925 如何度量抽样误差的大小?如何揭示抽样分布的规律?中心极限定理为我们提供解决办法:2023-5-192023-5-1926 中心极限定理(central limit theorem)从均数为从均数为m m、标准差为标准差为s s的总体中独立随机抽样,当样的总体中独立随机抽样,当样本含量本含量n n增加时,样本均数的分布将趋于正态分布,增加时,样本均数的分布将趋于正态分布,此分布的均数为此分布的均数为m m,标准差为,标准差为 。Xs(,)m sx(,)Xm s2023-5-192023-5-1927标准误(standard error,SE)样本统计量的标准差称为标准误

13、,用来衡量抽样误差的大小。样本统计量的标准差称为标准误,用来衡量抽样误差的大小。样本均数的标准差称为标准误。此标准误与个体变异样本均数的标准差称为标准误。此标准误与个体变异s s 成正比,与样本成正比,与样本含量含量n n的平方根成反比。的平方根成反比。2023-5-192023-5-19283、均数的标准误(standard error)(1)(1)概念:将样本均数的标准差称为均数的标准误,它是描述均数抽样误差大小的指标(2)(2)计算:实际工作中,s s 往往是未知的,一般可用样本标准差s s代替s s:一、均数的抽样误差XnssXSSn2023-5-192023-5-19293、均数的标

14、准误(standard error)(3)(3)统计学意义均数的标准误越大,样本均数的分布越分散,样本均数离总体均数就越远,样本均数与总体均数的差别越大,抽样误差越大;抽样误差越大,由样本均数估计总体均数的可靠性越差。反之,亦然。(4)(4)影响抽样误差大小的因素标准差样本含量n n 实际工作中,可通过适当增加样本含量来减少均数的标准误,从而降低抽样误差。2023-5-193个抽样实验结果图示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003

15、504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数2212.0;5XSn0920.0;30XSn1580.0;10XSn2023-5-192023-5-19314、总体分布非正态分布时,样本均数的分布规律中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布.样本均数的总体均数仍等于;样本均数的标准误仍满足均数标准

16、误的计算式;当较小时,样本均数的分布是偏态的;当足够大(50)样本均数的分布近似正态分布一、均数的抽样误差2023-5-192023-5-1932 非正态总体样本均数的抽样实验 图6-1(a)是一个正偏峰的分布,用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图 2023-5-190.002.505.007.5010.0012.5005001,0001,5002,0002,500FrequencyMean=0.9922Std.Dev.=1.01146N=10,0000.001.002.003.004.00n=501002003004005006

17、00FrequencyMean=0.9993Std.Dev.=0.44341N=10,0000.000.501.001.502.002.503.00n=100100200300400500600700FrequencyMean=0.9988Std.Dev.=0.31365N=10,0000.501.001.502.00n=300100200300400500600FrequencyMean=0.9997Std.Dev.=0.18276N=10,0000.500.751.001.251.501.75n=500100200300400500600700FrequencyMean=0.999Std.

18、Dev.=0.14125N=10,0002023-5-1938 影响抽样误差大小的因素有:影响抽样误差大小的因素有:样本标准差。样本标准差。S越大,越大,也就越大。也就越大。样本含量。样本含量。n 越大,抽样误差越小越大,抽样误差越小。因此如在一定标准差条件下,加大样本含量,可减少抽样误差,因此如在一定标准差条件下,加大样本含量,可减少抽样误差,以保证的样本均数的代表性和可靠性。以保证的样本均数的代表性和可靠性。Xs2023-5-192023-5-1939 例6-1 20006-1 2000年某研究者随机调查某地健康成年男子2727人,得到血红蛋白量的均数为125 g/L125 g/L,标准差

19、为15 g/L15 g/L。试估计该样本均数的抽样误差。=Xs/sn15/27 2.89g/L2023-5-192023-5-1940样本频率的抽样分布与抽样误差 2023-5-192023-5-1941黑球比例%样本频数样本频率(%)5.0 3 3.0 8.0 7 7.011.0 5 5.014.0 8 8.017.0 1616.020.0 2222.022.0 1515.025.0 7 7.028.0 7 7.031.0 5 5.034.0 3 3.040.0 2 2.0合计100 100.0 表表6-3 总体概率为总体概率为20%时的随机抽样结果(时的随机抽样结果(ni=35)2023-

20、5-192023-5-1942抽样分布与抽样误差2023-5-192023-5-1943样本频率样本频率 的总体均数参数为的总体均数参数为,率的标准误计算公式率的标准误计算公式公式公式nXp 1pnsnppnppSp)1(1)1(2023-5-192023-5-1944例6-2 某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试估计该样本频率的抽样误差。p=41.5%=0.415,n=776(1)pppns0.415 0.585.77%7760.01771=2023-5-192023-5-1945思考题:什么是抽样误差?决定抽样误差大小的因素有哪

21、些?抽样误差能避免么?抽样误差有规律么?标准误和标准差有何区别与联系?2023-5-192023-5-1946标准误和标准差有何区别与联系2023-5-192023-5-1947第二节分布分布的概念分布的特征界值表2023-5-192023-5-1948一、分布的概念XZms随机变量随机变量X XN N(m m,s s2 2)标准正态分布N(0,1)变换1,nvSXnSXtXmmt t分布(分布(=n n-1-1)标准正态分布标准正态分布N N(0 0,1 1)XZnms2(,)XXNm s样本均数2023-5-192023-5-1949t分布 设从正态分布N(m m,s s2)中随机抽取含量

22、为n的样本,样本均数和标准差分别为 和s,设:则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在生物统计杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。nsXsXtXmmX2023-5-192023-5-1950二、值与分布学习t 分布的意义 事实上,任何一个样本统计量均有其分布的特点和规律。统计量的抽样事实上,任何一个样本统计量均有其分布的特点和规律。统计量的抽样分布规律是进行统计推断的理论基础。分布规律是进行统计推断的理论基础。t t 分布是十分有用的,它是总体均数的区间估计和假设检验的理论基础。分布是十分有用的

23、,它是总体均数的区间估计和假设检验的理论基础。2023-5-192023-5-1952三、分布的特征分布的图形分布的参数:=n n-1-1自由度对图形的影响分布的极限是标准正态分布分布曲线下的尾部面积(概率)界值表2023-5-192023-5-1953t分布=(标准正态分布)=5=1012345-1-2-3-4-5f(t)0.10.20.3图6-3 不同自由度下的t分布图2023-5-192023-5-1954t分布的特征t分布为一簇单峰分布曲线t分布以0为中心,左右对称t 分布只有一个特征参数,即为自由度()。t分布与自由度 有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高,;自由度逐

24、渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。2023-5-192023-5-1955=(标准正态曲线)=5=10.10.2-4-3-2-1012340.3 图6.4 自由度分别为1、5、时的t分布 2023-5-192023-5-1956t 分布曲线下的面积规律同标准正态分布一样,统计应用中最关心的是t 分布曲线下的尾部面积(即概率)与横轴t 值间的关系。每一自由度下的t分布曲线都有其自身分布规律2023-5-192023-5-1957界值表(t critical value)统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间的关系编制了不同自由度

25、下的t界值表(附表3)(439439页)横标目为自由度(-1)纵标目为概率(即曲线下尾部阴影部分面积)表中的数字为相应的t t界值(t0)单侧概率(one-tailed probability)所对应的t t界值记为,双侧概率(two-tailed probability)所对应的t t界值记为/2,2023-5-192023-5-19582023-5-192023-5-19592023-5-192023-5-1960界值表(t critical value)不同自由度下的界值表:附表2 2 查t t0.05,160.05,16=1.746=1.746(单侧)P P(t t1.746)=0.0

26、51.746)=0.05或P P(t t-1.746)=0.05-1.746)=0.05 查t t0.05/2,160.05/2,16=1.746=1.746(双侧)P P(t t1.746)1.746)P P(t t-1.746)=0.05-1.746)=0.05或P P(-1.746(-1.746t t1.746)=0.95100,故可以用标准正态分布代替t分布,u0.10=1.64 即该地12岁男孩平均身高的90可信区间为:141.77143.57(cm),可认为该地12岁男孩平均身高在141.77143.57(cm)之间。)(77.1415477.064.167.14210.0cmsu

27、XX)(57.1435477.064.167.14210.0cmsuXX2023-5-192023-5-1975附 表 2 t 界 值 表 概 率,P 单 侧 0.25 0.20 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005 自 由 度 双 侧 0.50 0.40 0.20 0.10 0.05 0.02 0.01 0.005 0.002 0.001 1 1.000 1.376 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619 2 0.816 1.061 1.886 2.920 4.3

28、03 6.965 9.925 14.089 22.327 31.599 3 0.765 0.978 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924 4 0.741 0.941 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610 5 0.727 0.920 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869 100 0.677 0.845 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390 200 0.676 0.

29、843 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.340 500 0.675 0.842 1.283 1.648 1.965 2.334 2.586 2.820 3.107 3.310 1000 0.675 0.842 1.282 1.646 1.962 2.330 2.581 2.813 3.098 3.300 0.6745 0.8416 1.2816 1.6449 1.9600 2.3264 2.5758 2.8070 3.0902 3.2905 2023-5-192023-5-1976两总体均数差值的置信区间实际工作中,我们常需要估计两总体均

30、数之差的大小,实际工作中,我们常需要估计两总体均数之差的大小,例如正常成年男、女的血红蛋白平均相差多少?糖尿例如正常成年男、女的血红蛋白平均相差多少?糖尿病患者经某药物治疗后,试验组与对照组的总体血糖病患者经某药物治疗后,试验组与对照组的总体血糖值平均降低多少?冠心病患者和正常人的血清胆固醇值平均降低多少?冠心病患者和正常人的血清胆固醇值平均相差多少?我们可以用两样本均数之差值平均相差多少?我们可以用两样本均数之差()作为两作为两总体均数之差总体均数之差()的点估计。同理,点估计没有考虑抽样的点估计。同理,点估计没有考虑抽样误差的大小,需估计两总体均数之差的置信区间。误差的大小,需估计两总体均

31、数之差的置信区间。2023-5-192023-5-1977假设正态总体 和 ,当 ,均未知,但 时,则两总体均数之差()的双侧()置信区间为:=211(,)Nm s222(,)Nm s21s22s2212ss21mm11212/2,()XXXXtS2)1()1(2121nnnn21XXS)11(112nnSc)2()1()1(212222112nnSnSnSc当n1、n2较大时,可用 来近似计算。21XXS221212SSnn2023-5-192023-5-1978 例例6.5 测定测定28例结核病患者和例结核病患者和34例对照者的脑脊液中镁例对照者的脑脊液中镁(mmol/L)的含量,结果见表

32、的含量,结果见表6.5,试估计结核病人和对照者的脑,试估计结核病人和对照者的脑脊液中镁含量的总体均数之差的脊液中镁含量的总体均数之差的95%置信区间。置信区间。表表6.56.5 两对比组脑脊液中镁含量两对比组脑脊液中镁含量(mmol/L)(mmol/L)组别例数均数标准差结核组281.040.17对照组341.280.142023-5-192023-5-1979假定两组方差齐,假定两组方差齐,查界值表得查界值表得 222(28 1)0.17(34 1)0.140.023828342cS122121111()0.0238()0.039372834cXXSSnn1222834260nn0.05/2

33、,602.000t(1.28 1.04)2.0000.1613LC 00(mmol/L)(1.28 1.04)2.0000.3187UC 00(mmol/L)故两总体均数之差的95%置信区间为(0.16,0.32)mmol/L,可以认为结核病患者脑脊液中的镁含量较对照人群平均低0.24mmol/L,其95%置信区间为(0.16,0.32)mmol/L。2023-5-192023-5-1980总体概率的置信区间 根据样本含量n和样本频率p的大小,可以采用查表法和正态近似法计算总体概率的置信区间。1、查表法 当样本含量n较小,比如n 50,特别是p很接近0或100%时,可以通过查相应统计用表(附表

34、7),确定总体概率的置信区间。2023-5-192023-5-1981例 某医院对39名前列腺癌患者实施开放手术治疗,术后有合并症者2人,试估计该手术合并症发生概率的95%置信区间。解:查概率的置信区间表(附表7),在n=39的横行,X=2的纵列交叉处的数值为117 即该手术合并症发生概率的95%置信区间为1%17%2023-5-192023-5-1982注意:附表7中仅列出X n/2部分;当X n/2时,应以n X值查表,然后从100中减去查得的数值即为所求的置信区间。2023-5-192023-5-19832、正态近似法 当n足够大,且样本频率p和(1 p)均不太小时,如np与n(1 p)

35、均大于5时,p的抽样分布接近正态分布,此时总体概率的置信区间 p z/2Sp 2023-5-192023-5-1984例 用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。解:本例n比较大,且np=94及n(1 p)=26均大于5,p z/2 Sp=p z0.05/2 =0.783 1.96 =0.709 0.857 即该仪器乳腺癌总体检出率的95%可信区间置信区间为(70.9%,85.7%)。(1)ppn0.783(10.783)1202023-5-192023-5-1985 在某地随机抽取在某地随机抽取329人,

36、作血清登革热血凝抑制抗体反人,作血清登革热血凝抑制抗体反应检验,结果应检验,结果29人阳性,问人阳性,问(1)调查的)调查的329人的抗体阳性率是多少?人的抗体阳性率是多少?(2)抗体阳性率的抽样误差是多少?)抗体阳性率的抽样误差是多少?(3)试估计该地人群血清登革热血凝抑制抗体阳性率?)试估计该地人群血清登革热血凝抑制抗体阳性率?2023-5-192023-5-1986三、应注意的一些问题置信区间和置信限的关系准确度与精密度的关系2023-5-192023-5-1987正确理解可信区间的涵义可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95的可信度是

37、针对可信区间的构建方法而言的。以均数的95%可信区间为例,其涵义是:如果重复100次抽样,每100个样本所算得的100个可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。2023-5-192023-5-1988可信区间和可信限的关系 可信限:分别指两个点值,分别称为下限值和上限值。可信限:分别指两个点值,分别称为下限值和上限值。可信区间可信区间:是指以上、下可信限为界的一个范围。是指以上、下可信限为界的一个范围。用公式用公式 表示可信限;表示可信限;用用 表示可信区间。表示可信区间。,XXts/2,(,)XXXtsXts/2/22023-5-19置信区间的

38、解释 总体均数的95%置信区间:如果从总体中重复抽取如果从总体中重复抽取100份样本含量相同的独立样本,每份样本可分别计算一个置信区间,份样本含量相同的独立样本,每份样本可分别计算一个置信区间,那么在那么在100个置信区间中,大约有个置信区间中,大约有95个置信区间包括个置信区间包括(估计正确估计正确),只有只有5个置信区间不包括个置信区间不包括(估计错误估计错误)。或者说或者说对于某一个区间而言,它包含总体均数的可能性为对于某一个区间而言,它包含总体均数的可能性为95%,而不包含总体均数的可能性仅为,而不包含总体均数的可能性仅为5%。因此在实际应用中,。因此在实际应用中,以这种方法估计总体均

39、数犯错误的概率仅为以这种方法估计总体均数犯错误的概率仅为5%。2023-5-192023-5-1990 -2 -1 0 1 2 图图4.1 100个来自个来自N(0,1)的样本所估计的可信区间示意的样本所估计的可信区间示意 2023-5-192023-5-1991可信区间意义:虽然不能知道某校全体女大学生身高均数的确切数虽然不能知道某校全体女大学生身高均数的确切数值,全体女大学生身高均数在值,全体女大学生身高均数在163.0-164.5cm之间的可能之间的可能性是性是95%,在,在 162.7 164.7cm之间的可能性是之间的可能性是99%。换句话说,做出校全体女大学生身高均数为换句话说,做

40、出校全体女大学生身高均数为163.0-164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错的概率是,说错的概率是5%;做;做出校全体女大学生身高均数为出校全体女大学生身高均数为162.7 164.7cm的结论,说对的结论,说对的概率是的概率是99%,说错的概率是,说错的概率是1%。2023-5-192023-5-1992可信区间的两个要素准确度 反映为可信度反映为可信度1-1-的大小的大小 ,即区间包含总体均数的概率大,即区间包含总体均数的概率大小,越接近小,越接近1 1越好越好精密度 反映为区间的宽度,区间越窄越好反映为区间的宽度,区间越窄越好 在可信度确定的情况下,增加样本含

41、量可减小可信区间的宽在可信度确定的情况下,增加样本含量可减小可信区间的宽度度2023-5-192023-5-1993 9 5 可 信 区 间 9 9 可 信 区 间 公式 区 间 范 围 窄 宽 估计错误的概率 大(0.05)小(0.01)XXStXStX ,2/05.0,2/05.0,XXStXStX ,2/01.0,2/01.0,可信区间的两个要素当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。2023-5-192023-5-1994 求参数置信区间保 证准确度先 提 高精 度再处理处理“准确度与精密度准确度与精密度”关系的原则关系的原则在置信度确定的情况下,增加在置信度确定的情况下,增加样本含量样本含量可减小区间宽度。可减小区间宽度。2023-5-192023-5-1995可信区间与参考值范围的区别 可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。95%的可信区间中的95%95%是可信度,即所求可信区间包含总体参数的可信程度为95%95%95%95%的参考值范围中的95%95%是一个比例,即所求参考值范围包含了95%95%的正常人。2023-5-192023-5-1996总体均数置信区间与参考值范围的区别总体均数置信区间与参考值范围的区别2023-5-19

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(参数估计基础-课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|