1、2022-4-175.1 5.1 点估计点估计5.2 5.2 区间估计区间估计第五章第五章 参数估计参数估计2022-4-17 这一章介绍由样本推断总体的第二条途这一章介绍由样本推断总体的第二条途径,即由样本统计量估计总体参数,称为径,即由样本统计量估计总体参数,称为参数估计参数估计,主要介绍总体平均数和标准差,主要介绍总体平均数和标准差的估计。上一章讲解的是的估计。上一章讲解的是统计假设检验统计假设检验,即假设一个总体的平均数等于某一个值,即假设一个总体的平均数等于某一个值,然后通过样本数据去推断这个假设是否可然后通过样本数据去推断这个假设是否可以接受。以接受。 估计量估计量是估计总体参数的
2、估计量,对总是估计总体参数的估计量,对总体参数的估计可分为点估计和区间估计。体参数的估计可分为点估计和区间估计。 学习本章内容时应对照上一章的内容。学习本章内容时应对照上一章的内容。第五章第五章 参数估计参数估计2022-4-17 定义:用样本数据所计算出来的单个数值,定义:用样本数据所计算出来的单个数值,对总体参数所做的估计称为对总体参数所做的估计称为点估计点估计。 一个好的估计量应满足一个好的估计量应满足无偏性无偏性:统计量的理论平均值(数学期望:统计量的理论平均值(数学期望值)等于总体参数;如样本平均数的理论值)等于总体参数;如样本平均数的理论平均数等于总体平均数,样本方差的理论平均数等
3、于总体平均数,样本方差的理论平均数等于总体方差(平均数等于总体方差(4.124.12)。)。xxE)(5.1 点估计点估计222)(sSE2022-4-17 有效性有效性:在样本含量相同的情况下,如一:在样本含量相同的情况下,如一个统计量的方差小于另一个统计量的方差,个统计量的方差小于另一个统计量的方差,则前一个统计量更有效;如中位数的方差则前一个统计量更有效;如中位数的方差比平均数的方差大比平均数的方差大/2/2倍,用样本平均数倍,用样本平均数来估计总体平均数比中位数更有效。来估计总体平均数比中位数更有效。22nx5.1 点估计点估计平均数的方差平均数的方差中位数中位数m m的方差的方差22
4、2nm2022-4-17 相容性相容性:若统计量的取值任意接近于参数:若统计量的取值任意接近于参数值的概率随样本含量值的概率随样本含量n n的无限增加而趋于的无限增加而趋于1 1,则该统计量称为参数的相容估计量。则该统计量称为参数的相容估计量。x5.1 点估计点估计22nx 经证明,样本平均数和方差都符合经证明,样本平均数和方差都符合无偏无偏性,性,最小方差最小方差和和相容性相容性,因此它们分别为总体,因此它们分别为总体平均数和总体方差的平均数和总体方差的最优估计最优估计2022-4-17 试验的目的是希望获得有关试验处理总体试验的目的是希望获得有关试验处理总体的认识。从一个正态总体抽取一个样
5、本,可以的认识。从一个正态总体抽取一个样本,可以计算得样本平均数,标准差。尽管样本平均数计算得样本平均数,标准差。尽管样本平均数是总体平均数的估计值,是总体平均数的估计值, (这种估计方法统(这种估计方法统计上叫点估计计上叫点估计 )。但它没有考虑试验误差的)。但它没有考虑试验误差的影响,也未指出这种估计的可靠程度。对总体影响,也未指出这种估计的可靠程度。对总体平均数更合理的估计是在一定概率保证下,给平均数更合理的估计是在一定概率保证下,给出总体平均数和标准差的可能范围,这种估计出总体平均数和标准差的可能范围,这种估计方法叫方法叫区间估计区间估计,所给出的可能范围叫,所给出的可能范围叫置信区置
6、信区间间。 5.2 区间估计区间估计5.2.1 区间估计的基本原理区间估计的基本原理2022-4-17 例:用实验动物作实验材料,现从一批动例:用实验动物作实验材料,现从一批动物中抽取含量物中抽取含量n n= =1010的样本并已经计算出平的样本并已经计算出平均值为均值为10.2310.23g g。要求动物满足平均体重。要求动物满足平均体重= =10.0010.00g g,= =0.40.4的正态分布总体,若的正态分布总体,若 10.00g10.00g则应淘则应淘汰,问此批动物材料是否汰,问此批动物材料是否合适合适? 不 仅不 仅 = 1 0 . 0= 1 0 . 0 时 落 在 接 受 域
7、, 发 现时 落 在 接 受 域 , 发 现 =10.20,10.24,10.40=10.20,10.24,10.40时都落在接受域,由时都落在接受域,由此可见由样本平均数推断总体平均数所得此可见由样本平均数推断总体平均数所得结果不是单一值,而是一个区间。结果不是单一值,而是一个区间。5.2.1 区间估计的基本原理区间估计的基本原理2022-4-17 用样本平均数推断总体平均数所得到的结用样本平均数推断总体平均数所得到的结果不是单一值,而是一个区间。只要标果不是单一值,而是一个区间。只要标准化的样本平均数落在准化的样本平均数落在- -u u0.050.05(双侧)(双侧)和和u u0.050.
8、05(双侧)(双侧)区间内,所有的区间内,所有的H H0 0都将被接受,于都将被接受,于是得到一个包含总体平均数的区间,用是得到一个包含总体平均数的区间,用这种方法对总体参数所做的估计称为这种方法对总体参数所做的估计称为区区间估计间估计(interval estimate)interval estimate)。区间内包含区间内包含的概率为多少?的概率为多少?(95%,99%)(95%,99%)置信度水平等于置信度水平等于1-1-5.2.1 区间估计的基本原理区间估计的基本原理2022-4-17原因:由第四章抽样分布原因:由第四章抽样分布 , 已知时已知时)( 1nux(双侧)(双侧)5.2.2
9、 的置信区间的置信区间1-已知时已知时置信区间置信区间:作题步骤:作题步骤:a a 查查附表附表3 3,得,得u u ( (双侧双侧) )的值的值 b b 代入代入(1)(1)式,得式,得置信区间置信区间)(nuxnux(双侧)(双侧)(双侧)(双侧),)2(nxu可查出在一定的置信概率下,标准正态分布的置可查出在一定的置信概率下,标准正态分布的置信区间(信区间( - -u u ( (双侧)双侧), + +u u ( (双侧双侧) ))代入)代入(2 2)换算成用换算成用平均值表示的平均值表示的 的的置信区间置信区间。2022-4-17 习题:测得某批习题:测得某批2525个小麦样本的平均蛋个
10、小麦样本的平均蛋白质含量白质含量x=x=14.514.5%,%,已知已知2.502.50,试,试进行进行9595置信度下的蛋白质含量的区间置信度下的蛋白质含量的区间估计。估计。 置信度置信度P=1-P=1- 即即0.050.05,查表,查表u u0.050.05=1.96,=1.96,例题例题%)48.15%,52.13()96. 196. 1(xx,2022-4-17 未知时未知时的置信区间的置信区间:t t具具n-1n-1自由度自由度5.2.2 的置信区间的置信区间1-)( 1nstx(双侧)(双侧)(nstxnstx(双侧)(双侧)(双侧)(双侧),作题步骤:作题步骤:a a 查查附表附
11、表4 4,得,得t t ( (双侧双侧) )的值的值 b b 代入代入(1)(1)式,得式,得置信区间置信区间)(2nsxt可查出在一定的置信概率下,可查出在一定的置信概率下,t t分布的分布的置信区间(置信区间( - -t t ( (双侧双侧, + +t t ( (双侧双侧) ))代入)代入(2 2)式)式换算成用换算成用平均值表示的平均值表示的 的的置信区间置信区间。原因:由第四章抽样分布原因:由第四章抽样分布 , 未知时未知时2022-4-17 实际应用中希望得到一个较窄的置信区实际应用中希望得到一个较窄的置信区间,可采取三种办法减少置信区间:间,可采取三种办法减少置信区间:控制试验条件
12、和改善技术,控制试验条件和改善技术,减小减小或或s s;增加增加样本含量样本含量;放宽放宽 。最好采用上述第一种和第二种,第三种最好采用上述第一种和第二种,第三种方法方法不可取不可取。5.2.2 的置信区间的置信区间1-2022-4-17作题步骤:作题步骤:a a 查查附表附表6 6,查卡方分布的上侧分位,查卡方分布的上侧分位数与下侧分位数数与下侧分位数 b b 代入式代入式1 1,得,得置信区间置信区间 原因:由第四章原因:由第四章,4.10 ,4.10 2 2dfdf= =dfsdfs2 2/ / 2 2 =(=(n n-1) -1) S S2 2 / /2 2 (2)(2) 可查出在一定
13、的置信概率下,卡方分布的置信可查出在一定的置信概率下,卡方分布的置信区间区间代入代入(2 2)式)式, ,换算成换算成 的置信区间的置信区间。5.2.3 的置信区间的置信区间)(,1112/122/2nsns2022-4-17 一个混杂的小麦品种,株高标准差一个混杂的小麦品种,株高标准差 0 0= =1414cm,cm,经提经提纯后抽出纯后抽出1010株,它们的株高为株,它们的株高为9090, , 105105, , 101101, , 9595, , 100100, , 100100, , 101101, , 105105, , 9393, , 9797cmcm,考察提纯后,考察提纯后的群体
14、是否比原群体的群体是否比原群体整齐整齐?(置信区间设为?(置信区间设为0.990.99) 从附表从附表6 6查卡方分布表,查卡方分布表,双侧双侧检验检验 上侧分位数?上侧分位数? 下侧分位数?下侧分位数?代入式代入式例题例题已知已知n=10,n=10,经计算经计算s=4.92, (3.04,11.21)s=4.92, (3.04,11.21))(,1112/122/2nsns2022-4-17可查出在一定的置信概率下,可查出在一定的置信概率下,标准正态分布的置信区间标准正态分布的置信区间代入代入式式4.224.22,可换,可换算成算成,(,( 1 1- - 2 2) )的置信区间的置信区间。)
15、( 1)(21112122nnuxx(双侧)(双侧)5.2.4 平均数差的置信区间平均数差的置信区间1.1. 标准差标准差 i i已知时已知时,(,( 1 1- - 2 2) )的置信区间的置信区间 作题步骤:作题步骤: a a 查查附表附表3 3,得,得u u ( (双侧双侧) )的值的值 b b 代入式代入式1 1,得,得置信区间置信区间 2221212121)()(nnxxu原因:由第四章原因:由第四章 4.224.22 2022-4-17)11(2) 1() 1()(212122112122nnnnsnsntxx(双侧)(双侧)5.2.4 平均数差的置信区间平均数差的置信区间2.2.
16、标准差标准差 I I未知但相等时未知但相等时,(,( 1 1- - 2 2) )的置信的置信区间,区间,t t具具n n1 1+n+n2 2-2-2自由度自由度n n1 1=n=n2 2时时 6.12 t6.12 t具具2n-22n-2自由度自由度nsstxx222121)(双侧)(双侧)6.112022-4-17作题步骤:作题步骤: a a F F检验检验 是否相等是否相等b b 查查附表附表4 4,得,得t t ( (双侧双侧) )的值的值c c 代入式代入式6.116.11或或6.126.12,得,得置信区间置信区间 原因:由第四章原因:由第四章 4.244.24, 4.254.255.
17、2.4 平均数差的置信区间平均数差的置信区间)11() 1() 1() 1() 1()()(21212211212122221nnnnsnsnxxttnn(4.244.24)2022-4-17可查出在一定的置信概率下,可查出在一定的置信概率下,t t分布的置分布的置信区间信区间. .代入代入式式4.244.24或或4.254.25,可换算成,可换算成( ( 1 1- - 2 2) )的置信区间的置信区间。5.2.4 平均数差的置信区间平均数差的置信区间nssxxtn2221212122)()(2022-4-17 二个小麦品种从播种到抽穗所需天数见二个小麦品种从播种到抽穗所需天数见P75 P75
18、 例例5.95.9,问两者所需天数差异是否,问两者所需天数差异是否显著?显著?求求( ( 1 1- - 2 2) )的置信区间是否包含的置信区间是否包含0 0,包括,包括0 0意味着差异意味着差异不显著不显著,否则显著,否则显著首先经首先经F F检验可以认为检验可以认为 1 1= = 2 2且且n n1 1= =n n2 2=10 =10 代入公式?代入公式? dfdf? ?置信水平取置信水平取9595,查表,查表t t双侧双侧=?=?例题例题2022-4-17作题步骤:作题步骤: a a F F检验检验 b b查查附表附表4 4,得,得t t ( (双侧双侧) )的值(注意查表时的值(注意查
19、表时dfdf值)值)5.2.4 平均数差的置信区间平均数差的置信区间22112122)(nsnstxx(双侧)(双侧)3.3. 标准差标准差 i i未知且不等时未知且不等时,(,( 1 1- - 2 2) )的置信区的置信区间间, , 2212)1 (1dfkdfkdf222121121nsnsnsk222211xxxsssk6.132022-4-17 c c 代入式代入式6.136.13,得,得置信区间置信区间 原因:由第五章原因:由第五章 5.125.125.2.4 平均数差的置信区间平均数差的置信区间可查出在一定的置信概率下,可查出在一定的置信概率下,t t分布的置信区间分布的置信区间.
20、 .代代入入式式5.125.12,可换算成,可换算成( ( 1 1- - 2 2) )的置信区间的置信区间。12112122nsnsxxt2022-4-17配对数据差值配对数据差值的的置信区间置信区间:),(nstdnstddd5.2.5 配对数据的置信区间配对数据的置信区间nstdd可查出在一定的置信概率下,可查出在一定的置信概率下,t t分布的置分布的置信区间(信区间( -t-t ( (双侧双侧, +t+t ( (双侧双侧) ))代入)代入(5.135.13)式换算成)式换算成 d d的的置信区间置信区间。,nsdtdt t具具n-1n-1自由度自由度 6.14 6.14 作题步骤:作题步
21、骤:a a 查查附表附表4 4,得,得t t ( (双侧双侧) )的值的值 b b 代入式代入式6.146.14,得,得置信区间置信区间原因:由第五章原因:由第五章 5.135.13,2022-4-17作题步骤:作题步骤:a a 查查附表附表7 7,查,查F F分布的分布的F Fdf2,df1,df2,df1, /2/2和和F Fdf1,df2,df1,df2, /2/2b b 代入式代入式6.166.16,得置信区间得置信区间 5.2.6 方差比的置信区间方差比的置信区间22/,12/,211221sFsFssdfdfdfdf, 1 1/ / 2 2的置信区间:的置信区间: 式式6.166.
22、162022-4-17原因:由第四章原因:由第四章 4.26 4.26 5.2.6 方差比的置信区间方差比的置信区间22222121,21ssFdfdf 可知可知F F与与 1 1/ / 2 2的关系,的关系,查出在一定的置信概查出在一定的置信概率下,率下,F F分布的置信区间分布的置信区间代入代入4.264.26式,换算成式,换算成 1 1/ / 2 2的置信区间的置信区间。2022-4-17 的置信区间的置信区间 标准差标准差已知已知(式(式6.46.4) 标准差标准差未知未知(式(式6.66.6) 的置信区间(式的置信区间(式6.8)6.8)nux(双侧)(双侧)小节小节)( 1nstx
23、(双侧)(双侧))(,1112/122/2nsns2022-4-17 标准差标准差已知已知(式(式6.10)6.10)标准差标准差未知未知但但相等相等(式(式6.12)6.12)标准差标准差未知未知且且不相等不相等(式(式6.136.13)( 1)(21112122nnuxx(双侧)(双侧)小节小节 平均数差的置信区间(对照平均数的置信区间)平均数差的置信区间(对照平均数的置信区间) nsstxx222121)(双侧)(双侧)22112122)(nsnstxx(双侧)(双侧)2022-4-17 配对数据的置信配对数据的置信区间(式区间(式6.146.14)nstdd小节小节方差比的置信区间(式
24、方差比的置信区间(式6.166.16)22/,12/,211221sFsFssdfdfdfdf,2022-4-17结束结束结束结束结束结束P91 6.3, 6.4.P91 6.3, 6.4.作业:作业:2022-4-17一、名词解释一、名词解释区间估计区间估计 置信区间置信区间 置信度(置信概率)置信度(置信概率)二、计算题二、计算题 研究甲、乙两药对某病的治疗效果,研究甲、乙两药对某病的治疗效果,甲药治疗病畜甲药治疗病畜7070例,治愈例,治愈5353例;乙药治疗例;乙药治疗7575例,治愈例,治愈6262例,问两药的治愈率是否有例,问两药的治愈率是否有显著差异?并计算两种药物治愈率总体百显著差异?并计算两种药物治愈率总体百分率的分率的95%95%、99%99%置信区间。置信区间。习题与解答习题与解答