1、/12:44 AM第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.3 6.3 单一总体参数的区间估单一总体参数的区间估计计 6.1.1 总体、个体和样本 6.3.1 总体均值的区间估计 6.1.2 大数定律和中心极限定理 6.3.2 总体比例的区间估 6.1.3 三种分布 6.3.3 总体方差的区间估计 6.1.4 样本均值的抽样分布 6.4 6.4 两个总体参数两个总体参数的区间估计的区间估计 6.1.5 样本比例的抽样分布 6.4.1 两个总体均值之差的 6.1.6 样本方差的抽样分布 区间估计 6.1.7 两个总体样本统计量的抽样分布 6.4.2 两个总体比例之差的 6
2、.2 6.2 参数估计的一般问题参数估计的一般问题 区间估计 6.2.1 估计量和估计值 6.4.3 两个总体方差比值的 6.2.2 点估计 区间估计 6.2.3 点估计量的评价准则 6.2.4 区间估计第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布统计学教程卢小广/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.1.1 总体、个体和样本 总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。个体(Item Unit)是指构成总体的元素。总体容量(Population Size)是指构成总体的全部个
3、体的数量。样本(Sample)是指从总体抽取的若干个体构成的集合。抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽取若干个体的过程。样本容量(Sample size)是指构成样本的全部个体的数量。/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.1.1 总体、个体和样本 总体(Population)是指所研究的事物及其现象的全体,由该事物及其现象的全部个体组成。个体(Item Unit)是指构成总体的元素元素。总体容量(Population Size)是指构成总体的全部个体的数量。样本(Sample)是指从总体抽取的若干个体构成的
4、集合集合。抽样(Sampling)是指按照具体的抽样方法和抽样设计,从总体中抽取若干个体的过程。样本容量(Sample size)是指构成样本的全部个体的数量。讨论题讨论题 请用经济管理中的实例,解释上述的总体、个体和样本等概念。/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.1.2 大数定律和中心极限定理1大数定律 在对客观事物及其现象进行观测和实验中,随着观测或实验的次数增多,事件发生的频率和均值逐渐地趋于某个常数。(1)贝努利定理(Bernoulli Theorem)(6.1)贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而以严格
5、的数学形式表述了频率的稳定性特征,即n当很大时,事件发生的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的场合,可以用事件发生的频率来替代事件的概率。1limAAnPnnP/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 (2)车比雪夫定理(Chebyshev Theorem)设随机变量相互独立,且具有相同的有限的数学期望和方差,对于任意正整数有 (6.2)称序列 依概率收敛于总体均值。即当n充分大时,车比雪夫不等式几乎都是成立的;当n趋于无穷大时,n个随机变量的均值趋于总体均值。,nXXX2111limlim1nkknnXnPxP/12:4
6、4 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 2中心极限定理 在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。中心极限定理(Central Limit Theorem)反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,则 (6.3)xtnkknnndtexnnXxF21221limlim/12:44 AM统计学
7、教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 2中心极限定理 在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种随机变量往往近似地服从正态分布。中心极限定理(Central Limit Theorem)反映了随机变量近似地服从正态分布的特征。中心极限定理是大样本推断的理论基础。独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,则 (6.3)讨论题讨论题 大数定律和中心极限定理对于参数估计的意义。xtnkknnndtexnnXxF21
8、221limlim/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.1.3 三种分布1总体分布 总体分布(Population Distribution)是指由客观存在的,构成总体的个体所形成的频数分布,及其相关参数数值。例如,当研究某一企业职工收入情况时,该企业全体职工的收入状况的频数分布,以及反映该企业全体职工收入状况的均值、方差、偏态系数和峰度系数,从不同角度综合描述了这一总体的分布特征。我们往往是通过对构成总体的部分个体进行观察,即通过样本数据计算的统计量,例如样本均值、样本方差、样本偏态系数和样本峰度系数,以及样本的频数分布来推断总体参数,
9、用样本分布来估计总体分布。/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 2样本分布 样本分布(Sample Distribution)是指由构成样本的个体所形成样本的频数分布,以及计算出来的相关统计量频数分布,以及计算出来的相关统计量。样本中的个体都是来自于总体,具有总体的相关信息和基本特征,样本分布是总体分布的一个映象,一个缩影。当样本容量样本容量充分大时,样本分布趋近于总体分布。样本分布是指某一个具体的样本中的个体数量特征样本分布是指某一个具体的样本中的个体数量特征。由于样本是随机抽取的,每一次抽取的样本中的个体不尽相同,每一个具体的样本分布也会
10、与对应的总体分布存在或大或小的偏误,根据样本计算的统计量是随机变量。(随机抽取的)样本的分布与客观的总体分布之间的误差,需要借助抽样分布概念。/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 3抽样分布 抽样分布(Sampling Distribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量样本统计量的概率分布概率分布。所以,抽样分布是样本分抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。布的概率分布,抽样分布是抽样理论的研究对象。抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在
11、大样本场合,由中心极限定理有样本均值趋于正态分布。/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 3抽样分布 抽样分布(Sampling Distribution)是指从同分布总体中,独立抽取的相同样本容量的样本统计量样本统计量的概率分布。所以,抽样分布是样本分抽样分布是样本分布的概率分布,抽样分布是抽样理论的研究对象。布的概率分布,抽样分布是抽样理论的研究对象。抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样本均值趋于正态分布。讨论题讨论题 为什么说抽样分布是抽样理论研究的对象
12、,解释三种分布之间的联系。/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.1.4 样本均值的抽样分布 1大样本场合下的样本均值抽样分布 在反复抽取容量相同的独立同分布样本条件下,所得到的样本均值的概率分布称为样本均值的抽样分布。在样本容量充分大的情况下,即大样本场合,样本均值依据中心极限定理趋于正态分布。所谓独立同分布样本为从无限总体中随机抽取的等概样本,或从有限总体中以放回方式,随机抽取的等概样本。所谓大样本是指能够满足中心极限定理要求,使样本均值趋于正态分布的样本容量。在统计实践中一般称样本容量大于30即为大样本这只是一个粗略的经验数值。有离散
13、变量样本均值的计算公式 (6.4)nXxnii1/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 在样本容量充分大的场合下,样本均值渐进地趋于数学期望为总体均值,方差为总体方差的n分之一的正态分布,即 样本均值的数学期望为总体均值,表明从平均的观点来看,用样本均值估计总体均值不存在偏差,即具有无偏性;样本均值的方差为总体方差的n分之一,表明只要总体方差是有限的,那么随着样本容量的增大,样本均值的方差相应减小,用样本均值估计总体均值的误差也相应减小。同时可以由总体方差和样本容量,精确地计算出这一样本均值的方差,并且用这一样本方差度量使用样本均值估计总体均值
14、的误差。通过对样本均值的标准化处理,在用样本均值估计总体均值时,可以使用标准正态分布来计算抽样误差出现的概率。nNx2,/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 例例6.16.1 在一次研究某一企业职工收入情况的调查中,准备从该企业随机抽取100个职工个人的收入状况数据构成样本,以此推断该企业职工平均月收入。要求要求 若该企业职工平均月收入的总体均值为2000元,总体标准差为为250元,试计算样本均值不小于1950元的概率。解解 根据中心极限定理,在样本容量充分大时,样本均值渐进地趋于数学期望为总体均值,方差为总体方差的n分之一的正态分布,有本例
15、的样本均值渐进地趋于数学期望为2000元,标准差为25的正态分布,即。代入正态分布概率计算公式,得 即样本均值不小于1950元的概率为97.7%。(查表,教材324页)97725.02225200019502520001950ZPZPxPxP/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 2小样本场合下的样本均值抽样分布 在小样本场合,不满足中心极限定理对于样本容量充分大的要求,样本均值不趋于正态分布,而是趋于t分布。统计学家戈斯特(W.S.Gosset 1876-1936)在1908年以 Student 的笔名发表的一篇论文中,首次提出了t分布,从而
16、这一小样本分布理论被称为Student分布,简称为t分布。设为来自正态分布总体的样本,有 (6.5)为T统计量,T统计量服从于自由度为n-1的t分布。nsxT/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 式(6.5)中的s2表示样本方差,有 (6.6)式(6.6)存在着一个线性约束,T统计量服从自由度n-1为的t分布。t分布的形状也是一左右对称的钟形图形,比正态分布扁平,并且受到自由度数值大小的约束,自由度的数值越小,t分布越趋于扁平;自由度的数值越大,t分布扁平的程度越小,并且随着自由度的数值增大,t分布的形态逐渐趋于正态分布。t分布的应用条件是总
17、体服从正态分布。在总体方差未知时,t分布是一种精确的估计方法,正态分布只是其近似的概率分布。1122nxxsnii/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 例例6.2 6.2 假定某一企业职工收入情况服从正态分布中,从该企业随机抽取了16个职工个人的收入状况数据构成样本,拟以此推断该企业职工平均月收入。要求要求 若该企业职工平均月收入的总体均值为2000元,样本标准差为为250元,试计算样本均值不小于1950元的近似概率。解解 由于样本容量小于30,为小样本,此时的样本均值服从于t分布。并且,已知样本容量为16,因此本例的样本均值服从于自由度为1
18、5的t分布。有 即在样本容量仅为16的小样本条件下,该次调查的样本均值不小于1950元的概率为78.19%。781901.08.018.05.625016250200019501625020001950TPTPTPxPxP/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.1.5 样本比例的抽样分布 所谓的总体比例是指总体中具有某一属性的单位数与总体全部单位数的比例。样本比例抽样分布为在服从二项分布的总体中,重复抽取样本容量为的样本时,由样本比例的所有可能取值形成的相对频数分布。样本比例的抽样分布就是样本比例的所有可能取值的概率分布。在大样本场合,样本
19、比例的抽样分布渐进地趋于正态分布。即 (6.7)样本比例的方差为 (6.8)即有,在大样本下样本比例渐进地服从于 pEnp12nN1,/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.1.6 样本方差的抽样分布 在反复抽取容量相同的独立同分布样本条件下,所得到的样本方差的概率分布称为样本方差的抽样分布。在服从正态分布的同分布总体中,样本方差与总体方差的比值服从于自由度n-1为的卡方分布。即 (6.9)卡方分布仅在第一象限取值,所以分布的取值永远为正数。卡方分布一般为右偏态的偏峰分布,偏倚形态取决于其自由度的数值,自由度的数值越小,偏倚的程度越大,并且
20、随着自由度的数值增大,分布的形态逐渐趋于对称,正态分布是卡方分布的极限分布。11222212nsnxxnii/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 6.1.7 两个总体样本统计量的抽样分布1两个样本均值之差的抽样分布 在两个总体中,各自独立地反复抽取样本容量分别为和的独立同分布样本条件下,所得到的两个样本均值和之差的概率分布称为两个样本均值之差的抽样分布。在大样本场合,两个样本均值之差依据中心极限定理趋于正态分布。由于两个样本均值之差的数学期望为两个总体均值之差,即 (6.10)2121 xxE/12:44 AM统计学教程第6章 抽样分布与参数
21、估计 6.1 6.1 抽样分布抽样分布 两个样本均值之差的方差为这两个样本均值方差之和,有 (6.11)因此,这样的两个样本均值之差的抽样分布为 (6.12)2221212121nnNxx,22212121nnxxV/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 2两个样本比例之差的抽样分布 两个样本比例之差的抽样分布是指在两个服从二项分布的总体中,各自独立地反复抽取样本容量分别为和的独立同分布样本条件下,由所得到的两个样本比例和之差的所有可能取值形成的相对频数分布。在两个样本均为大样本的场合下,两个样本比例之差的抽样分布渐进地趋于正态分布。这时有两个
22、样本比例之差的数学期望等于两个总体比例之差,即 (6.15)方差为 (6.16)2121 ppE22211121121nnpp/12:44 AM统计学教程第6章 抽样分布与参数估计 6.1 6.1 抽样分布抽样分布 3两个样本方差比值的抽样分布 在两个正态总体中,各自独立地反复抽取样本容量分别为和的独立同分布样本条件下,所得到的两个样本方差和比值的概率分布称为两个样本方差比值的抽样分布。两个样本方差比值的抽样分布服从于F分布。F分布在形式上为两个独立的卡方分布除以各自自由度的比值。由式(6.9)可以给出两个样本方差和的卡方分布,再计算出这两者的比值,即得到F统计量。(6.17)1,111112
23、121222221222222121211nnFssnsnnsn第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题统计学教程卢小广/12:44 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 6.2.1 估计量和估计值1估计量 估计量(Estimator)是指用于估计相关的总体参数的统计量用于估计相关的总体参数的统计量。样本均值、样本比例和样本方差都是估计量。2估计值 估计值(Estimate)是指估计量的具体数值估计量的具体数值。例如,通过样本的数据,按照相关估计量的计算公式,所得出的样本均值、样本比例和样本方差的
24、具体数值就是估计值。参数估计(Parameter Estimation)就是在样本数据的基础上,计算在样本数据的基础上,计算估计量的具体数值估计量的具体数值估计值,去推断相关的总体参数的方法和过程估计值,去推断相关的总体参数的方法和过程。/12:44 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 6.2.2 点估计 点估计(Point Estimate)是指用估计量的数值直接作为总体参数的估计值的方法和过程。在总体分布形式为已知,从该总体中抽取一个样本,对未知参数所作的一个数值点的估计,称为参数的点估计。点估计的方法有矩估计法、顺序统计量法、最
25、大似然法和最小二乘法等。/12:44 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 矩估计法 矩估计法(Methods of Moment Estimation)是指用样本的矩,估计总体的矩的参数估计方法。矩是在数学期望基础上定义的数字特征,可以分为k阶原点矩和k阶中心矩两类。(1)k阶原点矩(Moment of Order K About the Origin)是指随机变量的k次方的数学期望,其中k为任意正整数,写为 (6.18)一阶原点矩就是随机变量的数学期望.(2)k阶中心矩(Centred Moment of Order k)是指随机变
26、量与其数学期望之差的k次方的数学期望,其中k为任意正整数,写为 (6.19)二阶中心矩就是随机变量的方差.kkXEm kkXEXEc/12:44 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 6.2.3 点估计量的评价准则 在参数的点估计中,可以从一致性、无偏性和有效性三个方面对点估计量进行评价。1一致性 一致性(Consistency)是指当样本容量趋于无穷大时,估计量依概率收敛于总体参数。即 (6.25)则称为的满足一致性准则的估计量,一般称之为一致估计量。一致估计量随着样本容量的增大,其数值越来越接近被估计的总体参数。1limPn/12:
27、44 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 2无偏性 无偏性(Unbiasedness)是指估计量的数学期望等于未知的总体参数真值。即 (6.26)则称为的满足无偏性准则的估计量,一般称之为无偏估计量。样本均值是总体均值的一个无偏估计量。(6.27)E niiniiXEnXnExE1111/12:44 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 2无偏性 无偏性(Unbiasedness)是指估计量的数学期望等于未知的总体参数真值。即 (6.26)则称为的满足无偏性准则的估计量,一般称
28、之为无偏估计量。样本均值是总体均值的一个无偏估计量。(6.27)讨论题讨论题 总体方差的最大似然估计量和矩估计量是否均为无偏估计量。E niiniiXEnXnExE1111/12:44 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 3有效性 有效性(Effectiveness)是指采用均方误差对估计量精确程度的测定,通常表现为两个估计量的均方误差之比。均方误差就是一个测定估计量本身的离散程度,以及估计量数学期望与总体相关参数的真值的偏倚程度的测度。均方误差(Mean Square Error)是估计量与总体参数真值的离差的平方的数学期望,有 (
29、6.28)若将估计量的数学期望与总体参数真值的离差记为,称为估计量的偏差,作为反映估计量与总体参数真值偏倚程度的测度。则可将式(6.23)写为 (6.29)2 EMSE 22222BVEEEEEEEMSE/12:44 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 均方误差是由估计量的方差和偏差两部分组成。其中估计量的方差反映的是估计量本身的离散程度;估计量的偏差反映的是估计量的数学期望与总体参数真值的偏倚程度。当两个估计量均为无偏估计量时,均方误差的式(6.29)中的第二项为0,只剩下第一项估计量的方差。这时只要比较估计量的方差就可以对其有效性
30、进行评价。从计算均方误差的式(6.29)可知,对于一个估计量的评价,需要综合分析它对于相关总体参数的估计误差,不能简单地认为一个无偏的估计量就一定优于一个有偏的估计量,还要具体度量有偏估计量的偏倚程度,以及两个估计量的有效性。所以,有效性是评价估计量的一个综合性的重要的准则。/12:45 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 6.2.4 区间估计 区间估计(Interval Estimate)是在点估计的基础上,给出在一定的置信程度下确定总体参数取值区间的方法和过程。在点估计中,总体参数估计量的具体取值为一数值点,而样本是从总体中随机地
31、抽取出来的,其估计值是依抽样分布的随机变量,单一的数值点不能全面反映抽样分布的状态,及其样本估计量的随机分布特征,不能度量样本估计的精确程度,所以提出了区间估计问题。建立在点估计基础上的区间估计,在给出了相关总体参数真值的估计量的同时,还给出了一个通常以取值区间形式表述的数值范围,以及在这个数值区间内包含总体参数的可靠程度。这种形式的参数估计就称为区间估计。/12:45 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 /12:45 AM统计学教程第6章 抽样分布与参数估计 6.2 6.2 参数估计的一般问题参数估计的一般问题 在区间估计中,置信区
32、间反映的是区间估计的精确程度,置信水平反映的是区间估计的可靠程度,对于某一样本容量已定的具体样本而言,这两方面是互为消长的。当通过缩小置信区间来提高对总体参数的估计精确程度时,就需要降低置信水平,降低对总体参数估计的可靠程度;若是要提高区间估计的可靠程度,势必会增大置信区间,降低对总体参数估计的精确程度。所以,需要根据具体情况和实际需要适当地选择置信水平的数值,进而确定置信区间。若既要提高区间估计的精确程度,又要提高区间估计的可靠程度,就需要采取增加样本容量,以及通过更有效的抽样和估计方法来实现。第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计统计学教程
33、卢小广/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 6.3.1 总体均值的区间估计1在方差已知时,总体均值的区间估计 在方差为已知时,样本均值服从于正态分布,因而构建Z统计量。有 (6.31)根据区间估计的定义,构造总体均值的双侧区间估计置信区间,对于给定的显著性水平,从式(6.30)和式(6.31)出发,有 (6.32)nxZ1222222nZxnZxPZnxZPZZZP/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 则有总体均值的双侧区间估计置信区间
34、为在对总体均值进行单侧区间估计时,有 (6.33)则总体均值的单侧区间估计置信区间为 或者nZxnZx22,1nZxPnZxP,nZxnZx,/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 在式(6.32)和式(6.33)中出现的总体标准差与样本容量平方根的商,称为样本均值标准差,反映了样本均值分布的离散程度。有样本均值方差为 (6.34)样本均值方差含有总体方差和样本容量两个因素,它是在总体服从正态分布时,度量使用样本均值估计总体均值时精确程度的测度。由于样本均值标准差具有与变量一致的量纲,一般采用它作为度量估计量精确程度
35、的测度。nx22/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 例例6.56.5 在某一企业职工收入情况的调查中,从该企业随机抽取100个职工个人的收入状况数据构成样本,并且已知该企业职工平均月收入的总体标准差为250元,样本均值为1985元。要求要求 试计算给定置信水平为95%的该企业职工平均月收入的总体均值的置信区间。解解 由本例给出的条件可知,这是一个双侧的区间估计问题。根据双侧区间估计的式(6.32),可计算得总体均值的置信区间为 即根据这次抽样调查的样本信息,可以认为该企业职工平均月收入的真实数值将依95%的概率落
36、在1936元到2034元之间。1025096.11985,1025096.11985,22nZxnZx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 例例6.66.6 某地对在该地就业的本科生在毕业一年后的月工资情况进行了一次调查,搜集了36名同学的月工资数据,具体如表6.2所示。并已知在该地就业的本科生在毕业一年后的月工资的总体标准差为400元。表6.2 36名毕业一年本科生的月工资情况 元由式(6.33),可计算得总体均值的置信区间为 可以认为总体均值,即在该地就业的本科生在毕业一年后的月平均工资的真实数值依95%的概率
37、落在2269.343元到2530.66元之间。1950208022001590214020801690196029802500260023002400245026002780259024602200180019802460258031001980189023903090290024602470265028902300273031806400959961.12400,6400959961.12400,22nZxnZx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 例例6.76.7 某进出口公司需要出口一批小型电机,其中有一个技
38、术指标为电机工作时定子线圈的最高温度,已知供货厂家该厂电机工作时定子线圈最高温度的总体标准差为8,随机抽出49台电机进行实测,得到该厂电机工作时定子线圈最高温度的样本均值为110。要求要求 试计算给定置信水平为99%的该厂电机工作时定子线圈最高温度的总体均值的置信区间。解解 采用式(6.33)计算在单侧区间估计下的置信水平为99%的总体均值的置信区间的上限。根据样本均值为110,可计算出该工厂单侧区间估计下的置信水平为99%的总体均值的置信区间的上限为 可以认为总体均值,即该工厂电机工作时定子线圈的平均最高温度依99%的概率落在小于112.66的区间以内。66.11249832634.2110
39、nZx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 2在总体方差未知时,总体均值的区间估计 在总体服从正态分布,但是总体方差未知时,新的统计量是服从自由度为n-1的t分布的T统计量。有 (6.35)由式(6.35)出发,则有在总体方差未知场合下,总体均值的双侧区间估计置信区间为以及在总体方差未知场合下,总体均值的单侧区间估计置信区间为 或1ntnsxTnstxnstx22,nstx,nstx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 例例6.86.8
40、 在一次对某品牌电视机的开关次数进行的破坏性测试中,随机抽取了9台电视机进行测试,具体数据为19050,18090,23098,18908,16896,20679,21567,17890,20456,试估计该品牌电视机开关次数的总体均值,及其在置信水平为95%下最低开关次数的单侧置信区间。可以得到总体均值的单侧区间估计置信区间为 从而认为根据样本数据推断总体均值,即该品牌电视机的平均开关次数的真实数值将依95%的概率不低于18400次。,3788.19778695.119626,2nstx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数
41、的区间估计 例例6.9 6.9 利用例6.6中36名同学的月工资数据,要求要求 在总体方差未知情况下,估计该地就业的本科生毕业一年后的月平均工资在置信水平为95%下的置信区间。由式(6.35)可以得到总体均值的双侧区间估计置信区间为 可以认为总体均值,即该地区毕业一年后的本科毕业生的月平均工资的真实数值将依95%的概率落在2262.32元到2537.68元之间。在总体方差未知的场合,当样本容量充分大时,可以采用式(6.31)建立统计量,对总体均值进行区间估计。假定样本均值已经服从正态分布的基础上,构造Z统计量,采用式(6.31)计算的总体均值的置信区间,要小于在样本均值服从t分布的基础上,采用
42、式(6.35)计算的总体均值的置信区间。69117.4060301.22400,69117.4060301.22400,22nstxnstx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 6.3.2 总体比例的区间估计 在大样本场合,可以认为样本比例的抽样分布渐进地趋于正态分布。这时有样本比例渐进地服从于正态分布,其标准化后的随机变量渐进地服从标准正态分布。有 (6.37)即有总体比例在显著性水平下的置信区间 (6.38)一般采用样本比例替代总体比例来计算其在显著性水平下的置信区间。即 (6.39)1,01NnpZnZp12
43、nppZp12/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 例例6.106.10 某公司为了分析新产品的电视广告效果,随机访问了100名用户,了解到其中有36人是通过电视广告了解该新产品的。要求要求 试以95%的置信水平,估计通过电视广告了解该新产品的用户占全 部用户的比例的置信区间。由式(6.37)得 即通过电视广告了解该新产品的用户占全部用户的比例的置信区间,在95%的置信水平下为26.592%到45.408%。%408.9%36100%361%3696.1%36/12:45 AM统计学教程第6章 抽样分布与参数估计
44、6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 6.3.3 总体方差的区间估计 在总体服从正态分布时,样本方差服从自由度为n-1的卡方分布,从而可以利用卡方分布来构造总体方差的置信区间,确定一个卡方值,使之对于给定的显著性水平,满足 (6.40)则有 (6.41)222221111122122222nsnnsn/12:45 AM统计学教程第6章 抽样分布与参数估计 6.3 6.3 单一总体参数的区间估计单一总体参数的区间估计 例例6.116.11 仍然利用例6.6中36名同学的月工资数据。要求要求 估计该地就业的本科生在毕业一年后的月均工资标准差,在置信水平为95%下的置信区间。
45、由式(6.41)可以得到总体方差的置信区间为 可以认为该地就业的本科生在毕业一年后的月工资标准差将依95%的概率落在330.04元到530.79元之间。569.209117.40635203.539117.40635222第6章 抽样分布与参数估计 6.4 6.4 两个总体参数的区间估计两个总体参数的区间估计统计学教程卢小广/12:45 AM统计学教程第6章 抽样分布与参数估计 6.4 6.4 两个总体参数的区间估计两个总体参数的区间估计 6.4.1 两个总体均值之差的区间估计1两个总体方差已知情况下的估计 在两个总体方差已知时,由两个这两个总体独立抽取的样本均值之差服从于正态分布,其标准差为
46、 (6.42)样本均值之差经标准化后,服从于标准正态分布。则有,两个总体均值之差在置信水平下的置信区间为 (6.44)22212121nnxx222121221nnZxx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.4 6.4 两个总体参数的区间估计两个总体参数的区间估计 例例6.126.12 某进出口公司需要出口一批小型电机,在A、B两个备选的小型电机供货厂家进行了一次调查,在每家工厂随机抽出49台电机进行实测,并且A、B两厂电机工作时定子线圈最高温度的总体标准差数据为已知,其中A工厂为8,B工厂为6。要求要求 试计算给定置信水平为99%的总体均值之差的置信区间。根据样本数据计
47、算得样本均值分别为A工厂110,B工厂114。由式(6.44)可得 即总体均值之差的置信区间为(-6.8,-1.2),即A、B两厂电机工作时定子线圈最高温度均值之差依95%的概率落在-6.8到-1.2以内。8.2449649896.111411022222BBAABAnnZxx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.4 6.4 两个总体参数的区间估计两个总体参数的区间估计 2两个相等总体方差未知情况下的估计 在两个总体方差未知,但服从正态分布,并且方差相等,则利用两个随机样本的信息来联合计算这个相等而又未知的总体方差的估计量,为 (6.45)其总体均值之差在置信水平下的置信
48、区间为 (6.48)2112122221122,1nnsnsns212,121221112nnsnntxx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.4 6.4 两个总体参数的区间估计两个总体参数的区间估计 例例6.136.13 某市采取随机抽样方法,在全市抽取100户城镇家庭进行生活费支出调查,今年每户家庭生活费支出的样本均值为38900元,样本标准差为580元;上年每户家庭生活费支出的样本均值为35800元,样本标准差为570元。假定该市这两年城镇家庭生活费支出服从正态分布,并且方差相等。根据式(6.48),有 即总体均值之差在置信水平下的置信区间为(2939.64,326
49、0.37)。该市这两年城镇家庭生活费支出均值之差,依95%的概率落在2939.64元到3260.37元的区间内。1001100102.575972.13580038900112212,121221nnsnntxx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.4 6.4 两个总体参数的区间估计两个总体参数的区间估计 3两个总体方差不相等且未知情况下的估计 若有两个均服从正态分布的总体,总体的方差未知,并且不相等,按照式(6.47)构造的统计量近似地服从于自由度为f的t分布。有 (6.49)则有,两个服从正态分布的总体,总体方差未知且不相等,其总体均值之差在置信水平下的置信区间为 (
50、6.50)1122222121212222121nnsnnsnsnsf 222121221nsnsftxx/12:45 AM统计学教程第6章 抽样分布与参数估计 6.4 6.4 两个总体参数的区间估计两个总体参数的区间估计 例例6.14 6.14 借用例6.13中的基本数据,只是假定该两市城镇家庭生活费支出服从正态分布,方差不相等。要求要求 试计算该市这两年城镇家庭生活费支出均值之差,在95%置信水平下的置信区间。根据式(6.49),计算出样本均值之差近似地服从的t分布的自由度。即 两个样本方差数值水平非常接近,所以计算出来的自由度与两个相等总体方差未知情况下的自由度基本一致,同为198。该市