1、参 数 估 计洪金益中南大学地学院地质数据处理基础6第六章 参数估计统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验统计推断的过程第六章 抽样与参数估计第一节第一节 抽样与抽样分布抽样与抽样分布 第二节第二节 参数估计基本方法参数估计基本方法第三节第三节 总体均值和总体比例的区间估计总体均值和总体比例的区间估计第四节第四节 两个总体均值及两个总体比例之差的估计两个总体均值及两个总体比例之差的估计第五节第五节 正态总体方差及两正态总体方差比的区间估计正态总体方差及两正态总体方差比的区间估计学习目标1. 了解抽样和抽样分布的基本概念了解抽样和抽样分布的基本概念2.
2、理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系3. 了解点估计的概念和估计量的优良标准了解点估计的概念和估计量的优良标准4. 掌握总体均值、总体比例和总体方差的区掌握总体均值、总体比例和总体方差的区间估计间估计第一节 抽样与抽样分布一一. 总体、个体和样本总体、个体和样本二二. 关于抽样方法关于抽样方法3样本均值的分布与中心极限定理样本均值的分布与中心极限定理4样本方差的分布样本方差的分布5两个样本方差比的分布两个样本方差比的分布六六. T 统计量的分布统计量的分布总体、个体和样本(概念要点)总体总体(Population):调查研究的事物或现象的全体,如某地区的地层;个体个体(It
3、em unit):组成总体的每个元素,如P、T、J、K;样本样本(Sample):从总体中所抽取的部分个体,如T、J含矿地层;样本容量样本容量(Sample size):样本中所含个体的数量,2个含矿地层。抽样方法(概念要点)1. 概率抽样:根据已知的概率选取样本; 简单随机抽样:完全随机地抽选样本; 分层抽样:总体分成不同的“层”,然后在每一层内进行抽样; 整群抽样:将一组被调查者(群)作为一个抽样单位; 等距抽样:在样本框中每隔一定距离抽选一个被调查者;2. 非概率抽样:不是完全按随机原则选取样本; 非随机抽样:由调查人员自由选取被调查者; 判断抽样:通过某些条件过滤来选择被调查者;3.
4、配额抽样:选择一群特定数目、满足特定条件的被调查者。样本均值的抽样分布1. 所有样本指标(如均值、比例、方差等)所形成的分布称为抽样分布;2. 是一种理论概率分布;3. 随机变量是 样本统计量;样本统计量;样本均值, 样本比例等。4. 结果来自容量相同的所有可能样本。抽样分布(概念要点)样本均值的抽样分布(实例)样本均值的抽样分布 (实例)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)样本均值的抽样分布 (实例)3.5
5、3.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)所有样本均值的均值和方差样本均值的分布与总体分布的比较样本均值的抽样分布与中心极限定理n = 4Xn =165 . 2=xs50=xm5=xss s =10抽样分布抽样分布总体分布总体分布m m = 50X中心极限定理Xm mm mx= =样本方差的抽样分布样本方差的分布卡方 (c2) 分布 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值c c2 = (
6、n-1)S2/2计算出所有的计算出所有的c c 2值值总体总体均值的标准差1. 所有可能的样本均值的标准差,测度所有样本均值的离散程度2. 小于总体标准差;3. 计算公式为:nxss=两个样本方差比的抽样分布两个样本方差比的抽样分布 设X1,X2, ,Xn1是来自正态总体N(1,12 )的一个样本, Y1,Y2, ,Yn2是来自正态总体N(2,22 )的一个样本,且Xi(i=1,2,,n1),Yi(i=1,2, ,n2)相互独立,则:两个样本方差比的抽样分布F(1,10)(5,10)(10,10)T 统计量的分布T 统计量的分布 设X1,X2,Xn1是来自正态总体N(1,12 )的一个样本,
7、称为统计量,它服从自由度为(n-1)的t 分布t 分布与正态分布的比较正态分布t 分布不同自由度的t分布标准正态分布t (df = 13)t (df = 5)SXnT)(m-=第二节 参数估计基本方法一一. 点估计点估计二二. 点估计的优良性准则点估计的优良性准则3区间估计区间估计参数估计的方法估估 计计 方方 法法点点 估估 计计区间估计区间估计被估计的总体参数总体参数总体参数符号表示符号表示用于估计的用于估计的样本统计量样本统计量一个总体一个总体均值比例方差两个总体两个总体均值之差比例之差方差比21mm-21PP -2221ss2sPm点 估 计点估计(概念要点)1. 从总体中抽取一个样本
8、,根据该样本的统计量对总体的未知参数作出一个数值点的估计例如: 用样本均值作为总体未知均值的估计值就是一个点估计;2. 点估计没有给出估计值接近总体未知参数程度的信息;3. 点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。1. 用于估计总体某一参数的随机变量如样本均值,样本比例、样本中位数等例如: 样本均值就是总体均值m的一个估计量如果样本均值 x = 3 ,则 3 就是 m 的估计值2. 理论基础是抽样分布估计量 (概念要点)估计量的优良性准则(无偏性)无偏性:无偏性:估计量的数学期望等于被估计的总体参数。估计量的优良性准则(有效性)估计量的优良性准则(一致性) 一致性:一致
9、性:随着样本容量的增大,估计量越来越接近被估计的总体参数。区间估计区间估计(概念要点)1.根据一个样本的观察值给出总体参数的估计范围;2.给出总体参数落在这一区间的概率;3.例如: 总体均值落在5070之间,置信度为 95%。置信区间估计(内容)s s2 2 已知已知s s2 2 未知未知 均均 值值方方 差差比比 例例置置 信信 区区 间间落在总体均值某一区间内的样本1.总体未知参数落在区间内的概率;2.表示为 (1 - ; 为显著性水平,是总体参数未在区间内的概率 3.常用的显著性水平值有 99%, 95%, 90%相应的相应的 为0.01,0.05,0.10置信水平 区间与置信水平 影响
10、区间宽度的因素1. 数据的离散程度,用 s 来测度2. 样本容量,3. 置信水平 (1 - ),影响 Z 的大小第三节 总体均值和总体比例的区间估计一一. 总体均值的区间估计总体均值的区间估计二二. 总体比例的区间估计总体比例的区间估计3样本容量的确定样本容量的确定总体均值的区间估计 (s已知)总体均值的置信区间 (s 已知)1.假定条件总体服从正态分布,且总体方差(s)已知如果不是正态分布,可以由正态分布来近似 (n 30)2.使用正态分布统计量总体均值的区间估计(正态总体:实例)【例【例】某种零件长度服从正态分布,从该批产品中随机抽取件,测得其平均长度为21.4 mm。已知总体标准差s s
11、 =0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。总体均值的区间估计(非正态总体:实例)总体均值的区间估计 (s未知)总体均值的置信区间 (s 未知)1.假定条件总体方差(s)未知总体必须服从正态分布正态分布2.使用 t 分布统计量3. 总体均值 m 在1-置信水平下的置信区间为总体均值的区间估计(实例)总体比例的区间估计总体比例的置信区间1.假定条件两类结果总体服从二项分布可以由正态分布来近似2.使用正态分布统计量3. 总体比例 的置信区间为总体比例的置信区间(实例) 样本容量的确定1.根据均值区间估计公式可得样本容量n为估计总体均值时样本容量的确定 2.样本容量n
12、与总体方差s2、允许误差、可靠性系数Z之间的关系为与总体方差成正比与允许误差成反比与可靠性系数成正比其中:样本容量的确定(实例)1.根据比例区间估计公式可得样本容量n为估计总体比例时样本容量的确定 样本容量的确定(实例)【例【例】一家市场调研公司想估计某地区有彩色电视机的家庭所占的比例。该公司希望对比例p的估计 误 差 不 超 过0.05,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)。第四节 两个总体均值及两个总体比例之差估计一一. 两个总体均值之差估计两个总体均值之差估计二二. 两个总体比例之差估计两个总体比例之差估计两个总体均值之差的估计两个样本均值之差的抽样分布 总
13、体总体1 总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2m m1- 1- m m2 2两个总体均值之差的估计 (s12、s22 已知)1.假定条件两个样本是独立的随机样本两个总体都服从正态分布若不是正态分布, 可以用正态分布来近似(n130和n230)2.两个独立样本均值之差的抽样分布服从正态分布,其期望值为两个总体均值之差的估计 (s12、s22 已知)3. 使用正态分布统计量Z两个总体均值之差的估计(实例)【例【例】一个银行
14、负责人想知道储户存入两家银行的钱数。他从两家银行各抽取了一个由25个储户组成的随机样本,样本均值如下:银行A:4500元;银行B:3250元。设已知两个总体服从方差分别为sA2=2500和sB2=3600的正态分布。试求m mA- m mB的区间估计(1)置信度为95%(2)置信度为99%BA两个总体均值之差的估计(计算结果) 两个总体均值之差的估计 (s12、s22未知,但相等)1.假定条件两个总体都服从正态分布s12、s12未知,但s12s122.总体方差s2的联合估计量为3. 估计量x1-x2的标准差为两个总体均值之差的估计 (s12、s22未知,但相等)两个总体均值之差的估计(实例)【
15、例【例】为比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员随机安排了10位顾客,并记录下为每位顾客办理账单所需的时间(单位:分钟),相应的样本均值和方差分别为:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位职员办理账单所需时间均服从正态分布,且方差相等。试求两位职员办理账单的服务时间之差的95%的区间估计。两个总体均值之差的估计(计算结果)两个总体均值之差的估计 (s12 、s22未知,且不相等)1.假定条件两个总体都服从正态分布s12、s12未知,且s12 s122.使用的统计量为1222221121212222121-=nnsnnsn
16、snsf两个总体均值之差的估计 (s12、s22未知,且不相等)两个总体均值之差的估计(续前例)【例【例】为比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员随机安排了10位顾客,并记录下了为每位顾客办理账单所需的时间(单位:分钟),相应的样本均值和方差分别为:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位职员办理账单所需时间均服从正态分布,但方差不相等方差不相等。试求两位职员办理账单的服务时间之差的95%的区间估计。两个总体均值之差的估计(计算结果) 两个总体比例之差的估计1. 假定条件两个总体是独立的两个总体服从二项分布可以用正态分布来
17、近似2. 两个总体比例之差P1-P2在1-置信水平下的置信区间为两个总体比例之差的区间估计两个总体比例之差的估计(实例)【例【例】某饮料公司对其所做的报纸广告在两个城市的效果进行了比较,它们从两个城市中分别随机地调查了1000个成年人,其中看过广告的比例分别为p1=0.18和p2=0.14。试求两城市成年人中看过广告的比例之差的95%的置信区间。两个总体比例之差的估计(计算结果)第五节 正态总体方差及两正 态总体方差比的估计一一. 正态总体方差的区间估计正态总体方差的区间估计二二. 两个正态总体方差比的区间估计两个正态总体方差比的区间估计正态总体方差的区间估计正态总体方差的区间估计(要点)1.
18、 估计一个总体的方差或标准差2. 假设总体服从正态分布3. 总体方差 s2 的点估计量为S2,且正态总体方差的区间估计(实例)【例【例】对某种金属的10个样品组成的一个随机样本作抗拉强度试验。从实验数据算出的方差为4。试求s2的95%的置信区间。2 两个正态总体方差比的区间估计两个正态总体方差比的区间估计(要点)1.比较两个总体的方差比2.用两个样本的方差比来判断如果S12/ S22接近于1,说明两个总体方差很接近如果S12/ S22远离1,说明两个总体方差之间存在差异3.总体方差比在1-置信水平下的置信区间为两个正态总体方差比的区间估计(实例)【例【例】用某一特定工序生产的一批化工产品中的杂
19、质含量的变异依赖于操作过程中处理的时间长度。某生产商拥有两条生产线,为了降低产品中杂质平均数量的同时降低杂质的变异,对两条生产线进行了很小的调整,研究这种调整是否确能达到目的。为此从两条生产线生产的两批产品中各随机抽取了25个样品,它们的均值和方差为 x1=3.2 ,S12 =1.04 x2=3.0 , S22 =0.51试确定两总体方差比s s12/ s s12的95%的置信区间。两个正态总体方差比的区间估计(计算结果)本章小结1. 抽样的有关概念抽样的有关概念2. 抽样分布抽样分布3. 点估计和区间估计的有关概念点估计和区间估计的有关概念4. 确定样本容量确定样本容量5. 区间估计区间估计结结 束束