1、第1页,共61页。第四讲用样本推断总体第1 页,共6 1 页。第2页,共61页。问题一:二战中的点估计德军有多少辆坦克?第2 页,共6 1 页。02.01002p02.0 p第3页,共61页。问题二某人想知道自己所承包的池塘的鱼的总数N,第一次随机捞出第4页,共61页。问题三政府部门想知道到底有多大比例的上海人同意上海大力发展轨第5页,共61页。问题四:每次民调中所需调查人数 为了调查对总统候第6页,共61页。统计推断的过程样本总体样本统计量总体均值、比例、方差第6 页,样本均值的分样本均值的分布布样本比例的样本比例的分布分布样本方差的样本方差的分布分布抽样分布抽样分布正态或正态或t分布分布正
2、态或正态或t分布分布第7页,共61页。样本统计量的抽样分布样本均值的分布样本比例的分布样本方差的分,样本均值是一个更有效的估计量总体未知参数落在区间内的概率无偏性:估计量的数学期望等于被估计的总体如果样本均值 x=3,则 3 就是 的估计值X2 N(2,2)要求:该校大学生平均上网时间的置信区间,置信概率为90%经验表明,总体方差约为1800000元。25066 77098 l69922 35662 74425 67202 118444 53500 79294 64544 86813 116269 37831 89341 73341 85288 138114 53402 85586 82256
3、 77539 88798两个总体均值之差的估计(12、22未知,但相等)两个独立样本均值之差的抽样分布服从正态分布,其期望值为该公司希望对比例p的估计误差不超过,要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)。二战中的点估计德军有多少辆坦克?有效的估计量。我们可以95的概率保证该企业职工由于同管理人员不能融洽相处而离开的比例在63.根据比例区间估计公式可得样本容量n为估估 计计 方方 法法点点 估估 计计区间估计区间估计假设检验假设检验第8页,共61页。,样本均值是一个更有效的估计量参数估计的方法估 计 方 法点第9页,共61页。点估计从总体中抽取一个样本,根据该样本的统计
4、量对总体的未知参2xp 2s第10页,共61页。被估计的总体参数总体参数符号表示用于估计的样本统计量一个总体第11页,共61页。1.用于估计总体某一参数的随机变量估计量第1 1 页,共6 1第12页,共61页。估计量的优良性准则无偏性:估计量的数学期望等于被估计的总体P第13页,共61页。估计量的优良性准则(有效性)A B 中位数的抽样分布均值的抽样第14页,共61页。估计量的优良性准则(一致性)一致性:随着样本容量的增大,估计第15页,共61页。区间估计1.根据一个样本的观察值给出总体参数的估计范围样本 2 2 已知已知 2 2 未知未知 均均 值值方方 差差比比 例例置置 信信 区区 间间
5、第16页,共61页。置信区间估计(内容)2 已知2 未知均 值方 差比 第17页,共61页。落在总体均值某一区间内的样本x _ X X =Z x第18页,共61页。总体未知参数落在区间内的概率置信水平 第1 8 页,共6 1 页。xxX第19页,共61页。置信区间与置信水平 均值的抽样分布(1 -)%区间包nx第20页,共61页。影响区间宽度的因素数据的离散程度,用 来测度第2 0 页,共)1,0(NnxZnZxnZx22,第21页,共61页。总体均值的置信区间(已知)1.假定条件 总体均值 498.21,302.21915.096.14.21,915.096.14.21,22nZxnZx第2
6、2页,共61页。总体均值的区间估计(正态总体)解:已知 N(,2),x176.27,824.24100696.126,100696.126,22nZxnZx第23页,共61页。总体均值的区间估计(非正态总体)解:已知 x 2 6,=)1(1ntnsxtnnstxnstxnn1212,第24页,共61页。总体均值的置信区间(未知)1.假定条件3.总3.53,69.462580639.250,2580639.250,1212nstxnstxnn第25页,共61页。总体均值的区间估计解:已知 N(,2),x=5 0,)1,0()1(NnppppZnppZp)1(2第26页,共61页。总体比例的置信区
7、间1.假定条件3.总体比例 的置信 764.0,636.0200)7.01(7.096.17.0)1(2nppZp第27页,共61页。总体比例的置信区间实例解:已知 n=2 0 0 ,0.7 ,总体服从正态分布,且总体方差()已知这是一个典型的用样本比例来估计总体比例从而再推断总体单位总量的实例。根据均值区间估计公式可得样本容量n为如果样本均值 x=3,则 3 就是 的估计值我们可以95的概率保证平均每天参加锻炼的时间在27.若不是正态分布,可以用正态分布来近似(n130和n230)总体服从正态分布,且总体方差()已知【例】一个 负责人想知道储户存入两家 的钱数。总体均值的区间估计(正态总体)
8、点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等总体均值的置信区间(已知)利用Excel计算必要样本数两个独立样本均值之差的抽样分布服从正态分布,其期望值为我们可以95的概率保证总体均值在53.12、12未知,且12 12【例】一个 负责人想知道储户存入两家 的钱数。2222Zn nZ2第28页,共61页。总体服从正态分布,且总体方差()已知根据均值区间估计公式2865.27500)1800000()96.1(222222Zn第29页,共61页。样本容量的确定实例解:已知2=1 8 0 0 0 0 0,Z/222)1(ppZn)1(2ppnZ第30页,共61页。根据比例区间估计公
9、式可得样本容量n 为估计总体比例时样本容量的385)5.0()5.01)(5.0()96.1()1(22222ppZn第31页,共61页。样本容量的确定实例【例】一家市场调研公司想估计某地区有彩色电11222nsn11,112222212nsnnsn第32页,共61页。正态总体方差的区间估计1.估计一个总体的方差或标准差4.第33页,共61页。正态总体方差的区间估计实例【例】对某种金属的1 0 个样品组成的3314.13,8925.17004.24110,0228.194110第34页,共61页。正态总体方差的区间估计计算结果解:已知n 1 0,s 2 4,从某学院男生中随机抽取30 名学生,
10、测得身高(cm)分别为170、175、172、168、165、178、180、176、177、164、.,数据如下表,以95%的置信度估计该学院男生的平均身高。第35页,共61页。从某学院男生中随机抽取3 0 名学生,测得身高(c m )分别第36页,共61页。第3 6 页,共6 1 页。第37页,共61页。利用E x c e l 计算必要样本数例:某县进行农村经济情况调查,已“样本容量计算”工作表 必要样本容量计算2222/)(允许误差)(标准差样本容量zn计算公计算公式式第38页,共61页。“样本容量计算”工作表 必要样本容量计算计算公式第3 8 页,共建立工作表nppzpnppzp1,1
11、22样本比例为样本比例为p,样本容量为样本容量为n计算公计算公式式第39页,共61页。建立工作表样本比例为p,样本容量为n 计算公式第3 9 页,nx22snZ2极限误差的区间半径1nstnt临界值临界值或nppZ)1(2极限误差的区间半径1n*临界值双侧区间半径nppnt)1(*)1(2第40页,共61页。区间估计总结总体与样本总体均值总体比例P 正态总体非正态第4 0Nnn1*)(临界值区间半径通式:不重复抽样第41页,共61页。注:第4 1 页,共6 1 页。2222Zn极限误差允许称为)(2nZ222)1(ppZn极限误差允许为)(第42页,共61页。区间估计必要样本容量n 的确定估计
12、估计其中:其中:第4 2 页,共第43页,共61页。帮想节约调查费用的广告公司拿主意某广告公司为了估计某地区收看第44页,共61页。总统选举的民意调查(背景)据 竞选业专业杂志第45页,共61页。学生每天上网的时间的区间一、某大学为了解学生每天上网的时间,85092 32609 59465 77437 32534 64090 32464 59902 39323 89641 94219 116803 92857 63436 65605 85861 64342 61978 67998 59817101769 95774 121352 69568 74276 66998 40001 72069 25
13、066 77098 l69922 35662 74425 67202 118444 53500 79294 64544 86813 116269 37831 89341 73341 85288 138114 53402 85586 82256 77539 88798 第46页,共61页。汽车性能调查 调查消费者对上海地区某一个主要制造商所生第47页,共61页。两个总体均值之差的估计第4 7 页,共6 1 页。总体总体1 总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2
14、所有可能样本所有可能样本的的X1-X2 1 1 2 2第48页,共61页。两个样本均值之差的抽样分布 m 1 s 1 总体1 s 2 m 2 总体222121)(2nnxx2121)(xxE第49页,共61页。两个总体均值之差的估计(1 2、2 2 已知)1.假定222121221)(nnZxx)1,0()()(2221212121NnnXXZ第50页,共61页。两个总体均值之差的估计(1 2、2 2 已知)两个总体均BA第51页,共61页。两个总体均值之差的估计(实例)【例】一个 负责人想知道储 3.1290,7.120925360025250058.2)32504500(62.1280,7
15、8.121925360025250096.1)32504500(第52页,共61页。两个总体均值之差的估计(计算结果)解:已知 (21221211nnsnsnsppp211212222112nnsnsnsp第53页,共61页。两个总体均值之差的估计(1 2、2 2 未知,但相等)假定2121221112nnsnntxxp)2(11)()(21212121nntnnSXXtp第54页,共61页。两个总体均值之差的估计(1 2、2 2 未知,但相等)使第55页,共61页。两个总体均值之差的估计(实例)【例】为比较两位 职员为新2.42101092.1811036.1611021121222211n
16、nsnsnsp)4.2,2.10(101101)2.4)(1.2(5.282.22第56页,共61页。两个总体均值之差的估计(计算结果)解:已知 )()()(2221212121ftnsnsXXt1222221121212222121nnsnnsnsnsf第57页,共61页。两个总体均值之差的估计(1 2 、2 2 未知,且不相等)222121221)(nsnsftxx第58页,共61页。两个总体均值之差的估计(1 2、2 2 未知,且不相等)第59页,共61页。两个总体均值之差的估计(续前例)【例】为比较两位 职员为 189.179121092.189121036.1621092.181036.16f)35.2,25.10(1092.181036.161009.25.282.22第60页,共61页。两个总体均值之差的估计(计算结果)自由度 f 为1-第61页,共61页。本讲小结1.点估计和区间估计的有关概念第6 1 页,共6 1 页。