ImageVerifierCode 换一换
格式:PPT , 页数:83 ,大小:2.13MB ,
文档编号:3004229      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3004229.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(SPSS第5章-总体分布、样本分布与参数估计(修课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

SPSS第5章-总体分布、样本分布与参数估计(修课件.ppt

1、第五章 总体分布、 样本分布与参数估计 5.1 总体分布与样本分布总体分布与样本分布一、总体与总体分布一、总体与总体分布 总体总体:反映总体特征的随机变量的取值的全体。反映总体特征的随机变量的取值的全体。 总体分布总体分布:反映总体特征的随机变量的概率分布。反映总体特征的随机变量的概率分布。二、随机样本与样本观测值二、随机样本与样本观测值 1、随机样本、随机样本 表征表征n次抽取个体的随机抽样的一组随机变量次抽取个体的随机抽样的一组随机变量X1,X2, Xn 。 2、样本观测值、样本观测值(样本数据样本数据) n次随机抽样的结果:次随机抽样的结果:x1,x2,xn (称为随机样本称为随机样本X

2、1,X2, Xn 的样本观测值的样本观测值)。 n称为随机样本向量称为随机样本向量( X1,X2, Xn )的维度,即自由度。的维度,即自由度。 一个总体10,5,8,7,10 Q:若有放回地抽取2次,请画出两次均值的分布图。 有放回(with replacement)抽样 ,ijXXX10587101010,1010 10,5 7.510,8910,78.510,101055,107.55,555,86.5 5,7 65,107.588,109 8,56.5 8,888,7 7.58,10977,108.57,567,87.5 7,777,108.51010,101010,57.510,89

3、10,78.510,1010 一个样本统计量的概率分布被称为该统计量的抽样分布 样本均值抽样分布 直方图0510678910其他接收频率0.00%50.00%100.00%150.00%频率累积 %3、样本、样本(累积累积)分布函数分布函数 设样本观测值设样本观测值x1 x2 , xn,ki为小于为小于xi+1的样本值出现的累积频的样本值出现的累积频次,次, n为样本容量,则可得样本累积频率分布函数如下:为样本容量,则可得样本累积频率分布函数如下:xxxxxnkxxxFniiin当当当 1 / 0)(11样本样本(累积累积)分布函数分布函数Fn(x)是对总体的累积分布函数是对总体的累积分布函数

4、F(x)的近似,的近似, n越大越大, Fn(x)对对F(x)的近似越好。的近似越好。格利文科格利文科 ( Glivenko )定理定理 当样本容量当样本容量 n 趋于无穷大时,趋于无穷大时,Fn(x)以概率以概率1(关于关于 x )均匀地收敛于均匀地收敛于F(x).1)0)()(suplim(xFxFPnxn思考:请举出总体均值和总体方差的合适估计量。 5.2 统计量与统计量的分布统计量与统计量的分布一、统计量的定义一、统计量的定义统计量统计量:统计量是不含未知参数的,随机样本:统计量是不含未知参数的,随机样本X1,X2,, Xn的函数。的函数。统计量的值统计量的值: 统计量的值是不含未知参

5、数的统计量的值是不含未知参数的, 样本观测值样本观测值x1,x2,xn的函数的函数.二、几个重要统计量分布:二、几个重要统计量分布: 2、t 与与 F分布分布1、 2(n)分布分布 设随机变量设随机变量 X N(0,1) , X1,X2,, Xn为为 X 样本,则样本,则 2 = X2i= X21 + X22 + X2n 2 (n) 2 (n)分布的均值分布的均值 E( 2)= n,方差,方差 D( 2 )= 2n。n=1n=4n=10 2(n)分布图分布图0, 00,)2(21)(2122xxexnxfxnnn 2(n)密度函数:密度函数:其中,其中,n为自由度。为自由度。 (n/2)为珈玛

6、函数,是一个含参数为珈玛函数,是一个含参数n/2的的积分,为:积分,为:0212)2/(dtetntn2、t 分布分布)(ntnYXT其中,其中,X N(0,1),Y 2(n)分布,且分布,且X与与Y相互独立。相互独立。密度函数为:密度函数为:xnxnnnxfnn212)1()2/()21()(t 分布图分布图3、F 分布分布),(nmFnVmUF其中,其中,U 2(m),V 2(n) ,且且U与与V相互独立。相互独立。m=100,n=20m=15,n=20重要性质:重要性质:0 00,)1 ()() 2/() 2/()2()(212xxxnmxnmnmnmnmxfnmm密度函数形式为:密度函

7、数形式为:),(1),(1mnFnmF三、由一般正态分布的随机样本所构成的若干重要统计量的分布三、由一般正态分布的随机样本所构成的若干重要统计量的分布定理:若定理:若X1,X2,, Xn 是正态总体是正态总体N( , 2)的一个随机样本,的一个随机样本,则:则:(1) X N( , 2 / n)(2) X 与与 S2 相互独立。相互独立。nXZ (3) N(0, 1)22)1(Sn (4) 2(n-1)(5) t(n -1)nSXT(6) 2(n)niiX122)(1(1) N(0,1)22212121)()(nnYX定理:若定理:若X1,X2,, Xn1 和和Y1,Y2,, Yn2 分别是正

8、态总体分别是正态总体N( 1, 12)和和N( 2, 22)的一个随机样本,且它们相互独立,的一个随机样本,且它们相互独立,则满足如下性质:则满足如下性质: (3) F(n1-1,n2-1)22222121SSF 21212122221121)2() 1() 1()()(nnnnnnSnSnYXT (2)t(n1+n2 - 2),( 1 = 2 )21122211121222)()(niiniiYnXn (4) F(n1,n2)四、任意分布的随机样本均值函数的均值与方差四、任意分布的随机样本均值函数的均值与方差设:随机变量设:随机变量 X 服从任何均值为服从任何均值为 ,标准差为,标准差为 的

9、分布,的分布,X是是随机样本随机样本X1,X2,, Xn的均值函数。则:的均值函数。则:(1) X = ;(2) X = / n 或或 2X = 2 / n Tips: 某类个体数量占总体数量的比例问题:某类个体数量占总体数量的比例问题:0-1分布分布 若若XB(1, p),则,则 E(X)= p, D(X)= p(1-p)X的均值也是总体中某类个体的比例的均值也是总体中某类个体的比例 pnpppXX)1 (,2五、中心极限定理五、中心极限定理假设随机变量假设随机变量 X 服从任何均值为服从任何均值为 ,标准差为,标准差为 的分布,的分布,X是是随机样本随机样本X1,X2,, Xn的均值函数。

10、的均值函数。当当 n 充分大时,有:充分大时,有:思考:在实际问题中思考:在实际问题中n多大?多大?2( ,)XNn近似地正态分布均匀分布总体分布样 本 均 值分布(n=2)样 本 均 值分布(n=10)样 本 均 值分布(n=30)指数分布Tips:当n 30, 无论总体分布形态如何,中心极限定理均适用;当n 15, 对于分布较为对称的总体,中心极限定理适用;当总体是正态分布时,无论样本大小,中心极限定理均适用。ExEx:某高校在研究生入学体检后对所有结果进行统计分析,得出其中某一项指标的均值是7,标准差2.2。从这个总体中随机选取一个容量为31的样本。(1)计算样本均值大于7.5的概率;(

11、2)计算样本均值小于7.2的概率;(3)计算样本均值在7.2和7.5之间的概率。解答1:)5 . 7(XP求)2 . 27-5 . 72 . 27-(XP)2273. 0Y(2 . 27-YPX,则:令?)2273. 0Y(),1 , 0(Y PN查表得其中标准正态分布表标准正态分布表 ( - ( - x x ) = 1 ( ) = 1 ( x x ) ) x00.010.020.030.040.050.060.070.080.0900.500 00.504 00.508 00.512 00.516 00.519 90.523 90.527 90.531 90.535 90.10.539 80

12、.543 80.547 80.551 70.555 70.559 60.563 60.567 50.571 40.575 30.20.579 30.583 20.587 10.591 00.594 80.598 70.602 60.606 40.610 30.614 10.30.617 90.621 70.625 50.629 30.633 10.636 80.640 40.644 30.648 00.651 70.40.655 40.659 10.662 80.666 40.670 00.673 60.677 20.680 80.684 40.687 90.50.691 50.695 00.

13、698 50.701 90.705 40.708 80.712 30.715 70.719 00.722 40.60.725 70.729 10.732 40.735 70.738 90.742 20.745 40.748 60.751 70.754 90.70.758 00.761 10.764 20.767 30.770 30.773 40.776 40.779 40.782 30.785 20.80.788 10.791 00.793 90.796 70.799 50.802 30.805 10.807 80.810 60.813 30.90.815 90.818 60.821 20.8

14、23 80.826 40.828 90.835 50.834 00.836 50.838 910.841 30.843 80.846 10.848 50.850 80.853 10.855 40.857 70.859 90.862 1解答2:)2 . 7(XP求)2 . 27-2 . 72 . 27-(XP)0909. 0Y(2 . 27-YPX,则:令?)0909. 0Y(),1 , 0(Y PN查表得其中统计方法统计描述统计推断参数估计假设检验点估计区间估计 5.3 点估计点估计1、概念、概念 设设 是总体分布中一个需要估计的参数,现从总体中抽是总体分布中一个需要估计的参数,现从总体中抽取

15、一个随机样本取一个随机样本X1,X2,, Xn ,记估计,记估计 的统计量为的统计量为 ),(21nXXX则称则称 为为 的估计量。的估计量。若得到一组样本观测值若得到一组样本观测值x1,x2,xn ,就可得出,就可得出 的估计的估计值,记:值,记: 。),(21nxxx注:在选取样本统计量注:在选取样本统计量 作为点估计时,必须考虑到作为点估计时,必须考虑到“无偏性无偏性”,这,这一点很重要。一点很重要。总体分布参数总体分布参数 的点估计,就是求出的点估计,就是求出 的估计值。的估计值。点估计点估计2、矩估计、矩估计 用样本矩来估计总体矩。用样本矩来估计总体矩。矩的一般形式:矩的一般形式:

16、E(X k)表示表示 k 阶原点矩阶原点矩(以原点为中心以原点为中心); E(X- )k 表示表示k 阶中心矩阶中心矩(以以 为中心为中心); Q:偏度、峰度、方差、均值分别是什么矩?2、矩估计、矩估计 Ex:设某批产品的寿命在上服从均匀分布,但是参数未知,随机地抽取五个产品,测得寿命分别是1265小时,1257小时,1276小时,1269小时和1266小时,试求这批产品寿命均值和方差的矩估计值,并写出相应的分布函数。3、极大似然估计法、极大似然估计法 若总体若总体 X 的的(累积累积)概率分布函数为概率分布函数为F(x, ), 概率密度函数概率密度函数 f (x, ), 其中其中 为未知参数

17、为未知参数 。 若若 X 为离散型随机变量为离散型随机变量, 则由离散型与连续型的对应关系则由离散型与连续型的对应关系, f (x, )对应于离散情况下的概率对应于离散情况下的概率P(X=x).X 为连续型随机变量时为连续型随机变量时, X的随机样本的随机样本X1,X2,, Xn的联合的联合概率密度函数为概率密度函数为niixfL1),()( 称为称为 的极大似然估计函数的极大似然估计函数. 当当 X 为离散随机变量时为离散随机变量时, L表示概率表示概率:),(2211nnxXxXxXPL关于关于 的极大值如果存在的极大值如果存在, 极大值极大值 就是就是 的的极大似然估计值极大似然估计值.

18、 其含义是其含义是: 一组观测值一组观测值x1,x2,xn在一次实验中出现了在一次实验中出现了, 其其联合概率就应当是最大的联合概率就应当是最大的, 所以选择所以选择 使联合密度使联合密度L最大的那个最大的那个.),(21nxxxEx: 设设x1,x2,, xn是正态总体是正态总体N( , 2)的样本观测值,的样本观测值,求求 与与 2 的极大似然估计值的极大似然估计值.解解: 极大似然函数为极大似然函数为nixieL12)(2221)(取对数取对数, 分别对分别对 与与 2 求偏导求偏导, 并令偏导为并令偏导为0, 可求出可求出 与与 2的极大的极大似然估计值如下似然估计值如下:2121)(

19、11niiniixxnxnx如果将上述如果将上述xi 换成换成 Xi , 上式成为极大似然估计量。上式成为极大似然估计量。 5.3 判别点估计的优劣标准判别点估计的优劣标准1、无偏估计量、无偏估计量E2、最小方差性、最小方差性)()(VarVar3、有效估计量、有效估计量 (1)无偏性;无偏性;(2)最小方差性。最小方差性。4、渐近无偏估计量、渐近无偏估计量)(lim En5、一致估计量、一致估计量1)(limpn一致估计量的另一等价定义:一致估计量的另一等价定义:(1) 渐进无偏的;渐进无偏的;(2)0)(limnnVar6、渐进有效性:、渐进有效性: (1) 一致估计量;一致估计量; (2

20、) 比其它的估计量更小的渐进方差。比其它的估计量更小的渐进方差。渐进方差定义:渐进方差定义:注:在实践中广泛应用的准则:注:在实践中广泛应用的准则:(1)小样本准则小样本准则 a、无偏性;、无偏性; b、有效性。、有效性。(2)大样本准则大样本准则 一致估计量。一致估计量。)(1lim)(lim2nnnnnEnEnVar思考:为了估计目前北京市场二手房交易的平均价格,制定相应的营销策略,某房地产中介公司某年第四季度的二手房交易中,随机抽取40个交易作为样本,得到二手房交易价格如下表所示(单位:万元)。 4852.436458019.94460.53339.52158.17236.6514973

21、.516654810237.542.84836.52746.233.5415658.53940.535.422.54150.83834.243根据上述数据如何估计总体的平均价格?如果需要进一步推断房屋款项在43万元以上的交易占全部交易的比例,应当如何分析呢?均值是未知的总体随机样本我有 95% 的把握认为 在40和50之间.均值 = 45.54X置信区间样本统计量(点估计)置信下界置信上界总体参数落在某区间内的概率1. 未知总体参数所在的区间称为置信区间;2. 未知总体参数落在区间内的概率为 (1,称为置信水平/置信度;3. 未知总体参数不落在区间内的概率 ,称为显著性水平;4. 置信水平通常

22、取值 99%, 95%, 90% 即显著性水平为0.01,0.05,0.1090% 样本95% 样本99% 样本x_nZXXZXX 2.581.6451.6452.58XXXXXX96. 196. 1 置信区间 影响区间宽度的因素: 1. 数据离散度 2. 样本容量 n 3. 置信水平 (1)(,)或 (,)XXXZXZXZXZnn 以总体均值的区间估计为例: 1. 确定置信水平 2. 根据置信水平,查标准正态分布表确定其 值;3. 实际抽样,并计算样本的均值 和抽样误差 ;4. 确定置信区间: 1/2zxxnZXXZX区间估计总体均值的区间估计总体比例的区间估计总体方差的区间估计两个总体均值

23、之差单一总体未知且小样本 1.假设 已知总体标准差 总体正态分布 如果不是正态, 可被正态分布逼近 (样本n 30) 2.置信区间/2/2-XZXZnn 沿用引例,假定房地产中介公司从上季度的二手房交易记录中得到以下信息:交易价格的标准差为15万元,于是我们假定总体标准差 =15。试在95%的置信水平下估计二手房平均价格的置信区间。4852.436458019.94460.53339.52158.17236.6514973.516654810237.542.84836.52746.233.5415658.53940.535.422.54150.83834.243 已知n=40, =15; 计算

24、得到样本均值 由1- 0.950.95,查标准正态分布概率表得: 于是在95%的置信水平下的置信区间为: 即(40.89,50.19)。结果表明:在95%的置信水平下,二手房交易价格的置信区间为40.89万元50.19万元。1/45.55niixxn0.0251.96z/21545.54 1.9645.544.6540 xzn 1.假设 总体标准差未知 总体服从正态分布 2.用 t 分布 3.置信区间/2,1/2,1-nnSSX tX tnn Zt0t (df = 5)标准正态分布 t (自由度df = 11) 1. 当样本统计量被计算出以后可以自由改变的观测值数目 2. 举例: 3 个数之和

25、是 6 X1 = 1 (或其他数) X2 = 2 (或其他数) X3 = 3 (不能改变) Sum = 6 自由度df=n1=2 沿用引例,假定该房地产公司在某日随机抽取16位二手房购买者,得到二手房交易价格如下表所示(万元)。 根据以往交易情况得知:二手房交易价格服从正态分布,但总体方差未知。试在95%的置信水平下估计二手房交易平均价格的置信区间。 63.422.6554879.437.542.84836.52745.233.54136.230.549 已知n=16;计算得到样本均值 ; 样本标准差 s=14.175; 由1 0.950.95,查表得: 于是在95%的置信水平下的置信区间为:

26、 即(35.923,51.027)。 结果表明:在95%的置信水平下,二手房价格的置信区间为35.923万元51.027万元;即该公司可以有95%的把握认为,二手房交易价格介于35.923万元到51.027万元之间。 43.475x 0.05152.131t/214.17543.4752.13143.4757.55216sxtn区间估计总体均值的区间估计总体比例的区间估计总体方差的区间估计两个总体均值之差单一总体独立样本配对样本区间估计的内容区间估计的内容 独立样本(Independent sample):两个样本是从两个总体中独立地抽取的,即一个样本中的元素与另一个样本中的元素相互独立。 1

27、.大样本条件下 (1)在两个总体的方差 1 12 2和 2 22 2均已知的情况下, 两个总体均值之差的置信区间为:221212/212()xxznn 1.大样本条件下 (2)在两个总体的方差 1 12 2和 2 22 2均未知的情况下,可用两个样本的方差s s1 12 2和s s2 22 2代替。 这时,两个总体均值之差的置信区间为:221212/212()ssxxznn 沿用引例。从次年初开始,北京二手房交易价格急剧攀升。为对比次年第一季度与当年第四季度二手房平均价格的差异,该房地产中介公司从次年第一季度的交易中随机抽取36个,得到二手房交易价格如下表所示(单位:万元)。55.448.65

28、24982.47267.542.84836.57745.233.54136.539.23948.64842.83645804541.253.51055245.53158.17276.2514996 将以上数据和引例中当年第四季度二手房交易价格进行整理,得到 根据以上数据,试以95%置信水平估计次年第一季度与当年第四季度的二手房交易平均价格差值的置信区间。 当年第四季度次年第一季度样本容量4036样本均值(万元)45.5453.93样本标准差(万元)16.8717.84 由于两个样本相互独立,且均为大样本,因此两个样本的均值之差服从正态分布。 在95%置信水平下做出区间估计如下: 即(16.22

29、,0.56)。 结果表明:有95%的把握认为,总体平均价格的差异介于16.22万元0.56万元之间,即次年第一季度比当年第四季度的二手房平均交易价格显著上升。22221212/21216.8717.84()(45.5453.93) 1.964036 8.397.83 ssxxznn 2.小样本条件下 (1)当两个总体的方差均已知时,可用上式建立两个总体均值之差的置信区间 。(2)当两个总体的方差 1 12 2和 2 22 2均未知,且 1 12 2 2 22 2时,可用两个样本的方差s s1 12 2和s s2 22 2计算总体方差的合并估计量s sp p2 2 。221122212112pn

30、snssnn这时,两个样本均值之差经标准化后服从自由度为的t分布。两个总体均值之差的置信区间为:212/2121211()(2)()pxxtnnsnn 沿用引例。为对比北京市不同地区二手房交易价格的差异,该房地产中介公司从中关村和望京地区两个营业部某年第一季度的二手房交易中各抽取8个,得到二手房交易价格如下表所示: 假定两个地区的二手房交易价格服从正态分布,且方差相等。试以95%置信水平估计某年第一季度中关村和望京地区的二手房平均价格差值的置信区间。中关村75.2626486.87265.558103.5望京地区45.53158.17250.2514996 已知n=16,总体方差未知;计算得

31、由1- 0.95,0.95,88214查表得 于是在95%置信水平下的置信区间为22121273.375,56.6,229.81,385.77xxss0.05/2(14)2.145t212/2121211 ()(2)()11(73.37556.6)2.145307.79 ()8816.775 18.816pxxtnnsnn 即(2.041,35.591)。 结果表明:有95%的把握认为,总体平均交易价格的差异介于2.041万元到35.591万元之间。 本例中,所求置信区间包含0,说明我们没有足够的理由认为某年第一季度中关村地区和望京地区的二手房交易平均价格存在显著差异。 2.小样本条件下 (3

32、)当两个总体的方差12和22均未知,且1222时,如果两个总体都服从正态分布且两个样本的容量相等n1=n2,则可用下列公式建立两个总体均值之差的置信区间:221212/21212()(2)ssxxtnnnn 2.小样本条件下 (3)当两个总体的方差12和22均未知,且1222时,如果两个样本的容量不相等n1n2,则两个样本均值之差经标准化后近似服从自由度为d的t分布,两个总体均值之差的置信区间为:221212/212()( )dssxxtnn22212122222121212()()()11ssnnssnnnnd其中, 配对样本(Matched sample),即一个样本中的数据与另一个样本中

33、的数据相对应。 1. 大样本条件下,两个总体均值之差的置信区间为: 2. 小样本条件下,两个总体均值之差的置信区间为:_/ 2ddzn_/21dsdtnn其中,d-为各差值的均值;当总体标准差未知时,可以用样本差值的标准差替代 。 沿用引例。为比较分析北京市同一地区不同年份二手房价格的差异,该房地产中介公司从中关村地区当年第四季度的二手房交易中,抽取了8个交易;并根据次年当月市场行情,分别对这8个房源进行重新估价,得到二手房价格如下表所示(单位:万元)。 假定二手房价格服从正态分布,且方差相等。试以95%置信水平估计中关村地区次年第一季度和当年第四季度的二手房平均价格差值的置信区间。当年交易价

34、格55.2625466.84462.558103.5次年市场估价64.569.564.87850.272.165109差额-9.3-7.5-10.8-11.2-6.2-9.6-7-5.5 已知n=8,总体方差未知;计算得。 由1-0.95,查表得 于是按照上式,在95%置信水平下的置信区间为: 即(10.172,6.604)。 结果表明:有95%的把握认为,总体平均价格的差异介于10.17万元6.60万元之间。即认为中关村地区次年第一季度比当年第四季度的二手房平均价格有显著提高。1263.25,71.64,8.388,2.134dxxds 0.05/2(7)2.365t_/22.13418.3

35、882.3658.388 1.7848dsdtnn 区间估计总体均值的区间估计总体比例的区间估计总体方差的区间估计两个总体比例之差单一总体 1.假设 总体服从二项分布 可以用正态分布近似估计 n p 5 且 n (1 - p) 5 2.置信区间估计/21pppzn 1.假设 总体服从二项分布 可以用正态分布近似估计 n p1 5 且 n (1 - p1 ) 5; n p2 5 且 n (1 p2 ) 5 2.置信区间估计112212/21211ppppppznn 根据引例以及例3的数据,整理得出次年第一季度与当年第四季度交易价格在43万元以上的二手房交易数量及所占比例,试在95%置信水平下估计

36、这两个时期,交易价格在43万元以上的二手房交易所占比例的差值的置信区间。整理数据如下 :当年第四季度次年第一季度样本容量n403643万元以上的交易数量2025所占比例p50%69.44% 已知 在95%置信水平下的置信区间为: 即(41.04%,2.16%)。 结果表明:有95%的把握认为,两个年份价格在43万元以上的二手房交易所占比例的差异介于- 41.04 %到2.16%之间。本例中,所求置信区间包含0,说明我们没有足够的理由认为次年第一季度与当年第四季度价格在43万元以上的二手房交易所占比例存在显著差异。121240,36;50%,69.44%.nnpp112212/21211 50%

37、 (1 50%)69.44% (1 69.44%)(50%69.44%) 1.96403619.44%21.60% ppppppznn区间估计总体均值的区间估计总体比例的区间估计总体方差的区间估计 1.假设 总体服从正态分布 2.用 分布 3. 置信区间:222222/21/211nsns 沿用引例,假定二手房的交易价格服从正态分布。试在95%的置信水平下估计二手房交易价格方差的置信区间。 4852.436458019.94460.53339.52158.17236.6514973.516654810237.542.84836.52746.233.5415658.53940.535.422.5

38、4150.83834.243 计算得 由0.05 在95%置信水平下总体方差的置信区间为: 即(191.10,469.63);相应地,总体标准差的置信区间为(13.82,21.67)。 结果表明:有95%的把握认为,当年第四季度二手房交易价格的标准差介于13.82万元到21.67万元之间。 245.54,284.79;xs22221/20.975/20.02513923.65,13958.12nn240 1284.7940 1284.7958.1223.65 假定E (Error)是在一定置信水平下允许的误差范围,又称边际误差,于是有: 估计总体均值时: 估计总体比例时:/2Exzn不想样本规

39、模过大或者过小! /21Ezn 估计总体均值时: 估计总体比例时: 估计两个总体均值之差时: 估计两个总体比例之差时:22/22znE2/221znE222/212122znnE2/2112212211znnE 沿用引例,假定房地产中介公司想要估计当年第四季度二手房的平均交易价格。按照历史经验,总体标准差为15万元。试问:在95%的置信水平下,使二手房平均交易价格的误差范围小于5万元,样本容量应定为多少?4852.436458019.94460.53339.52158.17236.6514973.516654810237.542.84836.52746.233.5415658.53940.535.422.54150.83834.243 已知: 样本容量 即应抽取35个交易作为样本。 /215;5;10.95,1.96;Ez2222/2221.961534.57355znE作业: 请在国家统计局网站找2组相关数据(数据量可以不同),并完成如下分析:(1) 给出各组数据的特征值及其置信区间;(2) 分析二者之间是否存在显著差异;(3) 结合实际给出合理解释。 请将本次作业的word文档命名为“学号姓名(第3次作业)”发送至 (注:内容雷同的作业均为不合格)

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|