统计学计算题复习课件.ppt

上传人(卖家):晟晟文业 文档编号:4316490 上传时间:2022-11-29 格式:PPT 页数:82 大小:2.28MB
下载 相关 举报
统计学计算题复习课件.ppt_第1页
第1页 / 共82页
统计学计算题复习课件.ppt_第2页
第2页 / 共82页
统计学计算题复习课件.ppt_第3页
第3页 / 共82页
统计学计算题复习课件.ppt_第4页
第4页 / 共82页
统计学计算题复习课件.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

1、众数的确定众数的确定 (分组数据)(分组数据)众数=25众数的确定众数的确定 (分组数据)(分组数据)组距组距频数频数10 14515 19720 241225 291830 342235 391640 441045 498 众数为众数为31.5Line 1Line 2Line 3众数的确定众数的确定 (分组数据)(分组数据)L众数组的真实下限值 d1众数组频数-众数组前一组频数 d2众数组频数-众数组后一组频数 i 每组数据的组距个数5.310.25.29)5(6445.295,61622,41822,5.29:21211MoiddLthusidddLMo中位数中位数 (位置的确定位置的确定

2、)奇数个数的数据奇数个数的数据:偶数个数的数据:偶数个数的数据:中位数的确定(分组数据)中位数的确定(分组数据)根据位置公式确定中位数所在的组采用下列近似公式计算:L 中位数组的真实组下限的值N 整组数据的总数量Sm-1 中位数组为止以上的累积频数fm 中位数组的频数i 组距的个数月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50ifSNLMmme12 件75.4934006003210250400eM简单平均数简单平均数 (Simple Mean)设一组数据为:设一组

3、数据为:X X1 1,X X2 2,XnXn 适用于总体资料未经分组整理、尚为原始资料的情况 总体均值总体均值 样本均值样本均值 式中:,为均值;N N(n n)为总体(样本)单位总数;XiXi为第i i个单位的变量值。X算术平均数的计算方法算术平均数的计算方法 案例分析案例分析 4.10某售货小组某售货小组5 5个人,某天的销售额分别为个人,某天的销售额分别为520520元、元、600600元、元、480480元、元、750750元、元、440440元,则元,则平均每人日销售额为:平均每人日销售额为:元13955440750480600520nXX加权平均数加权平均数 (Weighted M

4、ean)设一组数据为:设一组数据为:x x1 1,x x2 2,xnxn相应的频数为:相应的频数为:f f1 1,f f2 2,fkfk适用于总体资料经过分组整理形成变量数列的情况总体均值总体均值样本均值样本均值 (未分组未分组)公式中:为均值;f为相应频数;XiXi为第i i个单位的变量值。X加权平均数的计算方法加权平均数的计算方法案例分析案例分析 4.11 某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800Xf计算该企业该日全部工人的平均日产量。计算该企业该日全部

5、工人的平均日产量。加权平均数的计算方法加权平均数的计算方法案例分析案例分析 4.11 若上述资料为分组数列,则应取各组的若上述资料为分组数列,则应取各组的组中值组中值作为该作为该组的代表值用于计算;此时求得的算术平均数只是其组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。真值的近似值。简单平均数与加权平均数简单平均数与加权平均数(Simple Mean/Weighted Mean)设一组数据为:设一组数据为:x1,x2,xn各组的组中值为各组的组中值为:M1,M2,Mk 相应的频数为:相应的频数为:f1,f2,fk简单平均数简单平均数加权平均数加权平均数(分组数据分组数据)表示各组

6、的变量值变量值(分组数列的组中值组中值);表示各组变量值出现的频数(即权数权数)。iMif例:例:根据某电脑公司在各市场上销售量的分根据某电脑公司在各市场上销售量的分组数据,计算电脑销售量的均值。组数据,计算电脑销售量的均值。按销售量分组(台)按销售量分组(台)组中值组中值(Mi)市场个数市场个数(fi)Mi fi 140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 580139526404725370033152050172

7、0 9001175合计合计fi 120Mi fi 22200122 200185()120kiiiM fXn台样本样本方差和标准差方差和标准差(Sample Variance and Standard Deviation)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式注意:注意:样本方差用自样本方差用自由度由度n-1去除去除!样本标准差样本标准差 例题分析例题分析 4.18某电脑公司销售量数据平均差计算表某电脑公司销售量数据平均差计算表 按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)1401501501601601

8、70170180180190190200200210210220220230230240145155165175185195205215225235491627201710845160090040010001004009001600250064008100640027000170040007200640012500合计合计1205540018512022200fmfx样本标准差样本标准差 例题分析例题分析 4.18结论结论:每一天的销售量与平均数相比,平均相差21.58台练习题练习题 4.1 某百货公司6月份各天的销售额数据如下(单位:万元):(1)计算该百货公司日销售额的均值、中位数和四分位

9、数;(2)计算日销售额的标准差。解答解答 4.1 均值:均值:中位数中位数:位置为第15位和第16位 四分位数四分位数:中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1第15个数据的中间位置(第8位)靠上四分之一的位置上后四分位数位于第16第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273。标准差:21.17)(1.274308223万元nxx)(5.2722273272万元Me)(55.2614272273201万元Q)(75.2904272273291万元Q练习题练习题 4.2 在某地区抽取的120家企业按利润

10、额进行分组,结果如下:计算120家企业利润额的均值和标准差。解答解答 4.2 各组平均利润为 x,企业数为f,则组总利润为xf,由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:均值:67.42612051200fxfx解答解答 4.2 标准差:2()1ixxff2()1ixxff48.1161120668.16146661)(2fxmfs一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值均值比例比例方差方差总体总体均值均值的区间估计的区间估计(大样本大样本n 30)1.假定条件总体服从正态分布,且方差()已已知知如果不是正态分布

11、,可由正态分布来近似(n 30)2.使用正态分布统计量 z2.总体均值 在1-置信水平下的置信区间为总体均值的区间估计总体均值的区间估计 例题分析例题分析 6.2一家食品生产企业以生产袋装食品为主,为对食品质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.51

12、02.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体均值的区间估计总体均值的区间估计 例题分析例题分析 6.2解:解:已知N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:。由于是正态总体,且方差已知。总体均值在1-置信水平下的置信区间为 因此:食品平均重量的置信区间为101.44g109.28g总体均值的区间估计总体均值的区间估计 例题分析例题分析 6.3一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄(单位:周岁)数据如下表。试建立投保人年龄90%的置信区间。36

13、个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计总体均值的区间估计 例题分析例题分析 6.3解:解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:,总体均值在1-置信水平下的置信区间为因此:在置信水平为90%的情况下,投保人平均年龄的置信区间为37.37岁41.63岁。总体总体均值均值的区间估计的区间估计(小样本小样本)1.假定条件总体服从正态正态分布,但方差()未知未知小样本(n 1020 =0.05 n=16 临界值临

14、界值(s):检验统计量检验统计量:因为 Z0.05=1.645,2.41.645在 =0.05的水平上,拒绝H0有证据表明这批灯泡的使用寿命有显著提高。决策决策:结论结论:Z0拒绝域拒绝域0.052 未知大样本均值的检验未知大样本均值的检验 (例题分析例题分析 7.3)H0:1200 H1:1200 =0.05 n=100 临界值临界值(s):检验统计量检验统计量:因为 Z0.05=1.645,1.51.645在 =0.05的水平上,不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时。决策决策:结论结论:Z0拒绝域拒绝域0.052 未知小样本均值的检验未知小样本均值的检验 (例题分析例

15、题分析 7.4)H0:=5 H1:5 =0.05 df=10-1=9 临界值临界值(s):检验统计量检验统计量:因为 t0.025=2.262,3.162.262在 =0.05的水平上拒绝H0说明该机器的性能不好。决策:决策:结论:结论:t02.262-2.262.025拒绝拒绝 H0拒绝拒绝 H0.025均值的单侧均值的单侧t 检验检验 (计算结果计算结果)H0:40000 H1:40000 =0.05 df=20-1=19 临界值临界值(s):检验统计量检验统计量:因为 t0.05=1.729,0.8941.729在=0.05的水平上不拒绝H0不能认为制造商的产品同他所说的标准不相符。决策

16、决策:结论结论:t0拒绝域拒绝域0.05总体比例的检验总体比例的检验 (例题分析例题分析 7.6)H0:=14.7%H1:14.7%=0.05 n=400 临界值临界值(s):检验统计量检验统计量:因为 Z0.025=1.96,-0.254-1.96在=0.05的水平上不拒绝H0该市老年人口比重为14.7%.决策决策:结论结论:Z01.96-1.96.025拒绝拒绝 H0拒绝拒绝 H0.025方差的卡方方差的卡方(2)检验检验(例题分析例题分析 7.7)H0:2=1 H1:2 1 =0.05 df=25-1=24 临界值临界值(s):统计量统计量:在 =0.05的水平上不拒绝H0不能认为该机器

17、的性能未达到设计要求 20 /2=.05决策决策:结论结论:用置信区间进行检验用置信区间进行检验 (例题分析例题分析 7.8)H0:=1000 H1:1000 =0.05 n=16 临界值临界值(s):置信区间为置信区间为决策决策:结论结论:假设的0=1000在置信区间内,不拒绝H0不能认为这批产品的包装重量不合格。01.96-1.96.025拒绝拒绝 H0拒绝拒绝 H0.025练习题练习题 7.1 液晶显示屏批量生产的质量标准为平均使用寿命35000小时。某厂商宣称其生产的液晶显示屏的使用寿命远远超过规定标准。现从该厂商生产的一批液晶显示屏中随机抽取了100件样本进行验证,测得平均使用寿命为

18、35250小时,标准差为1380小时,试在(=0.05)的显著性水平下检验该厂商生产的液晶显示屏是否显著的高于规定标准?练习题练习题 7.2 某制盐企业用机器包装食盐,假设每袋食盐的净重量服从正态分布,每袋标准净重量为500克。某天开工后,为检验机器工作是否正常,从包装好的食盐中随机抽取了9袋,测得平均净重量为499克,样本标准差为16.03克,试在(=0.05)的显著性水平下检验这天包装机工作是否正常?练习题练习题 7.3 某公司计划为每一位员工配股,董事会估计配股方案在全体员工内的支持率为80%。现随机抽查100名员工,其中支持配股方案的有76人。试在(=0.05)的显著性水平下检验董事会

19、的估计是否可靠?练习题练习题 7.4解答解答 7.1解答解答 7.2解答解答 7.3解答解答 7.4方差分析方差分析练习题练习题 8.1 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到如下表:1)完成方差分析表 2)若显著性水平为=0.05,检验三种方法组装的产品数量之间是否有显著差异。练习题练习题 8.2 从三个总体中各抽取容量不同的样本数据,得到下表。检验3个总体的均值之间是否有显著差异.(=0.01)练习题练习题 8.3 某家电制造公司准备购进一批5#电池,现有

20、A,B,C三个电池生产企业愿意供货,为此比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得出其寿命(小时)数据如下表。试分析三个企业生产的电池的平均寿命之间有无差异。(=0.05)如果有差异,用LSD方法建议哪些企业之间有差异。解答解答 8.1 F=1.478F0.05(2,27)=3.354 131 所以不拒绝原假设,表明不认为三种方法组装的产品之间有显著差异。P值也可以直接用来进行统计决策,若P,则拒绝原假设,P,则不拒绝原假设。该题中P=0.245 946=0.05,因此不拒绝原假设H0。解答解答 8.2 F=4.6574F0.01(2,9)=8.0215 所以不拒绝原假设,

21、表明不认为三个总体均值之间有显著差异。P值也可以直接用来进行统计决策,若P,则拒绝原假设,P,则不拒绝原假设。该题中P=0.040877=0.01,因此不拒绝原假设H0。解答解答 8.3 F=17.0684F0.05(2,12)=3.88529 所以拒绝原假设,表明三个三个企业生产电池的寿命之间有显著差异。P值也可以直接用来进行统计决策,若P,则拒绝原假设,P,则不拒绝原假设。该题中P=0.00031=0.05,因此不拒绝原假设H0。解答解答 8.3第第1步:步:提出假设 检验1:检验2:检验3:解答解答 8.3第第2步:步:计算检验统计量检验1:检验2:检验3:第第3步:步:计算LSD检验1

22、:检验2:检验3解答解答 8.3第第4步:步:作出决策 A电池与B 电池寿命有显著差异 不认为A电池与C电池寿命有显著差异 B电池与C 电池寿命有显著差异回归回归练习题练习题 9.1 某汽车生产商欲了解广告费用x对销售量y的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源变差来源dfdfSSSSMSMSF FSignificance Significance F F回归回归2.17E-09残差残差220158.07-总计总计111642866.67-解答解答 9.1变差来源变差来源dfdfSSSSMSMSF FSignificance Significance F F回归回归11422708.61422708.664.62212.17E-09残差残差10220158.0722015.807总计总计111642866.67解:(2)由此可知,销售量与广告费用之间的相关系数是0.93。21422708.6086.60%1642866.67SSRRSST20.86600.93RR解答解答 9.1(3)估计的回归方程:回归系数 表示广告费用每增加一个单位,销售量平均增加1.420211个单位。(4)F=64.6221 ,所以这回归方程是显著的。363.6891 1.420211yx11.4202110.05(1,10)4.96F

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(统计学计算题复习课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|