第四章平均指标和变异指标课件.pptx

上传人(卖家):晟晟文业 文档编号:4959198 上传时间:2023-01-28 格式:PPTX 页数:81 大小:1.56MB
下载 相关 举报
第四章平均指标和变异指标课件.pptx_第1页
第1页 / 共81页
第四章平均指标和变异指标课件.pptx_第2页
第2页 / 共81页
第四章平均指标和变异指标课件.pptx_第3页
第3页 / 共81页
第四章平均指标和变异指标课件.pptx_第4页
第4页 / 共81页
第四章平均指标和变异指标课件.pptx_第5页
第5页 / 共81页
点击查看更多>>
资源描述

1、1统统 计计 学学 原原 理理第四章第四章平均指标与变异指标平均指标与变异指标2第一节第一节 平均指标的概念和作用平均指标的概念和作用一、平均指标的概念3二、平均指标的作用二、平均指标的作用(一)可以了解总体次数分布的集中趋势(二)可以对若干同类现象在不同单位、地区间进行比较研究(三)可以研究某一总体某种数值的平均水平在时间上的变化,说明总体的发展过程和趋势(四)可以分析现象之间的依存关系(五)平均指标可作为某些科学预测、决策和某些推算的依据4第二节第二节 平均指标平均指标5应用条件:资料未分组,各组出现的次数应用条件:资料未分组,各组出现的次数都是都是1 1。5 5名学生的学习成绩分别为:名

2、学生的学习成绩分别为:7575、9191、6464、5353、8282。则平均成绩为:。则平均成绩为:分分平平均均成成绩绩73536558253649075 一、算术平均数一、算术平均数(mean)61231ninixxxxxxnn_xxn一、算术平均数一、算术平均数(mean)7按家庭人口数分组按家庭人口数分组(人)人)家庭数家庭数 12345 50150300200100 合计合计 800 某村某村800个家庭人口数个家庭人口数根据以下资料计算某村平均家庭人口数?根据以下资料计算某村平均家庭人口数?8(Weighted mean)根据单项数列计算加权算术平均数根据单项数列计算加权算术平均数

3、112233111niinninniiiix fx fx fx fx fxff 9例:按日产量分组按日产量分组(件)(件)x x工人数(人)工人数(人)f f 日产总日产总量量 xfxf 1414 2 2 2828 1515 4 4 6060 1616 8 8 128128 1717 5 5 8585 1818 1 1 1818 合计合计 2020 319319 件件平平均均日日产产量量1620319 10按日产量按日产量分组(公分组(公斤)斤)工人数工人数f f 组中值组中值x x 日产总日产总量量xfxf20302030 1010 2525 25025030403040 7070 3535

4、 2450245040504050 9090 4545 4150415050605060 3030 5555 16501650合合 计计 200200 84008400 公公斤斤平平均均日日产产量量422008400 11权数对均值的影响权数对均值的影响 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组:甲组:考试成绩(考试成绩(x):0 20 100 人数分布(人数分布(f):):1 1 8 乙组:乙组:考试成绩(考试成绩(x):0 20 100 人数分布(人数分布(f):):8 1 1)(82108100120101分甲nxxnii)(12101100120801分乙nxxni

5、i12在组距数列中,均值大小不仅受组中值大小的影响,也受权数的影响,因此()A.当组中值较大且权数较大时,均值接近组中值大的一方B.当组中值较小且权数较小时,均值接近组中值小的一方C.当组中值较大而权数较小时,均值接近组中值大的一方D.当组中值较小而权数较大时,均值接近组中值小的一方E.当各组的权数相同时,权数对均值的大小没有影响13是非标志是非标志 x x单位数单位数 f f比重比重 1 1 0 0 合合 计计 N N 1 10N1N ffpNN1 qNN0 111010niiiniix fxfNNNP是1495%xP153、算术平均数的数学性质、算术平均数的数学性质(1)算术平均数与标志值

6、个数的乘积等于各标志值的总和。简单算术平均数:加权算术平均数:niixxn1niiiniifxxf1116(2)各个标志值与其算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:niiniixxnxx110)(niniiniiiininiiiixffxfxxfxxf111110)(17(3)各标志值与算术平均数离差的平方和为最小值。niixx12min)(184、算术平均数特点、算术平均数特点 1)集中趋势的最常用测度值2)一组数据的均衡点所在3)易受极端值的影响4)用于数值型数据,不能用于定类数据和定序数据19二、调和平均数二、调和平均数1110202113()3里小时20 二、调和

7、平均数二、调和平均数1.简单调和平均数:标志值的倒数的算术平均数的倒数。nxxxHn111121niinxnxxxn121111121 菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买了一种蔬菜共3斤,每斤0.33元;中午降价时又用1元钱买了4斤,每斤0.25元;晚上削价处理又用1元钱买了5斤,每斤0.2元。试问蔬菜平均每斤多少钱?22速度速度 x x行走里行走里程程 m m所需时间所需时间 2020 1 1 1515 2 2 1010 3 3 合计合计 6 6)(小小时时里里xm201152103103152201 )(2912126103152201小小时时里里平平均均速速度度 23 2.

8、加权调和平均数加权调和平均数缺少总体单位数计算公式:niiiniinnnxmmxmxmxmmmmH11221121niiniiiniiiiniiiniiiniiffxxfxfxxmm11111124例班班 组组平均劳平均劳动生产动生产率率 x x实际实际工时工时 产品产产品产量量(件件)m m 一一 1010 100100 10001000 二二 1212 200200 24002400 三三 1515 300300 45004500 四四 20 20 300300 60006000 五五 3030 200200 60006000合计合计 11001100 1990019900 xm)(09.

9、18110019900)xm()m(工工时时件件车车间间实实际际工工时时车车间间产产品品产产量量平平均均劳劳动动生生产产率率 25三、几何平均数(geometric mean)123nnniGx x xxx312111231nniiniiinfffffffniiGx x xxx26车间车间投入量投入量产出量产出量合格率合格率%x%x 一一 10001000 800800 8080 二二 800800 720720 9090 三三 720720 504504 707033%450%70%90%80 三三个个车车间间平平均均合合格格率率10005047205048007201000800%70%9

10、0%80 27年份年份累计存款额累计存款额本利率本利率%第第1 1年年105%105%第第2 2年年105%105%第第3 3年年108%108%第第1010年年112%112%105%5000 xxx 2000%105%5%105%105xxx%108%105%8%105%105202020 xxx 23320%112%110%108%105x0 x28%77108%112%110%108%105102332 平平均均本本利利率率本利率本利率x x年数年数f f 105%105%2 2 108%108%3 3 110%110%3 3 112%112%2 2 合合 计计 1010平均年利率平均

11、年利率=8.77%=8.77%29三种平均数之间的关系三种平均数之间的关系HGX30四、众数四、众数(mode)1.定义:众数是指社会现象总体中最普遍出现的标志值。1)一组数据中出现次数最多的变量值2)适合于数据量较多时使用3)不受极端值的影响4)一组数据可能没有众数或有几个众数31众数众数(不惟一性不惟一性)无众数无众数原始数据:10 5 9 12 6 8322.众数的确定1)单项式分配数列:出现次数最多的标志值2)组距式分配数列:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。334、单项式数列、单项式数列不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频

12、数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计50110034按日产量分组(件按日产量分组(件)工人数(人)工人数(人)2020151521213030222220202323101021()oM件354)组距式数列确定众数的公式)组距式数列确定众数的公式下限公式:上限公式:ooooooooMMMMMMMModffffffLM)()(111ooooooooMMMMMMMModffffffUM)()(111 1ooMMff1ooMMffoM

13、foMoMLoMU36例:例:00000000)()(1110MMMMMMMMdfffffflM年人均纯收入(千元)年人均纯收入(千元)农户数(户)农户数(户)5 5以下以下2402405656480480676711001100787870070089893203209 9以上以上160160合计合计30003000)(6161)7001100()4801100(48011006千元农户年人均收入众数计算表农户年人均收入众数计算表37判断法则判断法则1、当众数相邻的两组次数相等时,则众数组的组中值就是众数;2、当众数组前一组的次数较多,后一组的次数较少时,则众数在众数组内靠近他的下限;3、当

14、众数组后一组次数较多,前一组的次数较少时,则众数在众数组内靠近他的上限。38 1 1、中位数的含义:、中位数的含义:将总体各单位按其标志值大小顺将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数。序排列起来居于中间位置的那个数。2 2、确定中位数的方法、确定中位数的方法(1 1)由未分组资料确定中位数)由未分组资料确定中位数 排序排序 找中间位置找中间位置39中位数?中位数?【例例】9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630

15、2000位位 置置:1 2 3 4 5 6 7 8 9521921n位置40中位数?中位数?【例例】:10个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位置位置:1 2 3 4 5 6 7 8 9 10 5.5211021n位置102021080960中位数411、未分组资料确定中位数的方法:将总体各单位的标志值按照大小顺序排列当总体单位数n为奇数时:当总体单位数n为偶数时:21nexm2122nnexxm42按日产量分按日产量分组(件)组(件)x x工人数(人工人数(人)f f累计次数累计次数向上累计向上累计向下累计

16、向下累计2020101010108080222215152525707024243030555555552626252580802525合计合计808043定序数据的中位数定序数据的中位数甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计30044计算公式计算公式12()eeeefMeMMMsMLdf下 限 公 式12()eeeefMeMMMsMUdf上 限 公 式45年人均

17、纯收年人均纯收入(千元)入(千元)农户数(户农户数(户)向上累向上累计次数计次数5 5以下以下2402402402405656480480720720676711001100182018207878700700252025208989320320284028409 9以上以上16016030003000合计合计300030003 0 0 07 2 026167 1()1 1 0 0eM千 元(1)(1)计算累计次数计算累计次数(2)(2)确定中位数组确定中位数组(3)(3)根据中位数计算公式计根据中位数计算公式计算中位数算中位数3 0 0 01 5 0 022f中位数位次:中位数位次:462、

18、单项式分组资料确定中位数当 为奇数时:,当 为偶数时,eeeeMMMMedfSfLM12f21fexmf2122ffexxm3、组距式分组资料确定中位数下限公式:上限公式:eeeeMMMMedfSfUM1247六、众数、中位数和平均数的比较六、众数、中位数和平均数的比较 1、区别:1)三者的含义不相同;2)三者的计算(确定)方法不同;3)对数据的“灵敏度”和“概括能力”不同。482、联系:、联系:(1)三者都是作为反映总体一般水平(或集中趋势)的平均指标:(2)三者之间存在着一定的数量关系,A.在对称的正态分布条件下:算术平均数等于众数等于中位数:B.在非对称正态分布的情况下,众数、中位数和平

19、均数三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大。eoMMx 49eoxMM0eMMx0exMM 众数、中位数和算术平均数数量关系的经验众数、中位数和算术平均数数量关系的经验公式为:算术平均数和众数的距离约等于算术平公式为:算术平均数和众数的距离约等于算术平均数与中位数距离的三倍:均数与中位数距离的三倍:3()oexMxM50七、其他分位数七、其他分位数1、四分位数(quartile)1)能够将总体单位按标志值大小等分为四部分的三个数值。(排序)4)1(341ULnQnQ位置位置51(例题分析例题分析)甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类

20、别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 94 44 30 24132226270300合计合计30052数值型数据的四分位数数值型数据的四分位数【例例】:10个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9 10 25.84)110(375.24110UL位置位置QQ5.1532)15001630(25.015005.772)750780(75.0750ULQQ53数据类型

21、与集中趋势测度值数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型和所适用的集中趋势测度值数据类数据类型型定类数据定类数据 定序数据定序数据定距数据定距数据定比数据定比数据适适用用的的测测度度值值众数众数中位数中位数均值均值均值均值四分位数四分位数众数众数调和平均数调和平均数众数众数中位数中位数几何平均数几何平均数四分位数四分位数 中位数中位数四分位数四分位数众数众数54第三节第三节 分布的离中趋势分布的离中趋势一、变异指标的含义与作用1.定义:变异指标以平均数为中心,总体各单位标志值的差异大小范围或离差程度的指标。变异指标值越大,表明总体各单位标志的变异程度越大。2.作用:(1

22、)衡量平均指标的代表性。(2)研究总体标志值分布偏离正态的情况。(3)进行抽样推断等统计分析的一个基本指标。55二、极差(全距)二、极差(全距)(range)1、一组数据的最大值与最小值之差2、易受极端值影响3、未考虑数据的分布例:例:5名学生的成绩为名学生的成绩为50、69、76、88、97。56分位差 1)剔除了部分极端值计算的类似于极差的指标。2)内四分位间距:QR=Q3-Q1 3)四分位差:QD=(Q3-Q1)/257三、平均差三、平均差标志值与其算术平均数离差平均值。实质:以 算术平均数为中心,各标志值距平均数的平均距离。nxxDAnii1|.ffxxDAnii1|.58第一组第二组

23、XX-|X-|XX-|X-|20-404050-101025-353551-9930-303052-8835-252553-7750-101056-44701010600075151562228525257111119030307212121206060731313合计280合计76xxxx59(variance and standard deviation)21()niixxn221()niixxn211()niiiniixxff2211()niiiniixxff60例:求产量的标准差例:求产量的标准差日产量(件)日产量(件)20209 922221 123230 024241 126269

24、 9合计合计202023()x 件202()5件2)xx(2204()5件61练习:练习:42()x 公 斤日产量(日产量(公斤)公斤)工人数工人数f f组中值组中值x x2030203010102525288028803040304070703535343034304050405090904545810810506050603030555550705070合合 计计2002001219012190f)xx(2 1219020060 957 81()公斤21219020060 95()公斤62即:即:222()xx222yxb63标志值标志值x x单位数单位数f f1 10 0合计合计N N2

25、210(1)(1)PNP NNPP是2(1)PP是1N0N12N)P1(02N)P0(f)xx(2 642(1)95%(195%)47.5%PP(1)95%(195%)21.79%PP65五、变异系数五、变异系数(coefficient of variation)1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为xvs66变异系数变异系数某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x21234

26、567817022039043048065095010008.112.518.022.026.540.064.069.0【例例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度67变异系数变异系数)(19.309)(25.53611万元万元x)(09.23)(5215.3222万元万元x68东方制造公司和西京自来水公司股票的报酬率东方制造公司和西京自来水公司股票的报酬率及其概率分布情况详见下表,试计算两家公司及其概率分布情况详见下表,试计算两家公司的风险性大小。的风险性大小。东方制造公司和西京自来水公司股票报酬率的概率分布东方制造公司和西京自来水公司股票报

27、酬率的概率分布经济情况该种经济情况发生的概率(pi)报酬率(Ki)西京自来水公司东方制造公司繁荣0.204070一般0.602020衰退0.200-3069比较两个公司职工的平均工资水平哪个更均衡。比较两个公司职工的平均工资水平哪个更均衡。月工资额(元)月工资额(元)甲公司人数甲公司人数 乙公司人数乙公司人数 1000以下以下10001500150020002000以上以上 1020155 5102510 合合 计计 50 50 练习:练习:7011nkiikniixff 一阶E(X)=二阶 E(X2)=x2x71x11()nkikikniixxfvfix7233iiiXXff737444ii

28、XXff75761997年年农村居民家庭纯收入数据农村居民家庭纯收入数据按纯收入分组(百元)按纯收入分组(百元)户数比重(户数比重(%)5以下以下5101015152020252530303535404045455050以上以上2.2812.4520.3519.5214.9310.356.564.132.681.814.9477农村居民家庭纯收入数据偏态及峰度计算表农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组按纯收入分组(百元)(百元)组中值组中值Xi户数比重户数比重(%)Fi(Xi-X)3Fi(Xi-X)4Fi5以下以下510101515202025253030353540404545

29、5050以上以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计合计1001689.2572521.25781133113321.4291689.250.9561766.7339112.0

30、89KiiiiiiXXFXFN(百元)429.2111KiiiKiiFFXX(百元)089.1211KiiiKiiFFX4247 2 5 2 1.2 53.411 2.0 8 9iiiXXff79(从直方图上观察从直方图上观察)按纯收入分组按纯收入分组(元元)p 经常不断地学习,你就什么都知道。你知道得越多,你就越有力量p Study Constantly,And You Will Know Everything.The More You Know,The More Powerful You Will Be写在最后Thank You在别人的演说中思考,在自己的故事里成长Thinking In Other PeopleS Speeches,Growing Up In Your Own Story讲师:XXXXXX XX年XX月XX日

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第四章平均指标和变异指标课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|