1、statistics高等学校应用型特色规划教材清华大学出版社第一节 变异指标的基本理论第二节 全距、分位差和平均差第三节 标准差和标准差系数【学习目标】通过本章的学习和习题演算,掌握变异指标的意义和作用;标准差和标准差系数的计算和应用。了解变异指标的分布特性;极差、平均差和四分位差的概念、计算公式和特点;分布的偏度与峰度。第四节 偏度和峰度第五节 变异指标的应用 第六章第六章 变异指标变异指标 一、离种趋势的涵义第六章第六章 变异指标变异指标第一节 变异指标的基本理论 二、变异指标的作用第六章第六章 变异指标变异指标第一节 变异指标的基本理论例如:某车间有两个生产小组,各有例如:某车间有两个生
2、产小组,各有7名名工人,各人日产量如下工人,各人日产量如下:甲组:甲组:20,40,60,70,80,100,120乙组:乙组:67,68,69,70,71,72,73件乙甲70XX第六章第六章 变异指标变异指标第一节 变异指标的基本理论第六章第六章 变异指标变异指标第一节 变异指标的基本理论供货计划完成百分比供货计划完成百分比(%)季度总供季度总供货计划执货计划执行结果行结果1月月2月月3月月钢钢厂厂甲甲厂厂100323434乙乙厂厂100203050【专栏61】国家统计局日前发布的报告称,与2005年的工资数据相比,2006年全国城镇单位在岗职工的年平均工资增加了2596元,日平均工资增加
3、了10.36元。(中国证券报3月26日)温家宝总理在十届全国人大五次会议记者招待会上曾说:“一个舰队决定它速度快慢的不是那个航行最快的船只,而是那个最慢的船只。”同样,决定全国城镇单位在岗职工工资整体发展速度的是广大低收入者的增长情况。别把平均指标看得过重别把平均指标看得过重 第六章第六章 变异指标变异指标【专栏61】目前,虽然过去15年中,中国居民工资性收入稳步增长,但收入差距的扩大,已成为工资分配中的突出问题。1月31日,国家发改委官方网站公布系列收入分配报告显示,19902005年,城乡居民的工资性收入在居民总收入中所占的比重从45.3%逐步提高到63.2%.但也就在这一时期,平均货币工
4、资收入最高最低行业之比由1.76 1扩大为4.88 1。如果我们不注重行业间的收入差距过大问题,不采取措施弥补这种差距,而是任其扩大,一味追求平均指标的增长,那就无助于“整个社会的生活状况”的改善,因为一个舰队的速度,取决于那个最慢的船只。别把平均指标看得过重别把平均指标看得过重 第六章第六章 变异指标变异指标第六章第六章 变异指标变异指标第一节 变异指标的基本理论二、变异指标的种类以标志值之间相互比较说明变异情况以标志值之间相互比较说明变异情况 以平均数为比较标准来说明标志的变异情况以平均数为比较标准来说明标志的变异情况 以正态分布为标准说明分配数列偏离情况的指标以正态分布为标准说明分配数列
5、偏离情况的指标 第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标minmaxXXR指所研究的数据中,最大值与最小值之差,指所研究的数据中,最大值与最小值之差,又称又称极差极差。第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标元310440750minmaxXXR第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标解:4080120109010110minmaxXXR第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标2.13QQDQ从变量数列中,剔除了一部分极端值后从变量数列中,剔除了一部分极端
6、值后计算的类似于极差的指标计算的类似于极差的指标。上四上四分位分位数数下四下四分位分位数数第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标NXXNXXXXDANiiN11是各个数据与其算术平均数的离差绝对是各个数据与其算术平均数的离差绝对值的算术平均数,用值的算术平均数,用 表示。表示。总体算术总体算术平均数平均数总体单总体单位总数位总数第第 个单位个单位的变量值的变量值i.AD第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标【例【例A A】某售货小组某售货小组5 5个人,某天的销售额分别为个人,某天的销售额分别为440440元、元、480480元、元、520520元、
7、元、600600元、元、750750元,求该售货小组销售额的平均差。元,求该售货小组销售额的平均差。元6.93546855587505584401NXXDANii元558527905750600520480440X第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标miimiiimmmffXXfffXXfXXDA11111总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数i第第 组的变量组的变量值或组中值值或组中值i第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标月工资月工资(元)(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下3
8、00400400500500600600700700800800900900以上以上250350450550650750850950208314382456305237 78 20合计合计2 000Xf第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标元95.52220001045900200020950208250X元95.13820006.27789320002095.52295020895.5222501ffXXDAmii第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标第二节 全距、分位差和平均差 第六章第六章 变异指标变异指标100XDAVDA第三节 标准差和标准
9、差系数第六章第六章 变异指标变异指标NXXNii21 简单标准差简单标准差是各个数据与其算术平均数的离差平方的是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用算术平均数的开平方根,用 来表示;标来表示;标准差的平方又叫作方差,用准差的平方又叫作方差,用 来表示。来表示。2总体单总体单位总数位总数第第 个单位个单位的变量值的变量值i总体算术总体算术平均数平均数第三节 标准差和标准差系数第六章第六章 变异指标变异指标元558527905750600520480440X元62.10956008055587505584402221NXXNii第三节 标准差和标准差系数第六章第六章 变异指标
10、变异指标miiimiiffXX121总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数i第第 组的变量组的变量值或组中值值或组中值i第三节 标准差和标准差系数第六章第六章 变异指标变异指标月工资(元)月工资(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上250350450550650750850950 208 314 382 456 305 237 78 20合计合计2 000第三节 标准差和标准差系数第六章第六章 变异指标变异指标元95.5222000104590
11、0200020950208250X元9.167200001.5638659520002095.52295020895.52225022(比较:其工资的平均差为(比较:其工资的平均差为138.95元)元)第三节 标准差和标准差系数第六章第六章 变异指标变异指标33222cbacba第三节 标准差和标准差系数第六章第六章 变异指标变异指标 22XX 22NXNX22fXfffX变量值平方变量值平方的平均数的平均数变量值平均变量值平均数的平方数的平方第三节 标准差和标准差系数第六章第六章 变异指标变异指标kg500大象kg5.0免子kgx3500大象kgx5.2免子可比可比第三节 标准差和标准差系数
12、第六章第六章 变异指标变异指标身高的差异水平:身高的差异水平:cmcm体重的差异水平:体重的差异水平:kgkg用用变异系数变异系数可以相互比较可以相互比较身高身高x体重体重x可可比比第三节 标准差和标准差系数第六章第六章 变异指标变异指标100XV第三节 标准差和标准差系数第六章第六章 变异指标变异指标02.19100826.15100111XV47.19100768.14100222XV21VV第三节 标准差和标准差系数第六章第六章 变异指标变异指标为研究是非标志总体的数量特征,令为研究是非标志总体的数量特征,令0N1NN第三节 标准差和标准差系数第六章第六章 变异指标变异指标具有某种标志表
13、现的具有某种标志表现的单位数所占的成数单位数所占的成数NNP1不具有某种标志表现不具有某种标志表现的单位数所占的成数的单位数所占的成数NNQ010101NNNNNNNNNQP且有第三节 标准差和标准差系数第六章第六章 变异指标变异指标PNNNNNfXfXP10101PQPQPQQPPQNNNPNPffXXp22010212201)(第三节 标准差和标准差系数第六章第六章 变异指标变异指标25.05.02max时,有当QPPPPQ12PQPPPPPXVPP11第三节 标准差和标准差系数第六章第六章 变异指标变异指标218.0)95.01(95.095.0540020954003802038040
14、00101PQPXNNQNNPNNNpP所以有:,则件,件,件,己知概概 念念 计计 算算 特特 点点数列中最大值数列中最大值与最小值之差与最小值之差1极差极差 (R)R=最大值最大值-最小值最小值优点:容易理解,优点:容易理解,计算方便计算方便缺点:不能反映全缺点:不能反映全部数据分布状况部数据分布状况2平均差平均差 (A.D)各标志值与各标志值与均值离差绝均值离差绝对值的算术对值的算术平均平均iiffiXXDAnXXDAi简单:简单:加权:加权:优点:反映全部优点:反映全部数据分布状况数据分布状况缺点:取绝对值缺点:取绝对值,数字上数字上 不尽合理不尽合理第六章第六章 变异指标变异指标概概
15、 念念 计计 算算 特特 点点各标志值与均各标志值与均值离差平方的值离差平方的平均。平均。方差的平方根方差的平方根(取正根)(取正根)3方差方差(2)和和 标准差标准差()优点:反映全部优点:反映全部数据分布状况,数据分布状况,数字上合理。数字上合理。缺点:受计量单缺点:受计量单位和平均水平影位和平均水平影响,不便于比较响,不便于比较4标准标准差系差系 数数(V)标准差与均值标准差与均值之商,是无量之商,是无量纲的系数纲的系数简单:简单:加权:加权:优点:适宜不同优点:适宜不同数据集的比较数据集的比较缺点:对数据结缺点:对数据结构变化反应不灵构变化反应不灵敏敏ffXX22nXXi22XV2第六
16、章第六章 变异指标变异指标分布的矩分布的矩1.矩的基本形式矩的基本形式naxwnikik1第第i个个变量变量常数常数fiiniikikffaxw11权数权数第六章第六章 变异指标变异指标第六章第六章 变异指标变异指标第四节 偏度与峰度原点矩原点矩中心矩中心矩nxnikik1niiniikikffx11nxxnikik1niiniiikffxx112未分组资料未分组资料分组资料分组资料未分组资料未分组资料分组资料分组资料第六章第六章 变异指标变异指标MoxMox Mox MoMoMoxxx(对称分布对称分布)正偏态分布正偏态分布(右)(右)负偏态分布负偏态分布(左)左)1.平均数与众数比较法平均
17、数与众数比较法第六章第六章 变异指标变异指标2.矩法矩法 (m3三阶中心矩三阶中心矩)定义定义M=(X-A)k/n为变量为变量X关于关于A的的k阶矩阶矩。当当A=0,即以原点为中心,上式称为,即以原点为中心,上式称为“K阶原点矩阶原点矩”。K=1,2,3时,有:时,有:一阶原点矩一阶原点矩1=(X-0)1/n=X/n二阶原点矩二阶原点矩2=(X-0)2/n=X2/n三阶原点矩三阶原点矩3=(X-0)3/n=X3/n33第六章第六章 变异指标变异指标2.矩法矩法 当当A=,即以,即以 为中心,上式称为为中心,上式称为“K阶中心矩阶中心矩”。xxK=1,2,3时,有:时,有:0/)(11nXXnX
18、X/)(22nXX/)(33第六章第六章 变异指标变异指标K=1,2,3时,有:时,有:0/)(11nXXnXX/)(22nXX/)(33nXX33)(所以,所以,3可以测定偏度。为消除量纲,转变为可以测定偏度。为消除量纲,转变为系数,再除以系数,再除以3。33偏度系数0正偏态正偏态第六章第六章 变异指标变异指标测定分布的偏度测定分布的偏度2Q(对称分布对称分布)正偏态分布正偏态分布(右)(右)负偏态分布负偏态分布(左)左)3.分位数法分位数法3Q1Q2Q3Q1Q3Q2Q1Q第六章第六章 变异指标变异指标3.分位数法分位数法 DQQQQQ.1223由上页图可知,当公布为对称时,中位数与上、下由
19、上页图可知,当公布为对称时,中位数与上、下四分位数的距离相等地;当分布为正偏时,中位数四分位数的距离相等地;当分布为正偏时,中位数与上四分位数的距离大于它与下四分位数的距离;与上四分位数的距离大于它与下四分位数的距离;当分布为负偏时,中位数与上四分位数的距离小于当分布为负偏时,中位数与上四分位数的距离小于它与下四分位数的距离,因此,中位数与上、下四它与下四分位数的距离,因此,中位数与上、下四分位数的距离之差可以反映偏斜方向。分位数的距离之差可以反映偏斜方向。第六章第六章 变异指标变异指标测定分布的偏度测定分布的偏度3.分位数法分位数法0 分布为正偏分布为正偏0 分布为负偏分布为负偏=0 分布为
20、对称分布为对称优点:优点:可以排除极端值的干扰可以排除极端值的干扰缺点:缺点:由于从分布中剔除了两端各四分之一由于从分布中剔除了两端各四分之一的数据,故只能反映中间半数总体单位的分的数据,故只能反映中间半数总体单位的分布形态特征。为减少数据损失,可采用更高布形态特征。为减少数据损失,可采用更高程度的分位数,按类似方式定义偏度指标程度的分位数,按类似方式定义偏度指标。第六章第六章 变异指标变异指标1.矩法矩法4442233测定分布的峰度测定分布的峰度0 分布为高峰度的分布为高峰度的0 分布为低峰度的分布为低峰度的=0 分布为正态峰度的分布为正态峰度的第六章第六章 变异指标变异指标第六章第六章 变
21、异指标变异指标2.分位数法分位数法1913DDQQ1913526.0DDQQ观察表明,此式计算的结观察表明,此式计算的结果数值越小,分布图形越果数值越小,分布图形越陡峭;反之,数值越大,陡峭;反之,数值越大,分布图形越平坦。且在理分布图形越平坦。且在理论上可证明,对于正态分论上可证明,对于正态分布,这样计算的结果总是布,这样计算的结果总是0.526,故可定义相应的,故可定义相应的峰度指标为:峰度指标为:第五节 变异指标的应用2.总方差与组方差相结合总方差与组方差相结合 3.偏度、峰度与公差相结合偏度、峰度与公差相结合 1.平均指标与变异指标相结合平均指标与变异指标相结合第六章第六章 变异指标变
22、异指标本章小结:(1)平均指标描述的是总体的集中趋势,而标志变异指标描述的是总体的离中趋势。它们从两方面来反映总体的分布特征。其作用首先是衡量平均指标代表性大小的一种尺度,其次还可以反映社会经济活动过程的均衡性与协调性。(2)全距、四分位差、平均差与标准差在反映标志变异程度方面各有优缺点。方差()和标准差()是应用最广的标志变异指标。标准差与标准差系数是反映标志差异程度的主要指标。它比前面介绍的其它指标都科学。标准差就是标志值与其算术平均数离差的平方的算术平均数的平方根。第六章第六章 变异指标变异指标本章小结:(3)为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。标准差系数
23、是标准差与其算术平均数之比,它既消除了变量数列水平的影响,是反映标志差异程度方面目前最科学的统计指标之一。(4)要掌握是非标志的平均数与标准差的计算。是非标志的最大值是0.25。第六章第六章 变异指标变异指标复习思考题1.如何理解标志变异指标是衡量平均数代表性大小的尺度?2.全距、平均差和标准差各有什么特点?3.为什么说标准差是各种标志变异指标中最常用的指标?4.什么是标准差系数,计算标准差系数有何意义?5.标志变异指标与平均数有何关系?6.在何种情况下,只需计算标准差而不必计算标志变异系数,就可以比较出不同资料的平均数代表性的大小,为什么?7.某售货小组5人某天的销售额分别为440元、480
24、元、520元、600元、750元。试计算全距。第六章第六章 变异指标变异指标复习思考题 第六章第六章 变异指标变异指标8.已知某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的平均差。9.某车间有两个小组,每组都是6个工人,各人日产量件数如下:第一组:20,40,60,80,100,120第二组:67,68,69,71,72,73试计算其平均差。复习思考题 第六章第六章 变异指标变异指标10.某校统计学专业统计学成绩如下表,计算其平均差。成绩分组学生人数(人)f组中值(元)x60以下6070708080909010041224645565
25、758595合计50-复习思考题 第六章第六章 变异指标变异指标11.某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。计算下表中某公司职工月工资的标准差。月工资(元)组中值(元)X职工人数(人)f300以下25020830040035031440050045038250060055045660070065030570080075023780090085078900以上95020复习思考题 第六章第六章 变异指标变异指标12.甲、乙两单位人数及月工资资料如下:月工资(元)甲单位人数(人)乙单位人数比重()400以下40060060080060010001000以上425841262828304218合 计267100根据上表资料:(1)比较甲乙两单位哪个单位工资水平高;(2)说明哪个单位工资更具有代表性。复习思考题 第六章第六章 变异指标变异指标%25,600Vx450,202xx360,3622x174%,2.172xV13.根据平均数和标准差的关系。,则标准差为多少?,则标准差系数为多少?,则平均数为多少?,则平均数为多少?1.设2.设3.设4.设
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。