《应用统计基础(第3版)》课件第四章统计指标.ppt

上传人(卖家):momomo 文档编号:5049336 上传时间:2023-02-06 格式:PPT 页数:91 大小:2.39MB
下载 相关 举报
《应用统计基础(第3版)》课件第四章统计指标.ppt_第1页
第1页 / 共91页
《应用统计基础(第3版)》课件第四章统计指标.ppt_第2页
第2页 / 共91页
《应用统计基础(第3版)》课件第四章统计指标.ppt_第3页
第3页 / 共91页
《应用统计基础(第3版)》课件第四章统计指标.ppt_第4页
第4页 / 共91页
《应用统计基础(第3版)》课件第四章统计指标.ppt_第5页
第5页 / 共91页
点击查看更多>>
资源描述

1、 第四章第四章统统 计计 指指 标标 密苏里州,圣路易斯密苏里州,圣路易斯 华盛顿大学医疗中心的华盛顿大学医疗中心的BarnesBarnes医院,建于医院,建于19141914年,是为圣路易斯及其邻近地区的居民提年,是为圣路易斯及其邻近地区的居民提供医疗服务的主要医院,该医院被公认为美国供医疗服务的主要医院,该医院被公认为美国最好的医院之一。最好的医院之一。BarnesBarnes医院有一个收容计划,医院有一个收容计划,用以帮助身患绝症的人及其家人提高生活质量。用以帮助身患绝症的人及其家人提高生活质量。负责收容工作的小组包括一名主治医师、一名负责收容工作的小组包括一名主治医师、一名助理医师、护

2、士长、家庭护士和临床护士、家助理医师、护士长、家庭护士和临床护士、家庭健康服务人员、社会工作者、牧师、营养师、庭健康服务人员、社会工作者、牧师、营养师、经过培圳的志愿者以及提供必要的其他辅助经过培圳的志愿者以及提供必要的其他辅助服务的专业人员。通过收容工作组的共同努力,服务的专业人员。通过收容工作组的共同努力,家人及其家庭会获得必要的指导和支持,以帮家人及其家庭会获得必要的指导和支持,以帮助他们克服由于疾病、隔离和死亡而带来的紧助他们克服由于疾病、隔离和死亡而带来的紧张情绪。张情绪。在收容工作组的协作和管理上,采用每月报告在收容工作组的协作和管理上,采用每月报告和季度总结来帮助小组成员回顾过去

3、的服务。和季度总结来帮助小组成员回顾过去的服务。对于工作数据的统计概括则用作方针措施的规对于工作数据的统计概括则用作方针措施的规划和执行的基础。划和执行的基础。比如,他们搜集了有关病人被工作组收容的比如,他们搜集了有关病人被工作组收容的时间的数据。一个含有时间的数据。一个含有6767个病人记录的样本表个病人记录的样本表明,病人被收容的时间在明,病人被收容的时间在1 1185185天内变化。频数天内变化。频数分布表的使用对于概括总结收容天数的数据也分布表的使用对于概括总结收容天数的数据也是很有用的。此外,下面的描述统计学数值量是很有用的。此外,下面的描述统计学数值量度也被用于提供有关收容时间数据

4、的有价值的度也被用于提供有关收容时间数据的有价值的信息,信息,平均数:平均数:35.735.7天天 中位数:中位数:1717天天 众众 数:数:1 1天天 对以上数据进行解释,表明了平均数即对病人对以上数据进行解释,表明了平均数即对病人的平均收容时间是的平均收容时间是35.735.7天,也就是天,也就是1 1个月多个月多点。点。而中位数则表明半数病人的收容时间在而中位数则表明半数病人的收容时间在1717天以天以下,半数病人的收容时间在下,半数病人的收容时间在1717天以上。众数是天以上。众数是发生频数最多的数据值。众数为发生频数最多的数据值。众数为1 1天表明许多病天表明许多病人仅仅被收容了短

5、短的人仅仅被收容了短短的1 1天。天。有关该收容计划的其他统计汇总还包括住院有关该收容计划的其他统计汇总还包括住院费金额、病人在家时间与在医院时间的对比、费金额、病人在家时间与在医院时间的对比、痊愈出院的病人数目、病人在家死亡和在医院痊愈出院的病人数目、病人在家死亡和在医院死亡的数目。这些汇总结果将根据病人的年龄死亡的数目。这些汇总结果将根据病人的年龄和医疗普及程度的不同进行分析。总之,描述和医疗普及程度的不同进行分析。总之,描述统计学为收容服务提供了有价值的信息。统计学为收容服务提供了有价值的信息。第一节第一节 总量指标总量指标一、总量指标的概念 总量指标是反映现象总体在一定时间、地点、条件

6、下的总规模和总水平的综合指标,也称为绝对指标或绝对数。二、作用:1.反映一个国家的基本国情和国力,反映某部门、单位等人、财、物的基本数据。2.实行社会经济管理的基本依据。3.计算相对指标、平均指标以及各种分析指标的基础。三、总量指标的种类(一)按其所反映的内容不同、总体单位总量指标:反映总体中单位数多少的。、总体标志总量指标:是反映总体中某种数量标志值总和的。(二)按其所反映的时间状况不同、时期指标:反映现象在某一段时期内的总量。、时点指标:反映现象在某一时刻上的总量。时期指标与时点指标的特点时期指标反映现象在某一时期发展过程的总数量,例如一定时期的产品产量、产值、商品销售量、工资总额等。时点

7、指标反映现象在某一时刻(瞬间)上状况的总量,例如人口数、企业数、商品库存数、流动金额数等等。不同的特点:时期指标 时点指标从指标取得的方式看:通过连续计数加总取得;通过在某一时点上间断计数;是否具有可加性:可以相加,相加有意义;不可以相加相加无意义;指标数值的大小是否与时间长短有关指标数值的大小受时期长短的制约,时期越长,数值越大。指标数值的大小与时点间的间隔长短无直接关系。(三)按计量单位的不同(三)按计量单位的不同、实物量指标、实物量指标、价值量指标、价值量指标、劳动量指标、劳动量指标 返回返回实物单位实物单位自然单位自然单位度量衡单位度量衡单位标准实物单位标准实物单位双重或多重单位双重或

8、多重单位复合单位复合单位 第二节第二节 相对指标相对指标 第二节 相对指标一、概念:又称相对数,是用对比的方法反映某些相关事物之间数量 联系程度的指标。二、作用:1.是运用对比分析的方法,可说明事物发生和发展的程度、结构、比例和效益,有助于鉴别和分析事物。2.能使一些不能直接对比的事物找出共同比较的基础。3.是进行计划管理和考核企业经济活动效果的工具。三、表现形式:1.无名数:1)系数和倍数:将对比的基数抽象化为1的数值。2)成数:将对比的基数抽象化为10的数值。3)百分数:将对比的基数抽象化为100的数值。4)千分数:将对比的基数抽象化为1000的数值。2.有名数:将对比的分子、分母的计量单

9、位结合使用的复名数。(一)计划完成程度相对数1、概念:又称计划完成百分比,是用来检查计划执行情况的相对指标,通常用%表示。2、计算公式:%100计划数实际完成数计划完成程度相对数%10011月份计划数月份实际完成数一月份计划完成程度%10061全年计划数月累计完成数上半年计划完成进度%100431全年计划数季度预计季累计完成数全年计划预计完成程度实际应用:(1)检查本期计划完成程度。例如,(2)检查计划完成进度。例如,(3)计划预期完成情况。例如,四、种类以相对数计算计划完成相对数在经济管理中,有时计划任务是用提高或降低的百分数来规定的。比如,某企业计划规定劳动生产率提高10%,实际提高了5%

10、;某企业计划规定单位产品成本降低6%,实际降低了6%;这时应如何求劳动生产率提高和单位产品成本降低计划的完成程度?此时,应以实际完成的百分数与计划完成的百分数对比来计算。公式为:%100计划完成百分数实际完成百分数计划完成相对指标%10011计划提高率实际提高率计划完成相对指标%10011计划降低率实际降低率计划完成相对指标越小越好的指标:越大越好的指标:可分为越大越好的指标与越小越好的指标两种情况,注意在这两种情况下,分析超额完成任务的方法不同。某企业计划劳动生产率今年比去年提高10%,实际提高了15%。计划完成相对指标为 (正指标)某企业计划某种产品成本今年比去年降低5%,实际降低了6%。

11、计划完成相对指标为 (逆指标)%5.104%110%115%95.98%95%94 100%为超额为超额完成任务完成任务100%为超额为超额完成任务完成任务检查长期计划完成情况的两种方法1制定长期计划任务有两种方法:水平法:规定计划末期应达到的水平;累计法:规定全期应完成的累计总数。因此,检查长期计划完成情况也有两种方法。(1)水平法%100平计划规定末期应达到水计划末期实际达到水平计划完成程度相对数计算提前完成任务的时间,是根据计划期内连续一年时间的指标与计划规定最后一年的指标相对比来确定的。即:计划期内有连续一年时间的指标达到计划规定最后一年的指标水平,往后余下的时间,即为提前完成计划的时

12、间。案例“九五”计划规定某种产品达到年产45万吨的水平,实际在计划最后一年即2000年实际完成50万吨,那么,%1.111%1004550计划完成程度第一年第二年第三年第四年第五年上半年下半年一二三四一二三四产量3032171910101112 12 12 13 1345万吨万吨提前提前9个月个月假如此产品在五年内实际完成情况如下:检查长期计划完成情况的两种方法2(2)累计法%100计划全期规定的累计数计划全期累计实际完成计划完成程度%1.109%10022002400计划完成程度假如此项计划实际至第五年6月底为止,累计实际完成2200亿元,即提前半年完成计划。例如,某五年计划的基本建设投资总

13、额2200亿元,五年内累计实际完成2400亿元,则:适用条件水平法:一般当现象在各年度之间呈现递增或递减趋势较明显的情况下采用。如产品产量、产品成本等。累计法:当计划任务是以计划期全期累计应达到的水平下达的,检查计划执行情况用累计法。(二)结构相对数1、概念:利用分组法,将总体区分为不同性质的各部分,以各组数值对总体总数值计算得到的比重或比率。2、计算公式:%100总体总数值总体各组数值结构相对数199519961997199819992000第一产业20.520.419.118.617.715.9第二产业48.849.550.049.349.450.9第三产业30.730.130.932.1

14、32.933.23、作用:说明总体内部的构成情况,从而揭示现象的性质和特征。通过各构成部分在不同时期的变化,说明现象的发展过程和规律性。例如,我国三次产业构成 单位:%(三)比例相对数1、概念:是同一总体内不同组成部分的指标数值对比的结果,用来表明总体内部的比例关系。2、表示方法:可以用百分数来表示,也可以用比例的形式来表示。3、计算公式:总体中另一部分数值总体中某部分数值比例相对数 4、作用:1.说明同一总体内各部分的比例关系。2.用来分析研究国民经济中各种比例关系。(四)比较相对数1、概念:是将同一时期两个同类现象数值对比,说明同类现象在不同条件下的数量对比关系。2、计算公式:%100数值

15、另一条件下的同类指标值某条件下的某类指标数比较相对数3、应用方法:1.作为比较基数的分母可取不同的对象。1)比较对象是一般对象此时分子与分母可以互换。2)比较对象典型化此时分子与分母的位置不能互换。2.可以用总量指标对比,也可以用相对指标或平均指标对比。4、作用:1.进行类比分析。说明同一时期两个同类现象在不同(国家、地区、单位)条件下的数量对比关系。2.计算比较标准典型化的比较相对数,可以找出差距,为提高企业生产与管理水平提供依据。(五)强度相对数1、概念:是两个性质不同、但有联系的不同总体总量之比,说明现象的强度、密度或普遍程度。2、计算公式:的总量指标数值另一有联系而性质不同某一总量指标

16、数值强度相对数 千人个人个人口数商店数商业网点密度/510000005000个人个人商店数人口数商业网点密度/20050001000000指标数值越大,网点密度越小。逆指标:指标数值越大,网点密度越大。正指标:3、作用:1.反映和考核社会经济效益。例如,流通费用率、资金利润率、资金产出率等。2.为编制计划和长远规划提供依据。3.说明一个国家、地区、部门的经济实力或为社会服务的能力。例如,人均钢产量、人均GDP、每万人拥有的病床数、商业网点密度等。4、正逆指标:某些反映为社会服务能力及经济效益的指标分子与分母可以互换,有正、逆指标之分。例如,(六)动态相对数1、概念:同一现象在不同时间的两个数值

17、之比。计算结果用百分数或倍数表示。2、计算公式:%100基期水平报告期水平动态相对数3、作用:说明现象在不同时间上的发展速度与规律性。正确运用相对指标的原则1.注意两个对比指标的可比性。1)在经济内容上要具有内在联系;2)在总体范围及指标口径上要求一致或相适应;3)注意计算方法、计算价格的可比。2.正确选择对比的基数。原因是:1)不同的对比基数说明的问题不同;2)基数选择不当,会得出绝然相反的结论。3.和总量指标结合运用计算:增长1%的绝对值 例:我国钢产量 1949年 1950年 1978年 1979年 15.8万吨 61万吨 3178万吨 3448万吨 比上年增长量 45.2万吨 270万

18、吨 比上年增长百分比 286%8.5%100增长速度增长量 增长1%的绝对值 =0.16万吨 =31.8吨4、多种相对指标结合运用多指标结合运用多指标结合运用结构相对数结构相对数比例相对数比例相对数比较相对数比较相对数动态相对数动态相对数计划完成相对数计划完成相对数强度相对数强度相对数部分与总体关系部分与总体关系部分与部分关系部分与部分关系横向对比关系横向对比关系纵向对比关系纵向对比关系实际与计划关系实际与计划关系关联指标间关系关联指标间关系相对指标应当结合总量指标使用,多种相对指标应当结合运用。1998年相对于1997年,美国的GDP增长速度为3.9,同期中国GDP增长速度为7.8,恰好为美

19、国的2倍;但根据同期汇率(1美元兑换8.3元人民币),1998年中国GDP总量约合9671亿美元,约相当于同期美国GDP总量84272亿美元的1/9。第三节第三节 平均指标平均指标 平均指标是对频数(频率)分布平均指标是对频数(频率)分布资料的集中状况、集中程度和平均资料的集中状况、集中程度和平均水平的综合测度,是进一步统计分水平的综合测度,是进一步统计分析的重要依据。析的重要依据。一、平均指标的涵义一、平均指标的涵义 依据各种平均指标的具体代表意义和依据各种平均指标的具体代表意义和计算方式的不同,可以分为一般一般平均计算方式的不同,可以分为一般一般平均数和位置平均数两大类。数和位置平均数两大

20、类。1 1、一般平均数有平均数有:算术平均数、算术平均数、调调和平均数、和平均数、几何平均数几何平均数 2 2、位置平均数:众数、中位数、位置平均数:众数、中位数二、平均指标的分类二、平均指标的分类 位置平均数是根据数据集中处于特殊位置位置平均数是根据数据集中处于特殊位置的个别单位或部分单位的数据来确定的代表值,的个别单位或部分单位的数据来确定的代表值,因此某些数据的变动,不一定会影响到位置平均因此某些数据的变动,不一定会影响到位置平均数的水平,尽管如此,位置平均数对于整个数据数的水平,尽管如此,位置平均数对于整个数据集仍具有非常直观的代表性。集仍具有非常直观的代表性。常用的位置平均数有常用的

21、位置平均数有:众数众数(定类数据集中趋势的测度定类数据集中趋势的测度)、中位数中位数(定序数据集中趋势的测度定序数据集中趋势的测度)、其他分位数其他分位数(定序数据集中趋势的测度定序数据集中趋势的测度)等等.三、算术平均数、中位数和众数三、算术平均数、中位数和众数(一)算术平均数(均值)(一)算术平均数(均值)(Mean)(Average)Mean)(Average)在刻画数据的在刻画数据的“平均平均”特性的特征值中,最普特性的特征值中,最普遍最常用的是算术平均数,在统计上称为均值。遍最常用的是算术平均数,在统计上称为均值。有有简单平均数和加权平均数之分。简单平均数和加权平均数之分。计算公式:

22、计算公式:简单算术平均数:简单算术平均数:加权算术平均数:加权算术平均数:1 1、简单算术、简单算术平均数平均数(例题分析例题分析)例例 某公司某公司9 9名部门经理的月收入名部门经理的月收入(单位:元)为:(单位:元)为:25002500,30003000,26502650,29002900,34303430,33103310,29002900,28752875,27602760。求月收入的样本均值。求月收入的样本均值。2 2、加权算术平均数、加权算术平均数 (例题分析例题分析)某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组组中值组中值(xi)频数频数(fi)x

23、i fi 140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 9001175合计合计12022200加权平均数加权平均数(权数对均值的影响权数对均值的影响)甲乙两组各有甲乙两组各有1010名学生,他们的考试成绩及其名学生,他们的考试成绩及其分布数据如下分布数据如下甲组:甲组:考试成绩(考试成绩(x x):0 20 100 0 20 100 人数分布(人数分布(f

24、f):):1 1 81 1 8乙组:乙组:考试成绩(考试成绩(x x):0 20 100 0 20 100 人数分布(人数分布(f f):):8 1 18 1 1 如果数据的不同类型对均值的贡献不同,那么在计算平均数时就应对每一种类型的数据赋予与其重要性成比例的权重,这样计算的平均数称为加权平均数。一般,若 且 ,则 称为“权”。加权算术平均公式为:加权算术平均公式为:0,21 nwww1iwnwww,21 iniiwxwx1 例例:3:3个销售科的人员预测明年对本厂产品个销售科的人员预测明年对本厂产品需求量,三人经验不一样,因此预测量不需求量,三人经验不一样,因此预测量不一样,经验丰富的在预

25、测量中占的份额大一样,经验丰富的在预测量中占的份额大一点,设三人权的比例为一点,设三人权的比例为4 4:2 2:1 1,预测,预测量分别为量分别为900900,10001000,12001200,求平均预测量。,求平均预测量。课堂练习:课堂练习:1 1、下表为英国、下表为英国19991999年某地第一季度雇员失去工作年某地第一季度雇员失去工作天数统计,计算雇员失去工作的平均天数。天数统计,计算雇员失去工作的平均天数。天数(天数(x x)雇员数(雇员数(f f)xfxf累计频数(累计频数(F F)0 04104100 04104101 14304304304308408402 229029058

26、0580113011303 3180180540540131013104 4110110440440142014205 5202010010014401440合计合计1440144020902090-2 2、某食品店中顾客购买食品消费情况统计如下,计、某食品店中顾客购买食品消费情况统计如下,计算顾客购买食品的平均消费额。算顾客购买食品的平均消费额。消费额(元)消费额(元)人数(人数(f f)组中值组中值(x)(x)xfxf552 22.52.55 5(5 5,10106 67.57.54545(1010,15158 812.512.5100100(1515,2020121217.517.521

27、0210(2020,303010102525250250(3030,40404 4353514014040402 245459090合计合计4444-8408401、一组数据按照大小排序后处于中间位置上的值一组数据按照大小排序后处于中间位置上的值不受极端值的影响不受极端值的影响3 3、主要用于顺序数据,也可用数值型数据,但不、主要用于顺序数据,也可用数值型数据,但不能用于分类数据能用于分类数据(二)中位数(二)中位数(Median)(Median)中位数中位数(位置和数值的确定位置和数值的确定)数值确定数值确定 先将数据按从小到大的顺序重排,然后根先将数据按从小到大的顺序重排,然后根据以下公式

28、计算中位数。据以下公式计算中位数。数值型数据的中位数数值型数据的中位数 (9(9个数据的算例个数据的算例)【例例】:9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9中位数中位数 1080数值型数据的中位数数值型数据的中位数 (10(10个数据的算例个数据的算例)【例例】:10个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630

29、 2000位位 置置:1 2 3 4 5 6 7 8 9 10 例:例:中位数为第中位数为第40 40 名和名和4141名日产量的平均值名日产量的平均值 按日产量分按日产量分组(件)组(件)x x工人数工人数(人)(人)f f累计次数累计次数向上累计向上累计向下累计向下累计2020101010108080222215152525707024243030555555552626252580802525合计合计8080)(2422424件件 数值型数据的中位数数值型数据的中位数 (例题分析例题分析)(dfslmeeeemm1m2fme下限公式下限公式 )(dfsumeeeemm1m2fme上限公式

30、上限公式 对于组距数列的数据,首先要确定中对于组距数列的数据,首先要确定中位数所在的组,然后通过公式计算中位数位数所在的组,然后通过公式计算中位数的近似值。的近似值。计算公式为:计算公式为:数值型数据的中位数数值型数据的中位数 (例题分析例题分析)举例:举例:年人均纯年人均纯收入(千收入(千元)元)农户数农户数(户)(户)向上累向上累计次数计次数5 5以下以下2402402402405656480480720720676711001100182018207878700700252025208989320320284028409 9以上以上16016030003000合计合计30003000)(

31、71611100720230006千元千元 em(1)(1)计算累计次数计算累计次数(2)(2)确定中位数组确定中位数组(67)(67)(3)(3)确定中位数数值确定中位数数值1500-720=780(1500-720=780(户户)6 X 7 6 X 7 1 780 1100 1 780 11001500230002 fem1100 11100 1780 X780 X 定序数据的中位数定序数据的中位数 (例题分析例题分析)甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般

32、一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300课堂练习:60处地点100元价值货物的年底价值列表数据。年底价值年底价值地点数地点数(f)(f)累计频数累计频数80 8580 85)1 11 185 9085 90)4 45 590 9590 95)3 38 895 10095 100)6 61414100 105100 105)7 72121105 110105 110)10103131110 115110 115)14144545115 120115 120)7 75252120 125120 125)4 45656125 1301

33、25 130)2 25858 130 135 130 135)1 15959135 140135 140)0 05959140 145140 145)1 160601 1、一组数据中出现次数最多的变量值、一组数据中出现次数最多的变量值2 2、适合于数据量较多时使用、适合于数据量较多时使用3 3、不受极端值的影响、不受极端值的影响4 4、一组数据可能没有众数或有几个众数、一组数据可能没有众数或有几个众数5 5、主要用于分类数据,也可用于顺序数据、主要用于分类数据,也可用于顺序数据和数值型数据和数值型数据(三)众数(三)众数(Mode)Mode)众数众数(不惟一性不惟一性)原始数据原始数据:10

34、5 9 12 6 8原始数据原始数据:原始数据原始数据:定类数据的众数定类数据的众数 (例题分析例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1511 9 6 90.300.220.180.120.183022181218合计合计501100解:这里的变量为解:这里的变量为“饮饮料品牌料品牌”,这是个分类,这是个分类变量,不同类型的饮料变量,不同类型的饮料就是变量值就是变量值 所调查的所调查的50人中,人中,购买可口可乐的人数最购买可口可乐的人数最多,

35、为多,为15人,占被调查人,占被调查总人数的总人数的30%,因此众,因此众数为数为“可口可乐可口可乐”这一这一品牌,即品牌,即 Mo可口可乐可口可乐定序数据的众数定序数据的众数 (例题分析例题分析)解:这里的数据为顺解:这里的数据为顺序数据。变量为序数据。变量为“回回答类别答类别”甲城市中对住房甲城市中对住房表示不满意的户数最表示不满意的户数最多,为多,为108108户,因此户,因此众数为众数为“不满意不满意”这这一类别,即一类别,即 M Mo o不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非

36、常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510合计合计300100.0例:下表是关于交通事故的统计资料,忽略交通例:下表是关于交通事故的统计资料,忽略交通事故的等级,事故的频数统计如下事故的等级,事故的频数统计如下:事故次数事故次数0 01 12 23 344天数天数3 35 52 22 21 1数值型数据的众数数值型数据的众数 (例题分析例题分析)Mo1次次数值型数据的众数数值型数据的众数 (例题分析例题分析)对于组距数列的数据,首先要确定众数所在的组,对于组距数列的数据,首先要确定众数所在的组,然后通过公式计算众数的

37、近似值。然后通过公式计算众数的近似值。计算公式为:计算公式为:(推导过程见下页)(推导过程见下页)其中:其中:l l、u u表示众数所在区间的下、上限值表示众数所在区间的下、上限值 d d表示众数所在区间的组距表示众数所在区间的组距 f fm m表示众数所在区间的组频数表示众数所在区间的组频数 f fm+1m+1表示众数所在区间的后一个区间的组频数表示众数所在区间的后一个区间的组频数 f fm-1m-1表示众数所在区间的前一个区间的组频数表示众数所在区间的前一个区间的组频数 )(d)ff()ff(ffum00000000m1mm1mm1mmm0上上限限公公式式 )(d)ff()ff(fflm0

38、0000000m1mm1mm1mmm0下下限限公公式式 众数与相邻两组的关系示意图众数与相邻两组的关系示意图 根据上述关系,可以利用相似三角形推导出组距分配数列的众数的计算公式。举例举例:年人均纯收年人均纯收入(千元)入(千元)农户数农户数(户)(户)5 5以下以下2402405 56 64804806 67 7110011007 78 87007008 89 93203209 9以上以上160160合计合计30003000(1)确定众数组)确定众数组 (67)(2)计算众数)计算众数)(6161)7001100()4801100(480110060千千元元 m众数、中位数和平均数的比较1 1

39、、算术平均数的特点:、算术平均数的特点:(1 1)是就全部数据计算的,具有优良的数)是就全部数据计算的,具有优良的数学性质,实际中应用最为广泛。学性质,实际中应用最为广泛。(2 2)易受极端值的影响。)易受极端值的影响。应用:应用:当数据的分布比较有规则时,即不存在当数据的分布比较有规则时,即不存在极端值,数据对中心的偏离程度和偏斜程度极端值,数据对中心的偏离程度和偏斜程度都不大的情况下,用均值代表分布的中心比都不大的情况下,用均值代表分布的中心比较好。较好。2 2、中位数的特点:、中位数的特点:(1 1)不受极端值的影响。)不受极端值的影响。(2 2)具有计算简便,意义明显的优点。)具有计算

40、简便,意义明显的优点。(3 3)没有利用数据中的所有信息。)没有利用数据中的所有信息。应用:应用:(1 1)用于对定序数据的概括性度量。)用于对定序数据的概括性度量。(2 2)用于对数据中有极端值,且分布比较均)用于对数据中有极端值,且分布比较均匀的数值型数据的概括性度量。匀的数值型数据的概括性度量。3 3、众数的特点、众数的特点 (1 1)众数不受极端值的影响。)众数不受极端值的影响。(2 2)当频数分布无明显集中趋势时,不存在众数。)当频数分布无明显集中趋势时,不存在众数。(3 3)只利用数据集中很少的信息,而且还具)只利用数据集中很少的信息,而且还具有不惟一性。一组数据可能有众数,也可能

41、没有不惟一性。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数。有众数;可能有一个众数,也可能有多个众数。应用:应用:(1 1)用于对定类数据的概括性度量。)用于对定类数据的概括性度量。(2 2)用于对数据中有极端值,且分布具有明显集中趋)用于对数据中有极端值,且分布具有明显集中趋势的数值型数据的概括性度量。势的数值型数据的概括性度量。第四节第四节 变异指标变异指标月月份份 A A B B C C 1 1 2 2 3 3 1 11 10 00 0 1 13 30 00 0 1 12 20 00 0 2 20 00 0 3 30 00 00 0 4 40 00 0 1 16

42、60 00 0 1 12 20 00 0 8 80 00 0 一、变异指标的涵义一、变异指标的涵义 变异指标又称为变动度,是描述统计数据差变异指标又称为变动度,是描述统计数据差异程度或离散程度的指标。异程度或离散程度的指标。二、变异指标的作用二、变异指标的作用 1.1.变异指标是衡量平均指标代表性的尺度。变异指标是衡量平均指标代表性的尺度。2.2.变异指标是反映活动过程均衡性和稳定性变异指标是反映活动过程均衡性和稳定性的重要指标。的重要指标。3.3.变异指标还可以研究频数分布偏离正态的变异指标还可以研究频数分布偏离正态的情况。情况。三、变异指标 三、变异指标(一)绝对数形式 1、全距 2、平均

43、差 3、标准差 4、适用条件(二)相对数形式(三)定类数据的变异指标(四)定序数据的变异指标(一)绝对数形式的变异指标(一)绝对数形式的变异指标 1 1、全距(、全距(R R)公式:公式:R=R=最大值最大值最小值最小值 举例:举例:5 5名学生的成绩为名学生的成绩为5050、6969、7676、8888、97 97 则则R=97-R=97-50=4750=47 优点:计算简便优点:计算简便 缺点:全距是关于数据离散程度表达的一个很粗糙的缺点:全距是关于数据离散程度表达的一个很粗糙的量,仅仅取决于两个极端值的水平,不能反映其间的量,仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,受极端

44、值的影响过于显著,不符合稳变量分布情况,受极端值的影响过于显著,不符合稳健性和耐抗性的要求。全距有许多特殊的应用,如质健性和耐抗性的要求。全距有许多特殊的应用,如质量控制图中的极差图,提供证券市场行情等。量控制图中的极差图,提供证券市场行情等。2 2、平均差(、平均差(A.D)A.D)(1 1)简单平均差)简单平均差 公式:公式:应用条件:资料未分组。应用条件:资料未分组。举例:举例:5 5名工人日产量资料名工人日产量资料 nxxDA 日产量日产量(件件)20203 322221 123230 024241 126263 3合计合计8 8xx)(2352624232220 x件件 )(6158

45、DA件件 (2 2)加权平均差)加权平均差公式:公式:应用条件:资料经过分组,各组次数不同。应用条件:资料经过分组,各组次数不同。举例:前例,举例:前例,ffxxDA按日产量分按日产量分组(公斤)组(公斤)工人工人数数f f组中组中值值x x2020303010102525170170303040407070353549049040405050909045452702705050606030305555390390合合 计计20020013201320)(42x公斤公斤 fxx 公公斤斤)(662001320DA (3 3)平均差的优缺点)平均差的优缺点优点:平均差是根据全部数值计算的,受优点

46、:平均差是根据全部数值计算的,受 极端值影响较全距小。极端值影响较全距小。缺点:由于采取绝对值的方法消除离差的缺点:由于采取绝对值的方法消除离差的 正负号,应用较少。正负号,应用较少。3 3、标准差(、标准差()标准差是测定数据离散程度的最常用的方法。标标准差是测定数据离散程度的最常用的方法。标准差广泛应用于相关与回归分析、抽样推断、统计预准差广泛应用于相关与回归分析、抽样推断、统计预测等各方面。测等各方面。(1 1)简单标准差)简单标准差 公式:公式:应用条件:资料未分组应用条件:资料未分组.举例:前例,举例:前例,n)xx(2 日产量(件)日产量(件)20209 922221 123230

47、 024241 126269 9合计合计20202)xx()(23x件件)(2520件件 (2 2)加权标准差)加权标准差 公式:公式:应用条件:资料经过分组。应用条件:资料经过分组。举例:前例,举例:前例,ff)xx(2)(42x公斤公斤 日产量日产量(公斤)(公斤)工人数工人数f f组中值组中值x x2020303010102525288028803030404070703535343034304040505090904545810810505060603030555550705070合合 计计2002001219012190f)xx(2)(817956020012190公斤公斤 4 4、

48、绝对数形式变异指标的适用条件、绝对数形式变异指标的适用条件 当两个或多个数列的平均水平相等时当两个或多个数列的平均水平相等时,对比数列标志值间的变异程度及平均水平的对比数列标志值间的变异程度及平均水平的代表性代表性,用绝对数形式的变异指标。指标值用绝对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。性越不好;反之亦然。(二二)相对数形式的变异指标相对数形式的变异指标 公式:有全距系数、平均差系数和标准差系数,公式:有全距系数、平均差系数和标准差系数,应用最广泛的是标准差系数,其公式为:应用最广泛的是标准差系数,其公式为:举

49、例:举例:甲组日产量(件)为甲组日产量(件)为:60 65 70 75 80:60 65 70 75 80。乙组日产量(台)为:乙组日产量(台)为:2 5 7 9 122 5 7 9 12。%100 xv 从而对于不同平均水平或不同计量单从而对于不同平均水平或不同计量单位的两组数据,不能通过直接比较方差或位的两组数据,不能通过直接比较方差或标准差来表明数据离散程度的大小。为消标准差来表明数据离散程度的大小。为消除平均水平与计量单位的影响,需要计算除平均水平与计量单位的影响,需要计算离散系数。离散系数。组别组别平均数平均数标准差标准差标准差系数标准差系数%甲甲7070(件)(件)7.07(7.0

50、7(件件)10.110.1乙乙7 7(台)(台)3.41(3.41(台台)48.748.7相对数形式变异指标的适用条件相对数形式变异指标的适用条件 当两个或多个数列的平均水平不等时当两个或多个数列的平均水平不等时,对比数列标志值间的变异程度及平均水平对比数列标志值间的变异程度及平均水平的代表性的代表性,用相对数形式的变异指标。指用相对数形式的变异指标。指标值越大,说明变异程度越大,平均水平标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。的代表性越不好;反之亦然。1 1、某食品店中顾客购买食品消费情况统计:某食品店中顾客购买食品消费情况统计:消费额(元)消费额(元)人数(人数(f)

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(《应用统计基础(第3版)》课件第四章统计指标.ppt)为本站会员(momomo)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|