分布的集中趋势.pptx

上传人(卖家):晟晟文业 文档编号:4463917 上传时间:2022-12-11 格式:PPTX 页数:46 大小:417.14KB
下载 相关 举报
分布的集中趋势.pptx_第1页
第1页 / 共46页
分布的集中趋势.pptx_第2页
第2页 / 共46页
分布的集中趋势.pptx_第3页
第3页 / 共46页
分布的集中趋势.pptx_第4页
第4页 / 共46页
分布的集中趋势.pptx_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、分布的集中趋势一、分布的集中趋势 集中趋势是对数据资料的集中状况和平均水平的综合测度。常用来表述数列集中趋势的测度有算术平均数、调和平均数(harmonic mean)、几何平均数、众数、中位数和分位数等。这些测度在统计学中也称为平均指标或平均数,可以用来反映标志值的典型水平和标志值分布的中心位置或集中趋势。一、分布的集中趋势 一、算术平均数 算术平均数是统计中最基本的、应用最广泛的一种平均数。一般不特别说明时,所说的“平均数”就是指算术平均数。一、分布的集中趋势 算术平均数的类型算术平均数的类型1.根据掌握资料的不同,算术平均数可分别采用简单算术平均数和加权算术平均数两种方法进行计算。一、分

2、布的集中趋势 (1)简单算术平均数。当掌握的资料是总体未经分组整理的资料时,应依据总体各个单位的具体资料来计算,即将总体各单位标志值简单加总除以总体单位数之和。其计算公式为一、分布的集中趋势 (2)加权算术平均数。如果掌握的资料已经过分组,且编成变量数列,那么应采用加权算术平均数来计算平均数。加权算术平均数是用各组的标志值乘以相应的各组单位数,求出各组标志总量,并加总得到总体标志总量,再除以总体单位总量所得。其计算公式为一、分布的集中趋势 此外,从上述表达式中可以看出,加权算术平均数受两个因素的影响:一是各组的标志值,二是各组的单位数或频率。当各组的标志值不变时,其出现的次数f对于平均数的大小

3、起着权衡轻重的作用,统计学称其为权数。当各组次数相等时,影响平均数的因素就只有一个,即各组的标志值,这时加权算术平均数就等于简单算术平均数。可见,简单算术平均数是加权算术平均数的特例。一、分布的集中趋势 【例4-2】某商场售货员的人数及工资资料见表4-1,求该商场售货员的月平均工资。表表4 4-1 1 某商场售货员的人数及工资资料某商场售货员的人数及工资资料 一、分布的集中趋势 由上述计算可以看出,不仅受变量值x大小的影响,而且受各组单位数或频率f大小的影响。由于各组单位数或频率f对x的水平高低起着一种权衡轻重的作用,因而把f称为权数。显然,权数大的标志值对平均数的影响要大些,权数小的标志值对

4、平均数的影响相应小些,所以算术平均数的最终计算结果一定倾向于次数多的标志值。在本例中,某商场售货员的月平均工资为1 267.2元,最接近50人对应的标志值,这个结果可作为检验平均数计算正确与否的重要参考依据。一、分布的集中趋势 算术平均数的数学性质算术平均数的数学性质2.算术平均数在统计学中具有重要的地位。它是进行统计分析和统计推断的基础。首先,从统计思想上看,算术平均数是一组数据的重心所在,是数据误差相互抵消后的必然性结果。例如,对同一事物进行多次测量后的结果不一致,有可能是测量误差所致,也可能是其他因素的偶然影响所致,而利用算术平均数作为其代表值,则可以使误差相互抵消,反映出事物必然性的数

5、量特征。其次,算术平均数具有下面一些重要的数学性质,这些数学性质不仅在实际工作中(如在相关性分析和方差分析及建立回归方程中)有着广泛的应用,而且也体现了算术平均数的统计思想。一、分布的集中趋势 (1)各变量值与其算术平均数的离差之和等于零。(2)各变量值与其算术平均数的离差平方和为最小值。(3)如果对每个标志值加或减一个任意常数A,则平均数也加或减一个任意常数A,即两个独立的同性质变量代数和的平均数等于各变量平均数的代数和。(4)如果对每个标志值乘或除以一个任意常数A,则平均数也乘或除以任意常数A,即两个独立的同性质变量乘积(除商)的平均数等于各个变量平均数的乘积(除商)。一、分布的集中趋势

6、二、调和平均数 调和平均数又称倒数平均数,它是根据各标志值的倒数来计算的平均数,用 来表示。具体地说,调和平均数就是各标志值倒数的算术平均数的倒数,但计算结果并非是算术平均数的倒数。在统计实践中,直接使用调和平均数的场合比较少,大多数情况下,都是把调和平均数看作算术平均数的变形形式来使用。调和平均数根据计算方法的不同,可以分为简单调和平均数和加权调和平均数两种。一、分布的集中趋势 简单调和平均数简单调和平均数1.当所掌握的资料未进行统计分组,且各个标志值所对应的总量都相同时,用简单调和平均数进行计算。其计算公式为 (4-6)式中,为调和平均数;xi为各标志值;n为总体单位数nx一、分布的集中趋

7、势 加权调和平均数加权调和平均数2.前面曾提到,调和平均数是作为算术平均数(特别是加权算术平均数)的变形形式来应用的,所以应符合算术平均数的基本公式的要求,即分子应是总体的标志总量,分母应是总体的单位总量。在实际的应用中,加权调和平均数比简单调和平均数的应用要广泛,而且通常是在缺少分母资料时才应用加权调和平均数。这时,式(4-7)中的m是一种特定的权数,即m=xf,m则是总体的标志总量。下面以某机械厂的有关资料来说明加权调和平均数的应用。一、分布的集中趋势 【例4-5】某机械厂工人按日产量分组(见表4-3),试计算该厂工人的平均日产量。表表4 4-3 3 某机械厂工人按日产量分组某机械厂工人按

8、日产量分组 一、分布的集中趋势 解:当已知各组的日产零件数x和各组工人人数f时,可采用加权算术平均数来计算平均日产量;若已知的不是各组的工人人数,而是各组的日总产量m时,则可以利用加权调和平均数来计算该厂的平均日产量,即该厂的平均日产量为一、分布的集中趋势 由上述对算术平均数及调和平均数的介绍可知,当计算平均指标时,若缺少分子资料,即缺少总体的标志总量,则适宜采用加权算术平均数计算;若缺少分母资料,即缺少总体的单位总量,则适宜采用加权调和平均数计算。一、分布的集中趋势 三、几何平均数 几何平均数是n个变量值连乘积的n次方根。它是几何级数(等比级数)的平均数,是计算平均比率和平均速度时比较适用的

9、一种方法,符合人们的认识规律,通常用 来表示。Gx一、分布的集中趋势 简单几何平均数适用于资料未进行分组的情况。其计算公式为 (4-8)式中,为几何平均数;xi为变量值;n为变量值个数;为连乘符号。简单几何平均数简单几何平均数1.Gx一、分布的集中趋势 【例4-6】某企业生产某种产品要经过三个连续的作业车间才能完成。若某月份第一车间粗加工产品的合格率为95,第二车间精加工产品的合格率为93,第三车间最后装配的合格率为90,则该产品的企业合格率(三个车间的平均合格率)为多少?解:由于该企业的生产是流水作业,即后续车间的生产加工是在前面车间合格制品的基础上进行的,也就是说,其制品的合格率是在前面车

10、间的合格品的基础上计算得到的。所以,各车间合格率的总和不等于全厂的总合格率,但三个车间的合格率的连乘积却等于总合格率。因此,这是计算平均比率的问题,应采用几何平均数计算,则一、分布的集中趋势 加权几何平均数加权几何平均数2.【例4-7】某投资银行某笔投资的年利率是按复利计算的,过去25年的年利率资料见表4-4,求这25年的平均年利率。表表4 4-4 4 某投资银行某笔投资过去某投资银行某笔投资过去2525年的年利率资料年的年利率资料一、分布的集中趋势 解:计算平均年利率时,必须先将各年的利率加上100,换算为各年的本利率,然后再应用几何平均数的方法。平均年本利率为 则这25年的平均年利率为8.

11、48。一、分布的集中趋势 综上分析,几何平均数具有以下特点:(1)几何平均数主要适用于计算平均比率或平均速度,应用范围比较窄。(2)几何平均数同算术平均数、调和平均数相比,受极端值的影响比较小。(3)当变量数列中的变量值为零或负数时,几何平均数将无法计算或失去意义。一、分布的集中趋势 众数是指总体中出现次数最多的那个标志值,用M0表示。众数是一种位置平均数,表示被研究社会经济现象中最普遍、最常见的标志值,以反映该现象的一般水平。例如,要掌握市场上某种蔬菜的一般价格水平,只需了解市场上最普遍的成交价格即可,而不必通过这种蔬菜的全部贸易量和贸易额的平均计算获得。假定市场上这种蔬菜使用最多的成交价格

12、为每500克5.7元,则5.7元就可以代表这种蔬菜的一般价格水平。四、众数众数的概念众数的概念1.一、分布的集中趋势 众数的确定方法众数的确定方法2.(1)未分组数据及单项式变量数列众数的确定。当根据未分组数据或单项式变量数列计算众数时,只需找出出现次数最多的变量值即可。(2)组距式变量数列众数的确定。对于组距式变量数列众数的确定,首先要将频数最多的变量值所在的组定为众数组,然后利用上限公式或下限公式来推算具体的众数值。一、分布的集中趋势【例4-10】某企业120名工人的工资资料见表4-6,试计算其众数。表表4 4-6 6 某企业某企业120120名工人的工资资料名工人的工资资料一、分布的集中

13、趋势 解:经观察可知,变量值“26002700”这一组出现的频数最多,为40人,即众数组为变量数列的第三组,则利用式(4-11)或式(4-12)可得 由计算结果可知,众数为2640元。众数计算公式(以下限公式为例)的意义为:众数等于众数组的下限加上众数组组距的一部分数量,这部分数量的大小取决于众数组前后组的次数多少。众数是按比例推算的近似值。一、分布的集中趋势 众数的特点众数的特点3.根据上面所述,众数具有以下特点:(1)众数属于位置平均数,不受极端值的影响。(2)当变量数列为均匀分布、U形分布、J形分布时,不存在众数。(3)缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不像数值平均

14、数那样利用了全部数据信息。一、分布的集中趋势 中位数是一种按其在数列中的特殊位置而决定的平均数。将总体中各单位标志值按大小顺序排列,处在中点位置的标志值称为中位数,用Me来表示。它将全部标志值分成两部分,一半标志值比它大,一半标志值比它小,而且比它大的标志值的个数和比它小的标志值的个数相等。中位数同众数一样,也属于位置平均数。五、中位数中位数的概念中位数的概念1.一、分布的集中趋势 中位数的确定方法中位数的确定方法2.(1)未分组资料中位数的确定。在资料未分组的情况下,先将变量值按从小到大的顺序排列,然后根据研究数列项数的奇偶,用相应的公式来确定中位数。一、分布的集中趋势 表表4 4-7 7

15、某工厂某班组某工厂某班组1111名工人生产产品零件数资料名工人生产产品零件数资料【例4-11】某工厂某班组11名工人生产产品零件数资料见表4-7,试求中位数。一、分布的集中趋势 解:中位数的位置=(n+1)/2=(11+1)2=6,则中位数为第6号位置的零件数,即Me=x(6)=24件。若项数为偶数,在例4-11中加上1名工人,其生产零件为25件,则中位数应该为 与 这两个标志值的简单平均数,即一、分布的集中趋势 (2)分组变量数列中位数的确定。对于单变量值分组的情况,确定中位数时,首先要将变量数列的频数或频率进行累计;然后用公式f/2来计算中位数的项次,确定中位数组,找到中位数所在的位置;最

16、后确定中位数。若中位数的项次用公式(f+1)/2来计算,则不太科学。这是因为,由分组资料确定中位数,一般要通过累计次数计算,而累计次数有两种表示方法:向上累计和向下累计。如果按照(f+1)/2确定中位数的位置,在组距数列的情况下,根据向上累计次数和向下累计次数所计算的中位数不一致,而中位数只有一个。因而,确定中位数的位置,通常采用f/2,而不采用(f+1)/2。一、分布的集中趋势 表表4 4-9 9 某企业工人工资资料某企业工人工资资料【例4-13】表4-9为某企业工人工资资料,试计算其中位数。一、分布的集中趋势 确定中位数的方法如下:计算累计频数,见表4-9第3栏和第4栏。利用公式f/2确定

17、中位数的项次,f/2=120/2=60。通过观察,找到中位数(以向上累计为例),从向上累计频数可知,从第41个工人到第80个工人都包含在了第三组中。由此可以判断,第60个工人也应在第三组里。利用公式求得中位数近似值(以上限公式为例)。一、分布的集中趋势 中位数的特点中位数的特点3.(1)中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大值或极小值的影响,从而在一定程度上提高了中位数对分布数列的代表性。(2)有些离散型变量的单项式数列,当次数分布呈偏态时,中位数的代表性会受到影响。(3)缺乏敏感性。一、分布的集中趋势 由于算术平均数、众数和中位数的上述关系,一般

18、认为,在比较明显的偏斜分布情况下,用中位数来说明次数分布的位置特征比较适中。因为众数忽略了偏斜一侧的大量数值,而算术平均数又过分强调了这些数值。均值对极端值的反应十分灵敏,而中位数对极端值的反应不灵敏。因此,常常把中位数作为探索发现极端值的标准。把数据中的每一个数值和中位数相减,可以很容易发现极端值;而把每一个数值和均值相减却不容易发现极端值。算术平均数、众数和中位数的关系算术平均数、众数和中位数的关系4.一、分布的集中趋势 中位数是将统计分布从中间分成面积(数据个数)相等的两部分,与中位数相似的还有四分位数(quartile)、十分位数(decile)和百分位数(percentile)等。它

19、们分别是用3个点、9个点和99个点将数据四等分、十等分和一百等分后各分位点上的值。这里只介绍四分位数的计算。六、四分位数一、分布的集中趋势 未分组资料四分位数的确定未分组资料四分位数的确定1.与中位数的计算方法类似,根据未分组数据计算四分位数时,首先应对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。根据定义,四分位数的位置的确定方法是:Q1所在位置点=(n+1)/4,Q2所在位置点=2(n+1)/4=(n+1)/2,Q3所在位置点=3(n+1)/4。式中,Q1为下四分位数,Q3为上四分位数。一、分布的集中趋势 如果位置是整数,则四分位数就是该位置对应的值;如果是在0.5

20、的位置上,则四分位数取该位置两侧值的平均数;如果是在0.25或0.75的位置上,则四分位数等于该位置的下侧值加上按比例分摊位置两侧数值的差值。一、分布的集中趋势 分组变量数列四分位数的确定分组变量数列四分位数的确定2.确定单变量值分组数列的四分位数时,首先要将变量数列的频数或频率进行累计;然后用公式f/4和3f/4计算四分位数的项次,确定四分位数组,找到四分位数所在的位置;最后确定下四分位数和上四分位数。Q1所在位置点=f/4,Q2所在位置点=f/2,Q3所在位置点=3f/4。一、分布的集中趋势 表表4 4-10 10 某市某市20152015年职工家庭统计调查资料年职工家庭统计调查资料 【例4-15】某市2015年职工家庭统计调查资料见表4-10,试求其四分位数。一、分布的集中趋势 解:第1个四分位数所在位置点=f/4=10000/4=2500,则L1=2000。第3个四分位数所在位置点=3f/4=310000/4=7500,则L3=5000。将有关数字代入式(4-15)和式(4-16),则得 Q2(中位数)=4337.21(元)一、分布的集中趋势 综上所述,通过四分位数可以将研究总体频数分配的集中状况反映得更加清晰。另外,将四分位数与算术平均数结合起来,还可以分析频数分布的偏度,所以四分位数也是描述频数分布集中趋势的一个重要指标。谢谢谢谢观观

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(分布的集中趋势.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|