1、1以以Excel Excel 和和SPSSSPSS为工具的管理统计为工具的管理统计同济大学经济与管理学院同济大学经济与管理学院管理科学与信息系管理科学与信息系 张建同张建同 副副教授教授2本章主要介绍以下 3类综合统计指标:l度量中心(集中)趋势的平均指标l度量离散程度的指标l度量偏斜程度的指标 第第2章章 统计综合指标统计综合指标3平均指标是说明社会经济现象一般水平的统计指标,反映标志值分布的集中趋势。平均指标按计算方式可分为数值平均数和位置平均数两大类。2.1 度量集中趋势的平均指标度量集中趋势的平均指标4是根据总体各单位所有标志值计算出的平均数。包括算术平均数、几何平均数。(一一)算术平
2、均数算术平均数1.1.算术平均数的基本公式算术平均数的基本公式总体单位总数总体单位标志总量算术平均数 一一.数值平均数数值平均数 5 (1)(1)简单算术平均数简单算术平均数niixnx112.2.算术平均数的计算算术平均数的计算 n 总体单位总数;xi 第 i 个单位的标志值。(2)(2)加权算术平均数加权算术平均数 xi 第 i 组的代表值(组中值或该组变量值);f i 第 i 组的频数。iiiffxx6使使用用 Excel 函函数求加权算术平均数数求加权算术平均数利用 Excel“数学和三角函数”中的SUMPRODUCT 函数可以方便地计算出分组数据的加权算术平均数。语法规则:语法规则:
3、格式:SUMPRODUCT(,)功能:返回两个或多个区域中对应元素乘积之和。例例:利用比特啤酒公司各销售点分组频数分布数据,求各销售点的平均销售量。7(二二)几何平均数几何平均数当统计资料是各时期的发展速度等前后期的两两比环数据,要求每时期的平均发展速度时,就需要使用几何平均数。几何平均数是 n 个数连乘积的 n 次方根。1.简单几何平均数简单几何平均数nnGxxxx 21 2.加权几何平均数加权几何平均数 ffnffGnxxxx 2121f i 各比率出现的频数 8例例:某公司原料成本随时间增长的情况如下表求原料成本的平均年增长率。解一解一:1992199319941995成本2002282
4、39.4244.2年增长率(%)1452302.105.114.1Gx解二解二:3200/2.244Gx 年平均增长率=1.0688-1=6.88%0688.10688.193.使用使用 Excel 求几何平均数求几何平均数可以使用 Excel 统计函数中的 GEOMEAN 函数返回几何平均数。语法规则:格式:GEOMEAN(,)功能:返回所有参数中数据的几何平均数。10位置平均数是根据总体标志值所处的特殊位置确定的一类平均指标。包括中位数和众数两种。(一一)中位数中位数将总体各单位标志值按由小到大的顺序排列后处于中间位置的标志值称为中位数,记为Me。中位数是一种位置平均数,不受极端数据的影响
5、。当统计资料中含有异常的或极端的数据时,中位数比算术平均数更具有代表性。比如有 5 笔付款:9元,10元,10元,11元,60元付款的均值为 20 元,显然这并不是一个很好的代表值,而中位数 Me=10 元则更能代表平均每笔的付款数。二二.位置平均数位置平均数111.1.使用使用 Excel 的统计函数返回的统计函数返回未分组数据的中位数未分组数据的中位数可以使用 Excel 统计函数中的 MEDIAN 函数返回未分组数据的中位数。格式:MEDIAN(,)功能:返回所有参数中数据的中位数。122.2.分组数据中位数的确定分组数据中位数的确定 对于分组数据的统计资料,中位数要用插值法来估算。(1
6、)计算各组的累计频数;(2)确定中位数所在的组 是累计频数首次包含中位数位次f/2的组。dfSfLMmme121其中:L 中位数所在组的下限;Sm-1 中位数所在组前一组的累计频数;fm 中位数所在组的频数;d 中位数所在组的组距。13例例:计算下表数据的中位数解解:f/2=27.5,中位数在“15-25”的组中,分组 各组频数 累计频数 0-5 2 2 5-15 6 8 15-25 20 28 25-35 15 43 35-45 8 51 45 4 55 dfSfLMmme121102085.271575.24 14(二二)众数众数是总体中出现次数最多的标志值,记为M 0。众数明确反映了数据
7、分布的集中趋势,也是一种位置平均数,不受极端数据的影响。但并非所有数据集合都有众数,也可能存在多个众数。在某些情况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。又如,当要了解大多数家庭的收入状况时,也要用到众数。151.1.未分组数据众数的确定未分组数据众数的确定在数据量很大的时候,可以使用 Excel 统计函数中的 MODE 函数返回众数。格式:MODE(,)功能:返回所有参数中数据的众数。162.2.分组数据众数的确定分组数据众数的确定对于分组数据的统计资料,众数也要用插值法来估算。(1)确定众数所在的组
8、 对于等距分组,众数组是频数最高的组;(2)使用以下插值公式计算dLM2110其中:L 众数组的下限1 众数组与前一组的频数之差2 众数组与后一组的频数之差 d 众数组的组距12众数Ld17例例:计算下表数据的众数解:解:众数组是“15-25”的组,则分组 各组频数 0-5 2 5-15 6 15-25 20 25-35 15 35-45 8 45 4 dLM211010)1520()620(6201537.22 18三三.算术平均数和位置平均数间的关系算术平均数和位置平均数间的关系1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者相同。0 xf(Me,M0)X0 xfMeXM00
9、 xfMeXM02.频数分布为右偏态时,众数小于中位数,算术平均数大于中位数。3.频数分布为左偏态时,众数大于中位数,算术平均数小于中位数。19补充习题补充习题补充题3:某地区私营企业注册资金分组资料如下,求该地区私营企业注册资金的平均数、中位数和众数。注册资金(万元)50以下 50100 100150 150200 200250 250以上企业数2035422615520 补充题3答案注册资金(万元)企业数 累计企业数组中值50以下2020255010035557510015042971251502002612317520025015138225250以上5143275(万元)6.123ii
10、iffxx(万元)64.1195042555.711002/1dfSfLMmmef/2=143/2=71.5,中位数所在组为“100150”的组,众数组为“100150”的组,)(22.11550)2642()3542(35421002110万元dLM21xx频数要分析总体的分布规律,仅了解中心趋势指标是不够的,还需要了解数据的离散程度或差异状况。几个总体可以有相同的均值,但取值情况却可以相差很大。变异指标就是用来表示数据离散程度特征的。变异指标主要有:极差、平均差、标准差和变异系数。2.1 度量离散程度的指标度量离散程度的指标22【案例】道格拉斯公司应如何选择供应商【案例】道格拉斯公司应如何
11、选择供应商道森公司和克拉克公司是道格拉斯公司的两家供货商。两家供货商都表示大约需要10个工作日交付定货。下表是两家供应商定货交付时间的历史数据。今后道格拉斯公司应选择哪家供应商供货?道森公司:道森公司:克拉克公司:克拉克公司:交货天数次数交货天数次数9271106821129310411312213123一一.极差极差极差也称全距,是一组数据的最大值和最小值之差,通常记为R。显然,一组数据的差异越大,其极差也越大。极差是最简单的变异指标,它广泛应用于产品质量管理中控制质量的差异,一旦发现超过控制范围,就采取措施加以纠正,以保证产品质量的稳定。但极差有很大的局限性,它仅考虑了两个极端的数据,没有
12、利用其余数据的信息,因而是一种比较粗糙的变异指标。24二二.平均差平均差平均差是各数据与其均值离差绝对值的算术平均数,通常记为A.D。|1XXNDAi.平均差越大,反映数据间的差异越大。但由于使用了绝对值,其数学性质很差,因而很少使用。25三三.方差和标准差方差和标准差方差和标准差是应用得最为广泛的变异指标。标准差是方差的算术平方根,也称均方差或根方差。应注意总体方差、标准差与样本方差、标准差是有区别的。1.总体方差和总体标准差总体方差和总体标准差总体方差是各总体数据与其均值离差平方的均值,记为 2,总体标准差记为。22)(1XXNi2)(1XXNi 262.2.样本方差与样本标准差样本方差与
13、样本标准差样本方差记为 S 2,样本标准差记为 S,在推断统计中,它们分别是总体方差和标准差的优良估计。2)(11XXnSi其中:n 为样本容量,Xi 为样本观察值为样本均值。X22)(11XXnSi 27未分组数据方差和标准差的计算未分组数据方差和标准差的计算方差和标准差的手工计算非常烦琐,只要求掌握以下两种方法。使用计算器的统计功能使用计算器的统计功能(SD或STAT功能)使使用用 Excel 的统计函数的统计函数VARP(,)功能:返回所有参数中数据的总体方差。STDEVP(,)功能:返回所有参数中数据的总体标准差。VAR(,)功能:返回所有参数中数据的样本方差。STDEV(,)功能:返
14、回所有参数中数据的样本标准差。283.3.分组数据的方差与标准差分组数据的方差与标准差如果得到的是分组的频数分布数据,则方差与标准差的公式如下:,)(122iiifXXfiiifXXf2)(1,)(1122iiifXXfSiiifXXfS2)(11其中 Xi 是第 i 组的组中值或标志值。294.4.是非标志的平均数和标准差是非标志的平均数和标准差(增加增加)在对社会经济现象进行分析时,经常要将总体的所有单位按是否具有某种属性划分为两组,即“是”与“非”的两组。如将学生按性别分组,将产品按合格与否分组。又如在民意调查中,将被调查者按是否支持某位侯选人或是否赞成某项政策分为两组等等。30(1)(
15、1)比例的概念比例的概念比例是指具有某种性质或属性的单位数占总体全部单位数的比重,记为 P。N1总体中具有某一属性的单位数;N 总体单位总数。如产品中的次品率;全部人口或某单位职工中男、女的比率;某地区全部家庭中高(如月收入10000元)、中、低(月收入1000元)收入家庭各占的比重等。NNP131(2)(2)比例的平均数比例的平均数要计算比例的平均数,需要将是非标志的标志表现进行量化处理。记1代表具有某种属性的标志表现0代表不具有该属性的标志表现N1总体中具有该属性的单位数N0总体中不具有该属性的单位数N 总体单位总数则由加权算术平均数的计算公式,成数的平均数为iiipffxxNNN0101
16、NN1P可知,比例的平均数就是其本身比例的平均数就是其本身。32(3)(3)比例的方差和标准差比例的方差和标准差,由分组数据方差的计算公式:2P记比例的方差为iiiPffxx22)(NNPNNP0212)1()1)(1(PPPP)1()1(22PPPP)1(PP成数的标准差:当 P=0.5时,成数的标准差达到最大值,即5.05.05.0PNNPNP0212)0()1()1(PPP 33总体分布的特征不仅与均值和变异指标有关,而且与分布的偏斜程度有关,如对称分布、右偏分布和左偏分布。这种分布形态上的数量特征,往往具有重要的社会经济意义。偏度系数是度量偏斜程度的指标,主要有以下两种计算方法:一、用
17、标准差为单位计量的偏度系数该偏度系数记为SK,计算公式为 SK是无量纲的量,取值通常在-3+3之间,其绝对值越大,表明偏斜程度越大。当分布呈右偏态时,SK0,故也称正偏态;当分布为左偏态时,SK0,故也称负偏态。但除非是分组频数分布数据,否则SK公式中的众数M0有很大的随 2.3 度量离散程度的指标度量离散程度的指标0MXSK34二、使用三阶中心矩计量的偏度系数二、使用三阶中心矩计量的偏度系数 该偏度系数是用三阶中心矩除以标准差的三次方来度量偏斜程度,记为,计算公式为 称为三阶中心矩。偏度系数 可以适用任何数据。和SK的计算方法不同,因此根据同一资料计算的结果也不相同。可以使用Excel统计函数中的SKEW函数返回数据的偏度系数,语法规则如下:格式:SKEW(,)功能:返回所有参数中数据的偏度系数。33m33)(1 XXNmi35使用使用 Excel 求各种统计指标求各种统计指标当数据量很大时,手工计算统计指标是非常烦琐的,尤其是标准差、方差数等的计算量很大。使用Excel【工具】“数据分析”“描述统计”功能,可以方便地计算出各种综合统计指标。