1、基础指标基础指标特征指标特征指标总量指标总量指标相对数指标相对数指标平均指标:反映数据分布集中趋势的指标平均指标:反映数据分布集中趋势的指标变异指标:反映数据分布离散程度的指标变异指标:反映数据分布离散程度的指标偏态和峰度系数:反映数据分布形状的指标偏态和峰度系数:反映数据分布形状的指标反映总体基本状况的指标反映总体基本状况的指标反映总体数据取值分布特征的指标反映总体数据取值分布特征的指标第三章第三章 数据分布特征的描述数据分布特征的描述第1页,共60页。流量指标(时期数指标)流量指标(时期数指标)存量指标(时点数指标)存量指标(时点数指标)总量指标总量指标(绝对数指标绝对数指标)一、总量指标
2、:是反映社会经济现象的总规模或一、总量指标:是反映社会经济现象的总规模或总水平的统计指标。总水平的统计指标。第一节第一节 总量指标和相对指标总量指标和相对指标第2页,共60页。时期数时期数是是现象在一定时期内的总和。现象在一定时期内的总和。不同时期指标可累加不同时期指标可累加时期指标与时期长短有关时期指标与时期长短有关时期指标可连续计数时期指标可连续计数时点数时点数是现象在某一瞬间时刻的总量。是现象在某一瞬间时刻的总量。相邻时点数不能累加相邻时点数不能累加时点指标随时刻的变化不确定时点指标随时刻的变化不确定时点指标只能间断计数时点指标只能间断计数 下列指标是时期数还是时点数?下列指标是时期数还
3、是时点数?企业固定资产价值,年新增人口数,森林覆盖面积企业固定资产价值,年新增人口数,森林覆盖面积第3页,共60页。二、相对指标:是两个有联系的统计指标对比形成二、相对指标:是两个有联系的统计指标对比形成的比率,它反映社会经济现象各部分之间的依存的比率,它反映社会经济现象各部分之间的依存关系。是两个绝对数的比值,反映事物的相对数关系。是两个绝对数的比值,反映事物的相对数量。量。第4页,共60页。1、结构相对指标:总体的部分总量与总体总量相、结构相对指标:总体的部分总量与总体总量相互对比形成的相对数叫结构相对数。互对比形成的相对数叫结构相对数。%100总体总量总体中某部分数值结构相对数2、比例相
4、对数:总体内某一部分数值与另一部分数值对比、比例相对数:总体内某一部分数值与另一部分数值对比形成的相对数称为比例相对数。反映总体内各部分之间的比形成的相对数称为比例相对数。反映总体内各部分之间的比例关系,常用倍数或百分数表示。例关系,常用倍数或百分数表示。%100总体内另一部分数值总体内某一部分数值比例相对数第5页,共60页。3、比较相对数、比较相对数 不同总体的同一类型指标相互对比形成的相对数叫比较不同总体的同一类型指标相互对比形成的相对数叫比较相对数,反映不同国家、不同地区、不同单位之间的差异程相对数,反映不同国家、不同地区、不同单位之间的差异程度。通常用倍数和百分数表示。度。通常用倍数和
5、百分数表示。%100指标数值另一地区或单位的同类某一地区或单位的数值比较相对数第6页,共60页。4、动态相对指标、动态相对指标 不同时间上的同一指标相互对比形成的相对数叫动态不同时间上的同一指标相互对比形成的相对数叫动态相对指标,说明社会经济现象发展快慢的程度。相对指标,说明社会经济现象发展快慢的程度。%100基期数值报告期数值动态相对数 报告期是指所要研究的时期,又叫计算期;基期报告期是指所要研究的时期,又叫计算期;基期是指用作比较的时期。是指用作比较的时期。第7页,共60页。5、计划完成程度相对指标、计划完成程度相对指标 计划完成程度相对指标是将现象在某一时期实际完计划完成程度相对指标是将
6、现象在某一时期实际完成的数值与同时期的计划数值对比形成的相对数,一般成的数值与同时期的计划数值对比形成的相对数,一般用百分数表示。用百分数表示。%100 计划数实际数计划完成程度相对数第8页,共60页。例:某产品计划成本下降例:某产品计划成本下降5%,实际下降了,实际下降了8%,则计划完成,则计划完成程度为:程度为:%84.96%100%51%81计划完成程度相对数 计算结果表明超额完成计划计算结果表明超额完成计划3.16%,需要注意的是:像成,需要注意的是:像成本这类逆指标,计划完成程度小于本这类逆指标,计划完成程度小于100%,表明超额完成计,表明超额完成计划;而像产值这类正指标,计划完成
7、程度大于划;而像产值这类正指标,计划完成程度大于100%,表明,表明超额完成计划。超额完成计划。第9页,共60页。6、强度相对指标、强度相对指标 总体总量与另一有联系的总体单位数相互对比形总体总量与另一有联系的总体单位数相互对比形成的相对数叫强度相对指标,反映现象的强度、密度成的相对数叫强度相对指标,反映现象的强度、密度和普遍程度。强度相对指标是唯一的有计量单位的相和普遍程度。强度相对指标是唯一的有计量单位的相对指标。对指标。100%总体总量强度相对指标另一有联系的总体单位数 强度相对数的分子分母可以互换。在计算强度相对强度相对数的分子分母可以互换。在计算强度相对指标时,要保证相互对比的两个指
8、标间具有可比性,指标时,要保证相互对比的两个指标间具有可比性,即两个指标的时间规定应相同。即两个指标的时间规定应相同。第10页,共60页。222)(21)(axexp21)(ap显然显然描述了曲线的陡峭程度和数据的分散程度描述了曲线的陡峭程度和数据的分散程度下面具体给出下面具体给出一些描述统计量一些描述统计量x)(xpa如何描述数据的分布特征?如何描述数据的分布特征?集中趋势:向中心值靠拢的倾向集中趋势:向中心值靠拢的倾向离中趋势:远离其中心值的倾向离中趋势:远离其中心值的倾向分布形状:偏斜程度和扁平程度分布形状:偏斜程度和扁平程度第11页,共60页。第二节第二节 分布集中趋势的测度分布集中趋
9、势的测度 平均指标反映同类现象的一般水平,是总体内各单位参差不齐的平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。标志值的代表值,也是对变量分布集中趋势的测定。数据集中区数据集中区变量变量x算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数数值平均数数值平均数位置平均数位置平均数众数众数中位数中位数平均指标平均指标第12页,共60页。1、简单算术平均数、简单算术平均数 (Simple mean)iXNX1一、算术平均数一、算术平均数(Arithmetic mean)总体单位数总体总量算术平均数【例】【例】某商店前半年销售额分别为:
10、某商店前半年销售额分别为:327、368、428、402、398、423万元,则该商店的月平均销售额为:万元,则该商店的月平均销售额为:327 368 428 402 398 423391(6XXN万元)第13页,共60页。2、加权算术平均数、加权算术平均数(Weighted mean)iiiiiiffxffxX为单项式分组值或组距式分组的组中值为单项式分组值或组距式分组的组中值;ix加权算术平均数的大小受两个因素的影响加权算术平均数的大小受两个因素的影响:(1)受各组变量值)受各组变量值x大小的影响大小的影响;(2)受各组权数或权重大小的影响。)受各组权数或权重大小的影响。iiff是比重,称
11、之为权重是比重,称之为权重.if为各组频数,有权衡各为各组频数,有权衡各ix轻重的作用,称之为权数轻重的作用,称之为权数;第14页,共60页。6.78503930fxfx例如,求下面例如,求下面5050个人的班级中某门课程的平均成绩个人的班级中某门课程的平均成绩 成绩(分)成绩(分)人数(人)人数(人)f 组中值组中值 x 加权加权60以下以下60-7070-8080-9090-1002820101055657585 951105201500850950 合合 计计 50 3930第15页,共60页。说明算术平均数是一组数据的重心。说明算术平均数是一组数据的重心。数学性质数学性质 :min12
12、)(Nixxi或或min12)(iNifixx说明算术平均数是误差最小的一般水平的代表值。说明算术平均数是误差最小的一般水平的代表值。1各变量值与其均值的离差之和等于零各变量值与其均值的离差之和等于零2各变量值与其均值的离差平方和最小各变量值与其均值的离差平方和最小3算术平均数易受极端数值的影响算术平均数易受极端数值的影响0)(1Niixx0)(1iNiifxx或或第16页,共60页。v变量倒数的算术平均数再取倒数变量倒数的算术平均数再取倒数NiiHXNX11 二、二、调和平均数调和平均数Harmonic mean iiiHxmmXiiifxm 调和平均数是算术平均数的变形调和平均数是算术平均
13、数的变形iiiffx简单调和平均数简单调和平均数加权调和平均数加权调和平均数第17页,共60页。【例】某公司三个企业本期利润计划及执行情况资【例】某公司三个企业本期利润计划及执行情况资料如表料如表3-3,表,表3-4所示,试分别根据两个表所提供所示,试分别根据两个表所提供的不同资料计算利润平均计划完成程度。的不同资料计算利润平均计划完成程度。从平均利润计划完成程度的实际意义上看,计从平均利润计划完成程度的实际意义上看,计算公式应为:算公式应为:全公司计划利润总额全公司实际利润总额利润平均计划完成程度 第18页,共60页。企业企业利润计划完成程(利润计划完成程(%)Xi计划利润(元)计划利润(元
14、)Fi甲甲105210乙乙95220丙丙115.8250合计合计680表表3-3 表表33所给数据,已知各企业的计划利润及计划完成程度,从而可求所给数据,已知各企业的计划利润及计划完成程度,从而可求出实际利润出实际利润XF,因此利润平均计划完成程度的计算采用算术平均数的形,因此利润平均计划完成程度的计算采用算术平均数的形式,即:式,即:%74.105680250%8.115220%95210%1053131iiiiiFFXX第19页,共60页。企业企业利润计划完成程(利润计划完成程(%)Xi实际利润(元)实际利润(元)mi甲甲105220.5乙乙95209.0丙丙115.8289.5合计合计7
15、19.0表表3-4表表3-4所给数据,根据已知资料:即各企业利润计划完成程度,所给数据,根据已知资料:即各企业利润计划完成程度,各企业实际利润可求出计划利润额各企业实际利润可求出计划利润额 ,因而利润平均计划,因而利润平均计划完成程度计算采用调和平均数的形式,即:完成程度计算采用调和平均数的形式,即:iiXm%74.105%8.1155.289%950.209%1055.2200.7193131iiiiiHXmmX第20页,共60页。三、三、几何平均数几何平均数Geometric mean用于计算比率、利率用于计算比率、利率 或速率的平均或速率的平均vN N个变量值乘积的个变量值乘积的N N次
16、方根次方根简单几何平均数简单几何平均数加权几何平均数加权几何平均数NiNNGXXXXX21iiFFiGXX取对数取对数NiGXNX1ln1ln几何平均数的对数等于变量对数的算术平均几何平均数的对数等于变量对数的算术平均NiiiGXFFX1ln1ln和和第21页,共60页。解:由题中给出的数据可知,各年与前一年相比的比值(即发解:由题中给出的数据可知,各年与前一年相比的比值(即发展速度)分别为展速度)分别为109%、116%、120%,设平均发展速度,设平均发展速度为为 ,则它应该满足,则它应该满足例例 某水泥生产企业某水泥生产企业1995年的水泥产量为年的水泥产量为100万吨,万吨,1996年
17、年与与1995年相比增长率为年相比增长率为9%,1997年与年与1996年相比增长率为年相比增长率为16%,1998年与年与1997年相比增长率为年相比增长率为20%。求各年的年平均。求各年的年平均增长率。增长率。%91.114%120%116%1093X年平均增长率为年平均增长率为 114.91%100%=14.91%。X3100%120%116%109100X于是于是第22页,共60页。定义定义:一组数据按大小:一组数据按大小 顺序排列后处于顺序排列后处于正中间位置上的变量值正中间位置上的变量值四、中位数四、中位数 Median)()2()1(21,NNxxxxxx)(21)12()2(N
18、NexxMN为偶数时,为偶数时,)21(NexMN为奇数时,为奇数时,第23页,共60页。621N中位数位置27)6()21(XXMNe【例】【例】某单位某单位11个工人日加工零件数按大小顺序排列个工人日加工零件数按大小顺序排列为:为:11,15,18,20,25,27,32,35,38,41,46,试确定中位数。试确定中位数。因为因为N为奇数,则中位数为:为奇数,则中位数为:解:解:第24页,共60页。5.621N中位数位置302312922)7()6()12()2(XXXXMNNe【例】若【例】若12位工人的日加工零件数按大小顺序排列为位工人的日加工零件数按大小顺序排列为13,16,18,
19、24,25,29,31,35,39,40,43,45,试确,试确定中位数。定中位数。因为因为N为偶数,则中位数为:为偶数,则中位数为:解:解:第25页,共60页。单项式数列单项式数列中位数的确定中位数的确定 在累积次数分布表中找中位数在累积次数分布表中找中位数的位置的位置(N+1)2,对应的变量即,对应的变量即是中位数是中位数 工人看管机器台数工人看管机器台数(台台)工人数工人数(人人)向上累积人数向上累积人数 1 2 3 4 5 6 2 8 20 30 30 10 2 10 30 60 90 100 合合 100 4eM5.5021N第26页,共60页。为中位数所在前一组的向上累积次数为中位
20、数所在前一组的向上累积次数 为中位数所在后一组的向下累积次数为中位数所在后一组的向下累积次数组距式数列组距式数列中位数的确定中位数的确定 在向上(或向下)累积频数分布表在向上(或向下)累积频数分布表中找中位数所在组,记其下限为中找中位数所在组,记其下限为 L、上、上限为限为 U、组距为、组距为 d理理 论论 假假 定定:中位数所在组的中位数所在组的数据分布是均匀的。数据分布是均匀的。特点特点:中位数是一个位置代表中位数是一个位置代表数,不受极端值的影响数,不受极端值的影响min1NieiMXdfSNUMmme 12dfSNLMmme 121mS1mS第27页,共60页。某车间某车间50名工人日
21、加工零件数名工人日加工零件数向上累积频数分布表向上累积频数分布表252502N 按零件数按零件数 分组分组频数频数(人人)105110 110115 115120 120125 125130 130135 135140 3 5 8 14 10 6 4 合合 计计 50中位数的位置中位数的位置21.123514162512021dfSNLMmme中位数所在组中位数所在组120125L=120,U=125,d=514161mmfS由公式计算得由公式计算得 向上累积向上累积 频数频数(人人)381630404650 第28页,共60页。五、众数五、众数Mode 定义定义:一组数据中出现次数最多:一组
22、数据中出现次数最多 或密度最大的变量值或密度最大的变量值OMOMOM根据数据分布特点的不同,众数根据数据分布特点的不同,众数可以不存在,可以有一个,也可可以不存在,可以有一个,也可以有多个以有多个 第29页,共60页。特点特点:众数是一个位置平均数众数是一个位置平均数 不受极端值影响不受极端值影响,不一定唯一不一定唯一dLMO211dUMO211测测 度度:单项式时直接根据次数分布列确定;:单项式时直接根据次数分布列确定;组距式计算公式如下组距式计算公式如下(分布曲线最高峰对应的变量值分布曲线最高峰对应的变量值)mf1mmff1mmffLU11mmff12mmffxfOM第30页,共60页。某
23、车间某车间50名工人日加工名工人日加工零件频数分布表零件频数分布表 零件数零件数频数频数(人人)105110 110115 115120 120125 125130 130135 135140 3 5 8 14 10 6 4 合合 计计 50众数所在组众数所在组 120125L=120,U=125,d=51014811mmmfff由公式计算得由公式计算得 12351014814814120111dffffffLMmmmmmmo第31页,共60页。六、众数、中位数和均值的比较六、众数、中位数和均值的比较对称分布对称分布XMMeo右偏分布右偏分布XMMeo左偏分布左偏分布oeMMX0oMX0oMX
24、0oMX众数、中位数和均值是集中趋势的三个主要测度值众数、中位数和均值是集中趋势的三个主要测度值 适度偏斜时,均值到众数的距离大约是均值到中位数适度偏斜时,均值到众数的距离大约是均值到中位数距离的距离的3倍。即倍。即3()oeXMXM第32页,共60页。第三节第三节 分布离散趋势的测度分布离散趋势的测度 测定数据离散程度的指标叫变异指标。测定数据离散程度的指标叫变异指标。常用的反映离散程度的变异指标主要有常用的反映离散程度的变异指标主要有极差、异众比率、四分位差、平均差、方差极差、异众比率、四分位差、平均差、方差和标准差以及测度相对离散程度的离散系数和标准差以及测度相对离散程度的离散系数等。等
25、。第33页,共60页。一、一、极差极差(Range):极差也叫全距,是一组数据):极差也叫全距,是一组数据的最大值与最小值之差。即的最大值与最小值之差。即极差反映的是变量分布的变异范围或离散幅度极差反映的是变量分布的变异范围或离散幅度max()min()iiRXX R最高组上限最低组下限最高组上限最低组下限 或或第34页,共60页。imimirFF1FFFV二、异众比率(二、异众比率(Variation ratio):又称离异比率或变差):又称离异比率或变差比,是指非众数组的频数占总频数的比率,计算公式为比,是指非众数组的频数占总频数的比率,计算公式为异众比率的作用是衡量众数对一组数据的代表程
26、度。异众比率的作用是衡量众数对一组数据的代表程度。为变量值的总频数;为变量值的总频数;为异众比率;为异众比率;rViFmF为众数组的频数。为众数组的频数。第35页,共60页。三、分位差三、分位差:从变量数列中剔除一部分变量值之后重:从变量数列中剔除一部分变量值之后重新计算的类似于极差的指标。新计算的类似于极差的指标。四分位差反映了处于中间大约四分位差反映了处于中间大约50%的数据的离散程度。的数据的离散程度。其数值越小,中间数据越集中,它不受极端数值的影响。在其数值越小,中间数据越集中,它不受极端数值的影响。在一定程度上说明了中位数的代表程度。一定程度上说明了中位数的代表程度。LUQQH 四分
27、位差四分位差(Quartile deviation):也称为内距,是上也称为内距,是上四分位数四分位数QU与下四分位数与下四分位数QL之差。若用之差。若用H表示四分位差,则表示四分位差,则计算公式为:计算公式为:第36页,共60页。【例】某公司下属九个企业的年销售利润按大小顺序排列为:【例】某公司下属九个企业的年销售利润按大小顺序排列为:60,73,89,103,127,146,163,178,184,试计算试计算四分位差。四分位差。四分位差四分位差下四分位数下四分位数5.1702178163UQ8128973LQ5.89815.170H上四分位数上四分位数第37页,共60页。四、平均差(四、
28、平均差(Mean deviation):):各数据与其算术平各数据与其算术平均数离差的绝对值的算术平均数称为平均差。均数离差的绝对值的算术平均数称为平均差。平均差是随机变量的各个取值到其算术平均数的平平均差是随机变量的各个取值到其算术平均数的平均距离。它以均值为中心,反映了所有数据与均值的平均距离。它以均值为中心,反映了所有数据与均值的平均离差程度。均离差程度。NiidXXNM11KiiKiiidFFXXM11简单平均差简单平均差加权平均差加权平均差(未分组资料)(未分组资料)(分组资料)(分组资料)第38页,共60页。五、方差五、方差(Variance)和标准差和标准差(Standard d
29、eviation)2)(EEVar 记总体数据记总体数据NXXXX,:21的方差为的方差为2,那么,那么222211iiXXXXNN2222)(XFFXFFXXiiiiii或或随机变量随机变量的方差定义为的方差定义为第39页,共60页。标准差:方差的平方根标准差:方差的平方根.其量纲与变量值的计量单位相同其量纲与变量值的计量单位相同.方差或标准差以分布的重心方差或标准差以分布的重心均值为标准,综均值为标准,综合了所有差异,较极差和分位差更能准确反映离散合了所有差异,较极差和分位差更能准确反映离散程度程度.是测度离散程度最主要的指标。是测度离散程度最主要的指标。第40页,共60页。6.78503
30、930FXFX例:计算该班级例:计算该班级50个人的高等数学成绩的标准差个人的高等数学成绩的标准差 5565758595组中值组中值X 30254225562572259025 314850 3930 50 合合 计计 6050 33800 112500 72250 9025011052015008509502820101060以下以下60-7070-8080-90 90-100人数人数 F成绩(分)成绩(分)2XFX2XF96.61776.7822X04.11996.6177629796.617750314850222XFFX91.1004.119第41页,共60页。例:下面是例:下面是42
31、0户居民月耗电量资料,试计算其标准差户居民月耗电量资料,试计算其标准差月耗电量(度)月耗电量(度)户数(户)户数(户)20以下以下2020-304030-408040-5014050-608860-703270以上以上20第42页,共60页。例:两批轮胎按每只轮胎寿命(最大行驶里程)分组如下:例:两批轮胎按每只轮胎寿命(最大行驶里程)分组如下:行驶里程行驶里程(百公里)(百公里)各组轮胎按数目占整批轮胎总数的比重各组轮胎按数目占整批轮胎总数的比重第一批第一批第二批第二批150-2003.814.5200-2505.621.0250-30050.530.3300-35035.223.6350以上
32、以上4.910.6合计合计100.0100.0试比较两批轮胎的质量,并说明哪一批的质量较稳定。试比较两批轮胎的质量,并说明哪一批的质量较稳定。第43页,共60页。五、离散系数(变异系数)五、离散系数(变异系数)(Coefficient of variation)A 1 2 3 4 5 B991 992 993 994 995例例 A、B 两种商品在五家不同超市的售价两种商品在五家不同超市的售价(元元)试比较其离散程度试比较其离散程度第44页,共60页。4BARR%14.4732414.12 BABAXX9933%14.09932第45页,共60页。%100XRVR%100XHVH%100XMV
33、dM%100XV极差系数:极差系数:四分位差系数:四分位差系数:平均差系数:平均差系数:标准差系数:标准差系数:离散系数离散系数是一组数据的绝对变异指标与其算术是一组数据的绝对变异指标与其算术平均数的比率。平均数的比率。第46页,共60页。离散系数的作用:离散系数的作用:消除了消除了变量值绝对水平变量值绝对水平和和计量单位不同计量单位不同对绝对离对绝对离散指标的影响散指标的影响离散系数越小离散系数越小,数据分散程度越小数据分散程度越小,平均数代表性越高平均数代表性越高离散系数越大离散系数越大,数据分散程度越大数据分散程度越大,平均数代表性越低平均数代表性越低第47页,共60页。其中其中 为组平
34、均数,为组平均数,为总平均数,为总平均数,为各为各组权数,组权数,为组内方差。为组内方差。补充:方差加法定理:补充:方差加法定理:总方差组间方差组内平均方差总方差组间方差组内平均方差 iiiiiiiffffxx22222)(2iifxix第48页,共60页。例例 某企业有两个生产车间,甲车间某企业有两个生产车间,甲车间2020名工人,名工人,人均日加工产品人均日加工产品7878件,标准差为件,标准差为8 8件;乙车间件;乙车间3030名名工人,人均日加工零件工人,人均日加工零件7272件,标准差为件,标准差为1010件。计件。计算两个车间日加工产品的平均值及标准差。算两个车间日加工产品的平均值
35、及标准差。第49页,共60页。方差方差24.9450432428050301002064302030)4.7472(20)4.7478(222总平均数总平均数4.74503720302030722078212211fffxfxx(件件)71.924.94(件件)第50页,共60页。第四节第四节 偏态与峰度的测定偏态与峰度的测定数据分布特征数据分布特征集中趋势:算术平均数、众数、中位数集中趋势:算术平均数、众数、中位数分散程度:极差、分位差、标准差、离散系数分散程度:极差、分位差、标准差、离散系数偏斜程度:偏态系数偏斜程度:偏态系数扁平程度:峰度系数扁平程度:峰度系数第51页,共60页。对称分布
36、对称分布XMMeo右偏分布右偏分布XMMeo左偏分布左偏分布oeMMX0oMX0oMX0oMX一、偏度系数(一、偏度系数(SkewnessSkewness)偏度系数是对分布偏斜方向和程度的测度偏度系数是对分布偏斜方向和程度的测度.第52页,共60页。1.皮尔逊偏度系数皮尔逊偏度系数opMXSk3pSk0,右偏分布,右偏分布=0,对称分布,对称分布越接近于越接近于3,变量偏斜程度越大,变量偏斜程度越大越接近于越接近于0,变量越接近于对称分布,变量越接近于对称分布第53页,共60页。2.鲍莱(鲍莱(A.L.Bowley)偏度系数)偏度系数 是利用中位数与四分位数之间的关系测定偏斜状态。鲍莱是利用中
37、位数与四分位数之间的关系测定偏斜状态。鲍莱偏度系数是中位数到上四分位数的距离与中位数到下四分位数偏度系数是中位数到上四分位数的距离与中位数到下四分位数的距离之差除以四分位差所得到的比率,计算公式为:的距离之差除以四分位差所得到的比率,计算公式为:LULeeUBQQQMMQSk0,右偏分布,右偏分布=0,对称分布,对称分布越接近于越接近于1,变量偏斜程度越大,变量偏斜程度越大越接近于越接近于0,变量越接近于对称分布,变量越接近于对称分布1BSk第54页,共60页。3.矩法偏度系数矩法偏度系数 统计矩统计矩 未分组资料未分组资料 分组资料分组资料 原点矩原点矩 中心矩中心矩KXN1FFXKKXXN
38、)(1FFXXK)(KK第55页,共60页。XXni11222)(1XXni33)(1XXni44)(1XXni一阶原点矩一阶原点矩三阶中心矩三阶中心矩四阶中心矩四阶中心矩二阶中心矩二阶中心矩(均值)(均值)(方差)(方差)一阶中心矩一阶中心矩0)(11XXni第56页,共60页。定义矩法偏度系数定义矩法偏度系数00=0 越远离越远离0 越接近于越接近于0 分布分布 形态形态 正偏正偏 负偏负偏 对称对称偏斜程度偏斜程度越大越大偏斜程度偏斜程度越小越小333333FF)()(iiiiXXNXX第57页,共60页。二、峰度系数二、峰度系数矩法峰度系数矩法峰度系数凹型分布凹型分布均匀分布均匀分布平
39、坦峰平坦峰正态峰正态峰尖峰尖峰1.81.81.833344()iiiXXFF第58页,共60页。正态分布的正态分布的k阶中心矩阶中心矩22()21()d2xkkxex0,(1)!,kkK为奇数为奇数K为偶数为偶数22(1)kk 第59页,共60页。算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数数值平均数数值平均数位置平均数位置平均数众数众数中位数中位数平均指标平均指标极差极差异众比率异众比率 四分位数四分位数平均差平均差 标准差标准差绝对离散指标绝对离散指标相对离散指标相对离散指标变异指标变异指标偏度系数偏度系数峰度系数峰度系数 偏态和峰度指标偏态和峰度指标皮尔逊偏度系数皮尔逊偏度系数鲍莱偏度系数鲍莱偏度系数矩法偏度系数矩法偏度系数矩法峰度系数矩法峰度系数第60页,共60页。