1、 第一节 总量指标与相对指标4一、总量指标4(一)概念:说明总体在一定的时间、地点条件下,达到的规模或总量水平的指标称为总量指标,一般都是以绝对数的形式表现的,又称为绝对指标。4(二)分类:1、按反映的时间状况不同可分为4 时期指标 时点指标4 2、按反映总体的内容不同可分为:4 总体总量 标志总量4 3、按计量单位不同可分为 实物指标 劳动量指标 价值量指标总量指标4(三)作用:4 是反映国情国力的基本指标4 是制定计划的基础数据4 是计算其他指标的基础4(三)正确运用总量指标(绝对数)应注意的问题41、准确地把握统计指标的涵义、范围、界限,例如GDP、GNP、工资、增加值等。42、汇总时应
2、注意指标的同类性,区分混合量指标与折合量指标。43、统一计量单位,总量指标常用的计量单位有实物量单位劳动量单位价值量单位。二、相对指标4(一)概念:两个有联系的数值之比,称为相对指标或相对数。4常用单位:百分数、倍数、千分数、万分位数、小数、名数等4(二)种类:4 1、计划完成程度相对数4 2、结构相对指标4 3、比较相对指标4 4、强度相对指标4 5、动态相对指标4 6、比例相对指标1 计划完成程度相对数 41概念:用实际完成数与计划任务数之比,称为计划完成程度。42 应用该指标时注意的问题:4 计划任务的科学性4 长期计划的检查 A水平法 B累计法4 计划任务为相对数(超计划完成3%与超计
3、划完成3个百分点的区别)4 总计划完成与分组计划完成的相结合4 进度计划的检查2结构相对指标结构相对指标 4结构相对指标是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。4结构相对指标能够反映总体内部结构和现象的类型特征。%1003比例相对指标比例相对指标 4比例相对指标是总体中不同部分数量对比的相对指标。例如男女性别比。4用以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状况。4比较相对指标比较相对指标 4比较相对指标是不同单位的同类现象数量对比而确定的相对指标,用以说明某一同类现象在同一时间内各单位发展的不平衡程度,以
4、表明同类实物在不同条件下的数量对比关系。4比较相对数通常用来比较总体内部各不同部分或单位之间的位次或差距,如武汉人均GDP与上海或北京数据之比,可以说明武汉与其他大城市之间的差距,也可以用武汉与周边中部地区城市如长沙南昌等城市之比说明武汉的优点或成绩。5强度相对指标强度相对指标 4强度相对指标是两个性质不同但有一定联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度和普遍程度。它和其他相对指标根本不同的特点,就在于它不是同类现象指标的对比。强度相对指标可以用复名数加以表示。如人均GDP指标,人均耕地面积,人均森林面积等。4强度相对指标的分子分母位置可以互换,因而有正指标、逆指
5、标之分。应用时应注意与平均指标的区别。6动态相对指标动态相对指标 4两个指标名称相同性质相同指标在不同时期的数值进行对比所形成的相对数,一般用报告期数值除以基期水平。说明两个不同时期总体的变化与发展情况。动态分析指标是一个应用非常广泛的一个指标。计算公式如下,4通常将报告期定义为正在研究的时期,而用来比较的基础时期就是基期,在实际工作中用来对比的基期往往是指上年、上季、上月等。几种重要的应用相对数4人口密度;失业率;恩格尔系数;基尼系数;森林覆盖率;资金周转率4房地产业的容积率、房屋租售比;4银行业中的拨备率 4人均粮食产量;人均钢产量;(三)计算和运用相对指标应注意的问题41、分子、分母的可
6、比性4包括经济内容、口径、计算方法、价格、计量单位、总体范围等的可比性42、相对数与绝对数相结合43、选好对比的基数4正确地选好基数:4 A选择好对比的单位;4 B选择好对比的时期;4对比基数不能太小。第二节 数据集中趋势的测度指标4描述集中趋势的实质是找出数据的集中点或中心值。可以把这些中心值称为集中趋势的代表值。常见的集中值有:4 众数 Mode4 中位数 Median4 算术平均数 Mean4 几何平均数 Geometric mean4 调和平均数 Harmonic mean 一、众数(The mode)4(一)概念:将一组数据按在小顺序的加以排列,出现最多变量值即为众数。4(二)公式:
7、4L众数组下限 4d众数组组距;4f0众数组的次数;4f0-1众数组的前一组次数;4f0+1众数组的后的一组次数;dLM211010021001ffff(三)众数的特征41、概念通俗易懂42、不受极端值影响,有开口组时也可计算43、有可能出现两个或两上以上M044、不适合作代数运算。NfNRV0二、中位数(The median)4(一)概念:The median is a measure of the center of the data,with half of the values less than the median,and half greater than the median.
8、The median is not sensitive to outlying varibles4(二)公式:4L 中位数所在组下限4Sm-1累计到中位数的前一组的次数4f m 中位数所在组的次数4d 中位数所在组的组距dfSfLMmme12(三)中位数的特征41、不受极端值的影响42、适合于定序的资料。如七名学生成绩排序为AABBCDD则me=B(等)43、一组数据中,各数据与中位数的绝对值之和小于其他任何数值之间的绝对差,4即 为最小。44、不适合作代数运算eiMx三、均值(又称算术平均数)(The arithmetic mean)4(一)概念:总体的标志总量与总体总量之比。4(二)公式:
9、)()(21221121加权算术平均数简单算术平均数fxfffffxfxfxxnxnxxxxnnnn(三)均值的数学性质 41、各个变量值与均值离差之和为零。42、各变量值与其平均值的离差平方和为最小。43、每个变量值加以或减一个任意数A,则其平均数也增加或减少这个数A。44、如果每个变量值乘以或除以任意数A,则平均数也等于原平均数乘以或除以A。45、若数据较大可以对原数据进行先加减后乘除其原平均数保持相应变化。4上式34中A为任意常数。(三)均值的数学性质4公式14公式24公式34公式44公式50)(xxi最小2)(xxiAxffAx)(AXffAX/)/(AiffiAXX)((四)均值的应
10、用特点41、应用范围最广4与中位数、众数、调和平均、几何平均数相比,使用范围更广。42、受极端值的影响大4极大值或极小值对均值的影响很大。四、调和平均数 4(一)调和平均数(H)41、概念:变量值倒数的算术平均数的倒数42、公式:4简单公式4加权公式43、特征:4X i 04受极端值的影响4应用时可以看成是均值的变形XMMxMxMxMMMMHXMNXXXNHnnnn22112121111五、几何平均数 41、概念:变量值乘积的项数方根42、公式:43、特点:4适合等于比或类似等比4X i04受极端值的影响大)()()()(12112111加权简单ppnppnnnxxxGXxxGH、G、X、Me
11、、M0之间的关系 4(一)X、G、H之间的关系4在相同数据下,XGH4(二)X、Me、M0之间的关系322323)(3000XMMMMXXMMXXMeee六、集中趋势分析应注意的问题4(一)只有在同质总体的前提下才能计算均值,否则会掩盖事物质的差别。4如企业按照性别计算的平均工资,体现了不同性别的差异,但掩盖了不同岗位工资差异,掩盖了顾主和员工的收入差异.集中趋势分析应注意的问题职工类别基 期报 告 期工人数平均工资工人数平均工资A20075001007800B20070002007200C50050008005200全厂900600011005800(二)在分组情况下,要与分组法相结合。集中
12、趋势分析应注意的问题 学生成绩人数%60以下2 4.1760-701122.9270-801837.5080-901225.0090-100510.41 合计48100.00(三)要与分配数列、典型事例相结合。4(四)要与离散趋势分析相结合。以弥补其不能反映变量值差异和受极端值影响的缺陷。集中趋势分析应注意的问题第三节数据离散程度的测度指标(Measures of variation)4一、概念:所谓离散程度(或离中趋势)是指变量值背离分布中心值特征。是与集中趋势相对而存在的概念。4二、其作用4(一)描述总体内部变量值的差异程度,说明社会经济现象过程的均衡性或稳定性4如甲、乙两厂生产相同的钢材
13、,现分别找出10根钢材,经测试其抗拉强度为:4甲厂:110、120、120、125、125、125、130、135、140、1304乙方:90、100、120、125、130、130、135、140、145、1454试比较哪个厂的钢材质量更佳?4(二)衡量和比较均值指标的代表性高底4离散程度(离中趋势)指标愈大,平均数代表性愈小。反之离散程度(离中趋势)指标愈小,平均数代表性愈大。4(三)为抽选样本单位数提供依据4总体标志变异程度愈小,被研究总体愈一致,为了获得代表性资料,就可以抽取较少的样本单位;反之,需要多抽。三、离散程度指标4(一)极差R(The range)4又称为全距,是变量值中,最
14、大值与最小值之差。4R=max(x i)-min(x i)4其特征是:计算方法简便;通俗易懂;只能作粗略程度的度量;有一定的局限性。极差应用4中国加入WTO十周年人民币汇率变化 4年份 最高价 最低价 42001 8.2786 8.2762 42002 8.2775 8.2765 42003 8.2776 8.2765 42004 8.2774 8.2765 42005 8.2765 8.0702 42006 8.0705 7.8087 42007 7.8135 7.3040 42008 7.2996 6.8009 42009 6.8399 6.8250 42010 6.8287 6.6227
15、 4(资料来源:凤凰网理财)离散程度指标 4(二)四分位差4 四分位差类似于极差,但优于极差。将数据按大小顺序加以排列,并将全部数据分成四等份,其位置分别为,Q1、Q2、Q3 四分位差就是Q1到Q3之间的距离的一半。4四分方差是以中位数Q2为中心点,表示Q2到Q1或Q2到Q3之间的距离,四分位差越小,意味着中间的数据越集中,四分位差越大,则说明中间的数据越分散。所以四分位差是说明中位数的代表性高低的指标。4不受极端法的影响,即便有开口组,也可以计算。213QQDQ离散程度指标4(三)平均差,A.D(The mean absolute deviation)4总体各个指标值对共算术平均数的离差绝对
16、值的算术平均数。4考虑了每个Xi对的离差,较全面准确;)()(加权简单ffxxADnxxADii离散程度指标4(四)标准差(The Standard deviation)4又称均方差,是各变量值与其均值离差平方和的算术平均数的均方根。4 考虑了每个Xi对的离差,因此准确全面运用范围广。简化计算公式:iiffiAxffiAX22)()()()()()(22加权公式简单方式ffXXnXX22)(XX 根据某地大学生根据某地大学生20122012年消费情况年消费情况,计算人月消费额的方差和标准计算人月消费额的方差和标准差(平均差(平均458458元)元)月消费额(元)组中值x人 数f300以下300
17、400400500500600600700700以上250350450550650750801804302207020-208-108-892192292432641166464846436864852643461120209952027520186208025804801705280合 计100011736000 xx 2xx fxx21173610001173600022ffxx元33.1081000117360002ffxx 计算结果表明,每个大学生的月消费额与平均数相比,标准差=108.33元。方差与标准差用于测度数据的离散程度作用是一致的,但标准差的计量单位与变量值的计量单位相同,其
18、实际意义比方差清楚,所以通常在对社会经济现象进行分析时,更多使用标准差来测度统计数据的差异程度。4、是非标志的标准差 在社会经济活动中,常常存在这样的总体,其全部单位由具有某一标志的单位和不具有某一标志的单位两部分组成。这种将总体划分为“有”与“无”或者“是”与“非”的标志被称为是非标志(交替标志)。1表示具有所研究的变量值0表示不具有所研究的变量值N总体单位数N1 具有所研究变量值的单位数N0 不具有所研究变量值的单位数 这两部分单位数占全部单位数的成数(比重)可表示为:P=N1/N 总体中具有所研究变量值的单位数所占的成数;Q=N0 /N 总体中不具有所研究变量值的单位数所占的成数 两个成
19、数之和等于1,即:101NNNN1qp 现说明用是非标志计算平均数与标准差的方法如下:是非标志x总体单位数(成数)f变量总体单位数xf离差离差平方离差平方加权10PqP01p0-p合 计1pxx 2xx fxx221p20ppp21qp20qppq22是非标志的算术平均数为:ppqppfxfx1 是非标志的标准差为:pppqqpqppqffxx12或 例 某机械厂铸造车间本月生产6000吨铸件,其中合格品5400吨,不合格品600吨。其是非标志的平均数、标准差、方差计算如下:9.060005400p3.01.09.0pqp09.01.09.02 pqp离散程度指标4(五)离散系数:VR;VA.
20、D;V 4例如:对10名成人和10名小孩身高资料如下,试比较其离散程度:4成人组:166 169 172 180 170 172 174 168 173 1774幼儿组:68 69 68 70 71 73 72 73 74 75033.01.7373.2023.01.17299.31.731.17237.299.3儿成儿成儿成VVcmxcmxcmcm(六)资料的偏度、峰度的度量4均值反映次数的分布的集中趋势,变异指标反映次数分布的离中趋势。但是,当两个分布的均值和变异指标相同时,其分布的形态可能完全不同,一个为正态分布,另一个为偏态分布。这时就需要另一种重要指标偏斜度。4偏 度 Skewnes
21、s4峰 度 kurtosis 偏 度(Skewness)4偏度是指次数分布非对称的方向几程度的描述指标。为了精确测定次数分布的偏斜状况,统计上采用偏斜度指标。计算偏斜度有不同的方法,现介绍其中比较简单的一种方法。4为0表示对称分布,大于0表示右偏或正偏。小于0表示左偏或负偏。峰 度(kurtosis)4峰度是指次数分布曲线顶峰的尖平程度,是次数分布的另一个重要特征。统计上,常以正态分布曲线为标准,来观察比较某一次数分布曲线的顶端尖顶或平顶以及尖平程度的大小。根据变量值的集中与分散程度,峰度一般可表现为三种形态:尖顶峰度、平顶峰度和标准峰度。峰 度(kurtosis)4计算公式如下:4当次数分布为正态分布曲线时,=3,以此为标准就可比较分析各种次数分布曲线的峰度。当3时,表示分布曲线呈尖顶峰度,为尖顶曲线,说明变量值的次数较为密集地分布在众数的周围,值越大于3,分布曲线的顶端越尖峭。当3时,表示分布曲线呈平顶峰度,为平顶曲线,说明变量值的次数分布比较均匀地分散在众数的两侧,值越小于3,则分布曲线的顶峰就越平缓。