1、节数据集中趋势的测定节数据集中趋势的测定节数据离散程度的测定节数据离散程度的测定节动态数据的分析节动态数据的分析节相关与回归分析节相关与回归分析第一节第一节 数据集中趋势的测度数据集中趋势的测度一、均值一、均值二、中位数二、中位数三、众数三、众数 、集中趋势的最常用测度值 、易受极端值的影响 、用于数值型数据,不能用于分类数据和顺序数据nxnxxxxniin121112211211kiikkikkiikiiiix fx fxfxfxfffffxf按年龄分组按年龄分组(岁)(岁)人数人数合计合计 (岁)2.1970134711kiikiiiffxxl (件)67.10330311011kiiki
2、iiffxx、将数据排序后处于中间位置上的值。、不受极端值的影响 、可以用于顺序数据和数值型数据,但不能用于分类数据【例】【例】个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据:排排 序序:位位 置置:521921n位置iNUfsMmme12iNLfsMmme12、一组数据中出现次数最多的变量值、不受极端值的影响、一组数据可能没有众数或有几个众数iLMo211iUMo212下限公式:下限公式:、众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用、中位数不受极端值影响数据分布偏斜程度较大时应用、均值易受极端值影响数据对称分布或接近对称分布时应用第二节第二节 数据离散程度的测度数
3、据离散程度的测度一、极差一、极差二、异众比率二、异众比率三、平均差三、平均差四、方差和标准差四、方差和标准差五、标准差系数五、标准差系数、一组数据的最大值与最小值之差 计算公式为:()()、离散程度的最简单测度值、易受极端值影响l l l l 两组数据的平均数均为,但极差差别较大,因此,第一组数据的差异程度较小,平均数代表性比第二组大。异众比率:非众数组次数与总次数之比。用来衡量众数的代表性。v各变量值与其均值离差绝对值的算术平均数。v反映了各变量值与均值的平均差异。v计算公式为:v v 未分组数据:v 分组数据:nxxDA.ffxxDA.v标准差:各变量值与其均值离差平方的算术平均数的平方根
4、。v 、最常用的测度值。v 、反映了各变量值与均值的平均差异。已知以下数据:要求:计算该组数据的标准差。314716007230020001800160014001200900)16002300()16001200()1600900()(2222 nnxxxxl某班学生年龄分布情况如下:年龄人数频率()合计78.061.0501*6*13*30*)6.1821()6.1820()6.1819()6.1818(2222278.061.002.0*12.0*26.0*6.0*)6.1821()6.1820()6.1819()6.1818(22222岁)(6.185012162013193018fx
5、fx工资(元)人数频率()以上 合计工资(元)人数频率()以上 合计 fxx)(2256010084500203500422500301500fxfxffxx)(290481640010081640000)(2ffxx9048164002)(ffxx标准差系数:标准差与其相应的均值之比。xv某管理局所属家企业的产品销售数据某管理局所属家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)销售利润(万元)销售利润(万元))(19.309)(25.53611万元万元sx)(09.23)(5215.3222万元万元sx 一、一、水平分析指标水平分析指标 二、二、速度分析指标速度分析
6、指标 三、三、长期趋势的分析长期趋势的分析 (一)发展水平(一)发展水平(二)平均发展水平(二)平均发展水平(三)增长量(三)增长量(四)平均增长量(四)平均增长量 l现象在不同时间上的观察值。说明现象在某一时间上所达到的水平。l按照发展水平在序列中的位置可分为最初水平、最末水平和中间水平。l按照研究目的分为基期水平和报告期水平(计算期水平)。、概念:、概念:也称为序时平均数,是对不同时间也称为序时平均数,是对不同时间发展水平求平均数。发展水平求平均数。()绝对数时间数列的序时平均数()绝对数时间数列的序时平均数 时期数列的序时平均数时期数列的序时平均数nanaaaan 21时点数列的序时平均
7、数时点数列的序时平均数连续变动的连续时点数列连续变动的连续时点数列aan 非连续变动的连续时点数列非连续变动的连续时点数列afaf l间隔相等的间断时点资料间隔相等的间断时点资料 122 1222132132211 naaaaanaaaaaaannnn 间隔不等的间断时点资料间隔不等的间断时点资料 2221111232121niinnnffffaaaaaaa()相对数或平均数时间序列的序时平均数()相对数或平均数时间序列的序时平均数bac 、概念:报告期水平与基期水平之差,说明现象在、概念:报告期水平与基期水平之差,说明现象在一定时期内增长的绝对数量。一定时期内增长的绝对数量。、分类:、分类:
8、逐期增长量:报告期水平与前期水平之差逐期增长量:报告期水平与前期水平之差累计增长量:报告期水平与固定时期水平之差累计增长量:报告期水平与固定时期水平之差 nnaaaa,11000201,aaaaaan逐期增长量逐期增长量累计增长量累计增长量 011201aaaaaaaannn niaaaaaaiiii,2,1101011201,nnaaaaaal观察期内各逐期增长量的平均数,描述现观察期内各逐期增长量的平均数,描述现象在一定时期内平均每期增长的数量。象在一定时期内平均每期增长的数量。l计算公式为计算公式为1序列项数累计增长量逐期增长量个数逐期增长量之和平均增长量)(34.43957.21961
9、63.11040.3301 )(34.4395428.6656.9508.5355.9246.8 20052000万台或万台年平均年增长量上例中 (一)发展速度(一)发展速度 (二)增长速度(二)增长速度 (三)平均发展速度和平均增长速度(三)平均发展速度和平均增长速度 (四)增长的绝对值(四)增长的绝对值、概念:报告期水平与基期水平之比,说明、概念:报告期水平与基期水平之比,说明现象在一定时期内相对的发展程度。现象在一定时期内相对的发展程度。、分类:、分类:环比发展速度:报告期水平与前一期水环比发展速度:报告期水平与前一期水平平 的比值。的比值。定基发展速度:报告期水平与固定时期定基发展速度
10、:报告期水平与固定时期水平的比值。水平的比值。、环比发展速度与定基发展速度的关系:、环比发展速度与定基发展速度的关系:()各环比发展速度的连乘积等于相应期()各环比发展速度的连乘积等于相应期的定基发展速度的定基发展速度 ()两个相邻的定基发展速度,用后者除()两个相邻的定基发展速度,用后者除以前者,等于相应时期的环比发展速度以前者,等于相应时期的环比发展速度l环比增长速度环比发展速度l定基增长速度定基发展速度1增长量报告水平基期水平增长速度发展速度基期水平基期水平、概念:、概念:平均发展速度:各环比发展速度的平均数,平均发展速度:各环比发展速度的平均数,说明现象每期变动的平均程度说明现象每期变
11、动的平均程度。发展速度平均增长速度平均100 、计算 ()几何平均法(水平法)特点:着眼于期末水平121nnnniixxxxx120110nnnnnaaaaxaaaa基年第年第年第年第年第年总产值(万元)环比发展速度()定基发展速度()某企业总产值资料:%75.4%75.1042614.1%75.104261385.11.2707.340%75.104261268.1 0571.10251.11.08711.01621.0137X 55555平均增长速度或或平均发展速度XX()方程式法(累计法)()方程式法(累计法)niinaaaaa1321 niinaXaXaXaXa1030200aniin
12、naXXXX0121【例】某公司年实现利润万元,计划今后三年共实现利润万元,求该公司利润应按多大速度增长才能达到目的。%1.15%100%1.115%1.115040,3,60,152301233210XXXXaaXXXnaaaanii,解得,即则已知平均每年增平均每年增长长各年发展水平总和为基期的各年发展水平总和为基期的年年年年年年年年年年%1.1506.066.066.01.0%15则平均增长速度为 说明速度每增长一个百分点而增加的绝说明速度每增长一个百分点而增加的绝对量,用于弥补速度分析中的局限性。对量,用于弥补速度分析中的局限性。计算公式为:计算公式为:100100%1前期水平环比增长
13、速度逐期增长量绝对值增长111100(1)100iiiiiaaaaa 甲、乙两个企业的有关资料甲、乙两个企业的有关资料年年 份份甲甲 企企 业业乙乙 企企 业业利润额利润额(万元万元)增长率增长率()利润额利润额(万元万元)增长率增长率()速度高可能掩盖低水平,低速度可能隐藏着高水平,因此要速度高可能掩盖低水平,低速度可能隐藏着高水平,因此要结合基期水平进行分析。结合基期水平进行分析。(一)时距扩大法 (二)移动平均法 (三)配合趋势模型法l 把时间序列中各期指标数值按较长的时距加以归并,形成一个新的时间序列,以消除原数列中各种偶然因素的影响,呈现出现象的长期趋势。月份产值季度季度产值产值年份
14、年份销售量(台)销售量(台)年移动平均数年移动平均数年移动平均数年移动平均数 例:某企业商品销售量数据l通过数学方法对时间数列配合一个合适通过数学方法对时间数列配合一个合适的趋势方程的趋势方程,使其与原数列达到最优拟,使其与原数列达到最优拟合。合。计算趋势值及预测判断趋势类型计算待定参数定性分析直线趋势方程:直线趋势方程:btay曲线趋势方程:曲线趋势方程:taby 2ctbtay 一、一、相关与回归的基本问题相关与回归的基本问题 二、相关与回归分析二、相关与回归分析 (一)变量间的关系(一)变量间的关系 (二)相关关系的类型(二)相关关系的类型 (三)相关关系分析方法与步骤(三)相关关系分析
15、方法与步骤l确定性的函数关系:()l不确定性的统计关系相关关系 l按照涉及的变量多少:按照涉及的变量多少:l 简单相关简单相关l 复相关复相关l按照变量相关关系的表现形式分为按照变量相关关系的表现形式分为l 线性相关线性相关散布图接近一条直线散布图接近一条直线l 非线性相关非线性相关散布图接近一条曲线散布图接近一条曲线l按照变量相关关系变化的方向分为按照变量相关关系变化的方向分为l 正相关正相关变量同方向变化(同增同减变量同方向变化(同增同减)l 负相关负相关变量反方向变化(一增一减变量反方向变化(一增一减)、相关关系的分析方法 ()相关分析 分析变量之间相关形态及相关程度 ()回归分析 确定
16、变量间相关的具体数学形式 、相关关系的分析步骤 )定性分析变量之间是否存在相关关系;)分析变量间相关的方向、形态等;)测定相关的程度相关系数;)拟合回归方程式,说明变量间的数学关系;)对回归方程的拟合程度进行测定。(一)相关分析(一)相关分析 、相关表、相关表 ()简单相关表()简单相关表 ()分组相关表()分组相关表 、对变量之间关系密切程度的度量。、对变量之间关系密切程度的度量。、对两个变量之间线性相关程度的度量称为简、对两个变量之间线性相关程度的度量称为简单相关系数。单相关系数。)()(222)(yyxxyyxxryxxy2222yynxxnyxxynru相关系数的取值在与之间。u当时,表明与没有线性相关关系。u当 时,表明与存在一定的线性相关关系:u 若 ,表明与为正相关;u 若 ,表明与为负相关。u 当 时,表明与完全线性相关:u 若,称与完全正相关;u 若,称与完全负相关。01r0r 0r 1r、基本形式:、回归系数估计:bxayxbynxbnyaxxnyxxynb 22要求:)建立线性回归方程(以广告支出为自变量);)预测当广告支出为万元时的销售量。1076.420*1477.5958146.420*6.4207.35119*77.5958*6.42009.500073*7abxy141099070*1410y