1、第九章第九章 相关与回归相关与回归相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是经济分具体形式和规律性的统计方法,是经济分析、预测和控制的重要工具。析、预测和控制的重要工具。第一节第一节 相关与回归分析的基本问题相关与回归分析的基本问题一、相关的概念与种类一、相关的概念与种类n函数关系函数关系现象之间确实存在数量上的相互依存关系。现象之间确实存在数量上的相互依存关系。表现在:一个现象发生数量上的变化,另表现在:一个现象发生数量上的变化,另一个与之相联系的现象也会相应地
2、发生数一个与之相联系的现象也会相应地发生数量上的变化。量上的变化。n相关关系相关关系现象之间数量上不确定、不严格的依存关现象之间数量上不确定、不严格的依存关系。相关关系的全称为统计相关关系,它系。相关关系的全称为统计相关关系,它属于变量之间的一种不完全确定的关系。属于变量之间的一种不完全确定的关系。出租汽车费用与行驶里程:出租汽车费用与行驶里程:总费用总费用=行驶里程行驶里程 每公里单价每公里单价PKG 家庭收入与恩格尔系数:家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。相关关系相关关系n相关关系与函数关系的区别相关关系与函数关系的区别n函数关系是变量之间的一种
3、严格、完全确定性的关系,即一个变量的数值完全有另一个(或一组)变量的数值所决定、控制。函数关系通常可以用数学公式确切地表示出来。n相关关系难以像函数关系那样,用数学公式去准确表达。n相关关系与函数关系的联系相关关系与函数关系的联系n 由于客观上常会出现观察或测量上的误差由于客观上常会出现观察或测量上的误差等原因,函数关系在实际工作中往往通过相等原因,函数关系在实际工作中往往通过相关关系表现出来。当人们对某些现象内部规关关系表现出来。当人们对某些现象内部规律有较深刻认识时,相关关系可能变为函数律有较深刻认识时,相关关系可能变为函数关系。为此,在研究相关关系时,又常常使关系。为此,在研究相关关系时
4、,又常常使用函数关系作为工具,用一定的函数关系表用函数关系作为工具,用一定的函数关系表现相关关系的数量联系。现相关关系的数量联系。n相关关系的种类相关关系的种类根据相关关系的根据相关关系的程度划分程度划分 根据相关关系的方根据相关关系的方向划分向划分 根据自变量的多少根据自变量的多少划分划分 根据变量间相互关根据变量间相互关系的表现形式划分系的表现形式划分 不完全相关不完全相关 完全相关完全相关 不相关不相关 正相关正相关 负相关负相关 复相关复相关 单相关单相关 直线相关直线相关 曲线相关曲线相关 1、不相关。、不相关。如果变量间彼此的数量变化互相独立,则其关系为不相如果变量间彼此的数量变化
5、互相独立,则其关系为不相关。自变量关。自变量x变动时,因变量变动时,因变量y的数值不随之相应变动。例如,产品税的数值不随之相应变动。例如,产品税额的多少与工人的出勤率、家庭收入多少与孩子的多少之间都不存在额的多少与工人的出勤率、家庭收入多少与孩子的多少之间都不存在相关关系。相关关系。2、完全相关。、完全相关。如果一个变量的变化是由其他变量的数量变化所唯一如果一个变量的变化是由其他变量的数量变化所唯一确定,此时变量间的关系称为完全相关。即因变量确定,此时变量间的关系称为完全相关。即因变量y的数值完全随自的数值完全随自变量变量x的变动而变动,它在相关图上表现为所有的观察点都落在同一的变动而变动,它
6、在相关图上表现为所有的观察点都落在同一条直线上,这种情况下,相关关系实际上是函数关系。所以,函数关条直线上,这种情况下,相关关系实际上是函数关系。所以,函数关系是相关关系的一种特殊情况。系是相关关系的一种特殊情况。3、不完全相关。、不完全相关。如果变量间的关系介于不相关和完全相关之间,则如果变量间的关系介于不相关和完全相关之间,则称为不完全相关。如妇女的结婚年龄与受教育程度之间的一种关系。称为不完全相关。如妇女的结婚年龄与受教育程度之间的一种关系。大多数相关关系属于不完全相关,是统计研究的主要对象大多数相关关系属于不完全相关,是统计研究的主要对象根据相关关系的程度划根据相关关系的程度划分分1、
7、正相关。、正相关。指两个因素(或变量)之间的变化方向一致,指两个因素(或变量)之间的变化方向一致,都是呈增长或下降的趋势。即自变量都是呈增长或下降的趋势。即自变量x的值增加(或减的值增加(或减少),因变量少),因变量y的值也相应地增加(或减少),这样的关的值也相应地增加(或减少),这样的关系就是正相关。例如,工业总产值增加,企业税利总额也系就是正相关。例如,工业总产值增加,企业税利总额也随之增加;家庭消费支出随收入增加而增加等。随之增加;家庭消费支出随收入增加而增加等。2、负相关。、负相关。指两个因素或变量之间变化方向相反,即自指两个因素或变量之间变化方向相反,即自变量的数值增大(或减小),因
8、变量随之减小(或增大)。变量的数值增大(或减小),因变量随之减小(或增大)。如劳动生产率提高,产品成本降低;产品成本降低,企业如劳动生产率提高,产品成本降低;产品成本降低,企业利润增加等。利润增加等。根据相关关系的方向划分根据相关关系的方向划分1、单相关。、单相关。两个因素之间的相关关系叫单相关,两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量。即研究时只涉及一个自变量和一个因变量。2、复相关。、复相关。三个或三个以上因素的相关关系叫三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变复相关,即研究时涉及两个或两个以上的自变量和因变量。量和因变量。根据自变
9、量的多少划分根据自变量的多少划分1、直线相关(或线性相关)。、直线相关(或线性相关)。当相关关系的自变量当相关关系的自变量x发生变发生变动,因变量动,因变量y值随之发生大致均等的变动,从图像上近似值随之发生大致均等的变动,从图像上近似地表现为直线形式,这种相关通称为直线(或线性)相关。地表现为直线形式,这种相关通称为直线(或线性)相关。例如,销售量与销售额之间就呈直线相关关系。例如,销售量与销售额之间就呈直线相关关系。2、曲线(或非线性)相关。、曲线(或非线性)相关。在两个相关现象中,自变量在两个相关现象中,自变量x值值发生变动,因变量发生变动,因变量y也随之发生变动,这种变动不是均等也随之发
10、生变动,这种变动不是均等的,在图像上的分布是各种不同的曲线形式,这种相关关的,在图像上的分布是各种不同的曲线形式,这种相关关系称为曲线(或非线性)相关。曲线相关在相关图上的分系称为曲线(或非线性)相关。曲线相关在相关图上的分布,表现为抛物线、双曲线、指数曲线等非直线形式。例布,表现为抛物线、双曲线、指数曲线等非直线形式。例如,从人的生命全过程看,年龄与医疗费支出呈非线性相如,从人的生命全过程看,年龄与医疗费支出呈非线性相关。关。根据变量间相互关系的表现形式划分根据变量间相互关系的表现形式划分二、回归的概念和种类二、回归的概念和种类n1.回归的概念回归的概念 源自遗传学源自遗传学 现代概念:研究
11、自变量与因变量之间关系现代概念:研究自变量与因变量之间关系,其目的在于根其目的在于根据已知自变量来估计和预测因变量的总平均值。据已知自变量来估计和预测因变量的总平均值。n2.回归的种类回归的种类 根据回归变量多少,分为一元回归方程和多元回归方程根据回归变量多少,分为一元回归方程和多元回归方程 根据回归是否线性,分为线性回归方程和非线性回归方根据回归是否线性,分为线性回归方程和非线性回归方程程 根据回归是否有滞后关系,分为自身回归方程和无自身根据回归是否有滞后关系,分为自身回归方程和无自身回归现象的方程。回归现象的方程。n3.相关分析与回归分析的区别相关分析与回归分析的区别 相关分析研究随机变量
12、之间相互依存关系的方向和密切相关分析研究随机变量之间相互依存关系的方向和密切程度。直线相关用程度。直线相关用相关系数相关系数,曲线相关用曲线相关用相关指数相关指数表示。表示。回归分析研究某一因变量与一个或多个自变量之间数据回归分析研究某一因变量与一个或多个自变量之间数据关系变动趋势的方法。用关系变动趋势的方法。用回归方程回归方程表示表示。相关分析研究的都是随机变量,不用区分因变量和自变相关分析研究的都是随机变量,不用区分因变量和自变量量 回归分析研究时,要定出因变量和自变量。其中,自变回归分析研究时,要定出因变量和自变量。其中,自变量是确定的普通变量量是确定的普通变量,因变量是随机变量。因变量
13、是随机变量。相关和回归是研究事务两个不可分割的方面。相关和回归是研究事务两个不可分割的方面。二者具有共同的研究对象,而且在具体应用时,常常必二者具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有高度相关时,进行回归分析寻求其相关的具体形式才有意义。意义。认识现象之间相关
14、形式、方向、相关程度。认识现象之间相关形式、方向、相关程度。对经济现象进行推算和预测。对经济现象进行推算和预测。可用于补充缺少的资料。可用于补充缺少的资料。相关分析的主要内容相关分析的主要内容揭示现象之间是否存在相关关系。揭示现象之间是否存在相关关系。确定相关关系的表现形式。确定相关关系的表现形式。确定现象变量间相关关系的密切程度和方向。确定现象变量间相关关系的密切程度和方向。回归分析的主要内容回归分析的主要内容建立相关关系的回归方程。建立相关关系的回归方程。测定因变量的估计值与估计值的误差程度。测定因变量的估计值与估计值的误差程度。进行相关关系的定性分析进行相关关系的定性分析 确定回归方程确
15、定回归方程 计算相关系数或相关指数,对回归方程进行计算相关系数或相关指数,对回归方程进行显著性检验。显著性检验。利用回归方程式进行推算和预测利用回归方程式进行推算和预测 对推算和预测作出置信区间估计。对推算和预测作出置信区间估计。(一)直线相关分析的特点(一)直线相关分析的特点1.两个变量是对等关系两个变量是对等关系2.只能算出一个相关系数只能算出一个相关系数3.相关系数有正负号,表示正相关或负相关相关系数有正负号,表示正相关或负相关4.相关系数的计算对资料有一定要求,相关的两个变量必相关系数的计算对资料有一定要求,相关的两个变量必须都是随机的,这也反映对等关系。相关系数的计算须都是随机的,这
16、也反映对等关系。相关系数的计算与应用有其独立意义,可直接从给定资料计算,可不与应用有其独立意义,可直接从给定资料计算,可不经过回归分析。经过回归分析。(二)相关关系的判断(二)相关关系的判断1.定性判断法定性判断法这是从定性角度分析和判断现象之间是否这是从定性角度分析和判断现象之间是否具有相关关系,以及相关关系的类型。具有相关关系,以及相关关系的类型。这种分析和判断所依据的是对现象的了解这种分析和判断所依据的是对现象的了解和对有关的理论知识、专业知识的掌握,和对有关的理论知识、专业知识的掌握,以及一定的社会实践经验。以及一定的社会实践经验。相关表、相关图法相关表、相关图法在定性判断的基础上,把
17、具有相关关系的两个在定性判断的基础上,把具有相关关系的两个量的具体数值按照一定顺序平行排列在一张表量的具体数值按照一定顺序平行排列在一张表上,以观察它们之间的相互关系,这种表就称上,以观察它们之间的相互关系,这种表就称为为相关表相关表;把相关表上一一对应的具体数值在直角坐标系把相关表上一一对应的具体数值在直角坐标系中用点标出来而形成的散点图则称为中用点标出来而形成的散点图则称为相关图相关图。利用相关图和相关表,可以更直观、更形象地利用相关图和相关表,可以更直观、更形象地表现变量之间的相互关系。表现变量之间的相互关系。相关表:相关表:编号编号工龄长度工龄长度(年)(年)x日产量(件)日产量(件)
18、y编号编号工龄长度工龄长度(年)(年)x日产量日产量(件)(件)y123456789109101213141515171717100011001050130015001200125016001600180011121314151617181920181818202020212122221500170018001500175018501050185018001950 xy直线负相关直线正相关xy完全直线相关xy不相关xy相相 关关 图图2.2.定量测定相关系数定量测定相关系数(1)相关系数)相关系数说明直线相关条件下,两个现象说明直线相关条件下,两个现象之间相关关系密切程度的统计分析指标。之间相
19、关关系密切程度的统计分析指标。在计算相关系数之前,首先判定两个现象之间是否存在着在计算相关系数之前,首先判定两个现象之间是否存在着直线相关,否则计算出的相关系数就没有实际意义。直线相关,否则计算出的相关系数就没有实际意义。判定的一般方法是作图法。作图法是通过作散点图来判定判定的一般方法是作图法。作图法是通过作散点图来判定两个现象之间是否存在直线相关。两个现象之间是否存在直线相关。对两个变量之间线性相关程度的度量称为简单对两个变量之间线性相关程度的度量称为简单相关系数,用相关系数,用r 表示。而对于曲线相关来说,是表示。而对于曲线相关来说,是用相关指数来衡量其相关程度的。直线相关系数用相关指数来
20、衡量其相关程度的。直线相关系数也称也称皮尔逊相关系数皮尔逊相关系数。yxxyr2yx2xy协方差协方差变量变量x的标准差的标准差变量变量y的标准差的标准差nyynxxnyyxx2y2x2xy LLLxxxyryyxy22yx2yyxxyyxx负相关正相关0000rrLLxyxy3.相关系数相关系数r的意义的意义 相关系数的取值范围是:相关系数的取值范围是:1r1(r 1)r愈接近愈接近0,x与与y之间的直线相关程度愈小,之间的直线相关程度愈小,r 的值愈接近的值愈接近1,x与与y之间的相关程度愈高。之间的相关程度愈高。r 0表示两个变量之间不存在直线相关;表示两个变量之间不存在直线相关;r0.
21、3,表示极低度相关,表示极低度相关 0.3 r 0.5,表示低度相关,表示低度相关 0.5 r 0.8,表示中度相关,表示中度相关 r 0.8,表示高度相关,表示高度相关 r1表示存在着完全正相关;表示存在着完全正相关;r-1表示存在着完全负相关。表示存在着完全负相关。但需要注意的是,但需要注意的是,r只表示只表示x与与y的直线相关的直线相关密切程度密切程度。当。当r很小甚至等于很小甚至等于0时,并不一定时,并不一定表示表示x与与y之间就不存在其他类型的关系。变之间就不存在其他类型的关系。变量之间的非线性相关程度较大可能导致量之间的非线性相关程度较大可能导致r0,当当 r0或或r很小时,不能得
22、出变量无关的结论。很小时,不能得出变量无关的结论。对两个线性相关的变量对两个线性相关的变量x和和y,根据研究目,根据研究目的,确定出自便量和因变量,建立两个变量的,确定出自便量和因变量,建立两个变量间的线性回归方程,然后用回归方程赖测定间的线性回归方程,然后用回归方程赖测定因变量的发展趋势的分析过程。因变量的发展趋势的分析过程。n两个变量的地位不对等。分自变量和因变量两个变量的地位不对等。分自变量和因变量n因变量是随机变量,自变量为非随机变量,可因变量是随机变量,自变量为非随机变量,可以预先控制和给定。以预先控制和给定。n回归方程可据以利用自变量的给定值推算因变回归方程可据以利用自变量的给定值
23、推算因变量的相应值。量的相应值。n回归系数可正可负。正号说明正相关,负号说回归系数可正可负。正号说明正相关,负号说明负相关。明负相关。(一)简单直线回归分析的特点(一)简单直线回归分析的特点n1.简单直线回归方程又称一元线性回归方程。简单直线回归方程又称一元线性回归方程。它是根据成对的两种变量的数据,寻找一直线它是根据成对的两种变量的数据,寻找一直线方程代替两变量的变化趋势,根据自变量的变方程代替两变量的变化趋势,根据自变量的变动,来推算因变量发展趋势和水平的方法。它动,来推算因变量发展趋势和水平的方法。它是研究相互关联的两种经济现象数量变动依存是研究相互关联的两种经济现象数量变动依存关系的一
24、种方法。关系的一种方法。(二)简单直线回归方程的确定(二)简单直线回归方程的确定 当两变量当两变量x、y 之间存在直线相关关系时,可以用之间存在直线相关关系时,可以用直线方程直线方程 近似代替近似代替x与与y的关系。的关系。方程中的参数方程中的参数a是回归直线的起点值,表现为当时是回归直线的起点值,表现为当时回归直线的回归直线的y坐标,即坐标,即y轴上的一个点,数学上叫轴上的一个点,数学上叫截距。截距。参数参数b 是回归直线的斜率,即回归系数。它代表是回归直线的斜率,即回归系数。它代表自变量自变量x每增加一个单位时,因变量每增加一个单位时,因变量y的平均增加的平均增加值。值。a和和b 数值确定
25、了,直线回归方程也就确定了。数值确定了,直线回归方程也就确定了。确定确定a、b的数值可用最小平方法。的数值可用最小平方法。bxaybxay最小平方法最小平方法基本数学要求:基本数学要求:2()m inyy02012min,min)(22xbxaybxaybabxayyy,有求偏导数,并令其为零、分别对函数中,有由xbynxbnyaxxnyxxynb22)(进一步整理,有:进一步整理,有:2ynab xxya xb x (三)(三)相关性的相关性的显著性检验显著性检验R检验步骤:检验步骤:(1)计算相关系数计算相关系数R;(2)根据回归模型的自由度()根据回归模型的自由度(n-m)和给定显)和给
26、定显著性水平著性水平 值,从相关系数表中查出临界值值,从相关系数表中查出临界值R (n-m)。)。(3)判别:若)判别:若R R (n-m),表明两变,表明两变量之间线性相关关系显著,检验通过,模型可量之间线性相关关系显著,检验通过,模型可用于预测;若用于预测;若R R (n-m),表明两),表明两变量之间线性相关关系不显著,检验不通过,变量之间线性相关关系不显著,检验不通过,模型不能用于预测。模型不能用于预测。(四)估计标准误差(四)估计标准误差n估计标准误差:也称剩余标准差,是剩估计标准误差:也称剩余标准差,是剩余变差的平均数的方根。反映观测值与余变差的平均数的方根。反映观测值与估计值之间
27、的平均离差程度。估计值之间的平均离差程度。22)(22nxybyaynyysy若各观测值与估计值的平均离差愈小,说明两若各观测值与估计值的平均离差愈小,说明两变量之间的线性关系愈密切;反之,愈不密切变量之间的线性关系愈密切;反之,愈不密切估计标准误与相关系数估计标准误与相关系数r的关系的关系 二者都具有说明现象之间的相关关系密切程二者都具有说明现象之间的相关关系密切程度的作用。度的作用。相关关系与说明的现象之间的密切程度成正相关关系与说明的现象之间的密切程度成正向关系,而估计标准误的概念比较明确,回向关系,而估计标准误的概念比较明确,回归误差用绝对数表示,它所说明的密切程度归误差用绝对数表示,
28、它所说明的密切程度并不那么明显,也不能说明是正相关还是负并不那么明显,也不能说明是正相关还是负相关。相关。相关关系越大,估计标准误越小。相关关系越大,估计标准误越小。1、点估计:、点估计:2、区间估计:、区间估计:00bxay222220nyxbyaynyySSmntyiiiiiiyy例:企业编号企业编号产量产量x(千克)(千克)生产费用生产费用y(千元)(千元)123456789101112404250556578841001161251301401301501551401501541561701671801751851600176425003025422560847056100001345
29、61562516900196001690022500240251960022500237162722528900278893240030625342255200630077507700975012012138601700019372225002275025900合计合计102519211018353105051700942x2yxy解:(解:(1)绘制散点图)绘制散点图(2)建立简单直线回归方程:)建立简单直线回归方程:4207.0)1025(101835121921102517009412222XXnYXXYnb15.1241210254207.01219211XbYXbYna00bxay其
30、中其中a124.15(千克)的含义为生产费用的起点值(千克)的含义为生产费用的起点值b0.4027表示产品产量每增加表示产品产量每增加1千克,生产费用平均千克,生产费用平均增加增加0.4027千元。千元。xy4207.015.124(3)计算相关系数)计算相关系数5833.60081219211025170094nyxxy9167.2984121921310505nyy9167.14282121025101835nxxxy222yy222yyLLL9202.09167.29849867.142825833.6008yyxyLLLxxr(4)如根据上表中有关数据,可计算出生产费用对)如根据上表中
31、有关数据,可计算出生产费用对产量回归的估计的标准误差:产量回归的估计的标准误差:74.6212170944207.0192105.12431050522nXYbYaYSY千元(5)预测。n当产量为当产量为150千克时,生产费用千克时,生产费用n当产量为当产量为150千克时,生产费用的千克时,生产费用的95置信区置信区间为:间为:即:即:172.2376,202.2724千元)(255.1871504207.015.124y74.62281.2255.18720ySmntyn相关与回归分析应注意的问题相关与回归分析应注意的问题 应建立在现象之间确实存在相关关系的基础上应建立在现象之间确实存在相关
32、关系的基础上回归方程、相关系数和回归误差应结合使用回归方程、相关系数和回归误差应结合使用 要注意现象质的界限及相关关系作用的范围要注意现象质的界限及相关关系作用的范围要具体问题具体分析要具体问题具体分析 要考虑社会现象之间的复杂性要考虑社会现象之间的复杂性 第四节第四节 曲线相关与曲线回归分析曲线相关与曲线回归分析n一一.曲线相关与曲线回归的概念和分类曲线相关与曲线回归的概念和分类n曲线相关曲线相关:指相关的两个变量对应值的散点图呈某种曲线形状的关指相关的两个变量对应值的散点图呈某种曲线形状的关系式系式.n曲线回归曲线回归:根据曲线相关的变量拟合的回归方程根据曲线相关的变量拟合的回归方程.n常
33、见的曲线一元回归方程有常见的曲线一元回归方程有:n(1)双曲线回归方程双曲线回归方程:n(2)对数曲线回归方程对数曲线回归方程:n(3)二次曲线回归方程二次曲线回归方程:n(4)指数曲线回归方程指数曲线回归方程:n其中其中,(1)(2)(3)可以通过简单的变量换元可直接化为线可以通过简单的变量换元可直接化为线性回归方程性回归方程,采用最小平方法估计其待定参数采用最小平方法估计其待定参数;(4)常常通常常通过对数变形过对数变形,间接采用最小平方法估计参数间接采用最小平方法估计参数xbay1lnyabx2cxbxayxaby二、可线性化的曲线回归方程变换二、可线性化的曲线回归方程变换代换后方程代换
34、后方程方程代换方程代换原方程原方程xbayln2cxbxayxbay1xx1xbayxxlnxbay2xx xcbxayn时间数列自身相关:时间数列自身相关:指一个变量自身随时间的不同,指一个变量自身随时间的不同,其值在前后期其值在前后期(前一期或前几期前一期或前几期)之间表现出一定的依存关之间表现出一定的依存关系系.n例如本年产品产量与上一年产量有关例如本年产品产量与上一年产量有关,可用上年的产品产可用上年的产品产量与本年的产量进行分析量与本年的产量进行分析,又如荔枝的产量有大小之分又如荔枝的产量有大小之分,其其本年的产本年的产46量与前两年的产量有关量与前两年的产量有关,可用前两年的产量与
35、可用前两年的产量与今年的产量进行相关分析今年的产量进行相关分析,这种自身回归方程这种自身回归方程,对与掌握社对与掌握社会经济现象发展的规律性和进行经济预测决策都有重要会经济现象发展的规律性和进行经济预测决策都有重要作用作用n简单自身回归方程简单自身回归方程n参数参数a,b的估计与一元线性回归类似。的估计与一元线性回归类似。n例例9-71ttbyay第六节第六节 复相关与复回归分析复相关与复回归分析n一、复相关与复回归分析的概念与种类一、复相关与复回归分析的概念与种类n复相关(多元相关):多个变量之间的依存关系。复相关(多元相关):多个变量之间的依存关系。n复回归(多元回归):根据一个因变量和多
36、个自变量之间复回归(多元回归):根据一个因变量和多个自变量之间的关系建立的回归方程。的关系建立的回归方程。n复回归按照自变量的多少可以分为:复回归按照自变量的多少可以分为:n二元线性回归:二元线性回归:n三元线性回归:三元线性回归:nn元线性回归:元线性回归:22110 xbxbby3322110 xbxbxbbynnxbxbxbby22110二、二元线性回归分析二、二元线性回归分析n1、二元回归方程的确定、二元回归方程的确定n2、参数的估计:最小二乘法、参数的估计:最小二乘法n3、复相关系数:、复相关系数:表示一个因变量与多个子变量之间的相关表示一个因变量与多个子变量之间的相关 程度的指标。
37、程度的指标。22110 xbxbby22)()(yyyyR4 4、估计标准误、估计标准误5 5、检验:、检验:R R检验检验6 6、预测:点预测,区间预测同简单线形回归类似。、预测:点预测,区间预测同简单线形回归类似。mnyySy2)(第十章第十章 时间数时间数列分析指标列分析指标是指将社会经济现象是指将社会经济现象在不同时间上发展变化的某种统计指标数值,按在不同时间上发展变化的某种统计指标数值,按时间先后顺序排列所形成的数列,亦称动态数列。时间先后顺序排列所形成的数列,亦称动态数列。资料所属的时间资料所属的时间 在一定时间条件下的统计指标数值在一定时间条件下的统计指标数值n例例1 将我国将我
38、国19952002年的某产品产量发展情况按年的某产品产量发展情况按时间先后顺序排列起来就是一个时间数列。时间先后顺序排列起来就是一个时间数列。n时间数列由两个基本要素构成:一是被研究现象所时间数列由两个基本要素构成:一是被研究现象所属的时间;二是在一定时间条件下的统计指标数值属的时间;二是在一定时间条件下的统计指标数值时时间间数数列列的的种种类类绝对数时间数列绝对数时间数列 时期数列时期数列 时点数列时点数列 相对数时间数列相对数时间数列由两个时期数列对比而成的相对数时由两个时期数列对比而成的相对数时间数列间数列 由两个时点数列对比而成的相对数时由两个时点数列对比而成的相对数时间数列间数列 由
39、一个时期数列和一个时点数列对比由一个时期数列和一个时点数列对比形成的相对数时间数列形成的相对数时间数列 平均数时间数列平均数时间数列 绝对数时间数列是指将反映某种社会经济现象的绝对数时间数列是指将反映某种社会经济现象的一系列总量指标按时间的先后顺序排列而形成的一系列总量指标按时间的先后顺序排列而形成的数列。总量指标时间数列反映了社会经济现象总数列。总量指标时间数列反映了社会经济现象总量在各个时期所达到的规模、水平等总量特征。量在各个时期所达到的规模、水平等总量特征。1、时期数列。、时期数列。是指由时期总量指标编制而成的是指由时期总量指标编制而成的时间数列。在时期数列中,每个指标都反映某社时间数
40、列。在时期数列中,每个指标都反映某社会经济现象在一定时期内发展过程的累计量。会经济现象在一定时期内发展过程的累计量。n例例2 1990年年2001年我国税收基本情况就是一个年我国税收基本情况就是一个时期数列。时期数列。n特点特点:反映发展过程的累计总量反映发展过程的累计总量 各项指标值可以相加各项指标值可以相加 每项指标值大小与时期长短有关每项指标值大小与时期长短有关 指标数据通常是通过连续登记取得的指标数据通常是通过连续登记取得的指由时点总量指标编制而成的时间指由时点总量指标编制而成的时间数列。在时点数列中,每个指标数值所反映的社会数列。在时点数列中,每个指标数值所反映的社会经济现象都是在某
41、一时点(瞬间)上所达到的水平经济现象都是在某一时点(瞬间)上所达到的水平n例例3:下表所列的我国历年年末职工人数情况,就:下表所列的我国历年年末职工人数情况,就是一个时点数列。是一个时点数列。(l)时点数列中的每一个指标数值,都表示社会经济现象在某一时点(时刻)上的数量。(2)时点数列中的每个指标不能相加。由于时点数列中的指标数值都是反映现象在某一瞬间的数量,几个指标相加后无法说明这个数值属于哪一个时点上的数量,没有实际意义。(3)时点数列中每个指标数值大小和“时点间隔”长短没有直接关系。时点数列中每个指标只是现象在某一时点上的水平,因此它的大小与时点间隔的长短没有直接关系。例如,年末的人口数
42、不一定比某月底的人口数大。(4)时点数列中每个指标数值通常都是定期(间断)登记取得的。n是指一系列相对指标按照时间先后顺序排列所组成的时间数是指一系列相对指标按照时间先后顺序排列所组成的时间数列。它是用来反映社会经济现象之间数量对比关系的发展变列。它是用来反映社会经济现象之间数量对比关系的发展变化过程及其规律。化过程及其规律。n各期相对数对比基数不同,故各项水平数值不能直接相加。各期相对数对比基数不同,故各项水平数值不能直接相加。n例例4:下表所列的我国的民政事业费支出占国家财政支出的:下表所列的我国的民政事业费支出占国家财政支出的比重,就是一个相对数时间数列。比重,就是一个相对数时间数列。(
43、二)相对数时间数列(二)相对数时间数列n由一系列同类平均指标按照时间的先后顺序排列而由一系列同类平均指标按照时间的先后顺序排列而成的时间数列。反映的是社会经济现象一般水平的成的时间数列。反映的是社会经济现象一般水平的发展过程及其变动趋势。发展过程及其变动趋势。n例例5 下表所列的我国历年来职工平均工资情况,就下表所列的我国历年来职工平均工资情况,就是一个平均数时间数列。是一个平均数时间数列。n绝对数时间数列是基本数列,其余两种绝对数时间数列是基本数列,其余两种是派生数列。是派生数列。n常常将三者结合起来应用。常常将三者结合起来应用。n编制时间数列的目的:编制时间数列的目的:是要通过同一指标在是
44、要通过同一指标在不同时间上的对比来分析社会经济现象的发不同时间上的对比来分析社会经济现象的发展变化过程及其规律性。展变化过程及其规律性。n编制原则编制原则 时间的长短要可比时间的长短要可比 总体范围(地区、隶属关系范围等)要统一总体范围(地区、隶属关系范围等)要统一 经济内容要统一经济内容要统一 计算方法、计量单位要统一计算方法、计量单位要统一 n动态分析指标分为:动态分析指标分为:水平指标、速度指标水平指标、速度指标n一、发展水平与平均发展水平一、发展水平与平均发展水平n(一)发展水平(一)发展水平发展水平是指时间数列中的每一项具体指标数值,发展水平是指时间数列中的每一项具体指标数值,它反映
45、了某种社会经济现象在不同时间上所达到它反映了某种社会经济现象在不同时间上所达到的水平,也是计算各项时间分析指标的基础。的水平,也是计算各项时间分析指标的基础。发展水平一般是时期或时点总量指标,如销售额、发展水平一般是时期或时点总量指标,如销售额、在册工人数等;也可以是平均指标,如:平均工在册工人数等;也可以是平均指标,如:平均工资、单位产品成本等;资、单位产品成本等;还可以是相对指标,如:还可以是相对指标,如:计划完成程度、商品流转次数等。计划完成程度、商品流转次数等。n在时间数列中,由于发展水平所处的位置不同,在时间数列中,由于发展水平所处的位置不同,有最初水平和最末水平。最初水平是指时间数
46、有最初水平和最末水平。最初水平是指时间数列中第一项指标数值,它表示事物发展的原有列中第一项指标数值,它表示事物发展的原有基础;最末水平是指最后一项指标,它表示事基础;最末水平是指最后一项指标,它表示事物发展的在一定时期内的最终结果。物发展的在一定时期内的最终结果。n可用符号表示为可用符号表示为 ,它们代表数,它们代表数列中各个发展水平。其中列中各个发展水平。其中 就是最初水平,就是最初水平,是最末水平,其余的就是中间各项水平,简称是最末水平,其余的就是中间各项水平,简称为中间水平。为中间水平。naaaaa,32100anan为了计算时间分析指标,需要将不同时间的发为了计算时间分析指标,需要将不
47、同时间的发展水平进行比较。对比时把所要研究的那个时展水平进行比较。对比时把所要研究的那个时期(时点)的发展水平叫做期(时点)的发展水平叫做报告期发展水平报告期发展水平(或计算期水平),简称报告期水平;把用来(或计算期水平),简称报告期水平;把用来作为对比基础时期(时点)的发展水平叫做作为对比基础时期(时点)的发展水平叫做基基期发展水平期发展水平,简称基期水平。,简称基期水平。n报告期水平和基期水平不是固定不变的。它根报告期水平和基期水平不是固定不变的。它根据研究目的的不同和时间的变更而改变。据研究目的的不同和时间的变更而改变。(二)平均发展水平(二)平均发展水平平均发展水平是时间数列中各不同时
48、期发展水平平均发展水平是时间数列中各不同时期发展水平计算的平均数,又称序时平均数或时间平均数计算的平均数,又称序时平均数或时间平均数总量指标序时平均数的计算是解决其他两个序时总量指标序时平均数的计算是解决其他两个序时平均数计算的关键平均数计算的关键(1)由时期数列计算序时平均数)由时期数列计算序时平均数式中式中 序时平均数序时平均数 各时期发展水平各时期发展水平 时期项数时期项数nanaaaan21aan1、绝对数时间数列的序时平均数、绝对数时间数列的序时平均数例例6 某商业企业某商业企业2002年各月商品销售额资年各月商品销售额资料如下表所示。料如下表所示。如:第一季度月平均销售额如:第一季
49、度月平均销售额=(万元)(万元)n n第二季度月平均销售额第二季度月平均销售额=(万元)(万元)n n第三季度月平均销售额第三季度月平均销售额=(万元)(万元)n n第四季度月平均销售额第四季度月平均销售额=(万元)(万元)n全年月平均销售额全年月平均销售额n=550(万元万元)360338040030048035204804406003660600540760382070076012820700760660600540520480440380400300由连续时点数列计算序时平均数由连续时点数列计算序时平均数 A.间隔相等的连续时点数列间隔相等的连续时点数列例例7 某专业学生星期一至星期五出
50、勤人数资料如下表:某专业学生星期一至星期五出勤人数资料如下表:nanaaaan21(2)由时点数列计算的序时平均数)由时点数列计算的序时平均数 计算该专业学生平均每天出勤人数。计算该专业学生平均每天出勤人数。(人)(人)由计算可知,该专业学生本星期平均每天出由计算可知,该专业学生本星期平均每天出勤人勤人 数为数为158人人1585154158162156160naa B.间隔不等的连续时点数列间隔不等的连续时点数列 如果被研究现象不是逐日变动的,而是每隔一段如果被研究现象不是逐日变动的,而是每隔一段时间变动一次,则可根据每次互动的记录资料,时间变动一次,则可根据每次互动的记录资料,用每次变动持