1、统计学统计学原原理理第七章 相关分析知足常乐,历经兵农工商学。历经:兵团开车,地方修车,企业管理:技术、运营、物流、安全、保卫,职任:客运站长、公司经理,集团技术总监,总经理及法人代表。学历:本科、MBA,专业:汽车维修与使用、企业管理、经济管理。职业资格与职称:高级工程师、高级技师、国家经济师、高级技能专业教师、高级国家职业资格考评员。管理科学研究院特约讲师、管理顾问有限公司高级讲师。客座任教:大学、技师学院、国家职业资格培训与考评及企业内部职业培训。Q号657555589朱明 百度个人主页 (本人教学资料搜索:朱明zhubob(需要资料内容)朱明工作室第七章 相关分析 第一节第一节 相关的
2、意义和种类相关的意义和种类 第二节第二节 相关系数相关系数 第三节第三节 回归分析回归分析学习目的与要求 相关分析是研究变量之间相互关系的密切程相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法。度和相互联系方式的重要方法。通过本章的学习,要理解相关分析的有关概通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。并能够结合实际资料对变量进行相关分析。第一节 相关的意义和种类 一、相关分析的意义(一、相关分析的意义(P170P170)社会经济生活中有很多现象的数量是社会经济生
3、活中有很多现象的数量是相互联系的。相互联系的。在这些数量中往往有两个或多个有关在这些数量中往往有两个或多个有关系的数量标志(变量)存在。系的数量标志(变量)存在。二元总体与多元总体。(二元总体与多元总体。(P172P172)相关分析就是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的方法。二、相关关系的概念(二、相关关系的概念(P172P172)现象之间的关系可分为两类:现象之间的关系可分为两类:一是函数关系,它是一种一是函数关系,它是一种完全确定完全确定的依存关系。如圆的的依存关系。如圆的半径与面积之间的关系半径与面积之间的关系.二是相关关系,它是二是相关关系,它是一
4、种不完全确定一种不完全确定的依存关系。如商的依存关系。如商品销售额与利润之间的关系品销售额与利润之间的关系.函数关系与相关关系的联系:函数关系与相关关系的联系:P173P173 三、相关的种类(三、相关的种类(P173)按照相关的程度分,完全相关、不完全按照相关的程度分,完全相关、不完全相关和不相关。相关和不相关。按照相关的性质分,正相关和负相关。按照相关的性质分,正相关和负相关。按照相关的形式分,线性相关和非线性按照相关的形式分,线性相关和非线性相关。相关。按照影响因素多少分,单相关和复相关。按照影响因素多少分,单相关和复相关。(一)按相关关系涉及的因素多少划分 1.1.单相关:是两个变量的
5、相关,即一个因变量对一个自变量的相关关系。2.2.复相关:是三个或三个以上变量的相关,即一个因变量对两个或两个以上自变量的相关关系。(二)按现象之间相关关系的方向划分 1.1.正相关:是当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。2.2.负相关:是当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。(三)按现象之间相关关系的程度分 1.1.完全相关:当一种现象的数量变化完全由另一个现象的数量变化所确定时,称这两种现象间的关系为完全相关。例如在价格不变的条件下,商品销售额与销售量之间成正比例关系。2.2.完全不相关:当两个现象彼此互不
6、影响,其数量变化各自独立时,称为不相关现象。3.3.不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关,一般的相关现象都是指这种不完全相关。如人的身高和体重之间的关系。(四)按现象之间相关的形式分 1.1.线性相关:当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关,即直线相关。如产品总成本和单位成本之间的关系、职工工资总额和职工平均工资之间的关系等。2.2.非线性相关:如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关,即曲线相关。如产品单位成本和产量之间的关系。四、相关分析的内容(一)确定现象之间是否存在相关
7、关系及其表现形式(二)确定相关关系的密切程度(三)确定相关关系的数学表达式(四)确定变量估计值与实际值之间的差异程度 五、判别相关的方法 编制相关表 绘制相关图 对客观现象进行定性分析第二节 相关图表和相关系数(一)相关表 1.1.简单相关表:直接根据原始资料,将某一变量按大小排列,再将另一变量的对应值平行排列得到的相关表。例例7-1 表7-1即为一个简单相关表。表7-1 某市居民月消费支出和可支配收入相关表 单位:百元 2.2.分组相关表:是将原始资料进行分组而编制的相关表。可分为单变量分组相关表和双变量分组相关表。(1 1)单变量分组相关表 在具有相关关系的两个变量中,把其中一个变量进行分
8、组,列出各组次数,另一个变量不分组,这种相关表称为单变量分组相关表。(2 2)双变量分组相关表 双变量分组相关表是对具有相关关系的两个变量都进行分组而编制的相关表。例:P176(二)相关图 相关图是以直角坐标系的横轴代表自变量,纵轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形,又称散点图或散布图或相关点图。三、相关系数的计算 1.1.相关系数的概念和意义 (1)(1)概念:相关系数是指在直线相关条件直线相关条件下,说明两两个现象之间相关关系密切程度个现象之间相关关系密切程度的统计分析指标。(2)(2)意义:比相关表和相关图更能概括表现相关的形式
9、和程度。根据相关系数的大小,或把若干相关系数加以对比,可以发现现象发展中决定性的影响因素,因而相关系数对于判断变量之间相关关系的密切程度有着重要的作用。nixyyyxxn12)(1例:某投资组合由等权重的股票例:某投资组合由等权重的股票1 1和股票和股票2 2组成,两种组成,两种股票各自的报酬率如表股票各自的报酬率如表3 33 3所示如下:所示如下:两种股票投资报酬率数据两种股票投资报酬率数据第一步,计算两种股票的平均报酬率:niinRR11%153%25%15%5niinRR12%153%5%15%25=niiiRRRRn12211)(13%)15%5%)(15%25(%)15%15%)(1
10、5%15(%)15%25%)(15%5(第二步,计算两种股票的协方差:1220.0067 协方差的正负显示了两个投资项目之间报酬率变动的方向。协方差为正表示两种资产的报酬率呈同方向变动;协方差为负值表示两种资产的报酬率呈相反方向变化。协方差绝对值越大,表示这两种资产报酬率的关系越密切;协方差的绝对值越小,则这两种资产报酬率的关系也越疏远。2 2相关系数。相关系数。由于各方面的原因,协方差的意义很难解释,至少对于应用是如此。为了使其概念能更易于接受,可以将协方差标准化,将协方差除以两个投资方案投资报酬率的标准差之积,得出一个与协方差具有相同性质但却没有量化的数。我们将这个数称为这两个投资项目的相
11、关系数(correlation coefficient),它介于1和+1之间。相关系数的计算公式为:yxxyr23%)15%25(%)15%15(%)15%5()(22212111niinRR3%)15%5(%)15%15(%)15%25()(22212222niinRR2121212r%19.8%19.80067.0例:例:利用上例中的数据,计算两种股票的相关系数。第一步,计算两种股票的标准离差:股票1的标准离差:8.19股票2的标准离差:8.19第二步,计算股票1和股票2的相关系数:-1 相关系数的正负与协方差的正负相同。所以相关系数为正值时,表示两个变量呈同方向变化,负值则意味着反方向变
12、化。就其绝对值而言,系数值的大小,与协方差大小呈同方向变化。相关系数总是在1.0到+1.0之间的范围内变动,1.0代表完全负相关,+1.0代表完全正相关,0则表示不相关。2222)(1)(11ynyxnxyxnxyr一、计算公式一、计算公式(P184P184)简化式)简化式 2222)()(yynxxnyxxynr或者 2222)(1)(11ynyxnxyxnxyr()相关系数()相关系数|,表示两变量为完全,表示两变量为完全线性相关,线性相关,x x与与y y之间存在着确定的函数关系。之间存在着确定的函数关系。二、相关系数的性质二、相关系数的性质(P183)()当()当|时,表示x与y之间存
13、在着正相关关系;时,存在负相关系数;时,表示x与y之间完全没有直线关系,y的变化与x无关。例题P184第三节 回归分析一、回归分析的意义及种类一、回归分析的意义及种类回归和相关之间的联系与区别(回归和相关之间的联系与区别(P189P189)回归分析的种类:回归分析的种类:二、简单线性回归方程.建立回归方程建立回归方程bxay 2.2.用最小平方法求出参数用最小平方法求出参数a a、b b 利用简单线性回归方程进行回归分析的前提利用简单线性回归方程进行回归分析的前提:所分析的两个变量之间必须存在相关关系,且所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。相关程度在显著相关以上。2
14、222(,(11)或者)xxnyxxynbxnxyxnxyb 注意:是先求b,再求axbyaxnxyxnxyb 22(11)a与b 的经济意义 a:表示直线的起点值,b:回归系数,表示自变量每变动一个单位时,因变量平均变动了多少个单位。3.求回归方程 将求出的参数a、b代入方程y=a+bx 中,即可求出方程。4.4.利用回归方程进行预测估计利用回归方程进行预测估计 只能只能由自变量的数值估计因变量的由自变量的数值估计因变量的数值,数值,即只能由即只能由xyxy,而不能由而不能由yxyx。举例说明回归分析的方法 P206-13(1 1)计算相关系数计算相关系数 (最后列为合计数)(最后列为合计数
15、)998.0)4.95611.1582)(102611798(4.95102613.1686)(1)(11222222 ynyxnxyxnxyr 通过计算可知,投入和产出之间存在着高度的正相关关系。(2 2)建立回归方程)建立回归方程 设所建立的回归方程为:设所建立的回归方程为:y=a+bxy=a+bx236.16102008.164.95008.11026117984.95102613.16862ab再计算先计算 所求的直线方程为:y=1.236+1.008x b=1.008,说明投入每增加1千元,产出平均增加1008件。三、回归分析与相关分析的不同三、回归分析与相关分析的不同 1 1、回归
16、分析必须区分自变量和因变量,而、回归分析必须区分自变量和因变量,而相关分析不必区分。相关分析不必区分。2 2、回归分析的两个变量一个是自变量,一、回归分析的两个变量一个是自变量,一个是因变量,通过给定自变量的值来推算因变个是因变量,通过给定自变量的值来推算因变量的可能值;而相关分析的两个变量都是随机量的可能值;而相关分析的两个变量都是随机变量。变量。3 3、回归分析中对于因果关系不太明确的两、回归分析中对于因果关系不太明确的两个变量,可以建立两个回归方程;而相关分析个变量,可以建立两个回归方程;而相关分析只能计算出一个相关系数。只能计算出一个相关系数。4 4、一种回归方程只能做一种推算,即只能
17、、一种回归方程只能做一种推算,即只能给出自变量的值来推算因变量的值,不能逆给出自变量的值来推算因变量的值,不能逆推。推。第七章第七章 总结总结 一、现象之间的关系一、现象之间的关系 1.1.有无关系有无关系 2.2.如果有如果有,是什么关系是什么关系?函数关系函数关系?相关关系相关关系?二、相关分析二、相关分析 1.1.判断方法判断方法-有三种有三种 2.2.相关系数数值的大小与关系的程度相关系数数值的大小与关系的程度 三、回归分析三、回归分析 1 1、分析内容、分析内容 对相关分析关系中具有因果关系的变量进行分析。对相关分析关系中具有因果关系的变量进行分析。2.2.分析线性关系分析线性关系
18、建立线性回归方程建立线性回归方程 计算回归系数计算回归系数a a、b b,得到方程,得到方程 还可以根据还可以根据自变量的值来推算因变量的值(即只自变量的值来推算因变量的值(即只能由能由,而,而不能由不能由)例如多选例如多选下列属于正相关的现象有()。下列属于正相关的现象有()。.家庭收入越多,其消费支出也越多家庭收入越多,其消费支出也越多.某产品产量随工人劳动生产率的提高而增加某产品产量随工人劳动生产率的提高而增加.流通费用率随商品销售额的增加而增加流通费用率随商品销售额的增加而增加.生产单位产品所耗工时随劳动生产率的提高生产单位产品所耗工时随劳动生产率的提高 而减少而减少.总生产费用随产品
19、产量的增加而增加总生产费用随产品产量的增加而增加 答案:答案:BCBC 计算题举例(计算题举例(20072007年考题)年考题)为研究产品销售额和销售利润之间的关系,为研究产品销售额和销售利润之间的关系,某公司对所属某公司对所属1010家企业进行调查,设产品销家企业进行调查,设产品销售额为(万元),销售利润(万元)。对调售额为(万元),销售利润(万元)。对调查资料进行整理和计算,其结果如下:查资料进行整理和计算,其结果如下:x=795 x=795 x x=72925=72925 y=1065 y=1065 y y=121475=121475 xy=93200 xy=93200 要求:要求:(1 1)计算销售额和销售利润之间计算销售额和销售利润之间的相关系数;(的相关系数;(2 2)配合销售额对销售利润的)配合销售额对销售利润的直线回归方程。直线回归方程。解:解:(1 1)计算相关系数)计算相关系数相关关系在高度正,说明两变量之间存96.096.02.88485.8532)(1)(112222 ynyxnxyxnxyr (2 2)编制直线回归方程:)编制直线回归方程:y=a+bxy=a+bx54.3688.05.97225.8532)(1122 nxbnyaxnxyxnxyb 则所求的回归方程为:则所求的回归方程为:y=36.54+0.88x