1、第八章 现象间的相关分析 问题思考:当今社会,电视已成为人们生活中的伴侣,每当你看电视,特别是看到精彩内容的时候,往往被一些厂商的广告打扰。这些广告是“免费的午餐”吗?据说,有的厂商花费大量的资金在电视上做广告。1995年,孔府宴酒为了夺得中央电视台广告标王的宝座,花了3079万元的广告费,然而到了2004年,蒙牛乳业竟花了相当于孔府宴酒广告费的十倍价钱(3.1亿元)才成为中央电视台的广告标王。这是为什么?第八章 现象间的相关分析 事物的普遍联系决定了现象之间的相互影响和制约,人们往往利用现象之间的相互影响和相互制约关系来分析事物和决策未来。例如,在社会经济活动中,企业常常用广告来扩大商品的社
2、会影响,通过增加广告播放的次数和频率,加强对消费者的刺激,进而促进商品销售量的提高;工厂根据商品的市场销售状况来组织产品的生产、设计和研制;农民根据社会对农产品的需求,决定自己的种植品种和种植面积;居民家庭根据其收入状况决定自己的消费品种、消费数量和消费档次。1、函数关系、函数关系(1)是一一对应的确定关系(2)设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量(3)各观测点落在一条线上 一、相关关系的概念一、相关关系的概念 函数关系
3、函数关系(几个例子几个例子)2、相关关系 在反映客观事物数量特征的诸变量之间,必然产生和存在一定的关系:某一变量程度不同地取决于另外一个或一组变量,这种关系通常叫做依存关系。在大量的依存关系中,可以区分为函数关系和相关关系。相关关系的理解应把握两个要点(也是它的重要特点):一是就事物质的规定性而言,变量之间确实存在相互依存关系,即一个变量发生变化,另一个变量必然会相应地发生变化。二是就事物量的规定性而言,变量之间的依存关系表现为一定的范围,其具体数值不是惟一确定的。相关关系相关关系(correlation)(1)一个变量的取值不能由另一个变量唯一确定(2)当变量 x 取某个值时,变量 y 的取
4、值对应着一个分分布布各观测点分布在直线周围 相关关系相关关系(几个例子几个例子)n子女的身高与其父母身高的关系子女的身高与其父母身高的关系n从遗传学角度看,父母身高较高时,其子女的身高一般也比较高。但实际情况并不完全是这样,因为子女的身高并不完全是由父母身高一个因素所决定的,还有其他许多因素的影响n一个人的收入水平同他受教育程度的关系一个人的收入水平同他受教育程度的关系n收入水平相同的人,他们受教育的程度也不可能不同,而受教育程度相同的人,他们的收入水平也往往不同。因为收入水平虽然与受教育程度有关系,但它并不是决定收入的惟一因素,还有职业、工作年限等诸多因素的影响n农作物的单位面积产量与降雨量
5、之间的关系农作物的单位面积产量与降雨量之间的关系n在一定条件下,降雨量越多,单位面积产量就越高。但产量并不是由降雨量一个因素决定的,还有施肥量、温度、管理水平等其他许多因素的影响3、函数关系与相关关系的关系、函数关系与相关关系的关系 相关关系与函数关系的区别,突出表现在变量之间的具体关系值是否唯一确定。凡现象之间的关系值是唯一确定的就属于函数关系;凡现象之间的关系值不是唯一确定的则属于相关关系。相关关系与函数关系之间具有密切联系,一方面,由于在观察或测量中存在误差等原因,实际工作中的函数关系有时通过相关关系表现出来;另一方面,在研究相关关系时又常常借用函数关系的形式近似地将它表达出来,以便找到
6、相关关系的一般数量特征。二、相关关系的判断 认识社会经济现象之间的相关关系,一般先要进行现象之间相关关系的理论分析和借助相关表,相关图进行初步判断,进而计算相关指标和建立数学模型对事物进行量的精确认识。理论分析是为了认识现象之间确实存在的不以人们意志为转移的客观联系,应以经济规律和逻辑关系为依据。二、相关关系的判断 由于现象之间的相关关系比较复杂,测定相关关系之前,一般在理论分析的基础上还要利用相关表和相关图粗略地判断现象之间的相关程度和相关形态。相关表有的简单,有的复杂,一般的简单相关表是将具有相关关系的两个变量值按其中一个的大小顺序排列,另一个依其对应关系编排而成的统计表。它是粗略观察现象
7、之间相关程度的一种有效工具,同时也是绘制相关图和测定相关关系的依据。二、相关关系的判断 相关图也称相关散点图或散点图,是将具有相关关系的两个变量值描绘在坐标图上,以横轴表示自变量x,纵轴表示因变量y,按两变量的对应值标出坐标点的分布状况的统计图。它是粗略观察现象之间相关程度和相关形态的一种有效工具,它为测定相关关系奠定有效基础。例1 假定已知某地区19962003年居民货币收入和购买商品(含购买服务商品)支出的统计资料,据此可编制简单相关表,如表81所示。例2 依据表81的统计资料,可绘制相关散点图,如图81所示。从以上分析可以看出,相关表和相关图均具有粗略观察现象之间相关关系的功能;相关图与
8、相关表相比较,还有观察相关形态的作用;但相关图应以相关表提供的资料为依据。三、相关关系的种类(一)单相关和复相关(二)线性相关和曲线相关(三)正相关和负相关 三、相关关系的种类(一一)单相关和复相关单相关和复相关 1、单相关也称简单相关,指两个变量之间的相关关系,、单相关也称简单相关,指两个变量之间的相关关系,即研究时只涉及一个自变量和一个因变量的相关关系。例如,即研究时只涉及一个自变量和一个因变量的相关关系。例如,家庭收入水平和食品支出比重的相关关系。家庭收入水平和食品支出比重的相关关系。2、复相关指三个或三个以上变量之间的关系,即研究、复相关指三个或三个以上变量之间的关系,即研究时涉及两个
9、或两个以上的自变量和一个因变量的相关关系。时涉及两个或两个以上的自变量和一个因变量的相关关系。例如,商品购买力与居民货币收入、居民非商品支出、现金、例如,商品购买力与居民货币收入、居民非商品支出、现金、储蓄之间的关系。储蓄之间的关系。三、相关关系的种类(二)线性相关和曲线相关1、线性相关也称直线相关,指相互依存的变量之间的变动近似地表现为一条直线的关系。具体分析时,可以运用相关散点图进行观察,如图82所示。例如,商品销售量与商品销售额表现为线性关系。三、相关关系的种类三、相关关系的种类 2、曲线相关曲线相关也称非线性相关,指相互依存的变量之间的变动近似地表现为一条曲线,具体分析时,也可以通过相
10、关散点图来描述,如图83所示。例如,商品销售额与商品流通费用率一般表现为曲线关系,随着商品销售额的增加,商品流通费用率会有所降低。曲线相关有双曲线相关、指数曲线相关和抛物线相关等类型。三、相关关系的种类(三)正相关和负相关 1、正相关是指自变量的数值增加(或减少)时,因变量的数值也相应地增加(或减少),即自变量与因变量的变化方向具有一致性,如图82(a)所示。例如,居民货币收入和购买商品支出之间的相关关系就是正相关。2、负相关是指自变量数值增加时,因变量数值减少;或自变量数值减少时,因变量的数值增加,即自变量与因变量的变化方向具有不一致性,如图82(b)所示。例如,家庭收入水平与食品支出比重之
11、间的相关关系就是负相关。四、相关分析的主要内容(一)判断现象之间的相关状态 判断现象之间是否存在相关关系,是相关分析的基础环节,属于定性认识问题。(二)衡量现象相关的密切程度衡量现象之间的相关密切程度,通常是计算一些相关指标。例如,我们衡量简单线性相关的密切程度,可以计算相关系数;衡量曲线相关的密切程度,可以计算相关比率,衡量多种现象之间的相关密切程度,可以计算复相关系数。四、相关分析的主要内容 (三)确定相关关系的数学表达式 建立数学模型是精确认识事物和推算预测未来的基础。如果现象之间表现为线性相关,可以采用线性方程拟合;如果现象之间表现为曲线相关,可以采用曲线方程拟合。(四)检验因变量估计
12、值的误差 通常可以利用计算标准误差来获得这种误差的一般认识,并可以依据标准误差来观察预测值的置信区间,分析预测值的可靠程度。第二节 相关关系的测度(相关系数)(correlation coefficient)一、相关系数一、相关系数(correlation coefficient)1.度量变量之间关系强度的一个统计量2.对两个变量之间线性相关强度的度量称为简单相关系数3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 4.若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 rn也称为线性相关系数(linear correlation coefficient)n或称为P
13、earson相关系数(Pearsons correlation coefficient)相关系数相关系数(计算公式计算公式)样本相关系数的计算公式相关系数的性质相关系数的性质性质性质1:r 的取值范围是-1,1|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关 r=0,不存在线性线性相关关系-1r0,为负相关0r1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱相关系数的性质相关系数的性质n性质性质2:r具有对称性。即x与y之间的相关系数和y与x之间的相关系数相等,即rxy=ryxn性质性质3:r数值大小与x和y原点及尺度无关,即改变x和y的数据原点及计量尺度,
14、并不改变r数值大小n性质性质4:仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。这意为着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系n性质性质5:r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系相关系数的经验解释相关系数的经验解释1.|r|0.8时,可视为两个变量之间高度相关2.0.5|r|0.8时,可视为中度相关3.0.3|r|0.5时,视为低度相关4.|r|0.3时,说明两个变量之间的相关程度极弱,可视为不相关5.上述解释必须建立在对相关系数的显著性进行检验的基础之上二、相关系数的显著性检验二、相关系数的显著性检验(检验的步骤检验的步骤)1.检验两个变量之间是否存在线性相关关系检验两个变量之间是否存在线性相关关系2.采用采用R.A.Fisher提出的提出的 t 检验检验3.检验的步骤为检验的步骤为n提出假设:提出假设:H0:;H1:0n计算检验的统计量计算检验的统计量相关系数的显著性检验(例题分析)n【例例】居民货币收入与购买商品支出之间的相关系数进行显著性检(0.05)1.提出假设:H0:;H1:02.计算检验的统计量居民货币收入与购买商品支出之间