1、第十章 回归分析预测法第一节 相关分析第二节 一元线性回归预测法第三节 多元线性回归预测法第四节 非线性回归预测法第一节第一节 相关分析相关分析一、一、基础概念基础概念1、回归来源英国 高尔顿2、相关变量间的关系1)函数关系现象之间存在着严格的依存关系2)相关关系它反映着现象之间存在着非严格的、不确定的依存关系。3 3、回归分析预测法回归分析预测法对具有相关关系的变量,选择一个合适的数学模型即回归方程,描述变量之间的平均变化关系平均变化关系,并据此进行预测的一种分析方法。二、二、回归预测的一般程序:回归预测的一般程序:1、选择相关因素,确定相关关系 2、建立数学模型3、检验和评价、修正数学模型
2、4、运用模型进行预测 三、相关关系的类型三、相关关系的类型1 1、相关关系的方向分、相关关系的方向分正相关负相关xyxy2 2、按照相关关系的密切程度、按照相关关系的密切程度完全相关高度相关中度相关低度相关因变量因变量自变量自变量3 3、按照相关关系的表现形式、按照相关关系的表现形式线性相关非线性相关质量特征因素质量特征因素四、相关分析的方法四、相关分析的方法1、绘制相关图将收集到的大量数据资料以散点的形式在坐标平面上反映出来,形成散点图例1:某公司为了研究广告费支出对销售额的影响,统计了上半年各月的资料,数据如下表广告费支出与销售额相关表(单位:万元)广告费支出与销售额相关表(单位:万元)月
3、份月份1 12 23 34 45 56 6广告费广告费 3 34 43.53.54.54.54.84.85 5销售额销售额373750504343555560606262例2:某企业收集的商品销售额与商品流通费用率的有关资料,见下表商品销售额与商品流通费用率相关表商品销售额与商品流通费用率相关表销售额(千万元)销售额(千万元)2929343443435555646469697878流通费用率()流通费用率()2.12.11.81.81.51.51.41.41.31.31.31.31.281.282、相关系数,微弱相关,低度相关,显著相关高度相关3.05.03.08.05.0,18.0rrrr2
4、x2x2y6137024.83076105.5424.82 61618730720.9988第二节第二节 一元线性回归预测法一元线性回归预测法一、一元线性回归预测法一、一元线性回归预测法1、一元线性回归模型如果因变量(y)与某一个主要影响因素(自变量)之间存在着较为密切的线性相关关系,则可用一元线性回归模型来描述它们之间的数量关系。bxay2、最小二乘法求解参数 nXbnYaXXnYXXYnba22)(bXY3 3、对回归预测模型进行检验、对回归预测模型进行检验Sy表示回归标准差Y因变量实际值Y根据回归方程推算出来的因变量的估计值 nm 回归估计自由度m模型参数的个数2)回归标准差系数Sy/Y
5、 小于15%,预测模型拟合效果是较好的,可以用于预测 3)拟和优度检验R2越接近1拟合程度越好4、利用回归模型进行预测点预测区间预测YtSy,YtSy t为概率度,大小取决于可靠程度F(t)的大小可以通过查正态分布概率表获得,常用值F(t)68.27时,t1F(t)95时,t1.96F(t)95.45时,t2F(t)99.73时,t3F(t)99.99时,t4【例题】已知某地区2003年2012年国内生产总值与固定步产投资额的资料如下表所示。用回归分析法预测固定资产投资额增加到400万元时,该地区的国内生产总值。年份年份固定资产投固定资产投资额资额国内生产国内生产总值总值20032003144
6、1443833832004200414814838138120052005155155418418200620061801804684682007200723023065665620082008270270774774200920093003008768762010201032932997897820112011349349104210422012201238438411091109【解】1、绘制散点图,进行相关分析2、建立预测模型 nXbnYaXXnYXXYnba22)(bXY3、列表求解参数2x年份年份固定资产投资额固定资产投资额x x国内生产总值国内生产总值y yxyxy20032003
7、144144383383551525515220736207362004200414814839139157868578682190421904200520051551554184186479064790240252402520062006180180468468842408424032400324002007200723023065665615088015088052900529002008200827027077477420898020898072900729002009200930030087687626280026280090000900002010201032932997897832
8、176232176210824110824120112011349349104210423636583636581218011218012012201238438411091109425856425856147456147456合计合计2489248970957095199598619959866923636923634、进行模型检验5、预测当x=400时例2:某企业下半年产品产量与单位成本的相关资料见下表解:1、绘制相关图,判断相关关系60657075800246产量单位成本2、建立回归模型 nXbnYaXXnYXXYnba22)(bXYYabX77.371.82X3、对回归预测模型进行检验
9、Sy 3.818/(6-2)=0.98(元)4、利用回归模型进行预测当产量为6万件时,X6Y77.371.82666.45(元/件)若以99.99的可靠程度,则t4,所以预测值的置信区间为(62.53,70.37)tyixiix y2ix年份年份(百万元)(百万元)(亿元)(亿元)200520058.58.52727229.5229.57297292006200610.610.63131328.6328.696196120072007131334.534.5448.5448.51190.251190.252008200815153838570570144414442009200917.517.
10、54242735735176417642010201019.719.745.545.5896.35896.352070.252070.2520112011222249.649.61091.21091.22460.162460.162012201224.624.654.254.21333.321333.322937.642937.64130.9130.9321.8321.85632.475632.4713556.313556.3解:1)绘制散点图经观察,销售额与产值高度正相关,呈线性相关,可以线性回归模型进行预测。2)建立模型 nXbnYaXXnYXXYnba22)(bXY3)列表计算参数由表中
11、数据可计算出参数a=-7.7646b=0.5998所以回归模型为xbxa5998.07646.7y tyixiix y2ix年份产值销售额预测值误差误差平方(亿元)(百万元)20052005278.5229.57298.4 0.1 0.01 200620063110.6328.696110.8-0.2 0.04 2007200734.513448.51190.2512.9 0.1 0.01 200820083815570144415.0 0.0 0.00 200920094217.5735176417.4 0.1 0.01 2010201045.519.7896.352070.2519.5 0
12、.2 0.04 2011201149.6221091.22460.1622.0 0.0 0.00 2012201254.224.61333.322937.6424.7-0.1 0.01 321.8130.95632.4713556.34)检验模型(百万)14.02812.0yS5)预测当x=60.7亿元时(百万)64.287.607646.75998.07646.75998.0y xbxa某地区通过市场调查,收集到相关资料见下表:若若20132013年平均每户年收入提高年平均每户年收入提高1010,试建,试建立一元线形回归预测模型,预测立一元线形回归预测模型,预测20132013年平年平均每户
13、年消费支出可达到多少?若以均每户年消费支出可达到多少?若以95.4595.45的把握程度,计算置信区间。的把握程度,计算置信区间。解:1)相关分析利用数据资料绘制相关图收入支出相关图11.21.41.61.822.22.41.522.533.5收入(万元)支出(万元)(方法一)通过观察相关图,判定该地区每户居民的消费支出与收入成一元线形相关,可以用一元线形回归模型进行预测。(方法二)计算相关系数523.79312.59.34531.8312.52 517.78669.3420.99835 0.7r1所以该地区居民消费支出与收入高度正相关2)建立回归预测模型设一元线性回归预测模型为 nXbnYa
14、XXnYXXYnba22)(bXY 23.79312.59.345 31.8312.512.55 a9.3450.7612.550.032所以,一元线性回归方程为所以,一元线性回归方程为Y0.0320.76X3)对回归预测模型进行检验Sy0.019Sy值很小,说明模型拟和程度很好 b 0.764)利用模型进行预测当收入提高10时,X3.30代入方程Y0.0320.76X2.476(万元)(万元)若以95.45的可靠程度,则t2,Y2.476,Sy 0.019,代入预测值的置信区间计算公式(Yt Sy,Yt Sy)计算可得预测值的置信区间为(2.438,2.514)第三节第三节 多元线性回归预测
15、法多元线性回归预测法一、多元线性回归预测法一、多元线性回归预测法某一事物的发展变化受到多因素的影响,而每个影响因素与预测对象之间大体呈线性相关关系时,要选取多个自变量来建立回归方程。购买行为购买行为态度态度情感情感过去的过去的购买购买经验经验口碑口碑效应效应二、二元线性回归预测法二、二元线性回归预测法2211xbxbay2211xbxbnay21221111xxbxbxayx22221122xbxxbxayx回归标准差mnyyStt2y)(回归标准差系数小于15%,说明预测模型通过了回归标准差检验。复相关系数221yyyyRiii例题 某企业通过调查研究发现,企业的销售额与广告支出及销售人员的
16、数量有着密切的线性相关关系,有关资料如下年份年份2005200520062006200720072008200820092009201020102011201120122012广告费(万元)广告费(万元)170170180180160160190190180180180180170170180180销售员(人)销售员(人)290290320320250250340340330330310310300300300300销售额(千万元)销售额(千万元)26263030242432323131303027272727若2013年广告费支出200万元,推销人员达到350人,试预测销售额可达到多少?解:
17、1)建立预测模型。设二元线性回归预测模型为:其中,X1为广告费支出,X2为销售人员数量2)求解参数,见表2211xbxbayi将表中的数据代入公式得到 a0.011988 b10.00099 b20.0925则预测模型为Y 0.011988 0.00099 X1 0.0925 X23)进行模型检验。计算出有关数据所以回归标准差系数(Sy/Y)=0.998/28.375=3.48%说明模型的拟和程度好。4)进行预测Y 0.011988 0.00099 X1 0.0925 X2 0.011988 0.00099 200 0.0925 350 32.45(千万元)Sy 4.88037/(8-3)=0
18、.988(元)设某国每年小麦出口量的增长率设某国每年小麦出口量的增长率 y 和该年小麦产量的增长和该年小麦产量的增长率率 x1 及出口税率及出口税率 x2 有线性关系,其有线性关系,其20032012年年的样本数据如的样本数据如表,求样本的回归方程并预测表,求样本的回归方程并预测2010年的小麦出口增长率。年的小麦出口增长率。年份200342582010425162.5492.105492004912918214819.7630.58242005 12516012525114413.552.40312006 168112816864125614.5072.229252007 10 143140
19、3042196910011.3991.957120085743520284916256.6552.739362009 18 1622883632256432414.548 11.916492010 14 2022802840400419615.8243.32792011 12 1231443636144914410.7611.53512012 10 19419040763611610010.4830.2331110104 27 1282 256 279 1500891386 110.039 29.026176y1x2xyx1yx221xx21x22x2yiy 2iiyy 2yyi2127910
20、410110bba2127915001041282bba218927927256bba466.14a319.01b511.22b21511.2319.0466.14xxy,0,021bb91.0835.0176026.291122yyyyRiii03.21466.47026.2932nyyii,101x32x212013511.2319.0466.14xxy3511.210319.0466.14123.1003.22123.10,063.6183.14例题例题第四节第四节 非线性回归预测法非线性回归预测法一、非线性回归预测法的步骤把建立的非线性回归模型转化为线性回归模型,用线性回归模型的求解方
21、法进行求解参数,然后,再将求得的参数还原。1、多项式回归模型xbayxx1xbaybaxy xbaylnlnlnxxlnyyln aalnxbay xbaylnxxlnxbayxaby xbaylnlnlnyyln aalnbblnxbay xbaey xbay1lnlnxxaayy1lnlnxbay xbeay1xbeay1yy1 xexxbay【例题】某企业收集的商品销售额与商品流通费用率的有关资料,见下表。预测当销售额为80千万时,企业的流通费用率为多少?商品销售额与商品流通费用率相关表商品销售额与商品流通费用率相关表销售额(千万元)销售额(千万元)2929343443435555646
22、469697878流通费用率()流通费用率()2.12.11.81.81.51.51.41.41.31.31.31.31.281.28【解解】绘制散点图绘制散点图建立模型xbayxx1xbay列表计算参数销售额(千万元)销售额(千万元)x x2929343443435555646469697878流通费用率()流通费用率()y y2.12.11.81.81.51.51.41.41.31.31.31.31.281.280.0345 0.0345 0.0294 0.0294 0.0233 0.0233 0.0182 0.0182 0.0156 0.0156 0.0145 0.0145 0.0128
23、 0.0128 0.0724 0.0724 0.0529 0.0529 0.0349 0.0349 0.0255 0.0255 0.0203 0.0203 0.0188 0.0188 0.0164 0.0164 0.0012 0.0012 0.0009 0.0009 0.0005 0.0005 0.0003 0.0003 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 xyx2xxy2713.377363.0【例题】某企业收集了某产品的价格与销量的相关资料试预测,若价格下降到3元时,销量可以达到多少?解:1)根据资料,绘制相关图,由图形可知价格与销量间大体呈
24、指数曲线变化2)建立回归预测模型为YabX两边取对数得lnYlnaXlnb3)求解模型参数,列出相关计算时期时期1 12 23 34 45 5 合计价格X(元)价格X(元)4 43.83.83.73.73.53.53.23.218.2销量Y(万件)销量Y(万件)7 77.57.57.97.98.28.28.88.839.4Y=lnY1.9459 2.0149 2.0669 2.1041 2.174810.3066XY7.7836 7.6566 7.6475 7.3644 6.9594 37.41146X*X1614.4413.6912.2510.2466.62最小二乘法求得【例题】美国联邦储备
25、委员会很关注货币供应量的变动对国内生产总值GDP的影响。表(11.4)给出了美国1993年2007年GDP与货币供应量的数据。试建立回归方程用于预测。P276 例题例题年份年份国内生产总值国内生产总值GDP(亿美元)(亿美元)货币供应量货币供应量M2(亿美元)(亿美元)19931359.3861.019941472.8908.519951598.41023.219961782.81163.719971990.51286.719982249.71389.019992508.21500.220002723.01633.120013052.61795.520023166.01954.020033405.72185.220043772.22363.620054014.92562.620064240.32807.720074526.72901.0练习练习一、单选题4 4、回归分析与相关分析回归分析与相关分析u回归分析与相关分析均为研究及测量两个或两个以上变量之间关系的方法。u相关分析,是研究两个或两个以上随机变量之间相互依存关系的紧密程度。u回归分析,是研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间的数量变动的关系。由回归分析求出的关系式,称为回归模型。“回归”一词最初是由英国生物学家兼统计学家高尔顿提出来的。222)()(yyyyR