1、第一章统计案例第一章统计案例1 11 1回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用 栏目链接1 1了解随机误差、残差、残差图的概念了解随机误差、残差、残差图的概念2 2会通过分析残差判断线性回归模型的拟合效果会通过分析残差判断线性回归模型的拟合效果3 3掌握建立回归模型的步骤掌握建立回归模型的步骤4 4了解回归分析的基本思想方法和初步应用了解回归分析的基本思想方法和初步应用 栏目链接 栏目链接基基 础础梳梳 理理回归分析回归分析确定性确定性 栏目链接基基 础础梳梳 理理残差残差残差残差样本编号样本编号残差图残差图越窄越窄 栏目链接基基 础础梳梳 理理越小越小越好越好贡献率贡献
2、率1 栏目链接基基 础础自自 测测 栏目链接解析:解析:(4.9(4.95)5)2 2(7.1(7.17)7)2 2(9.1(9.19)9)2 20.03.0.03.故故选选C.C.答案:答案:C基基 础础自自 测测 栏目链接3 3有下列数据有下列数据下列四个函数中,模拟效果最好的为下列四个函数中,模拟效果最好的为( () ) A Ay y3 32 2x x1 1 B By yloglog2 2x x C Cy y3 3x x D Dy yx x2 2x123y35.9912.01解析:解析:当当x x1,2,31,2,3时,分别代入求时,分别代入求y y值,离值,离y y最近的值模最近的值模
3、拟效果最好,知拟效果最好,知A A模拟效果最好故选模拟效果最好故选A.A.答案:答案:A基基 础础自自 测测 栏目链接基基 础础自自 测测4 4总体偏差平方和为总体偏差平方和为287287,残差平方和为,残差平方和为120120,那么解释变,那么解释变量对总效应约贡献了量对总效应约贡献了_._. 栏目链接 栏目链接1重点重点通过实际操作进一步理解建立两相关变量的线性回归模通过实际操作进一步理解建立两相关变量的线性回归模型的思想;求线性回归方程;判断回归模型拟合的好型的思想;求线性回归方程;判断回归模型拟合的好坏坏 栏目链接2难点难点残差变量的解释与分析及指标残差变量的解释与分析及指标R2的理解
4、的理解 栏目链接3知识结构图知识结构图 栏目链接4 4思维总结思维总结(1)(1)求回归直线方程的一般方法求回归直线方程的一般方法 作出散点图,将问题所给的数据在平面直角坐标系作出散点图,将问题所给的数据在平面直角坐标系中描点,这样表示出的具有相关关系的两个变量的一组数中描点,这样表示出的具有相关关系的两个变量的一组数据的图形就是散点图,从散点图中我们可以看出样本点是据的图形就是散点图,从散点图中我们可以看出样本点是否呈条状分布,从而判断两个变量是否线性相关否呈条状分布,从而判断两个变量是否线性相关 栏目链接 栏目链接 栏目链接 栏目链接 在线性回归模型中在线性回归模型中R R2 2是刻画回归
5、效果的量,即表示回是刻画回归效果的量,即表示回归模型的拟合效果,也表示解释变量和预报变量的线性相归模型的拟合效果,也表示解释变量和预报变量的线性相关关系关关系R R2 2表示解释变量对预报变量变化的贡献率表示解释变量对预报变量变化的贡献率 栏目链接 栏目链接题型一题型一 线性回归模型的求解及应用线性回归模型的求解及应用例例1一个车间为了规定工时定额,需要确定加工零件所花一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了费的时间,为此进行了4次试验,收集的数据如下:次试验,收集的数据如下:(1)请画出上表数据的散点图;请画出上表数据的散点图;零件个数零件个数x/个个1234加工时
6、间加工时间y/小时小时2358 栏目链接 栏目链接 栏目链接 栏目链接 栏目链接 栏目链接跟跟 踪踪训训 练练1 1某种产品的广告费用支出某种产品的广告费用支出x x与销售额与销售额y y之间有如下的之间有如下的对应数据对应数据( (单位:万元单位:万元) ):(1)(1)画出散点图;画出散点图;(2)(2)求回归方程;求回归方程;(3)(3)据此估计广告费用支出为据此估计广告费用支出为1010万元时销售额万元时销售额y y的值的值x/万元万元24568y/万元万元3040605070 栏目链接跟跟 踪踪训训 练练 栏目链接跟跟 踪踪训训 练练 栏目链接跟跟 踪踪训训 练练 栏目链接题型二题型
7、二 模型拟合效果的分析模型拟合效果的分析例例2一个车间为了规定工时定额,需要确定加工零件所花一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了费的时间,为此进行了10次试验,测得数据如下:次试验,测得数据如下:(1)(1)如果如果y y与与x x具有线性相关关系,求回归直线方程具有线性相关关系,求回归直线方程(2)(2)根据求出的回归直线方程,预测加工根据求出的回归直线方程,预测加工200200个零件所用的个零件所用的时间为多少?时间为多少?(3)(3)求出相关指数求出相关指数R R2 2,作出残差图,并对模型拟合效果进,作出残差图,并对模型拟合效果进行分析行分析零件数零件数x
8、/个个102030405060708090100加工时加工时间间y/分钟分钟626875818995102108115122 栏目链接解析:解析:(1)列出下表:列出下表:i12345678910 xi102030405060708090100yi626875818995102108115122xi yi6201 3602 2503 2404 4505 7007 1408 64010 35012 200 栏目链接 栏目链接残差表链接残差表链接 栏目链接 栏目链接根据表格作出残差图,如下图:根据表格作出残差图,如下图: 栏目链接 注:注:横坐标为零件个数,纵坐标为残差横坐标为零件个数,纵坐标为残
9、差 由由R R2 20.999 620.999 62非常接近于非常接近于1 1,可知回归直线模型拟合,可知回归直线模型拟合效果较好残差图中的残差点比较均匀地落在水平的带效果较好残差图中的残差点比较均匀地落在水平的带状区域中,也说明选用的线性回归模型较为合适,带状状区域中,也说明选用的线性回归模型较为合适,带状区域的宽度比较狭窄,说明了模型拟合精度较高区域的宽度比较狭窄,说明了模型拟合精度较高 点评:点评:解决本题的关键在于公式的运用解决本题的关键在于公式的运用 栏目链接跟跟 踪踪训训 练练2已知某种商品的价格已知某种商品的价格x(元元)与需求量与需求量y(件件)之间的关之间的关系有如下一组数据
10、:系有如下一组数据:求求y对对x的回归直线方程,并说明回归模型拟合效果的的回归直线方程,并说明回归模型拟合效果的好坏好坏x/元元1416182022y/件件1210753 栏目链接跟跟 踪踪训训 练练 栏目链接跟跟 踪踪训训 练练 栏目链接跟跟 踪踪训训 练练列出残差表如下:列出残差表如下:i129.77.45.12.8yii00.30.40.10.2yi4.62.60.42.44.4 栏目链接跟跟 踪踪训训 练练 因为因为R R2 20.9940.994非常接近于非常接近于1 1,所以回归模型的拟合效果很,所以回归模型的拟合效果很好好 点评:点评:数据运算繁杂,通常采用分步计算的方法由相关指
11、数据运算繁杂,通常采用分步计算的方法由相关指数数R2可以看出回归的拟合效果很好可以计算相关系数可以看出回归的拟合效果很好可以计算相关系数r,看,看两个变量的线性相关关系是否很强两个变量的线性相关关系是否很强 栏目链接题型三题型三非线性回归分析非线性回归分析例例4在化学反应过程中某化学物质的反应速率在化学反应过程中某化学物质的反应速率y(g/min)与一种催化剂的量与一种催化剂的量x(g)有关,现收集了有关,现收集了8组数据列于下表组数据列于下表中,试建立中,试建立y与与x之间的回归方程之间的回归方程.x1518212427303336y6830277020565350 栏目链接解析:解析:根据
12、收集的数据作散点图如下图所示,根据样本根据收集的数据作散点图如下图所示,根据样本点分布情况可选用两种曲线模型来拟合点分布情况可选用两种曲线模型来拟合 栏目链接t2253244415767299001 089 1 296y6830277020565350 栏目链接作作y y与与t t的散点图如下:的散点图如下: 栏目链接 栏目链接 栏目链接 点评:点评:非线性回归分析有时并不给出检验公式,这时我们非线性回归分析有时并不给出检验公式,这时我们可以画出已知数据的散点图,把它与教材必修可以画出已知数据的散点图,把它与教材必修1 1中学过的各种中学过的各种函数函数( (幂函数、指数函数、对数函数等幂函数
13、、指数函数、对数函数等) )图象作比较,挑选一图象作比较,挑选一种跟这些散点拟合得最好的函数,然后像本例这样,采用适种跟这些散点拟合得最好的函数,然后像本例这样,采用适当的变量置换,把非线性回归问题转化为线性回归问题当的变量置换,把非线性回归问题转化为线性回归问题 栏目链接3某种书每册的成本费某种书每册的成本费y(元元)与印刷册数与印刷册数x(千册千册)有关,有关,经统计得到数据如下:经统计得到数据如下:跟跟 踪踪训训 练练x123510203050100200y10.155.524.082.852.111.621.411.301.211.15 栏目链接跟跟 踪踪训训 练练u10.50.330
14、.20.10.050.030.020.010.005y10.155.524.082.852.111.621.411.301.211.15 栏目链接跟跟 踪踪训训 练练 栏目链接 栏目链接 1 1建立回归模型的基本步骤为:建立回归模型的基本步骤为: (1) (1)确定研究对象,明确哪个变量是解释变量,哪个变量是确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量预报变量 (2) (2)画出解释变量和预报变量的散点图,观察它们之间的关画出解释变量和预报变量的散点图,观察它们之间的关系系( (如是否存在线性关系等如是否存在线性关系等) ) (3) (3)由经验确定回归方程的类型由经验确定回归方程
15、的类型( (如观察到数据呈线性关系,如观察到数据呈线性关系,则选用线性回归方程则选用线性回归方程) ) (4) (4)按一定规则按一定规则( (如最小二乘法如最小二乘法) )估计回归方程中的参数估计回归方程中的参数 (5) (5)得出结果后分析残差图是否有异常得出结果后分析残差图是否有异常( (如个别数据对应残如个别数据对应残差过大,残差呈现不随机的规律性等差过大,残差呈现不随机的规律性等) )若存在异常,则检查若存在异常,则检查数据是否有误,或模型是否合适等数据是否有误,或模型是否合适等 栏目链接 2 2分析两个变量相关关系的常用方法有:分析两个变量相关关系的常用方法有: (1) (1)利用
16、散点图进行判断:把样本数据表示的点在平面直角利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系有线性相关关系 (2) (2)利用相关指数利用相关指数R R2 2进行判断进行判断 3 3对具有相关关系的两个变量进行统计分析时,首先进行对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求回归直线方相关性检验,在确认具有线性相关关系后,再求回归直
17、线方程程 对于非线性回归问题,可以转化为线性回归问题去解决对于非线性回归问题,可以转化为线性回归问题去解决. . 栏目链接57写在最后写在最后成功的基础在于好的学习习惯成功的基础在于好的学习习惯The foundation of success lies in good habits谢谢聆听 学习就是为了达到一定目的而努力去干, 是为一个目标去战胜各种困难的过程,这个过程会充满压力、痛苦和挫折Learning Is To Achieve A Certain Goal And Work Hard, Is A Process To Overcome Various Difficulties For A Goal