1、第三章统计案例回归分析的基本思想及其初步应用第三课时人民教育出版社A版 高三|选修2-3人民教育出版社A版 高三|选修2-3线性回归方程:,其中:axby1122211()()()nniiiiiinniiiixxyyx ynxybxxxnxyabx线性回归模型:y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差.数据点和它在回归直线上相应位置的差异是随机误差的效应,称 为残差.由 得 .(1,2,3,)iieyy inLiiybxa(1,2,3,).iiieybxa inL人民教育出版社A版 高三|选修2-3检测下预习效果:检测下预习效果:1.有下列数据:下列四个函数中,模拟效果最好
2、的为()A.B.C.D.A 13 2xy 2logyx3yx2yxx123y35.9912.01人民教育出版社A版 高三|选修2-3检测下预习效果:检测下预习效果:2.已知回归方程 ,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A.0.01B.0.02C.0.03D.0.04C21yx人民教育出版社A版 高三|选修2-3相关系指数:22121()1()niiniiyyRyy 是刻画回归效果的量,除了表示回归模型的拟合效果,也表示解释变量和预报变量的线性相关关系(在线性回归模型中).越大,说明残差平方和越小,模型的拟合效果越好,在线性回归模型中,越接近于
3、1,回归的效果越好(因为 越接近于1,表示解释变量和预报变量的线性相关性越强)2R2R2R2R人民教育出版社A版 高三|选修2-3探究一:建立回归模型的基本步骤是什么?活动一 归纳提升,总结一般方法例1 某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:月人均收入月人均收入x元元3003904205205707007608008501080月人均生活费月人均生活费y元元255324335360450520580600630750试预测人均月收入为1100元和人均月收入为1200元的两个家庭的月人均生活费.详解:作出散点分布图如图,由图可知,月人
4、均生活费与人均收入之间具有线性相关关系.人民教育出版社A版 高三|选修2-3通过计算可知:639480.4xy,10214610300,iix10212540526,iiy3417560101iiiyx所以10110221100.6599.10iiiiix yxybxx751.58xbya所以回归直线方程为.751.586599.0 xy计算相关系数得r=0.993136,故月人均收入与月人均生活费之间具有显著相关关系.探究一:建立回归模型的基本步骤是什么?人民教育出版社A版 高三|选修2-3作残差图如图,计算相关指数得 0.9863,说明城镇居民的月人均生活费的差异有98.63是由月人均收入
5、引起的.2R探究一:建立回归模型的基本步骤是什么?由图可知,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.人民教育出版社A版 高三|选修2-3 由以上分析可知,我们可以利用回归方程 来作为月生活费的预报值.0.659958.751yx故预测月人均收入分别为1100元和1200元的两家庭的月人均生活费分别为784.59元和850.58元.探究一:建立回归模型的基本步骤是什么?将x1100代入回归方程得y784.59元;将x1200代入回归方程得y850.58元.人民教育出版社A版 高三|选修2-3点拨:建立回归模型的基本步骤(5)得出结论后分析残差图是否有异常(如个别数据对应的残
6、差绝对值过大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.探究一:建立回归模型的基本步骤是什么?(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系等).(3)由经验确定回归方程的类型(如果我们观察到诗句呈线性关系,则选用线性回归方程).(4)按一定的规则(如最小二乘法)估计回归方程中的参数.人民教育出版社A版 高三|选修2-3探究二:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识活动一 整合旧知,发现新问题 当两个变量呈线性相关关系时,我们通过模拟线性回归模型,用
7、回归分析的基本思想对两个变量进行研究.若当有些变量间的关系并不是线性相关,怎样确定回归模型?例2 一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方程.编号编号1234567温度温度x/C21232527293235产卵数产卵数y/个个711212466115325人民教育出版社A版 高三|选修2-3详解:根据收集数据,作散点图:探究二:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3活动二 观察发现,寻找新模型 样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,即不能直接用线性回归方程来建立两
8、个变量之间的关系.怎样确定回归模型?首先要作出散点图,如果散点图中的样本点并没有分布在某个带状区域内,则两个变量不呈现线性相关关系,不能直接利用回归方程来建立两个变量之间的关系,根据已有的函数知识,观察样本点是否呈指数函数关系或二次函数关系,选定适当的回归模型.根据已有的函数知识,从散点图中可以看到样本点分布在某一条指数函数曲线 的周围.xcecy21探究二:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3活动三 非线性转化为线性问题如果两个变量呈现非线性相关关系,怎样求出回归方程?可以通过对解释变量进行变换,如对数变换或平方变换,先得到另外两个变
9、量间的回归方程,再得到所求两个变量的回归方程.现在,我们通过对数变换把指数关系变为线性关系,即对 两边取自然对数xcecy2122111212lnlnlnlnlnlnlnlnc xc xyc ececc xecce x令 ,建立z与x之间的线性回归方程 yzlnxccz21ln12lnacbczabx令,即 分析x与z之间的关系,通过画散点图(如下图),可知x与z之间是存在着线性回归关系,可以用最小二乘法求出线性回归方程z=a+bx.探究二:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3由表1的数据可以得到变换后的样本数据表x2123252729
10、3235z1.9462.3983.0453.1784.1904.7455.784探究二:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3列表计算出各个量编号编号1234567合计合计温度温度x/C21232527293235192产卵数产卵数y/个个711212466115325569z=ln y1.946 2.398 3.045 3.178 4.190 4.745 5.784 25.285 xi2441529625729841102412255414xizi40.9 55.2 76.1 85.8 121.5 151.8 202.4 733.7 2
11、7.429 3.612 5414 733.71xzniix12niyiyx112221733.77 27.43 3.610.27254147 27.43niiiniix znxzbxnx ,3.8 4 3azbx,843.3272.0 xz0.2 7 23.8 4 3lnln0.2 7 23.8 4 3.xzyyxye因 为,所 以,即探究二:若两变量为非线性相关关系,如何建立回归模型?重点、难点知识人民教育出版社A版 高三|选修2-3探究三:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?活动一 二次曲线模型样本点还可以看作是分布在二次函数曲线 周围.221cxcy2tx令,建立
12、y与t之间的线性回归方程21ctcy12bcacyabt令,即分析y与t之间的关系,通过画散点图(如下图),可看到y与t的散点图并不分布在一条直线的周围,即不宜用线性回归方程来拟合它,即不宜用二次曲线 来拟合y与x之间的关系,这个结论还可以用残差分析得到.221cxcy人民教育出版社A版 高三|选修2-3 活动二 对比提升 为比较两个不同模型的残差,需建立相应的回归模型,用线性回归模型拟合回归方程.yabt编编号号1234567合合计计温温度度x/C21232527293235192产产卵卵数数y/个个711212466115325569t=x2441529625729841102412255
13、414ti2194481 279841 390625 531441 707281104857615006254652870tiyi308758191312517496555061177603981256109180 0.3 36 67 7773.42981.2864 46 65 52 28 87 70 06 61 10 09 91 18 8-2 20 02 2.5 54 43 3tniit12niiiyt1y2121znxzxnzxbniiniiixbza所以543.202367.0ty2tx因为,即y关于x的二次回归方程为543.202367.02xy探究三:能否用其它模型来拟合上述问题?如
14、何判断各种的模型的拟合效果?人民教育出版社A版 高三|选修2-3活动三 残差分析 指数回归模型与二次回归模型中哪个能更好地刻画红铃虫的产卵数y与温度x的关系?通过什么数据说明?一般在参数个数一定的条件下,相关指数越大或残差平方和越小说明模型拟合得越好.计算每个模型的相关指数,并进行模型的比较.探究三:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?人民教育出版社A版 高三|选修2-3探究三:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?指数函数模型的相关指数:编编号号1234567合合计计温温度度x/C21232527293235192产产卵卵数数y/个个711212
15、46611532556927.42981.2866.511.219.233.157.1129.2292.1548.374-74.3-70.3-60.3-57.3-15.333.7243.700.5-0.21.8-9.18.9-14.232.920.62575518.44940.13634.43281.7233.71136.759396.7 78141.40.270.033.1083.7079.01200.321084.26 1450.681450.6878141.4y关关于于x的的指指数数回回归归方方程程xniiiniiyye1212niiyy12y843.3272.0 xeyiy iiiyy
16、e22iiiyye98.0112122niiniiiyyyyR人民教育出版社A版 高三|选修2-3二次函数模型的相关指数:从相关指数的计算结果来看,指数函数模型的 比二次函数模型的 更接近于1,所以指数函数模型的回归效果好.2R2R探究三:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?人民教育出版社A版 高三|选修2-3再从残差图看:从图中可看出指数函数模型的残差点比较均匀地落在水平的带状域中,所以指数函数模型拟合精度较二次函数模型的高.探究三:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?人民教育出版社A版 高三|选修2-3点拨:归纳判断模型拟合效果的方法:(2)
17、通过残差分析比较两种模型的拟合效果.一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.探究三:能否用其它模型来拟合上述问题?如何判断各种的模型的拟合效果?(1)可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;人民教育出版社A版 高三|选修2-3知识梳理(1)建立回归模型的基本步骤确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.画出解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系等).由经
18、验确定回归方程的类型(如果我们观察到诗句呈线性关系,则选用线性回归方程).按一定的规则(如最小二乘法)估计回归方程中的参数.得出结论后分析残差图是否有异常(如个别数据对应的残差绝对值过大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.人民教育出版社A版 高三|选修2-3知识梳理(2)归纳判断模型拟合效果的方法:可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;通过残差分析比较两种模型的拟合效果.一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果.残差平方和越小的模型,拟合的效果越好.人民教育出版社A版 高三|选修2-3重难点突破(1)如果两个变量不呈现线性相关关系,常见的两个变量间的关系还有指数函数关系、二次函数关系.(2)两个变量间的非线性关系可以通过对解释变量的变换(对数变换、平方变换等)转化为另外两个变量的线性关系.(3)比较不同模型的拟合效果,可以通过残差平方和的大小,相关指数的大小来判断.
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。