1、2.3变量之间的相关关变量之间的相关关系系【学学 习习 目目 标标】1、知识与技能:、知识与技能:会画散点图判断线性相关关系,并对实际问题进会画散点图判断线性相关关系,并对实际问题进行分析和预测;加强对线性相关关系及回归直线含义行分析和预测;加强对线性相关关系及回归直线含义的理解的理解.2、过程与方法:、过程与方法:通过自主探究,体会数形结合、类比的数学思通过自主探究,体会数形结合、类比的数学思想方法想方法.通过动手操作培养学生观察、分析、比较和归通过动手操作培养学生观察、分析、比较和归纳能力,引出利用计算机等现代化教学工具的必要性纳能力,引出利用计算机等现代化教学工具的必要性.3、情感、态度
2、与价值观:、情感、态度与价值观:类比函数的表示方法,使学生理解变量间的相关类比函数的表示方法,使学生理解变量间的相关关系,增强对实际问题进行分析和预测的意识关系,增强对实际问题进行分析和预测的意识.利用利用计算机让学生动手操作,合作交流激发学生的学习兴计算机让学生动手操作,合作交流激发学生的学习兴趣趣.创设情境创设情境 导入新课导入新课 世界遗产世界遗产广西巴马长寿村广西巴马长寿村 我国广西省有一个长寿村,名列世界五我国广西省有一个长寿村,名列世界五大长寿地区,村里有个不成文的规矩,大长寿地区,村里有个不成文的规矩,“不到八十不祝寿不到八十不祝寿”.2003年年11月,国际月,国际自然医学会授
3、予巴马自然医学会授予巴马“世界长寿之乡世界长寿之乡”证证书书.同学们,知道长寿村长寿的秘密吗?同学们,知道长寿村长寿的秘密吗?遗传基因、遗传基因、自然环境、自然环境、水、水、饮食饮食 问题问题1、对于两个变量之间的关系,我们对于两个变量之间的关系,我们之前学过,之前学过,函数关系是一种确定性关系函数关系是一种确定性关系.那么那么下列变量与变量之间哪些是确定性的函数关系,下列变量与变量之间哪些是确定性的函数关系,哪些是不确定相关关系?哪些是不确定相关关系?正方形边长与面积之间的关系正方形边长与面积之间的关系圆的半径与圆的周长之间的关系圆的半径与圆的周长之间的关系年龄与人体的脂肪含量之间的关系年龄
4、与人体的脂肪含量之间的关系数学成绩与物理成绩之间的关系数学成绩与物理成绩之间的关系.相关关系相关关系初步探索,直观感知初步探索,直观感知探究一探究一:两个变量间的相关关系两个变量间的相关关系 请同学们试举几个现实生活中相关关请同学们试举几个现实生活中相关关系的例子系的例子.类别类别区别区别联系联系函数函数关系关系1、函数关系中两个变、函数关系中两个变量是一种确定性关系;量是一种确定性关系;2、函数关系是一种因、函数关系是一种因果关系果关系.1、对线性相关关系、对线性相关关系求回归直线后,可求回归直线后,可以通过确定的函数以通过确定的函数关系对两个变量间关系对两个变量间的取值进行估计;的取值进行
5、估计;相关相关关系关系1、相关关系是一种非、相关关系是一种非确定性关系;确定性关系;2、相关关系不一定是、相关关系不一定是因果关系,也可能是因果关系,也可能是伴随关系伴随关系.2、函数关系是理想、函数关系是理想的关系模型,而相的关系模型,而相关关系是更为一般关关系是更为一般的情况的情况问题问题2、在一次对人体脂肪含量和年龄的关在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组系的研究中,研究人员获得了一组样本数据样本数据:年龄年龄23273941454950脂肪脂肪9.517.8 21.2 25.927.526.328.2年龄年龄53545657586061脂肪脂肪29.6 30.2
6、 31.4 30.8 33.5 35.234.6 根据上述数据,人体的脂肪含量与根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?年龄之间有怎样的关系?探究二:散点图探究二:散点图初步探索,直观感知初步探索,直观感知如何进行数据分析?如何进行数据分析?思考:思考:上图叫做上图叫做散点图散点图,你能描述一下散点图的,你能描述一下散点图的含义吗?含义吗?在平面直角坐标系中,表示具有相关关系的两个在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为变量的一组数据图形,称为散点图散点图.种植西红柿,施肥量与产量种植西红柿,施肥量与产量 之间的散点图之间的散点图 问题问题3 下面两个散点
7、图中点的分布下面两个散点图中点的分布有什么不同?有什么不同?初步探索,直观感知初步探索,直观感知年龄与脂肪含量之间的散点图年龄与脂肪含量之间的散点图 观察左面散点图,发现这些点大致分观察左面散点图,发现这些点大致分布在一条直线附布在一条直线附 近近.像这样,如果散点图中点的分布从整像这样,如果散点图中点的分布从整体上看大致在一条体上看大致在一条_附近,我们就附近,我们就称这两个变量之间具有称这两个变量之间具有线性相线性相 关关系关关系,这条直线叫做这条直线叫做_.回归直线回归直线直线直线散点图散点图3).).如果所有的样本点都落在某一如果所有的样本点都落在某一直线附近直线附近,变量之间就有变量
8、之间就有线性相关关系线性相关关系.1).).如果所有的样本点都落在某一如果所有的样本点都落在某一函数曲线上,函数曲线上,就用该函数来描述变量之间的关系,即变量之就用该函数来描述变量之间的关系,即变量之间具有间具有函数关系函数关系2).).如果所有的样本点都落在某一如果所有的样本点都落在某一函数曲线附近函数曲线附近,变量之间就有变量之间就有相关关系相关关系.说明说明散点图散点图:用来判断两个变量是否具有相关关系用来判断两个变量是否具有相关关系.C3、判断下列图形中具有线性相关关系的、判断下列图形中具有线性相关关系的两个变量是两个变量是年龄与脂肪含量之间的散点图年龄与脂肪含量之间的散点图气温与热饮
9、杯数之间的散点图气温与热饮杯数之间的散点图 问题问题4 (1)两个散点图的有什么共同之处?两个散点图的有什么共同之处?探究三:线性相关、正相关、负相关探究三:线性相关、正相关、负相关(2)两个散点图的点的分布有什么不同?两个散点图的点的分布有什么不同?初步探索,直观感知初步探索,直观感知年龄与脂肪含量之间的散点图年龄与脂肪含量之间的散点图气温与热饮杯数之间的散点图气温与热饮杯数之间的散点图探究三:线性相关、正相关、负相关探究三:线性相关、正相关、负相关初步探索,直观感知初步探索,直观感知 左面的散点图中,点散布在从左下角左面的散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相到右上
10、角的区域,对于两个变量的这种相关关系,我们将它称为关关系,我们将它称为正相关正相关.右面的散点图中,点散布在从左上角右面的散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相到右下角的区域,对于两个变量的这种相关关系,我们将它称为关关系,我们将它称为负相关负相关.请同学们试举几个现实生活中变量之请同学们试举几个现实生活中变量之间成负相关实例间成负相关实例.初步探索,直观感知初步探索,直观感知如果散点图中点的分布如果散点图中点的分布从整体上从整体上看看大致在一条直大致在一条直线附近,我们就称这两个变量之间具有线附近,我们就称这两个变量之间具有线性相关线性相关关系关系,这条直线就叫做,这
11、条直线就叫做回归直线回归直线.这条回归直线的方程,简称为这条回归直线的方程,简称为回归方程回归方程.回归直线回归直线 整体上最接近整体上最接近 采用测量的方法:先画一条直线,测采用测量的方法:先画一条直线,测量出各点到它的距离,然后移动直线,到达一量出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测量出此时直线的个使距离之和最小的位置,测量出此时直线的斜率和截距,就得到回归方程斜率和截距,就得到回归方程.如何具体的求出这个回归方程呢?如何具体的求出这个回归方程呢?在图中选取两点画直线,使得直线在图中选取两点画直线,使得直线两侧的点的个数基本相同两侧的点的个数基本相同.脂肪0102
12、03040020406080脂肪三、如何具体的求出这个回归方程呢?三、如何具体的求出这个回归方程呢?在散点图中多取几组点,确定几条直线的在散点图中多取几组点,确定几条直线的方程,分别求出各条直线的斜率和截距的平均数,方程,分别求出各条直线的斜率和截距的平均数,将这两个平均数作为回归方程的斜率和截距将这两个平均数作为回归方程的斜率和截距.脂肪010203040020406080脂肪三、如何具体的求出这个回归方程呢?三、如何具体的求出这个回归方程呢?上述三种方案均有一定的道理,但可靠性不强,上述三种方案均有一定的道理,但可靠性不强,我们回到回归直线的定义我们回到回归直线的定义.求回归方程的关键是如
13、何用数学的方法来刻画求回归方程的关键是如何用数学的方法来刻画“从整体上看,各点与直线的偏差最小从整体上看,各点与直线的偏差最小”.如果散点图中点的分布如果散点图中点的分布从整体上看从整体上看大致在一条直线附近,大致在一条直线附近,我们就称这两个变量之间具有我们就称这两个变量之间具有线性相关关系线性相关关系,这条直线,这条直线就叫做就叫做回归直线回归直线.思考思考6:对一组具有线性相关关系的样本数据:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),(xn,yn),设其回归方,设其回归方程为程为 可以用哪些数量关系来刻画各样本点可以用哪些数量关系来刻画各样本点与回归直线的接近程度
14、?与回归直线的接近程度?当自变量当自变量x取取xi(i=1,2,n)时可以得到回归时可以得到回归直直线上的点的纵坐标为:线上的点的纵坐标为:它与样本数据它与样本数据yi的偏差是:的偏差是:假设我们已经得到两个具有线性相关关系的样本假设我们已经得到两个具有线性相关关系的样本的一组数据:的一组数据:(x1,y1),(x2,y2),(xn,yn),且所求回归直线方程是:且所求回归直线方程是:,其中,其中 是是待定系数待定系数.(x1,y1)(x2,y2)(xn,yn)ybxaba,(1,2,)iiybxa in()iiiiyyybxa(x1,y1)(x2,y2)(xn,yn)|iiyyid运算不方便
15、运算不方便避免相互抵消避免相互抵消各点与直线各点与直线的整体偏差的整体偏差1()iniiyy 求的最小值1iiniyy 求的最小值21)iniiyy求(的最小值2112222()()()nnQybxaybxaybxa这种通过求:这种通过求:的最小值而得到回归直线的方法,即求样本数据的点到的最小值而得到回归直线的方法,即求样本数据的点到回归直线的距离的平方和最小的方法叫做回归直线的距离的平方和最小的方法叫做最小二乘法最小二乘法.2221122()()()nnQybxaybxaybxa1122211()(),().nniiiiiinniiiixx yyx ynxybxxxnxay bx4、回归方程
16、的系数公式:、回归方程的系数公式:回归方程回归方程 ,其中:,其中:axby1122211()(),().nniiiiiinniiiixx yyxynxybxxxnxay bx 思考思考7:利用利用计算器或计算机计算器或计算机可求得年龄和可求得年龄和人体脂肪含量的样本数据的回归方程为人体脂肪含量的样本数据的回归方程为 ,由此我们可以根据,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分一个人个年龄预测其体内脂肪含量的百分比的比的回归值回归值.若某人若某人65岁,则其体内脂肪含岁,则其体内脂肪含量的百分比量的百分比约约为多少?为多少?0.5770.448yx=-37.1(0.57765-0.
17、448=37.1)若某人若某人65岁,可预测他体内脂肪含量在岁,可预测他体内脂肪含量在37.1(0.57765-0.448=37.1)附近的可能性比较大附近的可能性比较大.但不能说他体内脂肪含量一定是但不能说他体内脂肪含量一定是37.1原因原因:线性回归方程中的截距和斜率都是通过样:线性回归方程中的截距和斜率都是通过样本本估计的估计的,存在随机误差,这种误差可以导致预,存在随机误差,这种误差可以导致预测结果的偏差,即使截距斜率没有误差,也不可测结果的偏差,即使截距斜率没有误差,也不可能百分百地保证对应于能百分百地保证对应于x,预报值,预报值Y能等于实际值能等于实际值y例题:例题:1解:解:(1
18、)散点图如图示:散点图如图示:(2)由题意得:由题意得:9,4xy42222212341344iixxxxx4112233441158iiix yx yx yx yx y0.7,2.3bay bx 回归方程为:回归方程为:0.72.3yx(3)由回归方程预测,由回归方程预测,0.7 9 2.34y 即记忆力为即记忆力为9的同学的判断力约为的同学的判断力约为4小结小结1.求样本数据的线性回归方程,可按求样本数据的线性回归方程,可按下列步骤进行:下列步骤进行:第一步,列表计算平均数第一步,列表计算平均数 ,xy1niiix y21niix第二步,求和第二步,求和,1122211()(),()nni
19、ii iiinniiiixx yyxynx ybay bxxxxnx 第三步,计算第三步,计算 第四步,写出回归方程第四步,写出回归方程 变式:变式:(广东高考广东高考)下表提供了某厂节能降耗技下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量术改造后生产甲产品过程中记录的产量x吨与相吨与相应的生产能耗应的生产能耗y(吨标准煤吨标准煤)的几组对照数据的几组对照数据.x2345y2.5344.5(1)请画出上表数据的散点图请画出上表数据的散点图.(2)根据上表数据用最小二乘法求出根据上表数据用最小二乘法求出y关于关于x的的线性回归方程线性回归方程(3)由由(2)预测技改后生产预测技改后生
20、产100吨甲产品的生产吨甲产品的生产能耗是多少吨标准煤?能耗是多少吨标准煤?(参考数值:参考数值:2*2.5+3*3+4*4+5*4.5=52.5)解解 (1)由题设所给数据,可得散点图如图由题设所给数据,可得散点图如图.(2)对照数据由最小二乘法确定的回归方程的系数对照数据由最小二乘法确定的回归方程的系数为:为:=3.5-0.73.5=1.05.因此,所求的线性回归方程为因此,所求的线性回归方程为 =0.7x+1.05.2 3 4 52.5 3 4 4.53.5,3.5,44xy xbyay 121()()0.7()niiiniixxyybxx0.7 100 1.0571.05y(3)当当x=100时;时;所以技改后生产所以技改后生产100吨甲产品的生产能耗吨甲产品的生产能耗是是71.05吨标准煤吨标准煤(1)散点图:散点图:(2)正相关、负相关:正相关、负相关:(3)线性相关关系:线性相关关系:(4)回归方程的系数公式:回归方程的系数公式:1122211()(),().nniiiiiinniiiixxyyxnx ybxxxnxaybxy【知识归纳知识归纳】1、知识:、知识:(1)最小二乘法:最小二乘法:(2)转化与化归;转化与化归;数形结合;数形结合;2、思想方法:、思想方法: