1、2.32.3变量间的相关关系变量间的相关关系张张 雄雄平均数:指样本数据的平均数:指样本数据的算术平均数算术平均数 即即 _1.1.什么是众数、中位数、平均数、方差、什么是众数、中位数、平均数、方差、标准差?标准差?2.2.如何从频率分布直方图中估计众数、中如何从频率分布直方图中估计众数、中 位数、平均数?位数、平均数?3.3.方差与标准差的联系与区别是什么?方差与标准差的联系与区别是什么?众数:在一组数据中,出现众数:在一组数据中,出现次数次数最多的数据最多的数据(即频率分布最大即频率分布最大 值所对应的样本数据值所对应的样本数据)叫这组数据的众数叫这组数据的众数中位数:将一组数据按大小依次
2、排列,把处在中位数:将一组数据按大小依次排列,把处在最中间最中间位置的位置的 一个数据一个数据(或中间两个数据的平均数或中间两个数据的平均数)叫这组数据的中位数叫这组数据的中位数.2.2.众数、中位数、平均数与频率分布直方图的关系众数、中位数、平均数与频率分布直方图的关系众数众数中位数中位数平均数平均数 众数众数是最高矩形的是最高矩形的中点中点所对应的数据,所对应的数据,表示样本数据的中心值表示样本数据的中心值.在频率分布直方图中,在频率分布直方图中,中位数中位数左边和右边的直方左边和右边的直方 图图面积面积相等,由此可以估计中位数的值,但是相等,由此可以估计中位数的值,但是 有偏差;有偏差;
3、表示样本数据所占频率的等分线表示样本数据所占频率的等分线.平均数平均数等于每个小长方形的面积乘以小长方形底等于每个小长方形的面积乘以小长方形底 边边中点的横坐标之和中点的横坐标之和;平均数是频率分布直方图的平均数是频率分布直方图的中心中心,是频率分布,是频率分布 直方图的直方图的平衡点平衡点 .1.1.什么是众数、中位数、平均数、方差、什么是众数、中位数、平均数、方差、标准差?标准差?2.2.如何从频率分布直方图中估计众数、中如何从频率分布直方图中估计众数、中 位数、平均数?位数、平均数?3.3.方差与标准差的联系与区别是什么?方差与标准差的联系与区别是什么?方差方差是是标准差标准差s s的平
4、方的平方s s2 2,都是用来测量样本数据的,都是用来测量样本数据的 分散程度的特征数分散程度的特征数标准差标准差与原数据有相同的单位;与原数据有相同的单位;方差方差的单位是原数据单位的平方的单位是原数据单位的平方 .导入导入前面我们学习了两个量之间的关系有哪些?前面我们学习了两个量之间的关系有哪些?相等关系、不等关系;相等关系、不等关系;两个量之间的函数关系;两个量之间的函数关系;思考:思考:在学校里,老师对学生经常这样说:在学校里,老师对学生经常这样说:“如果你的数学如果你的数学 成绩好,那么你的物理学习就不会有什么大问题成绩好,那么你的物理学习就不会有什么大问题”.”.按照按照 这种说法
5、,似乎学生的物理成绩与数学成绩之间存在着这种说法,似乎学生的物理成绩与数学成绩之间存在着 一种相关关系,这种说法有没有根据?一种相关关系,这种说法有没有根据?2 2例题导读例题导读通过对例题的学习通过对例题的学习,(1),(1)学会如何作散点图;学会如何作散点图;(2)(2)学会如何用散点图判断两个变量是否相关学会如何用散点图判断两个变量是否相关;(3)(3)掌握求回归直线方程的方法掌握求回归直线方程的方法;(4)(4)熟悉回归直线方程的实际应用熟悉回归直线方程的实际应用1 1问题导航问题导航(1)(1)什么叫散点图?什么叫散点图?(2)(2)相关关系分为哪两种?相关关系分为哪两种?(3)(3
6、)什么叫回归直线?求回归直线的方法及什么叫回归直线?求回归直线的方法及步骤是什么?步骤是什么?1 1两个变量的线性相关两个变量的线性相关(1)(1)散点图:将样本中散点图:将样本中n n个数据点个数据点(x(xi i,y yi i)(i)(i1,2,n)1,2,n)描在平面直角坐标系中得到的图形描在平面直角坐标系中得到的图形(2)(2)正相关与负相关正相关与负相关 正相关:散点图中的点散布在从正相关:散点图中的点散布在从_到到_ 的区域的区域左下角左下角右上角右上角左上角左上角右下角右下角 负相关:散点图中的点散布在从负相关:散点图中的点散布在从_到到_ 的区域的区域2 2回归直线的方程回归直
7、线的方程(1)(1)回归直线:如果散点图中点的分布从整体上看大致在回归直线:如果散点图中点的分布从整体上看大致在 _ _附近,我们就称这两个变量之间具有附近,我们就称这两个变量之间具有_ 关系,这条直线叫做回归直线关系,这条直线叫做回归直线(2)(2)回归方程:回归方程:_对应的方程叫回归直线的方程,对应的方程叫回归直线的方程,简称回归方程简称回归方程一条直线一条直线回归直线回归直线线性相关线性相关这组样本点的中心在哪?这组样本点的中心在哪?如何确定回归直线方程呢?如何确定回归直线方程呢?2.2.回归直线的方程回归直线的方程(3)(3)最小二乘法最小二乘法 求回归直线方程求回归直线方程 时,使
8、得样本数据的点到回归直时,使得样本数据的点到回归直 线的线的_最小的方法叫做最小二乘法最小的方法叫做最小二乘法距离的平方和距离的平方和斜率斜率截距截距1.1.两个变量之间的关系与其对应的散点图特征两个变量之间的关系与其对应的散点图特征:(3)(3)两个变量间的关系是线性相关时,两个变量间的关系是线性相关时,(2)(2)两个变量间的关系是相关关系时,两个变量间的关系是相关关系时,(1)(1)两个变量间的关系是函数关系时,两个变量间的关系是函数关系时,数据点位于某曲线上数据点位于某曲线上.数据点位于某数据点位于某曲线曲线附近附近.数据点位于某数据点位于某直线直线附近附近.2.2.对回归直线与回归方
9、程的理解对回归直线与回归方程的理解(1)(1)回归方程回归方程被样本数据唯一确定,各样本点大致分布在回归直被样本数据唯一确定,各样本点大致分布在回归直 线附近线附近.对同一个总体对同一个总体,不同的样本数据对应不同的回归直线不同的样本数据对应不同的回归直线,所以回归直线也具有所以回归直线也具有随机性随机性(2)(2)对于任意一组样本数据,利用最小二乘法公式都可以求得对于任意一组样本数据,利用最小二乘法公式都可以求得 “回归方程回归方程”,如果这组数据不具有线性相关关系,即不存在如果这组数据不具有线性相关关系,即不存在 回归直线,那么所得的回归直线,那么所得的“回归方程回归方程”是没有实际意义的
10、是没有实际意义的 因此因此,对一组样本数据对一组样本数据,应先作应先作散点图散点图,在具有线性相关关系,在具有线性相关关系 的前提下再求回归方程的前提下再求回归方程例例1(1)1(1)下列关系中,属于相关关系的是下列关系中,属于相关关系的是_人的身高与视力的关系;人的身高与视力的关系;做自由落体运动的物体的质量与落地时间的关系;做自由落体运动的物体的质量与落地时间的关系;降雪量与交通事故的发生率之间的关系降雪量与交通事故的发生率之间的关系相关关系的判断相关关系的判断题号题号判断判断原因分析原因分析不是相关关系不是相关关系身高与视力无关,不具有函身高与视力无关,不具有函数关系,也不具有相关关系数
11、关系,也不具有相关关系不是函数关系,不是函数关系,也不是相关关系也不是相关关系自由落体的物体的质量与落地自由落体的物体的质量与落地时间无关,不具有相关关系时间无关,不具有相关关系相关关系相关关系降雪量越大,交通事故发生降雪量越大,交通事故发生率越高,不确定性的关系率越高,不确定性的关系(2)(2)下表是某地的年降雨量与年平均气温,判断两者是相关关系下表是某地的年降雨量与年平均气温,判断两者是相关关系吗?求回归直线方程有意义吗?吗?求回归直线方程有意义吗?年平均年平均气温气温()12.5112.51 12.7412.74 12.7412.74 13.6913.69 13.3313.33 12.8
12、412.84 13.0513.05年降雨量年降雨量(mm)(mm)748748542542507507813813574574701701432432解:以解:以x x轴为年平均气温,轴为年平均气温,y y轴为轴为年降雨量,可得相应的散点图,年降雨量,可得相应的散点图,如图所示:如图所示:因为图中各点并不在一条直线附近,所以两者不具有相关关系,因为图中各点并不在一条直线附近,所以两者不具有相关关系,求回归直线方程也是没有意义的求回归直线方程也是没有意义的方法归纳方法归纳(1)(1)两个变量两个变量x x和和y y相关关系的确定方法:相关关系的确定方法:(2)(2)判断两个变量判断两个变量x x
13、和和y y之间是否具有线性相关关系之间是否具有线性相关关系,常用的简便常用的简便 方法就是方法就是绘制散点图绘制散点图,如果发现点的分布从整体上看大致在,如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,一条直线附近,那么这两个变量就是线性相关的,注意不要注意不要 受个别点的位置的影响受个别点的位置的影响经验法:经验法:表格、关系式法:表格、关系式法:散点图法:散点图法:通过散点图通过散点图,观察它们的分布是否存在一定规律观察它们的分布是否存在一定规律,直观地判断;直观地判断;结合表格或关系式进行判断;结合表格或关系式进行判断;借助积累的经验进行分析判断借助积累的经
14、验进行分析判断1.(1)1.(1)对变量对变量x,yx,y有观测数据有观测数据(x(xi i,y,yi i)(i)(i1,2,10),1,2,10),得散点图得散点图(1);(1);对变量对变量u,vu,v有观测数据有观测数据(u(ui i,v,vi i)(i)(i1,2,10),1,2,10),得散点图得散点图(2)(2)由这两个散点图可以判断由这两个散点图可以判断()A.A.变量变量x x与与y y正相关正相关,u,u与与v v正相关正相关 B.B.变量变量x x与与y y正相关正相关,u,u与与v v负相关负相关C.C.变量变量x x与与y y负相关负相关,u,u与与v v正相关正相关
15、D.D.变量变量x x与与y y负相关负相关,u,u与与v v负相关负相关解析:图解析:图(1)(1)中的数据中的数据y y随着随着x x的增大而减小的增大而减小,因此变量因此变量x x与变量与变量y y负负相关;图相关;图(2)(2)中的数据中的数据v v随着随着u u的增大而增大的增大而增大,因此因此u u与与v v正相关正相关C C(2)(2)下面是随机抽取的下面是随机抽取的9 9名名1515岁男生的身高、体重表:岁男生的身高、体重表:1 12 23 34 45 56 67 78 89 916516515715715515517517516816815715717817816016016
16、3163525244444545555554544747626250505353解:法一:解:法一:根据根据经验经验可知可知,人的身高和体重之间存在相关关系人的身高和体重之间存在相关关系.法二:法二:观察观察表格数据表格数据可知可知,人的体重随着身高的增加而增加人的体重随着身高的增加而增加,因此人的身高和体重之间存在相关关系因此人的身高和体重之间存在相关关系法三:法三:以以x x轴表示身高,以轴表示身高,以y y轴表轴表 示体重,得到相应的示体重,得到相应的散点图散点图判断所给的两个变量是否存在相关关系判断所给的两个变量是否存在相关关系如图所示:如图所示:我们会发现我们会发现,随着身高的增高随
17、着身高的增高,体重基体重基本上呈增加趋势所以体重与身高本上呈增加趋势所以体重与身高之间存在相关关系之间存在相关关系,并且是正相关并且是正相关(1)(1)请画出上表数据的散点图;请画出上表数据的散点图;(2)(2)请根据上表提供的数据,用最小二乘法求出请根据上表提供的数据,用最小二乘法求出y y关于关于x x的线性的线性 回归方程回归方程 ;例例2 2 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录下表提供了某厂节能降耗技术改造后生产甲产品过程中记录 的产量的产量x(x(吨吨)与相应的生产能耗与相应的生产能耗y(y(吨标准煤吨标准煤)的几组对照数据:的几组对照数据:线性回归方程的建立线性回
18、归方程的建立x x3 34 45 56 6y y2.52.53 34 44.54.5(3)(3)已知该厂技改前已知该厂技改前100100吨甲产品的生产能耗为吨甲产品的生产能耗为9090吨标准煤试吨标准煤试 根据根据(2)(2)求出的线性回归方程,预测生产求出的线性回归方程,预测生产100100吨甲产品的生产吨甲产品的生产 能耗比技改前降低了多少吨标准煤?能耗比技改前降低了多少吨标准煤?(参考数值:参考数值:3 32.52.54 43 35 54 46 64.54.566.5)66.5)3 32.52.54 43 35 54 4 6 64.54.5解解(1)(1)散点图如图:散点图如图:0.70
19、.73.53.50.70.74.54.50.350.35 所求的线性回归方程为所求的线性回归方程为:4.54.53.53.566.566.586863 32 24 42 25 52 26 62 2(3)(3)当当x x100100时,时,由此可预测生产由此可预测生产100100吨甲产品的生产能耗比技改前大约降低吨甲产品的生产能耗比技改前大约降低了了19.6519.65吨标准煤吨标准煤909070.3570.3519.65(19.65(吨标准煤吨标准煤)y y0.70.71001000.350.3570.35(70.35(吨标准煤吨标准煤),x x3 34 45 56 6y y2.52.53 3
20、4 44.54.5(3)(3)已知该厂技改前已知该厂技改前100100吨甲产品的生产能耗为吨甲产品的生产能耗为9090吨标准煤试吨标准煤试 根据根据(2)(2)求出的线性回归方程,预测生产求出的线性回归方程,预测生产100100吨甲产品的生产吨甲产品的生产 能耗比技改前降低了多少吨标准煤?能耗比技改前降低了多少吨标准煤?(参考数值:参考数值:3 32.52.54 43 35 54 46 64.54.566.5)66.5)变式变式如果把本题中的如果把本题中的y y的值的值2.52.5及及4.54.5分别改为分别改为2 2和和5 5,如何求,如何求 回归直线方程?回归直线方程?直线方程为直线方程为
21、y y2 2x x3 3,可验证这四点共线,可验证这四点共线,解:散点坐标分别为解:散点坐标分别为(3,2)(3,2),(4,3)(4,3),(5,4)(5,4),(6,5)(6,5)x x3 34 45 56 6y y2.52.53 34 44.54.5方法归纳方法归纳 求线性回归方程的步骤:求线性回归方程的步骤:(6)(6)写出回归方程写出回归方程2.2.测量某地测量某地1010对父子身高对父子身高(单位:英寸单位:英寸)如下:如下:父亲身父亲身高高(x)60626465666768707274儿子身儿子身高高(y)63.6 65.2 66 65.5 66.9 67.1 67.4 68.3
22、 70.1 70如果如果x x与与y y之间具有线性相关关系,求回归直线方程;如果父之间具有线性相关关系,求回归直线方程;如果父亲的身高为亲的身高为7878英寸,试估计儿子的身高英寸,试估计儿子的身高解:先将两个变量的数字在表中计算出来,如下表所示:解:先将两个变量的数字在表中计算出来,如下表所示:序号序号x xi iy yi ix xi i2 2x xi iy yi i1 1606063.663.63 6003 6003 8163 8162 2626265.265.23 8443 8444 042.44 042.43 3646466664 0964 0964 2244 2244 465656
23、5.565.54 2254 2254 257.54 257.55 5666666.966.94 3564 3564 415.44 415.46 6676767.167.14 4894 4894 495.74 495.77 7686867.467.44 6244 6244 583.24 583.28 8707068.368.34 9004 9004 7814 7819 9727270.170.15 1845 1845 047.25 047.21010747470705 4765 4765 1805 180668668670.1670.144 79444 79444 842.444 842.4由上
24、表可得由上表可得:所以当父亲的身高为所以当父亲的身高为7878英寸时英寸时,估计儿子的身高估计儿子的身高约为约为72.213 872.213 8英寸英寸.当当x x7878时,时,故所求回归直线方程为故所求回归直线方程为:0.464 60.464 60.464 60.464 6x x35.975.35.975.0.464 60.464 6787835.97535.97572.213 872.213 8,35.97535.975代入公式得代入公式得:67.0167.010.464 60.464 666.866.81.1.我们常说我们常说“吸烟有害健康吸烟有害健康”,吸烟与健康之间的关系是吸烟与健
25、康之间的关系是()A.A.正相关正相关 B.B.负相关负相关 C.C.无相关无相关 D.D.不确定不确定解析:烟吸得越多,则健康程度越差解析:烟吸得越多,则健康程度越差B B2 2线性回归直线是指线性回归直线是指()A A样本少数点在其上的直线样本少数点在其上的直线B B样本所有点在其上的直线样本所有点在其上的直线C C样本大部分点在其上的直线样本大部分点在其上的直线D D样本所有点到其距离的平方和最小的直线样本所有点到其距离的平方和最小的直线解析:由线性回归直线的求法可知线性回归直线是样本所有解析:由线性回归直线的求法可知线性回归直线是样本所有点到其距离的平方和最小的直线点到其距离的平方和最小的直线D D单位,单位,y y平均增加的单位数平均增加的单位数x x每增加一个每增加一个2.52.5得得:y y2.5.2.5.
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。