1、12.4数据的相关性数据的相关性12.4.1相关性相关性12.4.2回归直线回归直线12.4.2回回归归直直线线课堂互动讲练课堂互动讲练知能优化训练知能优化训练课前自主学案课前自主学案学习目标学习目标1.理解两个变量的相关关系的概念;理解两个变量的相关关系的概念;2会作散点图,并利用散点图判断两个变会作散点图,并利用散点图判断两个变量之间是否具有相关关系;量之间是否具有相关关系;3会求回归直线方程会求回归直线方程课前自主学案课前自主学案1 用 样 本 估 计 总 体 主 要 有:用 样 本 的 用 样 本 估 计 总 体 主 要 有:用 样 本 的_估计总体的频率分布;用样本估计总体的频率分布
2、;用样本的的_估计总体的数字特征估计总体的数字特征2样本的数字特征主要有样本的数字特征主要有_、_、_、_及及_3在现实生活中两个变量之间的函数关系是一在现实生活中两个变量之间的函数关系是一种种_的关系的关系频率分布频率分布数字特征数字特征平均数平均数众数众数中位数中位数方差方差标准差标准差确定确定1相关关系相关关系与 函 数 关 系 不 同,相 关 关 系 是 一 种与 函 数 关 系 不 同,相 关 关 系 是 一 种_性关系性关系2两个变量的线性相关两个变量的线性相关(1)散点图:将样本中散点图:将样本中n个数据点个数据点(xi,yi)(i1,2,n)描在平面直角坐标系中得到的图描在平面
3、直角坐标系中得到的图形形(2)正相关与负相关正相关与负相关正相关:散点图中的点散布在从正相关:散点图中的点散布在从_到到_的区域的区域非确定非确定左下角左下角右上角右上角负相关:散点图中的点散布在从负相关:散点图中的点散布在从_到到_的区域的区域3回归直线的方程回归直线的方程(1)回归直线:如果散点图中点的分布从整体回归直线:如果散点图中点的分布从整体上看大致在上看大致在_附近,就称这两附近,就称这两个变量之间具有个变量之间具有_关系,这关系,这条直线叫做回归直线条直线叫做回归直线(2)回归方程:回归方程:_对应的方程叫对应的方程叫回归直线的方程,简称回归方程回归直线的方程,简称回归方程(3)
4、回归直线方程回归直线方程ybxa,其中,其中左上角左上角右下角右下角一条直线一条直线线性相关线性相关回归直线回归直线b是回归方程的斜率,是回归方程的斜率,a是截距是截距4最小二乘估计最小二乘估计我们可以求我们可以求Q(a,b)_的最小值,如果常数的最小值,如果常数a,b使使Q(a,b)达到最达到最小,就称直线小,就称直线l:ybxa为为xi与与yi的回的回归直线,回归直线中的归直线,回归直线中的a、b分别是固有值分别是固有值a0、b0的最小二乘估计的最小二乘估计1相关关系与函数关系有什么不同?相关关系与函数关系有什么不同?提示:提示:函数关系是一种确定的关系,相关关函数关系是一种确定的关系,相
5、关关系是一种非确定的关系函数关系是一种因系是一种非确定的关系函数关系是一种因果关系,而相关关系不一定是因果关系,也果关系,而相关关系不一定是因果关系,也可能是伴随关系可能是伴随关系2回归直线通过样本点的中心,对照平均回归直线通过样本点的中心,对照平均数与样本数据之间的关系,你能说说回归直数与样本数据之间的关系,你能说说回归直线与散点图中各点之间的关系吗?线与散点图中各点之间的关系吗?3“回归直线回归直线”方程能否按解析几何中求直方程能否按解析几何中求直线方程的方法来求?线方程的方法来求?提示:提示:不能求回归直线方程的方法是用最小不能求回归直线方程的方法是用最小二乘估计因为所有数据点都分布在一
6、条直线二乘估计因为所有数据点都分布在一条直线附近时,这样的直线可画出许多条,而附近时,这样的直线可画出许多条,而“回归回归直线直线”是这些直线中是这些直线中“最贴近最贴近”已知数据的,已知数据的,但并不一定过数据中的某个点,故一般不按解但并不一定过数据中的某个点,故一般不按解析几何中求直线方程的方法来求析几何中求直线方程的方法来求课堂互动讲练课堂互动讲练相关关系的判断相关关系的判断在现实生活中存在着大量的相关关系,如何判在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的断和描述相关关系,统计学发挥着非常重要的作用由于变量间的相关关系带有不确定性,作用由于变量间的相
7、关关系带有不确定性,这就需要通过收集大量的数据,对数据进行统这就需要通过收集大量的数据,对数据进行统计分析,发现规律,从而作出科学的判断计分析,发现规律,从而作出科学的判断 以下是在某地搜集到的不同楼盘新房以下是在某地搜集到的不同楼盘新房屋的销售价格屋的销售价格y(单位:万元单位:万元)和房屋面积和房屋面积x(单单位:位:m2)的数据:的数据:房屋面积房屋面积x(m2)115 11080135 105销售价格销售价格y(万万元元)24.821.619.429.222(1)画出数据对应的散点图;画出数据对应的散点图;(2)判断新房屋的销售价格和房屋面积之间是判断新房屋的销售价格和房屋面积之间是否
8、具有相关关系?如果有相关关系,是正相否具有相关关系?如果有相关关系,是正相关还是负相关?关还是负相关?【思路点拨】【思路点拨】先建立直角坐标系,画出散先建立直角坐标系,画出散点图,再判断相关关系点图,再判断相关关系【解】【解】(1)数据对应的散点图如图所示数据对应的散点图如图所示(2)通过以上数据对应的散点图可以判断,新通过以上数据对应的散点图可以判断,新房屋的销售价格和房屋的面积之间具有相关房屋的销售价格和房屋的面积之间具有相关关系,且是正相关关系,且是正相关【名师点评】【名师点评】两个随机变量两个随机变量x和和y相关关系相关关系的确定方法:的确定方法:(1)散点图法:通过散点图,观察它们的
9、分布散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;是否存在一定规律,直观地判断;(2)表格、关系式法:结合表格或关系式进行表格、关系式法:结合表格或关系式进行判断;判断;(3)经验法:借助积累的经验进行分析判断经验法:借助积累的经验进行分析判断变式训练变式训练1某地农业技术指导站的技术员,某地农业技术指导站的技术员,经过在经过在7块并排大小相同的试验田上进行施块并排大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表化肥量对水稻产量影响的试验,得到如下表所示的一组数据:所示的一组数据:(单位:千克单位:千克)施化肥施化肥量量x15202530354045水稻产水稻
10、产量量y330 345 365 405 445 450 455施化肥量施化肥量x和水稻产量和水稻产量y是否具有相关关系?是否具有相关关系?解:解:作出散点图进行分析散点图如下:作出散点图进行分析散点图如下:从散点图可以看出施化肥量从散点图可以看出施化肥量x和水稻产量和水稻产量y的的确存在一定相关关系,大体上随着施化肥量确存在一定相关关系,大体上随着施化肥量的增加,水稻的产量也在增加的增加,水稻的产量也在增加求回归直线方程求回归直线方程据最小二乘估计思想的公式,用待定系数法求据最小二乘估计思想的公式,用待定系数法求出出a,b,从而确定回归直线方程,从而确定回归直线方程 5个学生的数学和物理成绩个
11、学生的数学和物理成绩(单位:分单位:分)如下表:如下表:学生学生学科学科ABCDE数学数学8075706560物理物理7066686462画出散点图,判断它们是否具有相关关画出散点图,判断它们是否具有相关关系,若相关,求出回归方程系,若相关,求出回归方程【解解】以以x轴表示数学成绩,轴表示数学成绩,y轴表示物理轴表示物理成绩,可得到相应的散点图如图所示成绩,可得到相应的散点图如图所示由散点图可知,两者之间具有相关关系,且由散点图可知,两者之间具有相关关系,且为线性相关为线性相关列表,计算列表,计算i12345xi8075706560yi7066686462x i y i560049504760
12、4160372064005625490042253600变式训练变式训练2随着我国经济的快速发展,随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查该市统计部门随机调查10个家庭,得数据个家庭,得数据如下表:如下表:家庭编号家庭编号12345678910 xi(收入收入)/千千元元0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8yi(支出支出)/千千元元0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0
13、2.5(1)判断家庭平均收入与月平均生活支出是否判断家庭平均收入与月平均生活支出是否相关;相关;(2)若二者线性相关,求回归直线方程若二者线性相关,求回归直线方程解:解:(1)作出散点图:作出散点图:观察发现各个数据对应的点都在一条直线附观察发现各个数据对应的点都在一条直线附近,所以二者有线性相关关系近,所以二者有线性相关关系利用回归直线,我们可以进行预测若回归直利用回归直线,我们可以进行预测若回归直线方程为线方程为ybxa,则,则xx0处的估计值为:处的估计值为:ybx0a.某某5名学生总成绩和数学成绩名学生总成绩和数学成绩(单位:分单位:分)如下表所示:如下表所示:利用回归方程对总体进行估
14、计利用回归方程对总体进行估计学生学生ABCDE总成绩总成绩(x)482 383 421 364 362数学成绩数学成绩(y)7865716461(1)作出散点图;作出散点图;(2)求数学成绩求数学成绩y对总成绩对总成绩x的回归方程;的回归方程;(3)如果一个学生的总成绩为如果一个学生的总成绩为450分,试预测分,试预测这个学生的数学成绩这个学生的数学成绩【思路点拨】【思路点拨】进行线性回归分析的关键是进行线性回归分析的关键是求出线性回归直线方程由于求回归系数求出线性回归直线方程由于求回归系数a、b的运算量很大,故可用列表法并借助计算的运算量很大,故可用列表法并借助计算器求解器求解【解】【解】(
15、1)散点图如图所示:散点图如图所示:(2)列表:列表:i12345xi482 383 421 364 362yi7865716461x i y i3759624895298912329622082【名师点评】【名师点评】(1)回归分析是寻找相关关系回归分析是寻找相关关系中非确定性关系的某种确定性;中非确定性关系的某种确定性;(2)求回归直线方程,关键在于正确地求出系求回归直线方程,关键在于正确地求出系数数a,b,由于,由于a,b的计算量大,计算时要仔的计算量大,计算时要仔细,避免计算失误细,避免计算失误变式训练变式训练3一台机器由于使用时间较长,一台机器由于使用时间较长,生产的零件有一些会缺损
16、,按不同转速生产生产的零件有一些会缺损,按不同转速生产出来的零件有缺损的统计数据如下表:出来的零件有缺损的统计数据如下表:转速转速x(转转/秒秒)16 14 12 8每小时生产缺损每小时生产缺损零件数零件数y(件件)11 985(1)作出散点图;作出散点图;(2)如果如果y与与x线性相关,求出回归直线方程;线性相关,求出回归直线方程;(3)若实际生产中,允许每小时的产品中有缺损若实际生产中,允许每小时的产品中有缺损的零件最多为的零件最多为10个,那么,机器的运转速度应个,那么,机器的运转速度应控制在什么范围?控制在什么范围?解:解:(1)根据表中的数据画出散点图如图:根据表中的数据画出散点图如
17、图:(2)设回归直线方程为:设回归直线方程为:ybxa,并列表如,并列表如下:下:i1234xi1614128yi11985xiyi17612696401在研究两个变量是否存在某种关系时,必须在研究两个变量是否存在某种关系时,必须从散点图入手,对于散点图,可以做出如下判从散点图入手,对于散点图,可以做出如下判断:断:(1)如果所有的样本点都落在某一函数曲线如果所有的样本点都落在某一函数曲线上,那么就用该函数来描述变量之间的关系,上,那么就用该函数来描述变量之间的关系,即变量之间具有函数关系;即变量之间具有函数关系;(2)如果所有的样本如果所有的样本点都落在某一函数曲线附近,那么变量之间具点都落
18、在某一函数曲线附近,那么变量之间具有相关关系;有相关关系;(3)如果所有的样本点都落在某一如果所有的样本点都落在某一直线附近,那么变量之间具有线性相关关系直线附近,那么变量之间具有线性相关关系2知道知道x与与y呈线性相关关系,无需进行相呈线性相关关系,无需进行相关性检验,否则,应首先进行相关性检验,关性检验,否则,应首先进行相关性检验,如果本身两个变量不具备相关关系,或者说,如果本身两个变量不具备相关关系,或者说,它们之间相关关系不显著,即使求出回归直它们之间相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预线方程也是毫无意义的,而且用其估计和预测的量也是不可信的测的量也是不可信的.3利用回归方程估计总体,只是反映了利用回归方程估计总体,只是反映了x与与y的一种近似的相关关系,即的一种近似的相关关系,即y值并不一定是值并不一定是真实值真实值