1、第一课时第一课时 2.3 2.3 变量间的相关关系变量间的相关关系2.3.1 2.3.1 变量之间的相关关系变量之间的相关关系2.3.2 2.3.2 两个变量的线性相关两个变量的线性相关小明小明,你数学成绩不太好你数学成绩不太好,物理怎么样物理怎么样?也不太好啊也不太好啊.学不好数学学不好数学,物理物理也是学不好的也是学不好的?.你认为老师的说法对吗你认为老师的说法对吗?事实上事实上,我们在考察数学成绩对物理成绩影响的同时我们在考察数学成绩对物理成绩影响的同时,还还必须考虑到其他的因素必须考虑到其他的因素:爱好爱好,努力程度努力程度 如果单纯从数学对物理的影响来考虑如果单纯从数学对物理的影响来
2、考虑,就是考虑这两者之就是考虑这两者之间的间的相关关系相关关系物理成绩物理成绩数学数学成绩成绩学习学习兴趣兴趣花费花费时间时间其他其他因素因素由学习经验可知:物理成绩确实与数学成绩有一定的由学习经验可知:物理成绩确实与数学成绩有一定的关系,除此之外,学习兴趣、学习时间、教学水平等,关系,除此之外,学习兴趣、学习时间、教学水平等,也是影响物理成绩的一些因素,但这两个变量是有一也是影响物理成绩的一些因素,但这两个变量是有一定关系的,它们之间是一种不确定性的关系定关系的,它们之间是一种不确定性的关系. .类似于类似于这样的两个变量之间的关系,我们称之为这样的两个变量之间的关系,我们称之为相关关系相关
3、关系。有必要从理论上作些探讨,如果能通过数学成绩对物有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义理成绩进行合理估计,将有着非常重要的现实意义. .不是不是问题提出问题提出1 1. .函数是研究两个变量之间的依存关系的一函数是研究两个变量之间的依存关系的一种数量形式种数量形式. .对于两个变量,如果当一个变对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函确定,则这两个变量之间的关系就是一个函数关系数关系. .函数关系:两个变量之间是一种确定的关系函数关系:两个
4、变量之间是一种确定的关系知识探究(一):知识探究(一):变量之间的相关关系变量之间的相关关系思考思考1 1:考察下列问题中两个变量之间的关系:考察下列问题中两个变量之间的关系:(1 1)商品销售收入与广告支出经费;)商品销售收入与广告支出经费;(2 2)粮食产量与施肥量;)粮食产量与施肥量;(3 3)人体内的脂肪含量与年龄)人体内的脂肪含量与年龄. . 这些问题中两个变量之间的关系是函数关这些问题中两个变量之间的关系是函数关系吗?系吗? 均不是!均不是!上述两个变量之间的关系是一种非确定上述两个变量之间的关系是一种非确定性关系,称之为性关系,称之为相关关系相关关系,那么相关关,那么相关关系的含
5、义如何?系的含义如何? 自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关随机性的两个变量之间的关系,叫做相关关系系. .一、相关关系的概念一、相关关系的概念2 2、相关关系与函数关系的异同点、相关关系与函数关系的异同点不同点不同点:函数关系是一种确定的关系;而相关关系:函数关系是一种确定的关系;而相关关系是一种非确定关系。是一种非确定关系。相同点相同点:均是指两个变量的关系:均是指两个变量的关系相关关系相关关系当自变量取值一定当自变量取值一定, ,因变量的取值带有一定的因变量的取值带有一定的随机性(随机性( 非确定性关系非确定性
6、关系) )函数关系函数关系-函数关系指的是自变量和因变量之间的关系函数关系指的是自变量和因变量之间的关系是相互唯一确定的是相互唯一确定的. .1 1、对相关关系的理解、对相关关系的理解1 1、探究下面变量间的关系、探究下面变量间的关系: :1.球的体积与该球的半径; 2.粮食的产量与施肥量;3.匀速行驶车辆的行驶距离与时间;2 2、下列两变量中具有相关关系的是(、下列两变量中具有相关关系的是( )A A、角度和它的余弦值、角度和它的余弦值 B B、正方形的边长和面、正方形的边长和面积积C C、成人的身高和视力、成人的身高和视力 D D 、身高和体重、身高和体重D练习:练习: 在现实生活中存在着
7、大量的相关关系,如在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常何判断和描述相关关系,统计学发挥着非常重要的作用,变量之间的相关关系带有不确重要的作用,变量之间的相关关系带有不确定性,这需要通过大量的数据,对数据进行定性,这需要通过大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断。统计分析,发现规律,才能作出科学的判断。 对具有相关关系的两个变量进行统计分对具有相关关系的两个变量进行统计分析的方法叫析的方法叫回归分析回归分析 相关关系是进行回归分析的基础,同时,相关关系是进行回归分析的基础,同时,也是散点图的基础。也是散点图的基础。知识探究(二):散点图
8、知识探究(二):散点图 【问题问题】在一次对人体脂肪含量和年龄在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样关系的研究中,研究人员获得了一组样本数据:本数据: 其中各年龄对应的脂肪数据是这个年龄其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数人群脂肪含量的样本平均数. .年龄年龄 2323272739394141454549495050脂肪脂肪 9.59.517.817.8 21.221.2 25.925.9 27.527.5 26.326.3 28.228.2年龄年龄 5353545456565757585860606161脂肪脂肪 29.629.6 30.230.2
9、 31.431.4 30.830.8 33.533.5 35.235.2 34.634.6思考思考1 1:对某一个人来说,他的体内脂肪含量不一定随年对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性就可能表现出一定的规律性. .观察上表中的数据,大体上观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?看,随着年龄的增加,人体脂肪含量怎样变化?年龄年龄 2323272739394141454549495050脂肪脂肪 9.59.517.817.8 21.221.2 25
10、.925.9 27.527.5 26.326.3 28.228.2年龄年龄 5353545456565757585860606161脂肪脂肪 29.629.6 30.230.2 31.431.4 30.830.8 33.533.5 35.235.2 34.634.6思考思考2 2:为了确定年龄和人体脂肪含量之间的更明确的关为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象之间的关系有一个直观的印象. .以以x x轴表示年龄,轴表示年龄,y y轴表示轴表示脂肪含量,脂肪含量,你能
11、在直角坐标系中描出样本数据对应的图形你能在直角坐标系中描出样本数据对应的图形吗?吗? 思考思考3 3:上图叫做上图叫做散点图散点图,你能描述一下散点图,你能描述一下散点图的含义吗?的含义吗? 在平面直角坐标系中,表示具有相关关系的两个在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为变量的一组数据图形,称为散点图散点图. . 散点图散点图:用来判断两个变量是否具有相关关系用来判断两个变量是否具有相关关系. .思考思考4 4:观察散点图的大致趋势,人的年龄与人观察散点图的大致趋势,人的年龄与人体脂肪含量具有什么相关关系?体脂肪含量具有什么相关关系? 在上面的散点图中,这些点散布在
12、从左下角到右在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我上角的区域,对于两个变量的这种相关关系,我们将它称为们将它称为正相关正相关. .一般地,如果两个变量成正相一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?关,那么这两个变量的变化趋势如何? 思考思考6 6:如果两个变量成负相关,从整如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其体上看这两个变量的变化趋势如何?其散点图有什么特点?散点图有什么特点? 思考思考7 7:你能列举一些生活中的变量成正相你能列举一些生活中的变量成正相关或负相关的实例吗关或负相关的实例吗? ? 正相关的
13、特点:正相关的特点:一个变量随另一个变量的变大而一个变量随另一个变量的变大而变大,散点图中的点散布在从左下角到右上角的变大,散点图中的点散布在从左下角到右上角的区域区域负相关的特点:负相关的特点:一个变量随另一个变量的变大而一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的变小,散点图中的点散布在从左上角到右下角的区域区域例例2 2 以下是某地搜集到的新房屋的销以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:售价格和房屋的面积的数据:房屋面积房屋面积(平方米)(平方米) 616170701151151101108080135135105105销售价格销售价格(万元)(
14、万元) 12.212.215.315.324.824.821.621.618.418.429.229.22222画出数据对应的散点图,并指出销售画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关价格与房屋面积这两个变量是正相关还是负相关还是负相关. . 售价随房屋面积的变大而增加,散点图中的点散售价随房屋面积的变大而增加,散点图中的点散布在从左下角到右上角的区域布在从左下角到右上角的区域. .1 1对于两个变量之间的关系,有函数关系对于两个变量之间的关系,有函数关系和相关关系两种,其中函数关系是一种确和相关关系两种,其中函数关系是一种确定性关系,相关关系是一种非确定性关系定性关系
15、,相关关系是一种非确定性关系. .3.3.一般情况下两个变量之间的相关关系一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调成正相关或负相关,类似于函数的单调性性. .2 2散点图能直观反映两个相关变量之散点图能直观反映两个相关变量之间的大致变化趋势,利用计算机作散点间的大致变化趋势,利用计算机作散点图是简单可行的办法图是简单可行的办法. . 课堂小结课堂小结一、选择题(每题一、选择题(每题5 5分,共分,共1515分)分)1.1.下列关系中为相关关系的有下列关系中为相关关系的有( )( )学生的学习态度和学习成绩之间的关系;学生的学习态度和学习成绩之间的关系;教师的执教水平与
16、学生的学习成绩之间的关系;教师的执教水平与学生的学习成绩之间的关系;学生的身高与学生的学习成绩之间的关系学生的身高与学生的学习成绩之间的关系; ;某个人的年龄与本人的知识水平之间的关系某个人的年龄与本人的知识水平之间的关系. .(A)(A)(B)(B)(C)(C)(D)(D)【解析解析】选选A.A.据相关性的定义可知为相关关系,无相据相关性的定义可知为相关关系,无相关关系关关系. .巩固练习巩固练习3.3.在下列各变量之间的关系中在下列各变量之间的关系中: :汽车的重量和百公里耗油量汽车的重量和百公里耗油量. .正正n n边形的边数与内角度数之边形的边数与内角度数之和和. .一块农田的小麦产量
17、与施肥量一块农田的小麦产量与施肥量. .家庭的经济条件与学生家庭的经济条件与学生的学习成绩的学习成绩. .是相关关系的有是相关关系的有( )( )(A)(A)(B)(B)(C)(C)(D)(D)二、填空题(每题二、填空题(每题5 5分,共分,共1010分)分)4.4.(20102010广东高考)某市居民广东高考)某市居民2005200520092009年家庭平均收入年家庭平均收入x x(单位:万元)与年平均支出(单位:万元)与年平均支出y y(单位:万元)的统计资料(单位:万元)的统计资料如表所示:如表所示:根据统计资料,居民家庭年平均收入的中位数是根据统计资料,居民家庭年平均收入的中位数是
18、_,家,家庭年平均收入与年平均支出有庭年平均收入与年平均支出有 _的线性相关关系的线性相关关系. .(填(填“正相关正相关”、“负相关负相关”)【解析解析】收入数据按大小排列为:收入数据按大小排列为:11.511.5、12.112.1、1313、13.513.5、15,15,所以中位数为所以中位数为13.13.答案:答案:13 13 正相关正相关三、解答题(三、解答题(6 6题题1212分,分,7 7题题1313分,共分,共2525分)分)6.6.某品牌服装的广告费支出某品牌服装的广告费支出x x(单位:万元)与销售额(单位:万元)与销售额y y(单位:(单位:万元)之间有如下的对应数据:万元
19、)之间有如下的对应数据:试画出散点图,并判断广告费试画出散点图,并判断广告费x x与销售额与销售额y y是否具有线性相关关是否具有线性相关关系系. .【解析解析】根据题中数据画出散点图如下:根据题中数据画出散点图如下:观察散点图,可以发现观察散点图,可以发现5 5个样本点从整体上看大致在一条直线个样本点从整体上看大致在一条直线附近,所以变量附近,所以变量x x、y y之间具有线性相关关系之间具有线性相关关系. .三、回归分析三、回归分析 对具有对具有相关关系相关关系的两个变量进行统计分析的的两个变量进行统计分析的方法叫回归分析方法叫回归分析 (1 1)回归分析本质:)回归分析本质:寻找相关关系
20、中非确定寻找相关关系中非确定性关系的性关系的某种确定性。某种确定性。 (2)回归分析的意义:)回归分析的意义:相关关系到处存在,从某相关关系到处存在,从某种意义上讲,函数关系是一种理想的关系模型,种意义上讲,函数关系是一种理想的关系模型,而相关关系则是一种非常普遍关系。研究和学习而相关关系则是一种非常普遍关系。研究和学习相关关系,不仅可以使我们能够处理更为广泛的相关关系,不仅可以使我们能够处理更为广泛的数学问题,还可以使我们对函数关系的认识再上数学问题,还可以使我们对函数关系的认识再上升到一个新的高度。升到一个新的高度。四:回归直线方程四:回归直线方程1、回归直线、回归直线(1)回归直线的)回
21、归直线的定义定义:如果散点图中点的分布从整体上看大致在一条直线附近,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线我们就称这两个变量之间具有线性相关关系,这条直线叫做叫做回归直线回归直线(2)回归直线的)回归直线的特征特征:如果能够求出这条回归直线的方程(简称回归方程),那如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解对应两个变量之间的相关性么我们就可以比较清楚地了解对应两个变量之间的相关性.就像平均数可以作为一个变量的数据的代表一样,就像平均数可以作为一个变量的数据的代表一样,这条直这条直线也可以作为两个变量之
22、间具有相关关系的代表线也可以作为两个变量之间具有相关关系的代表.2、回归直线方程、回归直线方程定义:定义:一般地,设一般地,设x与与y是具有相关关系的两个变量,是具有相关关系的两个变量,且相应于且相应于n组观测值的组观测值的n个点(个点(xi,yi)()(i1,2,n)大致分布在一条直线附近,求在整体上与这)大致分布在一条直线附近,求在整体上与这n个点个点最接近的一条直线最接近的一条直线.设此直线方程为设此直线方程为y=bx+a. (*)这里这里在在y的上方加记号的上方加记号“”,是为了区分实际值,是为了区分实际值y,表示当,表示当x取值取值xi(i1,2,n)时,)时,y相应的观察值为相应的
23、观察值为yi,而而直线上对应于直线上对应于xi的纵坐标是的纵坐标是yi=bxi+a. (*)式叫做式叫做y对对x的回归直线方程,的回归直线方程,a、b叫做回归系数叫做回归系数.注意:注意:求回归直线方程的求回归直线方程的关键关键是如何用数学的方法来刻画是如何用数学的方法来刻画“从整体上看各点与此直线的距离最小从整体上看各点与此直线的距离最小”,即最贴近已知即最贴近已知的数据点,最能代表变量的数据点,最能代表变量x与与y之间的关系之间的关系.3、最小二乘法、最小二乘法假设我们已经得到两个具有线性相关的变量的一组数假设我们已经得到两个具有线性相关的变量的一组数据(据(x1,y1),(),(x2,y
24、2),),(xn,yn).这样的方法叫做最小二乘法这样的方法叫做最小二乘法. 符号符号21)( niiiabxyQ问题归结为问题归结为:a,b取什么值时取什么值时Q最小最小,即总体和最小即总体和最小.下面是下面是计算回归方程的斜率和截距的一般公式计算回归方程的斜率和截距的一般公式.根据最小二乘法和上述公式可以求回归方程根据最小二乘法和上述公式可以求回归方程.4、最小二乘法的步骤:、最小二乘法的步骤:(1)收集样本数据,()收集样本数据,(xi,yi).(2)作散点图,确定)作散点图,确定x、y具有线性相关关系具有线性相关关系.iii(3)ybxaxxi1 2nybxai1 2n设回归直线方程
25、,令 ( , , )得到 ( ,)iii4yyybxai12n( )求偏差:- -( )( , , , )21(5).ab() ,ab.niiiQyy求偏差平方和 ( , )这是一个关于待定系数 、 的二次多项式6abab( )求 、 ,使Q( , )为最小值.例题例题:根据下表根据下表,求回归方程求回归方程.分析:分析:求线性回归直线方程的步骤:求线性回归直线方程的步骤:iiiixyx y第一步:列表,;nnn22iiiii1i1i1xyxyx y第二步:计算 , ,;ba第三步:代入公式计算 、 的值;.第四步:写出直线方程1、列表、列表2、代入公式计算、代入公式计算3、写出回归直线方程、写出回归直线方程解:求回归方程的一般方法:求回归方程的一般方法:1、列表、列表2、计算、计算,x, y,12 niixiniiyx 13、求、求 a , b4、代入回归直线方程、代入回归直线方程