1、12.3变量间的相关关系变量间的相关关系 对于两个变量,如果一个变量取值一定时,另一个对于两个变量,如果一个变量取值一定时,另一个变量的取值被唯一确定,则这两个变量时函数关系。变量的取值被唯一确定,则这两个变量时函数关系。函数关系是一种确定性的关系,例如匀速直线运动函数关系是一种确定性的关系,例如匀速直线运动中时间与路程的关系是完全确定的,一个中时间与路程的关系是完全确定的,一个t对应一个对应一个s。我们今天要学习一个新的关系:我们今天要学习一个新的关系:相关关系相关关系2 思考?有人说:思考?有人说:“如果你的数学成绩好,那么你的如果你的数学成绩好,那么你的物理学习就不会有什么大问题。物理学
2、习就不会有什么大问题。”我们把数学成绩我们把数学成绩和物理成绩看成是两个变量,那么这两个变量时函和物理成绩看成是两个变量,那么这两个变量时函数关系吗?数关系吗?不是不是 学生的物理成绩与数学成绩之间存在一种相关关系。学生的物理成绩与数学成绩之间存在一种相关关系。3物理成绩与数学成绩确定是相关的,但两者之间不是确定的函物理成绩与数学成绩确定是相关的,但两者之间不是确定的函数关系,两者之间的对应不严格,有一定的随机性,它们是数关系,两者之间的对应不严格,有一定的随机性,它们是相关关系。当然水涨船高,属相关关系。当然水涨船高,属正相关关系正相关关系。物理成绩与数学成绩有一定关系,但还和是否喜欢物理,
3、和物理成绩与数学成绩有一定关系,但还和是否喜欢物理,和学生在物理学习上所用的时间等都有关系。学生在物理学习上所用的时间等都有关系。4我们还可以举出现实生活中存在许多相关关系的问题我们还可以举出现实生活中存在许多相关关系的问题1.商品销售收入与商品销售收入与广告支出经费广告支出经费之间的关系。之间的关系。商品销售收入与广告支出经费由密商品销售收入与广告支出经费由密切的联系,但商品销售收入还与切的联系,但商品销售收入还与商品质量商品质量、居民收入居民收入等因素有关。等因素有关。2.粮食产量与粮食产量与施肥量施肥量之间的关系。之间的关系。在一定范围内,施肥量越大,粮食产量就越高。在一定范围内,施肥量
4、越大,粮食产量就越高。但是粮食产量还要受到但是粮食产量还要受到土壤质量土壤质量、降雨量降雨量、田间管理水平田间管理水平等因素的影响。等因素的影响。3.人体内的脂肪含量与人体内的脂肪含量与年龄年龄之间的关系。在一定年龄段内,随年龄的增长,人体内之间的关系。在一定年龄段内,随年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯饮食习惯、体育锻炼体育锻炼等有关,可等有关,可能能 还与还与个人个人 的先天体质的先天体质有关。有关。5例例1.下面变量间的关系属于相关关系的是(下面变量间的关系属于相关关系的是()A.圆的周长和它的半径之间的关系圆的周长
5、和它的半径之间的关系B.价格不变的条件下,商品销售额与销售量之间的关系价格不变的条件下,商品销售额与销售量之间的关系C.家庭收入与消费支出之间的关系家庭收入与消费支出之间的关系D.正方形的面积和它的边长之间的关系正方形的面积和它的边长之间的关系C6 练习1.下列两个变量之间不具有相关关系的是()A.小麦的产量与施肥量小麦的产量与施肥量 B.球的体积与表面积球的体积与表面积 C.蛋鸭产蛋个数与饲养天数蛋鸭产蛋个数与饲养天数 D.甘蔗的含糖量与生长期的日照天数甘蔗的含糖量与生长期的日照天数B练习练习2.下列两个变量中具有相关关系的是(下列两个变量中具有相关关系的是(C)A.正方形的体积与棱长正方形
6、的体积与棱长 B.匀速行驶的车辆的行驶距离与时间匀速行驶的车辆的行驶距离与时间C.人的身高和体重人的身高和体重D.人的身高与视力人的身高与视力函数关系函数关系函数关系函数关系相关关系相关关系无相关关系无相关关系785页练习1.有关法律规定,香烟盒上必须印上有关法律规定,香烟盒上必须印上“吸烟有害健康吸烟有害健康”的警示语,吸烟是否一定会的警示语,吸烟是否一定会引起健康问题?你认为引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟健康问题不一定是由吸烟引起的,所以可以吸烟”的说的说法对吗?法对吗?吸烟只是影响健康的一个因素,对健康的影响还有其他一些因素,两者之间非函数吸烟只是影响健
7、康的一个因素,对健康的影响还有其他一些因素,两者之间非函数关系即非因果关系,但两者是相关关系,而且属负相关,吸烟影响健康是事实,关系即非因果关系,但两者是相关关系,而且属负相关,吸烟影响健康是事实,故应禁烟。故应禁烟。2.某地区的环境条件适合天鹅栖息繁衍,有人统计发现,村庄附近栖息的天鹅多,某地区的环境条件适合天鹅栖息繁衍,有人统计发现,村庄附近栖息的天鹅多,这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低。于是,他认为这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低。于是,他认为天鹅能够带来孩子。你认为这样得到的结论可靠吗?如何证明这个结论的可天鹅能够带来孩子。你认为这样得到的结论可
8、靠吗?如何证明这个结论的可靠性?靠性?不可靠,从不可靠,从 表面看,似有因果关系,但函数关系式一种因果关系,而相关关系部一表面看,似有因果关系,但函数关系式一种因果关系,而相关关系部一定是因果关系,也可能是伴随关系,是环境条件改善的两种伴随关系。定是因果关系,也可能是伴随关系,是环境条件改善的两种伴随关系。82、两个变量的线性相关、两个变量的线性相关 (1 1)回归分析)回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析。通俗地讲,对具有相关关系的两个变量进行统计分析的方法叫回归分析。通俗地讲,回归分析是寻找相关关系中非确定关系的某种确定性。回归分析是寻找相关关系中非确定关系的某种
9、确定性。(2 2)散点图)散点图 A A、定义;、定义;B B、正相关、负相关。、正相关、负相关。3 3、回归直线方程、回归直线方程 注注:如果关于两个变量统计数据的散点图呈现发散状如果关于两个变量统计数据的散点图呈现发散状,则这两个变量之间不则这两个变量之间不具有相关关系具有相关关系.9探究探究:.年龄脂肪239.52717.83921.24125.9454927.526.35028.25329.65430.25631.45730.8年龄脂肪5833.56035.26134.6如上的一组数据,你能分析人体的脂肪含量与年龄如上的一组数据,你能分析人体的脂肪含量与年龄 之间有怎样的关系吗?之间有
10、怎样的关系吗?10 从上表发现,对某个人不一定有此规律,但对很多个体放在一起,就体现出从上表发现,对某个人不一定有此规律,但对很多个体放在一起,就体现出“人体人体脂肪随年龄增长而增加脂肪随年龄增长而增加”这一规律这一规律.而表中各年龄对应的脂肪数是这个年龄而表中各年龄对应的脂肪数是这个年龄 人群的样本平均数人群的样本平均数.我们也可以对它们作统计图、我们也可以对它们作统计图、表,对这两个变量有一个直观上的印象和判断表,对这两个变量有一个直观上的印象和判断.下面我们以年龄为横轴,下面我们以年龄为横轴,脂肪含量为纵轴建立直脂肪含量为纵轴建立直角坐标系,作出各个点,角坐标系,作出各个点,称该图为称该
11、图为散点图散点图。如图:O20253035404550556065年龄脂肪含量51015202530354011从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角从刚才的散点图发现:年龄越大,体内脂肪含量越高,点的位置散布在从左下角到右上角的区域。称它们成到右上角的区域。称它们成正相关正相关。但有的两个变量的相关,如下图所示:但有的两个变量的相关,如下图所示:如高原含氧量与海拔高度如高原含氧量与海拔高度的相关关系,海平面以上,的相关关系,海平面以上,海拔高度越高,含氧量越海拔高度越高,含氧量越少。少。作出散点图发现,它们散作出散点图发现,它们散布在从左上角到右下角的区布在从
12、左上角到右下角的区域内。又如汽车的载重和汽域内。又如汽车的载重和汽车每消耗车每消耗1升汽油所行使的升汽油所行使的平均路程,称它们成平均路程,称它们成负相关负相关.注:课本注:课本P86的思考的思考.O12思考思考(1)两个变量成负相关关系时,散点图有什么特点?)两个变量成负相关关系时,散点图有什么特点?负相关的两个变量的散点图中点分布的区域为左上角到右下负相关的两个变量的散点图中点分布的区域为左上角到右下角。角。(2)你能列举出一些生活中的变量成正相关或成负相关的)你能列举出一些生活中的变量成正相关或成负相关的例子吗?例子吗?正相关:学习时间与成绩正相关:学习时间与成绩负相关:日月用眼和视力负
13、相关:日月用眼和视力13我们再观察它的图像发现这些点大致分布在一条直线附我们再观察它的图像发现这些点大致分布在一条直线附 近近,像这样,如果散点图中点的分布从整体上看大致在像这样,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相一条直线附近,我们就称这两个变量之间具有线性相 关关系关关系,这条直线叫做这条直线叫做回归直线回归直线,该直线叫,该直线叫回归方程回归方程。那么,我们该怎样那么,我们该怎样来求出这个回归方来求出这个回归方程?程?请同学们展开讨论,请同学们展开讨论,能得出哪些具体的能得出哪些具体的方案?方案?20253035404550556065年龄脂
14、肪含量051015202530354014.方案方案1、先画出一条直线,测量出各点与它的距离,再移动、先画出一条直线,测量出各点与它的距离,再移动直线,到达一个使距离的直线,到达一个使距离的 和最小时,测出它的斜率和截距,得回归和最小时,测出它的斜率和截距,得回归 方程。方程。20253035404550556065年龄脂肪含量0510152025303540如图如图:15.方案方案2、在图中选两点作直线,使直线两侧、在图中选两点作直线,使直线两侧 的点的个数基本相同。的点的个数基本相同。20253035404550556065年龄脂肪含量051015202530354016方案方案3、如果多
15、取几对点,确定多条直线,再求出、如果多取几对点,确定多条直线,再求出 这些直线的斜率和截距的平均值作为回归这些直线的斜率和截距的平均值作为回归 直线的斜率和截距。而得回归方程。直线的斜率和截距。而得回归方程。如图如图 我们还可以找到我们还可以找到 更多的方法,但更多的方法,但 这些方法都可行这些方法都可行 吗吗?科学吗?科学吗?准确吗?怎样的准确吗?怎样的 方法是最好的?方法是最好的?20253035404550556065年龄脂肪含量0510152025303540我们把由一个变量的变化我们把由一个变量的变化去推测另一个变量的方法去推测另一个变量的方法称为称为回归方法。回归方法。17回归直线
16、回归直线 实际上实际上,求回归直线的关键是如何用数学的方法来刻画求回归直线的关键是如何用数学的方法来刻画“从整从整体上看体上看,各点到此直线的距离最小各点到此直线的距离最小”.18这样的方法叫做最小二乘法这样的方法叫做最小二乘法.19人们经过实践与研究,已经找到了人们经过实践与研究,已经找到了计算回归方程的斜率与截距的一般公式计算回归方程的斜率与截距的一般公式:xbyaxnxyxnxxxyyxxbniiniiiniiniiiy,)()(1221121以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫最小二乘法。(参看如书P80)20思考:把表思考
17、:把表2-3中的年龄作为中的年龄作为x代入回归方程,看看得出的数值与真实数值之间的代入回归方程,看看得出的数值与真实数值之间的关系,从中体会什么?关系,从中体会什么?把年龄把年龄x代入回归直线方程,可以看到估计值代入回归直线方程,可以看到估计值y与数据与数据Y的值的值是由差距的,这说明是由差距的,这说明1.体内脂肪含量与年龄是相关关系,体内脂肪含量与年龄是相关关系,而非函数关系;而非函数关系;2.回归直线能较好地逼近两变量的关系,回归直线能较好地逼近两变量的关系,直线在整体上的接近程度最好,但因相关关系的非确定性,直线在整体上的接近程度最好,但因相关关系的非确定性,有些点的差距还是较大的。有些
18、点的差距还是较大的。21 例例3 3、有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:响,经过统计,得到一个卖出的饮料杯数与当天气温的对比表:摄氏温度摄氏温度()-5-50 04 47 71212热饮杯数热饮杯数 1561561501501321321281281301301515191923232727313136361161161041048989939376765454(1 1)画出散点图;)画出散点图;(2 2)从散点图中发现气温与热饮杯数之间关系的一般规律;)从散点
19、图中发现气温与热饮杯数之间关系的一般规律;(3 3)求回归方程;)求回归方程;(4 4)如果某天的气温是)如果某天的气温是22,预测这天卖出的热饮杯数,预测这天卖出的热饮杯数.22当当x=2x=2时,时,y=143.063.y=143.063.23(2)各点散步从左上角到右下角的区域里,因此,气温与热饮销售杯数之间成负相关,即气温越高,卖出去的热饮杯数越少。思考:气温为2摄氏度时,小卖部一定能够卖出143杯左右热饮吗?为什么?不一定,因为回归方程整体上的接近程度最好,但只能是较好的逼近,相关变量有随机性。24一、相关关系的判断一、相关关系的判断例例1:5个学生的数学和物理成绩如下表:个学生的数
20、学和物理成绩如下表:ABCDE数学8075706560物理7066686462画出散点图,并判断它们是否有相关关系。画出散点图,并判断它们是否有相关关系。解:解:数学成绩数学成绩由散点图可见,两者之间具有正相关关系。由散点图可见,两者之间具有正相关关系。25二、求线性回归方程二、求线性回归方程例例2:观察两相关变量得如下表:观察两相关变量得如下表:x-1-2-3-4-553421y-9-7-5-3-115379求两变量间的回归方程求两变量间的回归方程解解1:列表:列表:i12345678910-1-2-3-4-553421-9-7-5-3-1153799141512551512149xiyix
21、iyi计算得计算得:0,0yx110,1101011012yxxiiiii1010110010110101010122101iiiiixxyxyxb000bxbya26所求回归直线方程为所求回归直线方程为 y=x小结:求线性回归直线方程的步骤:小结:求线性回归直线方程的步骤:第一步:列表第一步:列表 ;第二步:计算第二步:计算 ;第三步:代入公式计算第三步:代入公式计算b,a的值;的值;第四步:写出直线方程。第四步:写出直线方程。yxyxiiii,yxxiniiniiyx112,27总结总结基础知识框图表解基础知识框图表解变量间关系变量间关系函数关系函数关系相关关系相关关系 散点图散点图线形回归线形回归线形回归方程线形回归方程