1、【高中数学优质课件】相关关系相关关系第一课时例1:判断下列两个变量之间哪些是什么关系?正方形边长x与面积S之间的关系圆的半径r与圆的周长C之间的关系年龄x与人体的脂肪含量y之间的关系数学成绩x与物理成绩y之间的关系.性别x与数学成绩y之间的关系 两个变量间存在着某种关系,带有不确定性(随机性),不能用函数关系精确地表达出来,我们说这两个变量具有相关关系.两个变量间的关系:(一)有关系:(1)确定的关系:函数关系 (2)不确定的关系:相关关系(二)无关 问题2、在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据:年龄年龄232739414549脂肪脂肪9.517.821.225
2、.927.526.3年龄年龄535456575860脂肪脂肪29.630.231.430.833.535.2 根据上述数据,人体的脂肪含量与年龄之间有怎样的关系?如何判断有没有关系?散点图散点图种植西红柿,施肥量与产量之间的散点图 下面两个散点图中点的分布有什么不同?年龄与脂肪含量之间的散点图 观察左边散点图,发现这些点大致分布在一条直线附近。像这样,如果散点图中点的分布从整体上看大致在一条_附近,我们就称这两个变量之间具有线性相关关系,直线3).如果所有的样本点大致都在某一直线附近,变量之间就有线性相关关系.1).如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之
3、间具有函数关系2).如果所有的样本点落在某一函数曲线附近,变量之间就有相关关系。问题4 (1)两个散点图的有什么共同之处?(2)两个散点图的点的分布有什么不同?左面的散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关。右面的散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关关系,我们将它称为负相关。3).如果所有的样本点大致都在某一函数附近,变量之间就有相关关系.11,1,rr 其中 为正,则两个变量正相关r为负,则两个变量负相关0.75r 认为具有较强的相关关系。或者有些题目会给出标准。当两个变量之间的相关关系足够强的时候,我们才会拟合两个
4、变量之间的相关关系。判断相关关系强弱的指标:第一个:相关系数r,第二个:相关指数R2或者(实际是相关系数r的平方):r和 R2的相关公式有用到题目会提供22121()1()niiiniiyyRyy 12211niiinniiiixxyyrxxyy 11,1,rr 其中 为正,则两个变量正相关r为负,则两个变量负相关当我们确定两个变量具有较强的线性相关关系的时候,如何找到表示出这两个变量之间的相关关系的直线方程?让我们能够利用所找到的直线方程对其他自变量的值进行数据预报。这就是回归直线如何通过给定的n个点坐标找出这条回归直线呢?”.”可以转化为:可以转化为:11,x y22,xy33,x y11
5、,x bxa22,x bxa33,x bxa=iiiiiiixyeyyybxa相对于点,的残差:真实值预报值,iix y点是真实的点坐标,iix bxaybxa点是回归直线上的预报点222211221+nnniiiyyyyyyyy残差的平方和:越小,模型的拟合效果越好这一寻找回归直线的方法叫最小二乘法这一寻找回归直线的方法叫最小二乘法(最小平方法):最小平方法):它通过最小化误差的平方和寻找数据的最佳函数匹配它通过最小化误差的平方和寻找数据的最佳函数匹配寻找回归直线的关键步骤分析:(1)通过两个变量的n个点坐标画出相应的散点图(2)从散点图判断两个变量是否分布在一条直线附近,接着通过计算相关系
6、数r,或者相关指数R2来判断两个变量是否具有较强的相关关系。(3)如果有较强的相关关系,我们就会利用利用最小二乘法来拟合两个变量之间的线性关系,所找的直线就是回归直线。且所找的回归直线必过中心点(4)最小二乘法寻找回归直线的原则就是计算n个点的残差平方和 ,它的最小值来就是我们所要找的这条回归直线。22121()1()niiiniiyyRyy 12211niiinniiiixxyyrxxyy22121()1()niiiniiyyRyy 二 关于:211()niiiyy这是残差的平方和关于残差平方和,与关于残差平方和,与R R2 2之间关系的说明:之间关系的说明:21niiiyy一 残差的平方和
7、,越小,说明真实点跟回归直线的距离越近,效果越好 212()niiiiyynynyy这是由给的 个点 和 个点 的平均值 来求解的,是一个固定值。22121()()niiiniiyyRyy3 因此根据残差平方和越小效果越好,中这个式子越小,效果越好 220,1RR4,值越接近1,越大,拟合效果越准确的。21niiiyy一 残差的平方和,越小,说明真实点跟回归直线的距离越近,效果越好220,1RR二 即:,值越接近1,越大,拟合效果越准确的。1,1,0,1rrr 三其中 为正,则正相关,,1,0rr 为负,则负相关,,r2 即:越大,越靠近1,拟合效果越准确的。当判断出来两个变量有很强的线性关系
8、时,我们会通过最下二乘法来计算这条回归直线的方程ybxa回归直线方程为:关于残差平方和,与关于残差平方和,与r r和和R R2 2之间关系的说明:之间关系的说明:计算回归方程的斜率计算回归方程的斜率b与截距与截距a的一般公式的一般公式:xyaaybx第二步:利用回归直线必过定点:,来求,则:1122211()()b()nniiiiiinniiiixxyyx ynx ybbxxxnx第一步:根据 的参考公式,求出。(一般这块计算量比较大,题目会提供参考公式和参考数据供选择),yxyy第三步:对于其他给的 的值,可以求出预报值 可以说明真实的 的值大概在 的附近ybxa回归直线方程为:C练习练习1:判断:判断下列下列图形中具有线性相关关系的两个变量是图形中具有线性相关关系的两个变量是(5,50)715yx7 101585y 0.8585.710.85 17585.7163.04yx=6463.04yy残差:真实值预报值