1、2.3 变量间的相关关系 2.3.2 2.3.2 线性回归方程线性回归方程 本课主要学习变量间的相关关系的相关内容,具体包括线性回归方程的求解。本课开始回顾了上节课所学变量间的相关关系与散点图的相关内容,紧接着引入回归直线的定义及特征,回归直线方程的定义及求法(最小二乘法),并且通过例题和习题进行讲解。最后通过习题进行加深巩固。1.理解线性回归。2.了解回归直线方程的求解方法。(3 3)如果所有的样本点都落在某一)如果所有的样本点都落在某一直线附近直线附近,变量之间就,变量之间就 有有线性相关关系线性相关关系 .(1 1)如果所有的样本点都落在某一)如果所有的样本点都落在某一函数曲线上函数曲线
2、上,就用该函数来就用该函数来 描述变量之间的关系,即变量之间具有描述变量之间的关系,即变量之间具有函数关系函数关系(2 2)如果所有的样本点都落在某一)如果所有的样本点都落在某一函数曲线附近函数曲线附近,变量之间就变量之间就 有有相关关系相关关系。散点图散点图:用来判断两个变量是否具有相关关系用来判断两个变量是否具有相关关系.1、回归直线、回归直线(1)回归直线的)回归直线的定义定义:如果散点图中点的分布从整体上看大致在一条直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做条直线叫做回归直线
3、回归直线(2)回归直线的)回归直线的特征特征:如果能够求出这条回归直线的方程(简称回归方程)如果能够求出这条回归直线的方程(简称回归方程),那么我们就可以比较清楚地了解对应两个变量之间的相,那么我们就可以比较清楚地了解对应两个变量之间的相关性关性.就像平均数可以作为一个变量的数据的代表一样,就像平均数可以作为一个变量的数据的代表一样,这条直线也可以作为两个变量之间具有相关关系的代表这条直线也可以作为两个变量之间具有相关关系的代表.2、回归直线方程、回归直线方程 定义:定义:一般地,设一般地,设x与与y是具有相关关系的两个变量,且相应是具有相关关系的两个变量,且相应于于n组观测值的组观测值的n个
4、点(个点(xi,yi)()(i1,2,n)大致分布在)大致分布在一条直线附近,求在整体上与这一条直线附近,求在整体上与这n个最接近的一条直线个最接近的一条直线.设此直设此直线方程为线方程为y=bx+a.这里在这里在y的上方加记号的上方加记号“”,是为了区分实际值,是为了区分实际值y,表示当,表示当x取值取值xi(i1,2,n)时,)时,y相应的观察值为相应的观察值为yi,而直线上对而直线上对应于应于xi的纵坐标是的纵坐标是yi=bxi+a.y=bx+a叫做叫做y对对x的回归直线方的回归直线方程,程,a、b叫做回归系数叫做回归系数.注意:注意:求回归直线方程的求回归直线方程的关键关键是如何用数学
5、的方法来刻画是如何用数学的方法来刻画“从整从整体上看各点与此直线的距离最小体上看各点与此直线的距离最小”,即最贴近已知的数据点,最即最贴近已知的数据点,最能代表变量能代表变量x与与y之间的关系之间的关系.在在7 7块并排、形状大小相同的试验田上进行施化肥量对水稻产块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:量影响的试验,得到如下表所示的一组数据(单位:kgkg):):施化肥量x15202530354045水稻产量y330345365405445450455y水稻产量水稻产量x(施化肥量施化肥量)10 20 30 40 503003504004
6、505003、最小二乘法、最小二乘法假设我们已经得到两个具有线性相关的变量的一组数假设我们已经得到两个具有线性相关的变量的一组数据(据(x1,y1),(),(x2,y2),),(xn,yn).根据最小二乘法和上述公式可以求回归方程根据最小二乘法和上述公式可以求回归方程.1122211()()()nniiiiiinniiiixxyyx ynxybxxxnxaybx 根据下表根据下表,求回归方程求回归方程.分析:分析:求线性回归直线方程的步骤:求线性回归直线方程的步骤:iiiixyx y第一步:列表,;nnn22iiiii1i1i1xyxyx y第二步:计算,;ba第三步:代入公式计算、的值;.第四步:写出直线方程1、列表、列表2、代入公式计算、代入公式计算3、写出回归直线方程、写出回归直线方程解:2871757 30 399.34.75,70007 30399.34.75 30257,ba 故可得故可得从从而而可可得得回回归归方方程程是是y=4.75x+257y=4.75x+257求回归方程的一般方法:求回归方程的一般方法:1、列表、列表2、计算、计算,x,y,12 niixiniiyx 13、求、求 a,b4、代入回归直线方程、代入回归直线方程