1、2例例1:下表是某小卖部:下表是某小卖部6天卖出热茶的杯天卖出热茶的杯数与当天气温的对比表:数与当天气温的对比表:气温气温/2618131041杯数杯数202434385064(1)将上表中的数据制成散点图)将上表中的数据制成散点图.(2)你能从散点图中发现温度与饮料杯)你能从散点图中发现温度与饮料杯数近似成什么关系吗数近似成什么关系吗?(3)如果近似成线性关系的话,请画出)如果近似成线性关系的话,请画出一条直线方程来近似地表示这种线性关系一条直线方程来近似地表示这种线性关系.(1)画出散点图:)画出散点图:温度温度杯杯数数(2)从图中可以看出温度与杯数具有相)从图中可以看出温度与杯数具有相关
2、关系,当温度由小到大变化时,杯数关关系,当温度由小到大变化时,杯数的值由大到小的值由大到小.所以温度与杯数成负相关所以温度与杯数成负相关.图中的数据大致分布在一条直线附近,图中的数据大致分布在一条直线附近,因此温度与杯数成线性相关关系。因此温度与杯数成线性相关关系。(3)根据不同的标准,可以画出不同的)根据不同的标准,可以画出不同的直线来近似地表示这种线性关系。直线来近似地表示这种线性关系。如可以连接最左侧和最右侧的点,或者如可以连接最左侧和最右侧的点,或者让画出的直线上方的点和下方的点的数目让画出的直线上方的点和下方的点的数目相同。相同。温度温度杯杯数数温度温度杯杯数数 由图可见,所有数据的
3、点都分布在一由图可见,所有数据的点都分布在一条直线附近,显然这样的直线还可以画条直线附近,显然这样的直线还可以画出许多条,而我们希望找出其中的一条,出许多条,而我们希望找出其中的一条,它能它能最好地最好地反映反映x与与Y之间的关系。之间的关系。换言之,我们要找出一条直线,使这换言之,我们要找出一条直线,使这条直线条直线“最贴近最贴近”已知的数据点。记此已知的数据点。记此直线方程是直线方程是 ybxa ybxa 这里在这里在y的上方加记号的上方加记号“”,是为了区,是为了区分分Y的实际值的实际值y.表示当表示当x取取xi(i=1,2,6)时,时,Y相应的观察值为相应的观察值为yi,而直线上对应,
4、而直线上对应于于xi的纵坐标是的纵坐标是yi=bxi+a.上式叫做上式叫做Y对于对于x的的回归直线方程回归直线方程,b叫做叫做回归系数回归系数。要确定回归直线方程,只要确定要确定回归直线方程,只要确定a与与b.回归直线的方程回归直线的方程 的求法:的求法:设设x,Y的一组观察值为的一组观察值为(xi,yi)(i=1,2,n)且回归直线的方程为且回归直线的方程为 ybxa当变量当变量x取取xi (i=1,2,n)时,可以时,可以得到:得到:(i=1,2,n),iiybxa它与实际收集到的它与实际收集到的yi之间的偏差是:之间的偏差是:iiiyyybxa(i=1,2,n),可见,偏差的符号可见,偏
5、差的符号有正有负有正有负,若将它们,若将它们相加会造成相互抵消,所以它们的和不能相加会造成相互抵消,所以它们的和不能代表代表n个点与相应直线在整体上的接近程个点与相应直线在整体上的接近程度。故采用度。故采用n个偏差的平方和个偏差的平方和 2221122()()()nnQybxaybxaybxa表示表示n个点与相应直线在整体上的接近程度个点与相应直线在整体上的接近程度.记记 21()niiiQybxa(为连加符号为连加符号)上式展开后,是一个关于上式展开后,是一个关于a,b的二次多的二次多项式,应用项式,应用配方法配方法,可求使,可求使Q取得最小值取得最小值时时a、b的值的值.这样,回归直线就是
6、所有直线中这样,回归直线就是所有直线中Q取最取最小值的那一条。由于平方又叫做二乘方,小值的那一条。由于平方又叫做二乘方,所以这种使所以这种使“离差平方和为最小离差平方和为最小”的方法,的方法,叫做叫做“最小二乘法最小二乘法”。用最小二乘法求回归直线方程中用最小二乘法求回归直线方程中a,b有下面的公式:有下面的公式:1122211()(),().nniiiiiinniiiixxyyx ynx ybxxxnxaybx 其中其中11,niixxn11niiyyn同样同样a,b的上方加的上方加“”,表示是由观察,表示是由观察值按最小二乘法求得的值按最小二乘法求得的估计值估计值。由于由于 ,故巧合的是:
7、,故巧合的是:(xi,yi)(i=1,2,n)的中心点的中心点 在回归直线上,在回归直线上,x处的估计值为处的估计值为 .ybxa(,)x y ybxa例例2.在某种产品表面进行腐蚀刻线试验,在某种产品表面进行腐蚀刻线试验,得到腐蚀深度得到腐蚀深度Y与腐蚀时间与腐蚀时间x之间相应的一之间相应的一组观察值如下表:组观察值如下表:x/s5101520304050607090 120Y/m610101316171923252946(1)画出表中数据的散点图;)画出表中数据的散点图;(2)求)求Y对对x的回归直线方程;的回归直线方程;(3)试预测腐蚀时间为)试预测腐蚀时间为100时腐蚀深度是时腐蚀深度
8、是多少?多少?解解:(:(1)散点图如下)散点图如下(2)根)根据公式求据公式求腐蚀深度腐蚀深度Y对腐蚀对腐蚀时间时间x的的回归直线回归直线方程。方程。序号序号xYx2xy156253021010100100315102251504201340026053016900480640171600680750192500950860232600138097025490017501090298100261011120461440055205102143678013910计算计算a,b的值的值.由上表分别计算由上表分别计算x,y的平均数得的平均数得11214,11510yx304.03043.0)115
9、10(1136750112141151011139102b346.5115103043.011214a写出回归方程为写出回归方程为y=0.304x+5.346.(3)根据求得的回归方程,当腐蚀时间)根据求得的回归方程,当腐蚀时间为为100s时,时,y=0.304100+5.346=38.86(m)即腐蚀深度约为即腐蚀深度约为38.86m.练习题练习题1下列说法正确的是(下列说法正确的是()(A)y=2x2+1中的中的x,y是具有相关关系的是具有相关关系的两个变量两个变量 (B)正四面体的体积与其棱长具有相关)正四面体的体积与其棱长具有相关关系关系 (C)电脑的销售量与电脑的价格之间是)电脑的销
10、售量与电脑的价格之间是一种确定性的关系一种确定性的关系 (D)传染病医院感染)传染病医院感染“非典非典”的医务人的医务人员数与医院收治的员数与医院收治的“非典非典”病人数是具有病人数是具有相关关系的两个变量相关关系的两个变量D2.有关线性回归的说法,不正确的是有关线性回归的说法,不正确的是()A.相关关系的两个变量不是因果关系相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量回归直线最能代表线性相关的两个变量之间的关系之间的关系D.任一组数据都有回归方程任一组数据都有回归方程D3.下面哪些变量是相关关系下面哪
11、些变量是相关关系()A.出租车费与行驶的里程出租车费与行驶的里程 B.房屋面积与房屋价格房屋面积与房屋价格 C.身高与体重身高与体重 D.铁的大小与质量铁的大小与质量C4.回归方程回归方程y=1.5x15,则,则()A.y=1.5 x15 B.15是回归系数是回归系数a C.1.5是回归系数是回归系数a D.x=10时,时,y=0A5.线性回归方程线性回归方程y=bx+a过定点过定点_.(x,y)6.已知回归方程已知回归方程y=4.4x+838.19,则可估,则可估计计x与与y的增长速度之比约为的增长速度之比约为_.5227.下表是某地的年降雨量与年平均气温,下表是某地的年降雨量与年平均气温,
12、判断两者是相关关系吗?求回归直线方程判断两者是相关关系吗?求回归直线方程有意义吗?有意义吗?年平均气温年平均气温(C)12.5112.8412.8413.6913.3312.7413.05年降雨量年降雨量(mm)748542507813574701432由散点图看出,由散点图看出,求回归直线方求回归直线方程无实际意义。程无实际意义。8.某市近某市近10年的煤气消耗量与使用煤气户年的煤气消耗量与使用煤气户数的历史资料如下:数的历史资料如下:年年 份份1993 1994 2019 2019 2019 2019 2019 2000 2019 2019x用户(万用户(万户)户)11.21.61.822.53.244.24.5y(百万立(百万立方米)方米)679.81212.114.5202425.427.5(1)求回归方程;)求回归方程;(2)若市政府下一步再扩大)若市政府下一步再扩大5千煤气用户,千煤气用户,试预测该市煤气消耗量将达到多少试预测该市煤气消耗量将达到多少.解:(解:(1)画散点图并求回归方程)画散点图并求回归方程y=6.0573x+0.0811(2)当)当x=5时时,y=30.367630.37。