1、回归分析的基本思想及其回归分析的基本思想及其 初步应用初步应用 2020/4/13 自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定 随机性的两个变量之间的关系随机性的两个变量之间的关系叫做叫做相关关系相关关系。 1、定义、定义: 1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系; 注注 对具有相关关系的两个变量进行统计对具有相关关系的两个变量进行统计 分析的方法叫分析的方法叫回归分析回归分析。 2):): 函数关系函数关系是是 确定性关系确定性关系 复习复习 变量之间的两种关系变量之间的两种关系 y = x2 如:人的身高与年龄;如:人的身高与年龄
2、; 产品的成本与生产数量;产品的成本与生产数量; 2020/4/13 1 叫做叫做回归直线方程回归直线方程; 相应的直线叫做相应的直线叫做回归直线回归直线。 2、对两个变量进行的线性分析叫做、对两个变量进行的线性分析叫做线性回归分析线性回归分析。 11 2 22 11 ()() , () nn iii i ii nn ii ii xx yyxnxy b xxxnx ay bx y 1、回归直线方程、回归直线方程 ybxa 2020/4/13 2、求回归直线方程的步骤:、求回归直线方程的步骤: 11 11 (1), nn ii ii xx yy nn 求 2 11 (2),. nn iii ii
3、 xx y 求 (3)代入公式)代入公式 11 2 22 11 ()() , () ,(1) nn iii i ii nn ii ii xx yyxnxy b xxxnx ay bx y (4)写出直线方程为)写出直线方程为y=bx+a,即为所求的回归直线方程。即为所求的回归直线方程。 ( , )x y 称为样本点的中心称为样本点的中心。 2020/4/13 例例1 1、观察两相关量得如下数据、观察两相关量得如下数据: : x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 -5 -3 -1 1 5 3 7 9 101010 2 2 111 0,0, 110,3 01 0.3
4、 ,1 ii ii iii xy yyxx 求两变量间的回归方程求两变量间的回归方程. . 解:列表:解:列表: i 1 2 3 4 5 6 7 8 9 10 xi -1 -2 -3 -4 -5 5 3 4 2 1 yi -9 -7 -5 -3 -1 1 5 3 7 9 xiyi 9 14 15 12 5 5 15 12 14 9 2020/4/13 10 1 10 22 1 10 110100 1 110100 10 i i i i i x y b yx xx 000aybxb .yx 所求回归直线方程为所求回归直线方程为 相关系数相关系数 n n iiii i=1i=1 nnnn 2222
5、 iiii i=1i=1i=1i=1 (x - x)(y - y)(x - x)(y - y) r =r = (x - x)(y - y)(x - x)(y - y) 2 2 _ _ n n 1 1i i 2 2 i i 2 2 _ _ n n 1 1i i 2 2 i i n n 1 1i i _ _ _ i ii i y yn ny yx xn nx x y yx xn ny yx x 3 3、利用回归直线方程对总体进行线性相关性的检验、利用回归直线方程对总体进行线性相关性的检验 2020/4/13 2020/4/13 2020/4/13 例例3 3、炼钢是一个氧化降碳的过程,钢水含碳量的
6、多少、炼钢是一个氧化降碳的过程,钢水含碳量的多少 直接影响冶炼时间的长短,必须掌握直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼钢水含碳量和冶炼 时间的关系。如果已测得炉料熔化完毕时,钢水的含碳时间的关系。如果已测得炉料熔化完毕时,钢水的含碳 量量x与冶炼时间与冶炼时间y(从炉料熔化完毕到出刚的时间)的一(从炉料熔化完毕到出刚的时间)的一 列数据,如下表所示:列数据,如下表所示: x(0.01%) 104 180 190 177 147 134 150 191 204 121 y(min) 100 200 210 185 155 135 170 205 235 125 (1 1)y y与与x
7、 x是否具有线性相关关系;是否具有线性相关关系; (2 2)如果具有线性相关关系,求回归直线方程;)如果具有线性相关关系,求回归直线方程; (3 3)预测当钢水含碳量为)预测当钢水含碳量为160160个个0.01%0.01%时,应冶炼多少分时,应冶炼多少分 钟?钟? 2020/4/13 (1)(1)列出下表列出下表, ,并计算并计算 i 1 2 3 4 5 6 7 8 9 10 xi 104 180 190 177 147 134 150 191 204 121 yi 100 200 210 185 155 135 170 205 235 125 xiyi 10400 36000 39900
8、32745 22785 18090 25500 39155 47940 15125 101010 2 2 111 159.8,172, 265448,312350,287640 ii ii iii xy yyxx 10 1 1010 22 22 11 10 0.99060.632. (10)(10) ii i ii ii x yx y r xxyy 于是, 2020/4/13 10 1 10 22 1 10 1.267 10 i i i i i x y b yx xx 30.51.aybx 所以回归直线的方程为所以回归直线的方程为 =1.267x-30.51 y (3)(3)当当x=160x=160时时, 1.267.160, 1.267.160- -30.51=17230.51=172 y (2)设所求的回归方程为设所求的回归方程为 ybxa 2020/4/13 相关关系的测度相关关系的测度 (相关系数取值及其意义) -1.0 +1.0 0 -0.5 +0.5 完全负相关完全负相关 无线性相关无线性相关 完全正相关完全正相关 负相关程度增加负相关程度增加 r 正相关程度增加正相关程度增加