1、1、两个变量的关系、两个变量的关系不相关不相关相关相关关系关系函数关系函数关系线性相关线性相关非线性相关非线性相关问题问题1:现实生活中两个变量间的关系有哪些呢?:现实生活中两个变量间的关系有哪些呢?相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系。之间的关系。复习复习 变量之间的两种关系变量之间的两种关系思考:相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一
2、般的情况复习复习 变量之间的两种关系变量之间的两种关系问题问题2:对于线性相关的两个变量用什么方法:对于线性相关的两个变量用什么方法来刻划之间的关系呢?来刻划之间的关系呢?2、最小二乘估计、最小二乘估计最小二乘估计下的线性回归方程:最小二乘估计下的线性回归方程:ybxa1122211()()()nniiiiiinniiiixxyyx ynxybxxxnx aybx1111,.nniiiixx yynn其中你能推导出这个公式吗?你能推导出这个公式吗?(,)x y称为样本点的中心。称为样本点的中心。1122(,),(,),.,(,)nnx yxyxy假设我们已经得到两个具有相关关系的变量的一组数据
3、假设我们已经得到两个具有相关关系的变量的一组数据 且回归方程是:且回归方程是:y=bx+a,(1,2,.,)ix in()iiiiyyybxa其中,其中,a,b是待定参数。当变量是待定参数。当变量x取取 时时 它与实际收集到的它与实际收集到的 之间的残差是之间的残差是iyoxy11(,)x y22(,)xy(,)iix yiiyy残差的符号有正有负,若将它们相加会造成相互抵消残差的符号有正有负,若将它们相加会造成相互抵消即即n个残差的平方和最小个残差的平方和最小 故采用故采用n个残差的平方和个残差的平方和2222211)()()(abxyabxyabxyQnnniiiabxyQ12)(易知,截
4、距易知,截距 和斜率和斜率 分别是使分别是使取最小值时取最小值时 的值。由于的值。由于(,)()iiiiQyyyx ab,21(,)()()niiiQyxyxyx 221()2()()()niiiiiyxyxyxyxyxyx2211()2()()(),nniiiiiiyxyxyxyxyxn yx11()()()()nniiiiiiyxyxyxyxyxyx注意到,11()()nniiiiyxyxn yx()()0,yxnyn xn yx221(,)()()niiiQyxyxn yx 因此,2222111()2()()()()nnniiiiiiixxxxyyyyn yx2222211221111(
5、)()()()()()()()()nniiiinniiiinniiiiiixxyyxxyyn yxxxyyxxxx121()()()niiiniixxyyxxyx这正是我们所要推导的公式。这正是我们所要推导的公式。在上式中,后两项和在上式中,后两项和 无关,而前两项为非负无关,而前两项为非负数,因此要使数,因此要使Q取得最小值,当且仅当前两项的值取得最小值,当且仅当前两项的值均为均为0,即有,即有,1)所求直线方程叫做所求直线方程叫做回归直线方程回归直线方程;相应的直线叫做相应的直线叫做回归直线回归直线。2)对两个变量进行的线性分析叫做对两个变量进行的线性分析叫做线性回归分析线性回归分析。12
6、12211()()(,)niiiniiiniiniixxx yybxnxyxxany bxxy 3、回归直线方程、回归直线方程ybxa 的意义是:的意义是:ba,以以 为基数,为基数,x x每增加每增加1 1个单位,个单位,y y相应地平均增加(或减少)相应地平均增加(或减少)个单位个单位。ab4、求回归直线方程的步骤:、求回归直线方程的步骤:1111(1),nniiiixxyynn求211(2),.nniiiiixx y求(3)代入公式)代入公式1221121()()(),.(,1)niniiiniiiiniixnxx yybxxa y bxxxyxny(4)写出直线方程为)写出直线方程为
7、,即为所求的回归直线即为所求的回归直线方程。方程。ybxa回归分析的基本步骤回归分析的基本步骤:画散点图画散点图求回归方程求回归方程预报、决策预报、决策5、线性回归模型线性回归模型ybxae其中其中bx+a是确定性函数,是确定性函数,e是随机误差是随机误差注:注:e产生的主要原因:产生的主要原因:(1)所用确定性函数不恰当;所用确定性函数不恰当;(2)忽略了某些因素的影响;忽略了某些因素的影响;(3)观测误差。观测误差。思考:身高x=172cm,女大学生的体重女大学生的体重一定是60.316kg吗?0.84985.712yxabx说明身高说明身高x每增加每增加1个单位时,体重个单位时,体重y就
8、增加就增加0.849个个单位,这表明身高与体重具有正的线性相关关系单位,这表明身高与体重具有正的线性相关关系.探究?探究?身高为身高为172172的女大学生的体重一定的女大学生的体重一定是是60.316kg60.316kg吗?如果不是吗?如果不是,其原因是什其原因是什么么?散点图只是形象地描述点的分布情况,它的散点图只是形象地描述点的分布情况,它的“线性线性”是否是否明显只能通过观察,要想把握其特征,必须进行定量的研究明显只能通过观察,要想把握其特征,必须进行定量的研究有必要对两个变量之间作线性相关性检验有必要对两个变量之间作线性相关性检验负相关负相关正相关正相关相关系数相关系数 相关系数的性
9、质相关系数的性质:(1)|r|1(1)|r|1 (2)|r|(2)|r|越接近于越接近于1 1,x,y的线性相关程度越强;的线性相关程度越强;|r|r|越接近于越接近于0 0,x,y的线性相关相关程度越弱的线性相关相关程度越弱 注注:b b 与与 r r 同号同号n ni ii ii i=1 1n nn n2 22 2i ii ii i=1 1i i=1 1(x x-x x)(y y-y y)r r=(x x-x x)(y y-y y)2 2_ _n n1 1i i2 2i i2 2_ _n n1 1i i2 2i in n1 1i i_ _ _i ii iy yn ny yx xn nx x
10、y yx xn ny yx x问题:问题:达到怎样程度,达到怎样程度,x、y线性相关呢?线性相关呢?它们的相关程度怎样呢?它们的相关程度怎样呢?建构数学建构数学(线性线性)相关性检验相关性检验作统计假设作统计假设,变量变量x x与与y y不具有线性相关关系不具有线性相关关系.根据小概率事件根据小概率事件0 00505与与n-2n-2在附表中查出相关在附表中查出相关系数系数r r的一个临界值的一个临界值r r0.050.05作出统计推断作出统计推断:若若|r|r|r|r0.050.05,则表明有,则表明有95%95%的把握认为的把握认为x x与与y y之间具之间具有线性相关关系有线性相关关系;若
11、若|r|r|r|r0.050.05,则没有理由拒绝原来的假设,则没有理由拒绝原来的假设.这时寻这时寻找回归直线方程是毫无意义的找回归直线方程是毫无意义的.线性相关关系检验的步骤线性相关关系检验的步骤 根据公式计算相关系数根据公式计算相关系数r r的值的值.(潍坊潍坊)对四对变量对四对变量y y和和x x进行相关性检验进行相关性检验,已知已知n n是观测值组数是观测值组数,r,r是相关系数是相关系数,且已知且已知n=7,r=0.9533;n=7,r=0.9533;n=15,r=0.3010n=15,r=0.3010n=17,r=0.499;n=17,r=0.499;n=3,r=0.955.n=3
12、,r=0.955.则则x x与与y y具有线性相关关系的是具有线性相关关系的是A.A.B.B.C.C.D.D.某大学中随机选取某大学中随机选取8名女大学生,其身高和体重数据名女大学生,其身高和体重数据如下表所示如下表所示.编号编号1 12 23 34 45 56 67 78 8身高身高/cm/cm165165165165157157170170175175165165155155170170体重体重/kg/kg48485757505054546464616143435959求根据女大学生的身高预报体重的回归方程,并预报求根据女大学生的身高预报体重的回归方程,并预报一名身高为一名身高为172cm
13、的女大学生的体重的女大学生的体重.故所求回归方程为:故所求回归方程为:0.84985.712yxr=0.798表明体重与身高有很强的线性相关性,从表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型是有意义的而说明我们建立的回归模型是有意义的.0.707一般情况下,在尚未断定两个变量之间是否具有线性相关关一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验在确认其具有线性相关系的情况下,应先进行相关性检验在确认其具有线性相关关系后,再求其回归直线方程;关系后,再求其回归直线方程;1.1.线性回归分析线性回归分析相关系数相关系数若若|r|r|r|r0.050
14、.05,则表明有,则表明有95%95%的把握认为的把握认为x x与与y y之间具有线性相之间具有线性相关关系关关系;若若|r|r|r|r0.050.05,则没有理由拒绝原来的假设,则没有理由拒绝原来的假设.这时寻找回归这时寻找回归直线方程是毫无意义的直线方程是毫无意义的.2.2.非线性回归分析非线性回归分析两个变量之间不呈线性相关关系,不能直接利用线性回归方两个变量之间不呈线性相关关系,不能直接利用线性回归方程建立两个变量的关系程建立两个变量的关系,可以通过变换的方法转化为线性回归可以通过变换的方法转化为线性回归模型模型.如如2c x1yc ezln y令3.3.注意问题注意问题(1)回归方程只适用我们研究的样本总体回归方程只适用我们研究的样本总体(2)不能期望回归方程得到的值是变量的精确值不能期望回归方程得到的值是变量的精确值,事实上它是事实上它是变量的可能取值的精确值变量的可能取值的精确值.4.5,3.5,xy4142221466.544.5 3.566.5630.758644.54iiiiixxybxxy442iiii 1i 1x86,x y66.593.50.70.352aybx0.70.3570.35yx