1、直直线线相相关关直直线线回回归归xSSSPb r r:+,两变量间的相关关系同向变化;,两变量间的相关关系同向变化;-,两变量间的相关关系反向变化。,两变量间的相关关系反向变化。b:+b:+,y y 随随x x的增加的增加(减少减少)而增加而增加(减少减少);-,y y 随随x x的增加的增加(减少减少)而减少而减少(增加增加)。联系联系r r与与b b符号相同,都取决于两变量离均差乘积和符号相同,都取决于两变量离均差乘积和SPSP。yxSSSSSPr回归方程的显著性回归方程的显著性回归系数的显著性回归系数的显著性相关系数的显著性相关系数的显著性xybxay三者同时显著或不显著,是等价的。由于
2、r的检验可以直接查表,较为简单,可以用其代替对b的假设检验。)2(nQUFbbbsbsbtrrrsrsrt22rbttFySSUr 12rSSUyx或y的总变异能够通过y或x以直线回归的关系来估计的比重只占25,其余75的变异无法借助直线回归来估计,说明两变量间的相关关系实际意义不大。如果如果r r=0.5=0.5 r rr r0.01(24)0.01(24),相关系数极显著,相关系数极显著dfdf=24=24r r0.01(24)0.01(24)=0.496=0.496 r r2 20.250.25y y依依x x的直线回归系数的直线回归系数x x 依依y y的直线回归系数的直线回归系数xx
3、ySSSPb/yyxSSSPb/yxSSSSSPr22yxxybbr/2回归回归相关相关x x可以精确测量、可以精确测量、严格控制严格控制y y服从正态分布。服从正态分布。x x服从正态分布。服从正态分布。y y服从正态分布。服从正态分布。xbayxyxy/ybaxyxyx/I型回归型回归II型回型回归归区别区别xbayxyxy/两两变量间变量间依存变化依存变化的数量关系的数量关系两两变量间变量间相关关系相关关系的数量关系的数量关系回归相关单向xyxy双向&有些资料用相关表示较适宜,比如兄弟与姐妹有些资料用相关表示较适宜,比如兄弟与姐妹间的身高关系、人的身高与前臂长之间的关系等间的身高关系、人
4、的身高与前臂长之间的关系等资料。资料。&有些资料用相关和回归都适宜,此时须视研究有些资料用相关和回归都适宜,此时须视研究需要而定。需要而定。&就一般计算程序来说,是先求出相关系数就一般计算程序来说,是先求出相关系数r r并并对其进行假设检验,如果对其进行假设检验,如果r r显著并有进行回归分显著并有进行回归分析之必要,再建立回归方程。析之必要,再建立回归方程。回归系数有单位,形式为(依变量单位回归系数有单位,形式为(依变量单位/自变量单位),相关系数没有单位。自变量单位),相关系数没有单位。相关系数的范围在相关系数的范围在-1-1+1+1之间,而回归系之间,而回归系数没有这种限制。数没有这种限
5、制。不要把毫无关联的两个事物或现象用来作不要把毫无关联的两个事物或现象用来作相关或回归分析。相关或回归分析。*l相关分析只是以相关系数来描述两个变量间相互关相关分析只是以相关系数来描述两个变量间相互关系的密切程度和方向,并不能阐明两事物或现象间存系的密切程度和方向,并不能阐明两事物或现象间存在联系的本质。在联系的本质。*l相关并不一定就是内在关系,切不可单纯依靠相关相关并不一定就是内在关系,切不可单纯依靠相关系数或回归系数的显著性系数或回归系数的显著性“证明证明”内在关系之存在。内在关系之存在。l要证明两事物间的内在关系,必须凭籍专业知识从理要证明两事物间的内在关系,必须凭籍专业知识从理论上加
6、以阐明。但是,当事物间的因果关系未被认识论上加以阐明。但是,当事物间的因果关系未被认识前,相关分析可为理论研究提供线索。前,相关分析可为理论研究提供线索。1 2 3 4 5 64321 1 2 3 4 5 64321 1 2 3 4 5 64321正向正向直线关系直线关系负向直线关系负向直线关系曲线关系曲线关系直线关系是两变量间最简单的一种关系。直线关系是两变量间最简单的一种关系。这种关系仅在变量的一定取值范围内可用,范围这种关系仅在变量的一定取值范围内可用,范围过大,散点图就偏离直线,需要借助于曲线描述。过大,散点图就偏离直线,需要借助于曲线描述。如果缩小研究范围,则任意非直线关系最后都可以
7、如果缩小研究范围,则任意非直线关系最后都可以用线性关系来近似,但范围过小,使用上不方便。用线性关系来近似,但范围过小,使用上不方便。不能对变量间的关系有一个整体上的认识。不能对变量间的关系有一个整体上的认识。在不同取值范围内还要换用不同的方程。在不同取值范围内还要换用不同的方程。1 2 3 4 5 64321曲线资料曲线资料直线资料直线资料直线回归方程直线回归方程曲线回归方程曲线回归方程xy非线性回归直线化过程非线性回归直线化过程对数函数曲线对数函数曲线指数函数曲线指数函数曲线幂函数曲线幂函数曲线LogisticLogistic生长曲线生长曲线曲线类型的确定曲线类型的确定数据变换数据变换常用曲
8、线回归的直线化常用曲线回归的直线化倒数函数曲线倒数函数曲线单细胞生物生长初期数量单细胞生物生长初期数量酶促反应动力学米氏方程酶促反应动力学米氏方程指数函数指数函数单细胞生物全生长期数量单细胞生物全生长期数量S S 型曲线型曲线双曲线双曲线一、非线性回归直线化过程一、非线性回归直线化过程 通过所获得资料的自然尺度绘制散点图,通过所获得资料的自然尺度绘制散点图,按照散点趋势画出相应的曲线。按照散点趋势画出相应的曲线。如果有多种曲线类型可供选择,可多做几如果有多种曲线类型可供选择,可多做几次回归,进行比较,从中确定最好的曲线类型。次回归,进行比较,从中确定最好的曲线类型。散点图散点图 确定了曲线类型
9、之后,回归的任务就变成确定了曲线类型之后,回归的任务就变成确定曲线公式中的参数,称为确定曲线公式中的参数,称为曲线拟合曲线拟合。根据散点图进行直观的比较,选出一种曲根据散点图进行直观的比较,选出一种曲线类型,并将原数据进行转换,将曲线方程直线类型,并将原数据进行转换,将曲线方程直线化,用转换后的数据绘制散点图,若该图形线化,用转换后的数据绘制散点图,若该图形为直线趋势,即表明选取的曲线是恰当的,否为直线趋势,即表明选取的曲线是恰当的,否则将重新进行选择。则将重新进行选择。数据转换数据转换 实际上,只有少数几种简单非线性方程可实际上,只有少数几种简单非线性方程可用这种方法线性化,而绝大多数都是不
10、行的。用这种方法线性化,而绝大多数都是不行的。曲线拟合曲线拟合曲线与实测点曲线与实测点吻合程度吻合程度的高低的高低22)()(yyyy小小吻合程度高吻合程度高大大吻合程度低吻合程度低22)()(1yyyy2R相关指数相关指数(1)(1)回归曲线拟合程度的高低;回归曲线拟合程度的高低;(2)(2)利用回归方程进行估测的可靠利用回归方程进行估测的可靠程度的高低;程度的高低;直接引入新变量。直接引入新变量。曲线方程数学变换后,再引入新变量。曲线方程数学变换后,再引入新变量。xbaylgxxlgbxaybaxy xbaylglglg bxay对数函数:对数函数:幂函数:幂函数:例:例:xbaylnxb
11、ayxxln2bxaxybxay xyy/bxaxey bxay)/ln(xyy aalnbaxy1 xbay)/1ln(yy xxlnaaln倒数函数xbxayyxy bxay(reciprocal function)bxay1bxaxyyy/1bxay yxy/bxay 二、常用曲线回归的直线化二、常用曲线回归的直线化指数函数bxaey bxay lnln(exponential function)xaby yylnbxay aalnbxaylnlnlnyylnxbay aalnbbln对数函数xbaylgxxlgbxay(logarithmic function)xbaylnxxlnbx
12、ay幂函数baxy bxayxbaylnlnln(power function)yylnaalnxxln双曲线xbay1 bxayyy1xx1S形曲线xbeay1xbeay1 bxayyy1xex烘烤时间对叶绿素含量的影响烘烤时间对叶绿素含量的影响baxy bxaylglglgxbaylglglg bxay9631.01464.0 xy4009.110101464.0aa烘烤时间对叶绿烘烤时间对叶绿素含量的影响素含量的影响5402.0735.022)9(01.0r 开始增长缓慢,而在以后的某一范围内开始增长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,迅速增长,达到某限度后
13、,增长又缓慢下来,曲线略呈拉长的曲线略呈拉长的“S”S”。Logistic生长曲线0 xybxaeKy10 xyK1+aKbxaeKy10 xaKy1xKy 起始量起始量终极量终极量K2bxaeKy1bax)/1ln(2Ky 下凹下凹上凸上凸1bxaeba)/1ln(0 xyK1+aKbxaeKy1bxaeyyK)ln(yyKyaalnbbxbay?K?K12y是累积频率,则是累积频率,则y无限增大的终极量为无限增大的终极量为100(%)。100Ky是生长量或繁殖量时,可限是生长量或繁殖量时,可限3对等距观测值,计算对等距观测值,计算K。312232131222)(yyyyyyyyyKx(周次
14、)y(kg)20.3040.8661.7382.2102.47122.67142.80 x(周次)y(kg)20.3040.8661.7382.2102.47122.67142.80 x(周次)y(kg)20.3040.8661.7382.2102.47122.67142.80 x(周次)y(kg)20.3040.8661.7382.2102.47122.67142.80827.2K759.2K996.2K692.2Kx(周次)y(kg)(2.827-y)/yy=ln(2.827-y)/y)20.30 8.4233 2.1310 40.86 2.2872 0.8273 61.73 0.6341
15、-0.4555 82.20 0.2850-1.2553 102.47 0.1445-1.9342 122.67 0.0588-2.8336 142.80 0.0096-4.6415 9914.0 xyr874.0)5(01.0rxbay 5200.0b9940.2abxaeKy1aalnbb9654.199940.2eeaa5200.0 bbxey5200.09654.191827.2)(4135.12kgKy周)(76.5lnbax不是所有非线性方程都能用变量代换线性化。不是所有非线性方程都能用变量代换线性化。即使方程类型不对时,变量代换与线性回归仍可即使方程类型不对时,变量代换与线性回归仍可照常进行,但结果没有任何用途,强行使用会导照常进行,但结果没有任何用途,强行使用会导致错误。致错误。只能使变换后数据的线性方程残差最小,采用线只能使变换后数据的线性方程残差最小,采用线性化方法进行曲线回归后必须进行检验。性化方法进行曲线回归后必须进行检验。