1、医学统计学直线回归医学统计学直线回归分析分析主要内容主要内容l直线回归方程的建立l直线回归的统计推断l直线回归的应用l直线回归需注意的问题l直线回归与直线相关的联系与区别医学统计学直线回归分析2医学统计学直线回归分析3直线回归(linear regression)用来研究两个连续型变量之间数量上的线性依存关系。因变量(dependent variable)常用y表示自变量(independent variable)常用x表示医学统计学直线回归分析4例例14.1 某研究欲探讨男性腰围与腹腔内脂肪面积的关系,对20名男性志愿受试者测量其腰围(cm),并采用磁共振成像法测量其腹腔内脂肪面积(cm2)
2、,结果如表14.1所示。试建立腹腔内脂肪面积和腰围的直线回归方程。医学统计学直线回归分析5医学统计学直线回归分析6 为了直观了解腹腔内脂肪面积与腰围的关系,以这20名男性志愿者的腰围为横坐标,腹腔内脂肪面积为纵坐标绘制散点图医学统计学直线回归分析7图14.1 两变量直线回归关系散点图腹腹腔腔内内脂脂肪肪面面积积(cm2)腰围腰围(cm)医学统计学直线回归分析8函数关系与回归关系函数关系与回归关系医学统计学直线回归分析9 abxayy xx0 x=x医学统计学直线回归分析10a0a=0a0:每增加(减少)一个观测单位,增加(减少)b个单位。b0y x医学统计学直线回归分析12b0:每增加(减少)
3、一个观测单位,减少(增加)|b|个单位。b0 xy 医学统计学直线回归分析13b=0:与 没有直线回归关系。b=0 xy医学统计学直线回归分析14回归方程的估计回归方程的估计原理:最小二乘法(least square method)各实测点到直线的纵向距离平方之和达到最小医学统计学直线回归分析15计算公式计算公式2()()()xyxxlxxyyblxxaybx医学统计学直线回归分析16其中其中22()/xxlxxn22()/yylyyn()/xylxyxyn 医学统计学直线回归分析17本例本例22()/950.778xxlxxn22()/7293.650yylyyn()/2006.649xyl
4、xyxyn 2006.6492.11053950.778xyxxlbl95.6452.1105390.99096.39212aybx 医学统计学直线回归分析18故所求回归方程为:故所求回归方程为:96.392122.11053yx 医学统计学直线回归分析19直线回归的统计推断直线回归的统计推断l样本回归系数bl总体回归系数l对的两种假设检验方法:方差分析法 t检验法医学统计学直线回归分析20方差分析法方差分析法医学统计学直线回归分析21总变异的分解总变异的分解即:222()()()yyyyyy残回总SSSSSS医学统计学直线回归分析22 :总离均差平方和(不考虑回归关系的总变异):回归平方和(
5、总变异中可以用回归关系所 解 释的部分。值越大,说明回归效果越好。):残差平方和(总平方和中无法用回归关系解 释的部分随机误差)总SS回SS残SS医学统计学直线回归分析23自由度的分解自由度的分解医学统计学直线回归分析24构造构造F统计量统计量/MSSSFMSSS回回回残残残医学统计学直线回归分析25方差分析表方差分析表来源平方和SS自由度均方MS统计量F总总=n-1回归回=1MS回=SS回/1MS回/MS残残差残=n-2MS残=SS残/(n-2)2yySS 总2(yy)SS 回2SS(yy)残医学统计学直线回归分析26本例本例1.建立检验假设,确定检验水准=0.05医学统计学直线回归分析27
6、2.计算检验统计量2()7293.650yySSyyl总24235.086xxSSb l回3058.564SSSSSS残总回/4235.086/124.924/3058.564/18MSSSFMSSS回回回残残残医学统计学直线回归分析28医学统计学直线回归分析29t检验法检验法公式:其中:0bbbtS-=2n=-xxxyblSS2nSSSxy残医学统计学直线回归分析31本例本例3058.56413.035352202y xSSSn残13.035350.42275950.778y xbxxSSl2.110534.99240.42275bbbtS医学统计学直线回归分析32l查t界值表,得P0.00
7、1,结论与方差分析法一致l实际上:对同一资料作总体回归系数是否为0的假设检验,方差分析和t 检验是一致的。Ftb医学统计学直线回归分析33总体回归系数的区间估计总体回归系数的区间估计本例:/2,(2)nbbtS(2.110532.101 0.42275,2.110532.101 0.42275)(1.222,2.999)医学统计学直线回归分析34决定系数决定系数(coefficient of determination)2SSRSS回总 反映了回归贡献的相对程度,即在因变量y的总变异中用y与x回归关系所能解释的比例。在实际应用中,常用决定系数来反映回归的实际效果。本例决定系数为0.581 2R
8、医学统计学直线回归分析35直线回归分析的应用直线回归分析的应用l因变量总体条件均数的置信区间估计l应变量个体y值的预测区间医学统计学直线回归分析36总体条件均数的置信区间估计总体条件均数的置信区间估计py py pynpSty)2(,2/其中:xxpxyylxxnSSp2)(1医学统计学直线回归分析37应变量个体应变量个体y值的预测区间值的预测区间l对于给定的x=xp,y值的预测区间计算公式为:其中:/2,|ppy xytS2|()11ppy xy xxxxxSSnl医学统计学直线回归分析38二者的区别二者的区别(置信带和预测带)置信带和预测带)医学统计学直线回归分析39直线回归分析需注意的问
9、题直线回归分析需注意的问题l回归分析前应绘制散点图(必需有直线趋势时,才适宜作直线回归分析。应注意资料有无离群点(outlier)及离群点的处理。医学统计学直线回归分析40l模型假设条件的考察(残差图)医学统计学直线回归分析41l结果的解释及正确应用 反映自变量对应变量数量上影响大小的是回归系数,而非P值。内插与外推医学统计学直线回归分析42直线回归与直线相关分析的联系与区别医学统计学直线回归分析43联系联系l 对于服从双变量正态分布的同一组数据,既可作直线相关分析又可作直线回归分析,相关系数与回归系数正负号一致。本例:r=0.762 b=2.11l对于同一样本,相关系数与回归系数的假设检验等价。tb=tr医学统计学直线回归分析44l对于服从双变量正态分布的同一组资料l用回归可以解释相关:xybSrS=22/RSSSSr回总医学统计学直线回归分析45区别区别l资料要求:直线相关要求双变量正态分布,直线回归要求给定自变量值时,因变量服从正态分布l应用及意义:相关系数说明两变量间相互关系的方向与密切程度;回归系数说明两变量的数量依存关系 医学统计学直线回归分析46l计算公式:l取值范围:l单位:相关系数无单位,回归系数有单位/xyxxyyrll lxxxyllb/11rb医学统计学直线回归分析47