医学统计学课件-第九章-双变量回归与相关(第9章).ppt

上传人(卖家):晟晟文业 文档编号:3792248 上传时间:2022-10-13 格式:PPT 页数:98 大小:1.96MB
下载 相关 举报
医学统计学课件-第九章-双变量回归与相关(第9章).ppt_第1页
第1页 / 共98页
医学统计学课件-第九章-双变量回归与相关(第9章).ppt_第2页
第2页 / 共98页
医学统计学课件-第九章-双变量回归与相关(第9章).ppt_第3页
第3页 / 共98页
医学统计学课件-第九章-双变量回归与相关(第9章).ppt_第4页
第4页 / 共98页
医学统计学课件-第九章-双变量回归与相关(第9章).ppt_第5页
第5页 / 共98页
点击查看更多>>
资源描述

1、 Bivariate Regression&Correlation10/13/20221 讲课内容:讲课内容:10/13/20222 p第第2、第第3、第第4章介绍了计量资料章介绍了计量资料单变量单变量的统的统 计描述与统计推断:计描述与统计推断:lP.13 例例2-1:计算计算101名成年女子名成年女子血清总胆固血清总胆固 醇醇的平均指标与变异指标。的平均指标与变异指标。lP.51 例例3-7:比较阿卡波糖胶囊比较阿卡波糖胶囊(试验组试验组)与拜与拜 糖苹胶囊糖苹胶囊(对照组对照组)降低糖尿病人的降低糖尿病人的空腹血糖值空腹血糖值 有无差别。有无差别。lP.73 例例4-2:比较安慰剂组、降

2、血脂新药比较安慰剂组、降血脂新药2.4g 组、降血脂新药组、降血脂新药4.8g组、降血脂新药组、降血脂新药7.2g组降组降 低患者的低患者的低密度脂蛋白含量低密度脂蛋白含量有无差别。有无差别。10/13/20223p在医学研究中常要分析在医学研究中常要分析两变量两变量间或间或多变多变 量间量间的关系:的关系:l 年龄与血压年龄与血压l 药物剂量与动物死亡率药物剂量与动物死亡率l 肺活量与身高、体重、胸围和肩宽等肺活量与身高、体重、胸围和肩宽等 10/13/20224p事物间的相关关系事物间的相关关系l确定性关系确定性关系 两变量间的函数表达式两变量间的函数表达式 圆的周长与半径的关系:圆的周长

3、与半径的关系:C2 R 路程与速度、时间的关系:路程与速度、时间的关系:LST 数学中数学中X与与Y的直线函数关系:的直线函数关系:Ya+bX l非确定性关系非确定性关系 两变量间存在关系,但未精两变量间存在关系,但未精 确到可以用函数表达式来描述。确到可以用函数表达式来描述。年龄与血脂的关系;年龄与血脂的关系;身高与体重的关系;身高与体重的关系;体重与体表面积的关系。体重与体表面积的关系。10/13/20225Linear Regression10/13/20226一、直线回归的概念一、直线回归的概念“回归回归”是一个借用已久因而相沿成习是一个借用已久因而相沿成习 的统计学术语。的统计学术语

4、。直线回归是分析直线回归是分析成对观测数据成对观测数据中两变量中两变量 间间线性依存关系线性依存关系的方法。的方法。10/13/20227p生物遗传学上的生物遗传学上的“回归回归”Pearson K(英英,18571936)1903年搜集了年搜集了1078个家庭人员的身高、前臂长等指标的记录,个家庭人员的身高、前臂长等指标的记录,发现儿子身高发现儿子身高(Y,英寸英寸)与父亲身高间与父亲身高间(X,英寸英寸)存在线性依存关系:存在线性依存关系:=33.73+0.516 X 但不少身材高的父亲的儿子成年后身高比其但不少身材高的父亲的儿子成年后身高比其父亲矮,不少身材矮的父亲的儿子成年后身父亲矮,

5、不少身材矮的父亲的儿子成年后身高比其父亲高。高比其父亲高。Galton F(英英,18221911)将这种现象称之为将这种现象称之为子一代身高向人群平均身高的子一代身高向人群平均身高的“回归回归”。Y10/13/20228210=102410/13/20229Francis GaltonFrancis Galton 爵士爵士(英英,18221911)是达是达尔文尔文(Charles Darwin)的表弟。他对统计学的表弟。他对统计学的主要贡献是提出的主要贡献是提出“相关相关”与与“回归回归”的概念,用统计方法的概念,用统计方法对进化论中的变异进对进化论中的变异进行研究,开创了生物行研究,开创了

6、生物统计学。统计学。10/13/202210Karl PearsonKarl Pearson(英英,18571936)是是Francis Galton 的得的得意门生,他开创了统意门生,他开创了统计方法学。他对统计计方法学。他对统计学的主要贡献:变异学的主要贡献:变异数据的处理、分布曲数据的处理、分布曲线的选配、卡方检验线的选配、卡方检验的提出、回归与相关的提出、回归与相关的发展。的发展。10/13/202211p天文学上的天文学上的“回归回归”地球绕太阳公转,在公转的同时本身还自转,地球绕太阳公转,在公转的同时本身还自转,在本身自转的同时地球的假设轴心还来回摆在本身自转的同时地球的假设轴心还

7、来回摆动。由于地球轴心的来回摆动,太阳光垂直动。由于地球轴心的来回摆动,太阳光垂直照射到地球上就有南、北两个极限位置照射到地球上就有南、北两个极限位置(南、南、北纬北纬23027),分别称南、北回归线,太阳分别称南、北回归线,太阳光对赤道光对赤道“回归回归”垂直照射到南、北回归线垂直照射到南、北回归线的时间分别为我国农历的冬至与夏至。的时间分别为我国农历的冬至与夏至。10/13/202212p日常生活中的日常生活中的“回归回归”现象现象 1岁姜二狗,岁姜二狗,7岁姜二狗同学,岁姜二狗同学,20岁小姜同志,岁小姜同志,30岁姜科长,岁姜科长,40岁姜处长,岁姜处长,50岁姜局长,岁姜局长,60岁

8、姜老,岁姜老,70岁老姜,岁老姜,80岁姜二狗。岁姜二狗。p目前目前“回归回归”已成为表示变量之间已成为表示变量之间数量依数量依存关系存关系的统计术语,并且衍生出的统计术语,并且衍生出“回归方回归方程程”、“回归系数回归系数”等统计学概念。等统计学概念。10/13/202213例例 某地方病研究所调查了某地方病研究所调查了8名正常儿童的尿名正常儿童的尿肌酐含量肌酐含量(mmol/24h),试估计尿肌酐含量试估计尿肌酐含量(Y)对其年龄对其年龄(X)的回归方程。的回归方程。10/13/2022148名儿童的年龄与其尿肌酐含量名儿童的年龄与其尿肌酐含量2.42.62.833.23.43.64681

9、01214年龄(岁)年龄(岁)X尿肌酐尿肌酐含量含量bXaY Y(mmol/24h)hat10/13/202215各散点呈直线趋势各散点呈直线趋势但并非均在一条直线上但并非均在一条直线上根据原始数据拟合的直线方程与数理根据原始数据拟合的直线方程与数理 上二元一次函数方程在内涵上有区别,上二元一次函数方程在内涵上有区别,称为称为直线回归方程直线回归方程。10/13/202216二、直线回归方程的求法二、直线回归方程的求法6617.15.91392.09838.2XbYa1392.0428450.5n/)X(Xn/)Y)(X(XY)XX()YY)(XX(llb222XXXY 最小二乘法最小二乘法2

10、)YY(在所有直线中最小在所有直线中最小10/13/20221710/13/202218CASIO fx-3600PV计算器计算计算器计算a、b与与r步骤步骤 键键 盘盘 说说 明明 1 MODE 2 进入线性回归模式进入线性回归模式 LR 2 SHIFT KAC 清除以前储存数据清除以前储存数据 3 13 XDYD 3.54 DATA 数据输入数据输入 11 XDYD 3.01 DATA 9 XDYD 3.09 DATA 4 SHIFT r 显示相关系数显示相关系数 0.8818 5 SHIFT a 显示截距显示截距 1.6617 6 SHIFT b 显示回归系数显示回归系数 0.1392

11、SHIFT DEL 删除输错的一对数据删除输错的一对数据10/13/2022198名儿童的年龄与其尿肌酐含量名儿童的年龄与其尿肌酐含量2.42.62.833.23.43.6468101214年龄(岁)年龄(岁)X尿肌酐尿肌酐含量含量Y(mmol/24h)X1392.06617.1Y (8,2.8)(12,3.3)10/13/202220p b 的意义的意义斜率斜率(slope)X1392.06617.1Y 年龄每增加年龄每增加1岁岁,尿肌酐含量平均增加尿肌酐含量平均增加0.1392(mmol/24h)b的单位为的单位为(Y的单位的单位/X的单位的单位)10/13/202221bXa Y a 截

12、距截距(intercept,constant)X=0 时,时,Y的估计值的估计值a的单位与的单位与Y值相同值相同当当X可能取可能取0时,时,a才有实际意义。才有实际意义。p a 的意义的意义10/13/202222回归直线的有关性质回归直线的有关性质直线通过均点直线通过均点 各点到该回归线纵向距离平方和较到其它任何各点到该回归线纵向距离平方和较到其它任何直线者为小。直线者为小。2)YY()Y,X(X XY bXaY 为来自为来自的一个样本的一个样本对于对于X各个取值,相各个取值,相应应Y的总体均数的总体均数10/13/202223的的一一个个样样本本为为来来自自 X bXaYXY XY10/1

13、3/202224三、直线回归方程中的统计推断三、直线回归方程中的统计推断(一)回归方程的假设检验(一)回归方程的假设检验1.1.方差分析方差分析(1 1)建立检验假设并确定检验水准)建立检验假设并确定检验水准 H0:=0 H1:0 =0.052)Y(Y 2)(的分解的分解重点重点10/13/202225因变量因变量Y总变异总变异 的分解的分解X Y Y)(YY )(YYY)(YY Y2)YY(10/13/202226)YY(YY(YY ))YY(YY(YY )222)YY)YY)YY (SS总总=SS回回+SS残残XXXYl/lb ,XbYa ,bXaY0)YY)(YY2 (222)YY()Y

14、Y)(YY2YY()YY(()222)YY()YY)(YY2YY()YY(()10/13/202227未引进回归时的总变异:未引进回归时的总变异:(sum of squares of deviation from mean)引进回归以后的剩余变异引进回归以后的剩余变异:(sum of squares of residuals)回归的贡献,回归平方和:回归的贡献,回归平方和:(sum of squares due to regression)2)YY(Y的总变异分解的总变异分解2)YY(2)YY(10/13/202228(3)计算检验统计量计算检验统计量F值值97.200388.08134.0M

15、SMSv/SSv/SSF 残残回回残残残残回回回回SS总总=lYY=1.0462 SS回回=blXY=l2XY/lXX=5.8452/42=0.8134SS残残=SS总总SS回回=1.04620.8134=0.2328v总总=v回回+v剩剩v总总=n1,v回回=1,v残残=n210/13/202229F0.01(1,6)=13.7410/13/2022302.t 检验检验bS0bt XXX.YblSS 2n 2nSS2n)YY(S2XY 残残回归的剩余标准差回归的剩余标准差扣除了扣除了X的影响后的影响后Y方面的变异方面的变异;引进回归方程后引进回归方程后,Y方面的变异。方面的变异。10/13/

16、202231(2)计算检验统计量)计算检验统计量 t 值值(1)建立检验假设并确定检验水准)建立检验假设并确定检验水准1970.0282328.0SX.Y 0304.0421970.0Sb 579.40304.01392.0t (3)确定)确定P值下结论值下结论 )(2/),1(t579.497.20F 0.005P 317.4t579.4t6,2/005.0 10/13/202232(二)总体回归系数(二)总体回归系数 的可信区间的可信区间),(0.2136 0648.00304.0447.21392.0Stbb6,2/05.0 此区间不包括此区间不包括=0,结论为,结论为b有统计学意义。有

17、统计学意义。10/13/202233 SPSS结果结果A AN NO OV VA Ab b.8131.81320.968.004a.2336.0391.0467RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:(Constant),年龄(岁)a.Dependent Variable:尿肌酐含量(mmol/L)b.C Co oe ef ff fi ic ci ie en nt ts sa a1.662.2975.595.001.9352.388.139.030.8824.579.004.065.214(C

18、onstant)年龄(岁)Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95%Confidence Interval for BDependent Variable:尿肌酐含量(mmol/L)a.10/13/202234(三)利用回归方程进行估计与预测(三)利用回归方程进行估计与预测1.总体均数总体均数 的可信区间的可信区间XY 220XYYY,2/0)XX()XX(n1SSStY00 XY:给定给定X后对应后对应Y的总体均数的总体均数:Y0给定给

19、定X后对应后对应Y的样本均数的样本均数10/13/2022350Y,2/0StY 2.个体个体Y值的容许区间值的容许区间220XYY)XX()XX(n11SS0 给定给定X后对应个体后对应个体Y值波动范围值波动范围10/13/202236 X Y (体重体重,kg)(体表面积体表面积,103cm2)11.0 5.28311.8 5.29912.0 5.35812.3 5.29213.15.60213.7 6.01414.4 5.83014.9 6.10215.2 6.07516.0 6.411例例 某地某地10名三岁儿童体重与体表面积名三岁儿童体重与体表面积10/13/202237111213

20、1415164.55.05.56.06.57.0可信区间可信区间与与容许区间容许区间示意示意(confidence band&tolerance band)X 体重体重Y 体体表表面面积积10/13/202238Linear Correlation10/13/202239p生物遗传学上的生物遗传学上的“相关相关”在回归分析中,有理由认为父亲身高决定儿在回归分析中,有理由认为父亲身高决定儿子身高,故把父亲身高作为自变量子身高,故把父亲身高作为自变量X,儿子身,儿子身高作为应变量高作为应变量Y。Pearson K(英英,18571936)在对同一家庭中兄在对同一家庭中兄弟与姐妹身高间关系进行分析时

21、,发现两者弟与姐妹身高间关系进行分析时,发现两者难以象父亲与儿子身高间关系那样区别自变难以象父亲与儿子身高间关系那样区别自变量量X与应变量与应变量Y,也不必计算回归方程。,也不必计算回归方程。Galton F(英英,18221911)将这种现象称之为将这种现象称之为“相关相关”。10/13/202240u 当一个变量增大,另一个也随之增大当一个变量增大,另一个也随之增大(或减少或减少),我们称这种现象为共变,或,我们称这种现象为共变,或相关。相关。两个变量有共变现象,称为有相两个变量有共变现象,称为有相关关系关关系。u 相关关系不一定是因果关系。相关关系不一定是因果关系。一、直线相关的概念一、

22、直线相关的概念10/13/202241r=0(h)r 0(f)r-1(d)r1(b)0r1(a)-1r0(c)r 0(e)r 0(g)零相关正相关负相关完全正相关完全负相关零相关零相关零相关相互关系示意图相互关系示意图10/13/202242相关系数的性质相关系数的性质u两变量间的线性关系密切程度与相关方两变量间的线性关系密切程度与相关方 向用直线相关系数向用直线相关系数r表示。表示。u1 r 1ur0为正相关为正相关ur0为负相关为负相关ur0为零相关或无相关为零相关或无相关10/13/202243YYXXXY22lll)YY()XX()YY)(XX(r 22)YY()YY()XX()XX(

23、r YXsYYsXX1n1r二、相关系数的意义与计算二、相关系数的意义与计算 Pearson 相关系数相关系数 标准化后的协方差标准化后的协方差协协方方差差方方差差 1n)YY)(XX(1n)XX(2 10/13/2022448818.01.046425.845 lll )YY()XX()YY)(XX(rYYXXXY22 10/13/202245SPSS结果结果C Co or rr re el la at ti io on ns s1.000.882.8821.000.002.002.8888尿肌酐含量(mmol/L)年龄(岁)尿肌酐含量(mmol/L)年龄(岁)尿肌酐含量(mmol/L)年龄

24、(岁)Pearson CorrelationSig.(1-tailed)N尿肌酐含量(mmol/L)年龄(岁)10/13/202246三、相关系数的统计推断三、相关系数的统计推断(一)相关系数的假设检验(一)相关系数的假设检验 0:H0 尿肌酐含量与年龄之间无直线相关关系尿肌酐含量与年龄之间无直线相关关系 0.05 0:H1 10/13/202247附表附表20.005P 870.0r0.8818r0.005/2,6 附表附表130.005P 317.4t579.4t579.4288818.018818.02nr1rS0r 6,2/005.0r22r rtbt10/13/202248(二)总体

25、相关系数的可信区间(二)总体相关系数的可信区间相关系数的抽样分布在相关系数的抽样分布在 0时呈偏态分布时呈偏态分布1e1er 3nuZZ22Z2/Z的的1-可信区间:可信区间:变换后变换后r的的1-可信区间:可信区间:)r1()r1(ln21Z Z变换后服从正态分布变换后服从正态分布10/13/202249-0.8-0.6-0.4-0.2 0.00100200300-1.0 00.20.40.60.81.00100200300 =-0.8 =0.810/13/202250R.A.Fisher(1921)的的 z 变换变换1e1err1r1ln21zz2z2 z 近似服从均数为近似服从均数为 ,

26、标准差为标准差为 的正态分布。的正态分布。)1/()1(ln21rr3/1n10/13/202251相关系数的相关系数的z变换值的抽样分布变换值的抽样分布(=-0.8)00.51.01.52.0050100150200-0.8-0.6-0.4-0.2 0.00100200300-1.0变换前变换前变换后变换后10/13/202252 01234050100150200 00.20.40.60.81.00100200300相关系数的相关系数的z变换值的抽样分布变换值的抽样分布(=0.8)变换前变换前变换后变换后10/13/202253相关系数的可信区间估计相关系数的可信区间估计1.将将 r 变换

27、为变换为 z。2.根据根据 z 服从正态分布,估计服从正态分布,估计 z 的可信区间。的可信区间。3n1uzsuzz 1e1erz2z2 3.再将再将 z 变换回变换回 r。10/13/202254p求得求得8名健康成人血清总胆固醇与低密度脂名健康成人血清总胆固醇与低密度脂蛋白胆固醇含量间的蛋白胆固醇含量间的 r=0.974,试求总体相关,试求总体相关系数系数 的的95%可信区间。可信区间。1649.2974.01974.01ln21r1r1ln21Z z的的95%可信区间:可信区间:0414.32883.138/96.11649.23n/uZ2/05.0 总体相关系数总体相关系数的的95%可

28、信区间可信区间:(0.8587 0.9954)10/13/202255四、决定系数四、决定系数7775.08818.0ll/lSSSSR2YYXX2XY2 )(总总回回 0R21 Y的总变异中回归关系所能解释的百分比的总变异中回归关系所能解释的百分比 年龄可解释尿肌酐含量变异性的年龄可解释尿肌酐含量变异性的77.75%10/13/202256五、直线回归与直线相关的区别与联系五、直线回归与直线相关的区别与联系p 区别区别 ur没有单位,没有单位,b有单位;有单位;u相关表示相互关系,没有依存关系;相关表示相互关系,没有依存关系;回归有依存关系;回归有依存关系;u对资料的要求不同:对资料的要求不

29、同:当当X和和Y都是随机的,可以进行相关和回都是随机的,可以进行相关和回 归分析;归分析;当当Y是随机变量,是随机变量,X是控制变量时,理论是控制变量时,理论 上只能作回归而不能作相关分析;上只能作回归而不能作相关分析;10/13/202257p 区别区别 uI型回归:型回归:Y是随机变量,是随机变量,X是控制变量;是控制变量;II型回归:型回归:Y与与X均是随机变量。均是随机变量。u同一资料中由同一资料中由X推算推算Y与由与由Y推算推算X的回归的回归方程不同:方程不同:YbaXXbaYY.XY.XX.YX.Y 10/13/202258p 联系联系u均表示线性关系均表示线性关系u符号相同:共变

30、方向一致符号相同:共变方向一致u假设检验结果相同:假设检验结果相同:tr=tbyyxxxyxxxylllr llb 总总回回SSSSr bbr llrb2y.xx.yxxyy u 可以互相换算:可以互相换算:10/13/202259六、直线回归与相关应用的注意事项六、直线回归与相关应用的注意事项u相关:相关:X与与Y没有主次,为双向。没有主次,为双向。u回归:回归:Y依依X变化而变化,为单向。变化而变化,为单向。u自变量的选择:自变量的选择:原因、容易测量、变异小原因、容易测量、变异小u要有实际意义。要有实际意义。1.根据分析目的选择变量及统计方法根据分析目的选择变量及统计方法10/13/20

31、2260孩子的身高与小树孩子的身高与小树的高度间显示出显的高度间显示出显著的相关性著的相关性100104102106108孩子的身高(c m)小树的高度(c m)140 150 160 170 180 19010/13/202261u有无异常点,谨慎剔除。有无异常点,谨慎剔除。2.进行相关、回归分析前要绘制散点图,进行相关、回归分析前要绘制散点图,进行判断进行判断10/13/202262离群值对相关的影响离群值对相关的影响10/13/202263样本的间杂性对相关性的误导样本的间杂性对相关性的误导10/13/2022643.用残差图考察数据是否符合模型假设条件用残差图考察数据是否符合模型假设条

32、件 iiiYYe Y与与X为线形关系为线形关系误差服从均数为误差服从均数为0的正态分布的正态分布方差相等方差相等各观察单位独立各观察单位独立u回归模型应用前提条件:回归模型应用前提条件:10/13/202265e0Y10/13/2022660000eeeeYYYY10/13/202267uP值越小越有理由认为变量间直线关系值越小越有理由认为变量间直线关系 存在,不能说关系越密切。存在,不能说关系越密切。u直线回归关系可以内插,不宜外延。直线回归关系可以内插,不宜外延。u当样本含量较大时,统计学检验的作用当样本含量较大时,统计学检验的作用 减弱。减弱。r0.05/2,100=0.1954.结果的

33、解释及正确应用结果的解释及正确应用10/13/202268Rank Correlation 10/13/202269p应用条件:应用条件:1.不服从双变量正态分布而不宜作积差不服从双变量正态分布而不宜作积差 相关分析;相关分析;2.总体分布类型未知;总体分布类型未知;3.原始数据用等级表示。原始数据用等级表示。10/13/202270表表93 某某省省 1995年年到到1999年年居居民民死死因因构构成成与与WYPLL构构成成 死死 因因 类类 别别 死死因因构构成成(%)WYPLL构构 成成(%)d d2 PQ(1)X(2)P(3)Y(4)Q(5)(6)=(3)-(5)(7)=(6)2 (8

34、)=(3)(5)1 0.03 1 0.05 1 0 0 1 2 0.14 2 0.34 2 0 0 4 3 0.20 3 0.93 6-3 9 18 4 0.43 4 0.69 4 0 0 16 5 0.44 5 0.38 3 2 4 15 6 0.45 6 0.79 5 1 1 30 7 0.47 7 1.19 8-1 1 56 8 0.65 8 4.74 12-4 16 96 9 0.95 9 2.31 9 0 0 81 10 0.96 10 5.95 14-4 16 140 11 2.44 11 1.11 7 4 16 77 12 2.69 12 3.53 11 1 1 132 13 3

35、.07 13 3.48 10 3 9 130 14 7.78 14 5.65 13 1 1 182 15 9.82 15 33.95 18-3 9 270 16 18.93 16 17.16 17-1 1 272 17 22.59 17 8.42 15 2 4 255 18 27.96 18 9.33 16 2 4 288 合合 计计 171 171 92 2063 work years of potential life lost10/13/202271表表93 某某省省 1995年年到到1999年年居居民民死死因因构构成成与与WYPLL构构成成 死死因因类类别别 死死因因构构成成(%)WY

36、PLL构构成成(%)d d2 PQ(1)X(2)P(3)Y(4)Q(5)(6)=(3)-(5)(7)=(6)2 (8)=(3)(5)1 0.03 1 0.05 1 0 0 1 2 0.14 2 0.34 2 0 0 4 3 0.20 3 0.93 6-3 9 18 4 0.43 4 0.69 4 0 0 16 5 0.44 5 0.38 3 2 4 15 6 0.45 6 0.79 5 1 1 30 7 0.47 7 1.19 8-1 1 56 8 0.65 8 4.74 12-4 16 96 9 0.95 9 2.31 9 0 0 81 10 0.96 10 5.95 14-4 16 140

37、 11 2.44 11 1.11 7 4 16 77 12 2.69 12 3.53 11 1 1 132 13 3.07 13 3.48 10 3 9 130 14 7.78 14 5.65 13 1 1 182 15 9.82 15 33.95 18-3 9 270 16 18.93 16 17.16 17-1 1 272 17 22.59 17 8.42 15 2 4 255 18 27.96 18 9.33 16 2 4 288 合合 计计 171 171 92 2063 10/13/2022720.001P 728.0rr905.018189261)1n(nd61r05.0 0:H

38、0:H18n0.001,SS32SS1S0 或用秩或用秩Pi、Qi直接计算积差相关系数直接计算积差相关系数r附表附表14(n50)10/13/202273SPSS结果结果C Co or rr re el la at ti io on ns s1.000.905*.0001818.905*1.000.000.1818Correlation CoefficientSig.(2-tailed)NCorrelation CoefficientSig.(2-tailed)N死因构成(%)WYPLL构成(%)Spearmans rho死因构成(%)WYPLL构成(%)Correlation is sign

39、ificant at the 0.01 level(2-tailed).*.D De es sc cr ri ip pt ti iv ve e S St ta at ti is st ti ic cs s5.55568.66889185.55568.3102818死因构成(%)WYPLL构成(%)MeanStd.DeviationN10/13/20227410/13/20227510/13/202276YXbcb2b1bc010/13/20227710/13/202278一、曲线拟合的一般步骤一、曲线拟合的一般步骤 1.依据分析目的确定依据分析目的确定X与与Y,根据两变量根据两变量 散点图、结

40、合专业知识选择曲线类型。散点图、结合专业知识选择曲线类型。2.求回归方程:曲线直线化。求回归方程:曲线直线化。3.拟合优度:拟合优度:R2。10/13/202279CRF:促肾上腺皮质激素释放因子促肾上腺皮质激素释放因子 ACTH:肾上腺皮质激素肾上腺皮质激素例例9-1310/13/2022802060100140180-100102030 例例9-13数据散点图数据散点图CRF(nmol/L)XYACTH(pmol/L)10/13/20228110/13/202282 例例9-13数据对数据对X作对数变换散点图作对数变换散点图2060100140180-3-2-1012YACTH(pmol/

41、L)lg CRF(nmol/L)X98.0RXlg 171.3611.110Y2 10/13/202283例例9-1410/13/202284 例例9-14数据散点图数据散点图病人住院天数(天)病人住院天数(天)XY预后指数预后指数10/13/20228500.511.522.533.544.5010203040506070lnY预预后后指指数数 例例9-14数据对数据对Y作对数变换散点图作对数变换散点图病人住院天数(天)病人住院天数(天)XX038.0e66.56YX038.0037.4Yln 10/13/202286bXa)bXa(eeeYbXaYlnY 用最小二乘估计只能保证用最小二乘估

42、计只能保证 最小最小2 YY)(不能保证将变换值方程不能保证将变换值方程 回代回代后得到的后得到的 最小。最小。2YY)()bXa(eY 10/13/202287 二、曲线拟合的用途二、曲线拟合的用途 1.定量刻画定量刻画X与与Y的关系。的关系。2.用决定系数用决定系数R2反应两变量曲线关系的密反应两变量曲线关系的密切程度。切程度。10/13/202288YX0XlgbaY 三、常见的几种曲线三、常见的几种曲线对数曲线对数曲线10/13/202289YX0)bXa(eY 指数曲线指数曲线10/13/202290YX0Y=b0+b1 X+b2 X2 抛物线抛物线10/13/202291YXY=b

43、0+b1 X+b2 X2+b3 X3 03次多项式曲线次多项式曲线10/13/20229233221010 X)b(bX10221010XbXbXbbY Cubic.6XlnbbY cLogarithmi.5eY Growth.4b bY Compound.3XbXbbY c2.Quadrati XbbY Linear.110 三次模型三次模型对数模型对数模型生长模型生长模型复合模型复合模型二次模型二次模型线性模型线性模型SPSS中曲线模型中曲线模型10/13/202293bXa b010 Xb0 X)/b(be11Y Logistic Logistic.11 XbY Power.10X/bb

44、Y Inverse.9e bY lExponentia.8eY S S .71110 模模型型幂幂模模型型逆逆模模型型指指数数模模型型型型模模型型10/13/202294Model Summary and Parameter EstimatesModel Summary and Parameter EstimatesDependent Variable:ACTH(pmol/L).980148.08613.001110.06015.685.989278.18113.00097.567.186EquationLogarithmicPowerR SquareFdf1df2Sig.Model Summ

45、aryConstantb1Parameter EstimatesThe independent variable is CRF(nmol/L).例例9-1310/13/202295M Mo od de el l S Su um mm ma ar ry y a an nd d P Pa ar ra am me et te er r E Es st ti im ma at te es sDependent Variable:预后指数.886100.617113.00046.460-.753.965362.458113.00072.283-15.966.64223.273113.00014.2211

46、06.305.982321.054212.00055.822-1.710.015.989317.970311.00059.225-2.366.040.000.955276.379113.00056.665.963.82963.174113.000159.930-.719.43710.088113.0072.5054.263.955276.379113.0004.037-.038.955276.379113.00056.665-.038.955276.379113.000.0181.039EquationLinearLogarithmicInverseQuadraticCubicCompoundPowerSGrowthExponentialLogisticR SquareFdf1df2Sig.Model SummaryConstantb1b2b3Parameter EstimatesThe independent variable is 住院天数.例例9-1410/13/202296 讲课内容:讲课内容:10/13/202297Thank you!10/13/202298

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 医疗、心理类
版权提示 | 免责声明

1,本文(医学统计学课件-第九章-双变量回归与相关(第9章).ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|