1、重庆交通大学管理学院2022年11月27日星期日17:54:23v 内容提要内容提要非条件非条件logistic回归回归模型简介模型简介简单分析实例简单分析实例哑变量设置哑变量设置自变量的筛选方法与逐步回归自变量的筛选方法与逐步回归模型拟合效果与拟合优度检验模型拟合效果与拟合优度检验模型的诊断与修正模型的诊断与修正条件条件logistic回归回归重庆交通大学管理学院2022年11月27日星期日17:54:23对分类变量的分析,当考察的影响因素较少,且也为分类对分类变量的分析,当考察的影响因素较少,且也为分类变量时,常用列联表(变量时,常用列联表(Contingency Table)进行整理,)
2、进行整理,并用并用 2检验或分层检验或分层 2检验进行分析,但存在以下局限性:检验进行分析,但存在以下局限性:无法描述其作用大小和方向,更不能考察各因素间是否无法描述其作用大小和方向,更不能考察各因素间是否有交互作用;有交互作用;当控制的分层因素较多时,将导致检验结果不可靠;当控制的分层因素较多时,将导致检验结果不可靠;2检验无法对连续性自变量进行分析检验无法对连续性自变量进行分析(致命缺陷)(致命缺陷)。模型简介模型简介重庆交通大学管理学院2022年11月27日星期日17:54:23logistic回归模型适合于应变量为二项分类的资料,回归模型适合于应变量为二项分类的资料,在医学研究领域中的
3、应用广泛。如流行病病因学研在医学研究领域中的应用广泛。如流行病病因学研究(包括队列研究、病例对照研究、横断面研究究(包括队列研究、病例对照研究、横断面研究等)、临床疗效研究(如疗效与治疗方法、患病轻等)、临床疗效研究(如疗效与治疗方法、患病轻中重等因素关系)、卫生服务研究(如是否就诊与中重等因素关系)、卫生服务研究(如是否就诊与性别、年龄、文化程度的关系)等等。性别、年龄、文化程度的关系)等等。模型简介模型简介重庆交通大学管理学院2022年11月27日星期日17:54:23011log()ppit PXX011011exp()1exp()ppppXXPXX011111exp()ppPXX模型简
4、介模型简介v logistic回归模型:回归模型:重庆交通大学管理学院2022年11月27日星期日17:54:24 反应变量为二分类变量或某事件的发生率;反应变量为二分类变量或某事件的发生率;自变量与自变量与logit(P)之间为线性关系;)之间为线性关系;残差合计为残差合计为0,且服从二项分布;,且服从二项分布;各观测间相互独立。各观测间相互独立。模型简介模型简介适用条件适用条件v logistic logistic回归模型应该使用最大似然法来解决方程的回归模型应该使用最大似然法来解决方程的估计和检验问题,不应当使用以前的最小二乘法进行参数估计和检验问题,不应当使用以前的最小二乘法进行参数估
5、计。估计。重庆交通大学管理学院2022年11月27日星期日17:54:24例例1 某医师希望研究病人的年龄某医师希望研究病人的年龄age、性别、性别sex(0为女性、为女性、1为男性)、心电图检验是否异常为男性)、心电图检验是否异常ecg(ST段压低、段压低、0为正常、为正常、1为轻度异常、为轻度异常、2为为重度异常)与冠心病重度异常)与冠心病ca是否有关,数据见是否有关,数据见logistic_binary.sav。简单分析实例简单分析实例重庆交通大学管理学院2022年11月27日星期日17:54:24简单分析实例简单分析实例重庆交通大学管理学院2022年11月27日星期日17:54:24选
6、入应变量选入应变量选入自选入自变量变量简单分析实例简单分析实例重庆交通大学管理学院2022年11月27日星期日17:54:24Dependent Variable Encoding01Original Value未患病患病Internal Value简单分析实例简单分析实例结果分析结果分析v 此表为应变量取值水平编码,此表为应变量取值水平编码,SPSSSPSS默认取值水平默认取值水平高的为阳性结果。高的为阳性结果。重庆交通大学管理学院2022年11月27日星期日17:54:24简单分析实例简单分析实例结果分析结果分析v 本表输出当前模型的本表输出当前模型的-2log-2log(似然值)和两个伪
7、决(似然值)和两个伪决定系数,但对于定系数,但对于logisticlogistic回归而言,通常看见的伪决回归而言,通常看见的伪决定系数不像线性回归模型中的决定系数那么大。定系数不像线性回归模型中的决定系数那么大。Model Summary86.811a.237.316Step1-2 Log likelihoodCox&Snell R SquareNagelkerke R SquareEstimation terminated at iteration number 5 because parameter estimateschanged by less than.001.a.重庆交通大学管理
8、学院2022年11月27日星期日17:54:24Variables in the Equation1.356.5466.1621.0133.882.873.3845.1621.0232.395.093.0357.0001.0081.097-5.6421.8069.7571.002.004sexecgageConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s)entered on step 1:sex,ecg,age.a.简单分析实例简单分析实例结果分析结果分析v 此表输出模型中的各自变量的偏回归系数及其标准此表输出模型中的各自变量的偏回归系数及其标准误、误
9、、Wald Wald 2 2、自由度、自由度、P P 值、值、OROR值(即值(即expexp(B B)。)。重庆交通大学管理学院2022年11月27日星期日17:54:24哑变量设置哑变量设置在回归模型中,回归系数在回归模型中,回归系数b b表示其他自变量不变,表示其他自变量不变,x x每改变一个单位时,所预测的每改变一个单位时,所预测的y y的平均变化量,当的平均变化量,当x x为连续性变量时,这样解释没有问题,二分类变量为连续性变量时,这样解释没有问题,二分类变量由于只存在两个类别间的比较,也可以对系数得到由于只存在两个类别间的比较,也可以对系数得到很好的解释。但是当很好的解释。但是当x
10、 x为多分类变量时,仅拟合一为多分类变量时,仅拟合一个回归系数就不太合适了,此时需要使用个回归系数就不太合适了,此时需要使用哑变量哑变量(dummy variabledummy variable)方式对模型进行定义。)方式对模型进行定义。重庆交通大学管理学院2022年11月27日星期日17:54:24例例2 Hosmer 和和Lemeshow于于1989年研究了低出生体年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿(变量名为重儿(变量名为LOW,1表示低出生体重儿,表示低出生体重儿,0表示表示非低出生体重儿),考虑的自变量有产妇妊娠
11、前体非低出生体重儿),考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(数据文件见:患高血压等。(数据文件见:logistic_step.sav。)。)哑变量设置哑变量设置重庆交通大学管理学院2022年11月27日星期日17:54:24哑变量设置哑变量设置重庆交通大学管理学院2022年11月27日星期日17:54:24哑变量设置哑变量设置重庆交通大学管理学院2022年11月27日星期日17:54:24选入无序多选入无序多分类变量分类变量设置参照水设置参照水平平哑变量设置哑变量设置重庆交通大学管理学院2022年11月2
12、7日星期日17:54:24Categorical Variables Codings961.000.00026.0001.00067.000.000白人黑人其他种族种族Frequency(1)(2)Parameter coding哑变量设置哑变量设置结果分析结果分析v 哑变量(种族)的设置情况哑变量(种族)的设置情况重庆交通大学管理学院2022年11月27日星期日17:54:24Variables in the Equation-.025.037.4831.487.975-.014.0074.0901.043.9867.1462.028-.908.4374.3261.038.403.329.5
13、34.3801.5371.390.927.3995.4141.0202.528.552.3452.5621.1091.7361.763.6896.5411.0115.831.649.4681.9251.1651.913.032.171.0351.8511.0331.1431.0871.1041.2933.135agelwtracerace(1)race(2)smokeptlhtuiftvConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s)entered on step 1:age,lwt,race,smoke,ptl,ht,ui,ftv.a.哑变量设置哑
14、变量设置v 白人低出生体重的风险较低,而黑人风险较高。白人低出生体重的风险较低,而黑人风险较高。结果分析结果分析重庆交通大学管理学院2022年11月27日星期日17:54:24 参照水平最好要有实际意义,不推荐使用其他作为参照;参照水平最好要有实际意义,不推荐使用其他作为参照;参照水平组要有一定的频数作保证,应不少于参照水平组要有一定的频数作保证,应不少于30或或50例;例;对有序自变量的分析:对有序自变量的分析:从专业出发确定;从专业出发确定;分别以哑变量和连续性变量的方式引入模型进行比较分别以哑变量和连续性变量的方式引入模型进行比较后确定。后确定。哑变量设置哑变量设置v 哑变量设置应该注意
15、的问题哑变量设置应该注意的问题重庆交通大学管理学院2022年11月27日星期日17:54:24 Forward:Conditional (最可靠)(最可靠)Forward:LR Forward:Wald (应当慎用)(应当慎用)Backward:Conditional(最可靠)(最可靠)Backward:LR Backward:Wald(应当慎用)(应当慎用)v 6 6 种筛选自变量的方法种筛选自变量的方法逐步回归逐步回归重庆交通大学管理学院2022年11月27日星期日17:54:24例例3 仍以例仍以例2的数据的数据为例,演示如何在为例,演示如何在SPSS中实现逐步中实现逐步logistic
16、回归分析。回归分析。逐步回归逐步回归重庆交通大学管理学院2022年11月27日星期日17:54:24选择其中一选择其中一种逐步法种逐步法逐步回归逐步回归重庆交通大学管理学院2022年11月27日星期日17:54:25Model Summary227.893a.035.050223.583b.057.080217.220b.088.124Step123-2 Log likelihoodCox&Snell R SquareNagelkerke R SquareEstimation terminated at iteration number 3 because parameter estimate
17、schanged by less than.001.a.Estimation terminated at iteration number 4 because parameter estimateschanged by less than.001.b.逐步回归逐步回归v 给出了模型拟合过程中每一步的给出了模型拟合过程中每一步的-2log-2log(L L)及)及两个伪决定系数。两个伪决定系数。结果分析结果分析重庆交通大学管理学院2022年11月27日星期日17:54:25Variables in the Equation.802.3176.3911.0112.230-.964.17530.37
18、01.000.381.823.3186.6831.0102.2771.272.6164.2701.0393.569-1.062.18433.2241.000.346-.015.0075.5841.018.985.728.3274.9611.0262.0711.789.6946.6391.0105.986.893.8291.1581.2822.441ptlConstantStep1aptlhtConstantStep2blwtptlhtConstantStep3cBS.E.WalddfSig.Exp(B)Variable(s)entered on step 1:ptl.a.Variable(s)
19、entered on step 2:ht.b.Variable(s)entered on step 3:lwt.c.逐步回归逐步回归结果分析结果分析重庆交通大学管理学院2022年11月27日星期日17:54:25Variables not in the Equation3.1491.0763.3401.0685.3592.0695.0281.0252.0561.1523.1641.0754.7221.0302.1621.141.7531.38522.8588.004agelwtracerace(1)race(2)smokehtuiftvVariablesOverall StatisticsSt
20、ep1ScoredfSig.逐步回归逐步回归结果分析结果分析v 输出了尚不在模型中的自变量是否能被引入的输出了尚不在模型中的自变量是否能被引入的ScoreScore检验结果,这里只给出第一步的结果。检验结果,这里只给出第一步的结果。重庆交通大学管理学院2022年11月27日星期日17:54:25对数似然值与伪决定系数对数似然值与伪决定系数模型预测正确率模型预测正确率ROCROC曲线曲线模型拟合效果检验模型拟合效果检验v 拟合效果判断指标:拟合效果判断指标:重庆交通大学管理学院2022年11月27日星期日17:54:25-2 倍对数似然值表示模型的拟合效果,其值越小,越接近于倍对数似然值表示模型
21、的拟合效果,其值越小,越接近于0,说明模型拟合效果越好。,说明模型拟合效果越好。但是,当自变量中存在缺失值时,因为一般统计软件在进行但是,当自变量中存在缺失值时,因为一般统计软件在进行计算时会把含有缺失值的记录予以剔除,不参与统计分析,计算时会把含有缺失值的记录予以剔除,不参与统计分析,此时不能用此时不能用-2log likelihood 对不同模型的拟合效果进行比对不同模型的拟合效果进行比较。较。模型拟合效果检验模型拟合效果检验重庆交通大学管理学院2022年11月27日星期日17:54:25Classification Tablea123794.6471220.371.4Observed正常
22、低出生体重低出生体重儿Overall PercentageStep 3正常低出生体重低出生体重儿PercentageCorrectPredictedThe cut value is.500a.例例3进行逐步回归的第三步(进行逐步回归的第三步(step3)输出以上结果,预测)输出以上结果,预测正确的记录占正确的记录占71.4。模型拟合效果检验模型拟合效果检验重庆交通大学管理学院2022年11月27日星期日17:54:25Save子对话框子对话框模型拟合效果检验模型拟合效果检验v先保存研究对先保存研究对象的预测概率。象的预测概率。重庆交通大学管理学院2022年11月27日星期日17:54:25模型
23、拟合效果检验模型拟合效果检验重庆交通大学管理学院2022年11月27日星期日17:54:25模型拟合效果检验模型拟合效果检验重庆交通大学管理学院2022年11月27日星期日17:54:25模型拟合效果检验模型拟合效果检验v 这就是这就是ROCROC曲线,曲线,预测效果最佳时,曲预测效果最佳时,曲线应该从左下角垂直线应该从左下角垂直上升至顶,然后水平上升至顶,然后水平向右延伸到右上角。向右延伸到右上角。结果分析结果分析重庆交通大学管理学院2022年11月27日星期日17:54:25Area Under the CurveTest Result Variable(s):Predicted prob
24、ability.708.043.000.624.792AreaStd.ErroraAsymptotic Sig.bLower BoundUpper BoundAsymptotic 95%Confidence IntervalThe test result variable(s):Predicted probability has at least one tie between the positiveactual state group and the negative actual state group.Statistics may be biased.Under the nonpara
25、metric assumptiona.Null hypothesis:true area=0.5b.模型拟合效果检验模型拟合效果检验结果分析结果分析v 本表是对本表是对ROCROC曲线下面积计算的结果,可见曲线下面曲线下面积计算的结果,可见曲线下面积为积为0.7080.708,9595可信区间为可信区间为0.6240.624 0.7920.792。重庆交通大学管理学院2022年11月27日星期日17:54:25模型拟合优度检验(模型拟合优度检验(Test of Goodness Fit):):考察当前模型是否可以进一步改善,检验当前模型与饱考察当前模型是否可以进一步改善,检验当前模型与饱和模型
26、的预测效果之差是否有统计学意义。和模型的预测效果之差是否有统计学意义。拟合优度检验拟合优度检验重庆交通大学管理学院2022年11月27日星期日17:54:25 Pearson 和和Deviance 拟合优度检验:拟合优度检验:当自变量很多,或包含连续性自变量时,不可以用这两种方法。当自变量很多,或包含连续性自变量时,不可以用这两种方法。似然比检验:似然比检验:主要用于考察饱和模型是否可以进一步简化。主要用于考察饱和模型是否可以进一步简化。HosmerLemeshow检验检验:通常用于自变量很多,或包含连续性自变量的情况。通常用于自变量很多,或包含连续性自变量的情况。拟合优度检验拟合优度检验v
27、模型拟合优度检验的常用方法:模型拟合优度检验的常用方法:重庆交通大学管理学院2022年11月27日星期日17:54:25点击主对话框中的点击主对话框中的options按钮,出现如下所示的对话框:按钮,出现如下所示的对话框:拟合优度检验拟合优度检验重庆交通大学管理学院2022年11月27日星期日17:54:25Hosmer and Lemeshow Test9.9798.266Step3Chi-squaredfSig.Contingency Table for Hosmer and Lemeshow Test1616.69732.303191515.30343.697191817.46155.5
28、39231613.21524.785181513.70845.292191512.68335.317181112.31075.690181112.27986.72119610.531138.4691975.8121011.1881712345678910Step3ObservedExpected低出生体重儿=正常ObservedExpected低出生体重儿=低出生体重Total拟合优度检验拟合优度检验结果分析结果分析重庆交通大学管理学院2022年11月27日星期日17:54:25用用save子对子对话框可以保存各话框可以保存各种残差;种残差;如果残差的绝如果残差的绝对值大于对值大于2,提,提示
29、该记录可能是示该记录可能是异常点。异常点。Save子对话框子对话框模型的诊断与修正模型的诊断与修正v 残差分析残差分析重庆交通大学管理学院2022年11月27日星期日17:54:25多重共线性的对偏回归系数的影响与线性回归模型中的表现多重共线性的对偏回归系数的影响与线性回归模型中的表现一致,如增加或删除一条记录,模型中偏回归系数值发生较一致,如增加或删除一条记录,模型中偏回归系数值发生较大变化,专业上认为有意义的因素无统计学意义等等。大变化,专业上认为有意义的因素无统计学意义等等。如果在进行如果在进行logisticlogistic模型分析中,尤其是在向模型中引入交模型分析中,尤其是在向模型中
30、引入交互作用项时出现了回归结果反常现象,则自变量之间的多重互作用项时出现了回归结果反常现象,则自变量之间的多重共线性是需要排除的一种可能。共线性是需要排除的一种可能。模型的诊断与修正模型的诊断与修正v 多重共线性的识别:多重共线性的识别:重庆交通大学管理学院2022年11月27日星期日17:54:25目前目前SPSSSPSS的的logisticlogistic过程中尚没有关于多重共线性过程中尚没有关于多重共线性诊断的结果输出,代替方法之一是运用相同的反应诊断的结果输出,代替方法之一是运用相同的反应变量与自变量,拟合线性回归模型,并进行相应的变量与自变量,拟合线性回归模型,并进行相应的共线性诊断
31、。共线性诊断。模型的诊断与修正模型的诊断与修正v 多重共线性的识别:多重共线性的识别:重庆交通大学管理学院2022年11月27日星期日17:54:25匹配设计匹配设计(matched design)是在设计阶段控制混杂因素的)是在设计阶段控制混杂因素的一种方法。当得到一名研究病例后,选择一名或多名非病例一种方法。当得到一名研究病例后,选择一名或多名非病例作为对照,选择相应对照的条件是:某些需要控制的混杂因作为对照,选择相应对照的条件是:某些需要控制的混杂因素与该病例之间相同或相似,从而形成一个匹配的对子。一素与该病例之间相同或相似,从而形成一个匹配的对子。一个匹配的对子可以只有个匹配的对子可以
32、只有 1个病例和个病例和1个对照,称个对照,称1:1匹配;匹配;当病例很罕见时,常采用当病例很罕见时,常采用 1个病例,多个对照,此时称为个病例,多个对照,此时称为1:m匹配,常用的匹配,常用的 m一般小于等于一般小于等于4,不同的对子,不同的对子,m可以不同;可以不同;还可设计还可设计m:n匹配,即不同对子的病例与对照个数均可不同,匹配,即不同对子的病例与对照个数均可不同,这样的设计增加了收集资料的灵活性。这样的设计增加了收集资料的灵活性。条件条件logistic回归回归简介简介重庆交通大学管理学院2022年11月27日星期日17:54:25对于这类匹配设计资料,如果采用以上介绍的非条件对于
33、这类匹配设计资料,如果采用以上介绍的非条件 logisticlogistic回归方法,将会降低检验效能。而应当采用回归方法,将会降低检验效能。而应当采用条件条件logisticlogistic回归模型回归模型(conditional logistic conditional logistic regression modelregression model)又称配对又称配对logisticlogistic回归模型进行回归模型进行分析。分析。条件条件logistic回归回归简介简介重庆交通大学管理学院2022年11月27日星期日17:54:25 用变量差值拟合:用变量差值拟合:只适用于只适用于1
34、:1配对的情况,用配对的情况,用Multinomial logistic 过程实现;过程实现;用分层用分层Cox模型拟合:适用范围非常广。模型拟合:适用范围非常广。条件条件logistic回归回归v SPSS SPSS中的拟合方法:中的拟合方法:重庆交通大学管理学院2022年11月27日星期日17:54:25例例4 Mack等人预考察服用雌激素与患子宫内膜癌的关等人预考察服用雌激素与患子宫内膜癌的关系,对退休居住在社区的妇女进行病例对照研究。除服系,对退休居住在社区的妇女进行病例对照研究。除服用雌激素以外,研究的自变量还包括肥胖、胆囊病史、用雌激素以外,研究的自变量还包括肥胖、胆囊病史、服用其
35、他非雌激素药物。数据见服用其他非雌激素药物。数据见1_1_logistic.sav。条件条件logistic回归回归实例分析实例分析重庆交通大学管理学院2022年11月27日星期日17:54:25compute case=case1-pute age=age1-pute est=est1-pute gall=gall1-pute nonest=nonest1-nonest2.execute.由于本例是由于本例是1:1配对,可以使用变量差值方式加以拟合。配对,可以使用变量差值方式加以拟合。首先运用首先运用compute过程产生配对过程产生配对logistic回归的分析变量,回归的分析变量,或用以
36、下程序予以实现:或用以下程序予以实现:条件条件logistic回归回归实例分析实例分析重庆交通大学管理学院2022年11月27日星期日17:54:25条件条件logistic回归回归实例分析实例分析重庆交通大学管理学院2022年11月27日星期日17:54:25条件条件logistic回归回归实例分析实例分析v 把自变量全部把自变量全部选入选入CovariateCovariate框,框,不能选入不能选入factorfactor框!框!重庆交通大学管理学院2022年11月27日星期日17:54:25默认情况下该复默认情况下该复选框选中,应该选框选中,应该去除该复选框去除该复选框条件条件logis
37、tic回归回归实例分析实例分析重庆交通大学管理学院2022年11月27日星期日17:54:25WarningsThe dependent variable has only one valid value.A conditional logistic regressionmodel will be fitted.条件条件logistic回归回归结果分析结果分析v 这是系统给出的警告,说明由于反应变量只有一这是系统给出的警告,说明由于反应变量只有一个水平,因此个水平,因此SPSSSPSS将拟合条件将拟合条件logisticlogistic回归模型。回归模型。重庆交通大学管理学院2022年11月2
38、7日星期日17:54:25Model Fitting Information87.33753.17834.1594.000ModelNullFinal-2 Log LikelihoodModel Fitting CriteriaChi-SquaredfSig.Likelihood Ratio Tests结果分析结果分析条件条件logistic回归回归v 对模型中所有对模型中所有偏回归系数是否均为偏回归系数是否均为0进行似然比进行似然比检验,结果说明他们不全为检验,结果说明他们不全为0。重庆交通大学管理学院2022年11月27日星期日17:54:25Pseudo R-Square.419.558
39、.391Cox and SnellNagelkerkeMcFadden结果分析结果分析条件条件logistic回归回归v 输出了输出了三种三种伪决定系数,本伪决定系数,本例的伪决定系数例的伪决定系数还比较大。还比较大。重庆交通大学管理学院2022年11月27日星期日17:54:25Likelihood Ratio Tests53.658.4801.48872.01318.8361.00058.7705.5921.01853.279.1021.750Effectageestgallnonest-2 Log Likelihood ofReduced ModelModel Fitting Crite
40、riaChi-SquaredfSig.Likelihood Ratio TestsThe chi-square statistic is the difference in-2 log-likelihoods between the finalmodel and a reduced model.The reduced model is formed by omitting an effectfrom the final model.The null hypothesis is that all parameters of that effect are 0.结果分析结果分析条件条件logist
41、ic回归回归v 输出从模型中分别剔除每一自变量后拟合新的条件输出从模型中分别剔除每一自变量后拟合新的条件logisticlogistic回归回归模型的模型的-2-2倍似然对数值,用于考察是否可以从当前模型中剔除该自变倍似然对数值,用于考察是否可以从当前模型中剔除该自变量,提示可以进一步采用逐步回归对当前模型中自变量进行筛选。量,提示可以进一步采用逐步回归对当前模型中自变量进行筛选。重庆交通大学管理学院2022年11月27日星期日17:54:25Parameter Estimates.277.403.4731.4911.320.5992.9082.698.82410.7121.00114.851
42、2.95274.7231.836.9044.1221.0426.2701.06636.893.256.807.1001.7521.291.2656.279ageestgallnonestcase1.00BStd.ErrorWalddfSig.Exp(B)Lower BoundUpper Bound95%Confidence Interval forExp(B)结果分析结果分析条件条件logistic回归回归v 可见,服用雌激素者患子宫内膜癌的概率是未服用雌激可见,服用雌激素者患子宫内膜癌的概率是未服用雌激素者的素者的14.85114.851倍,有胆囊病史者患子宫内膜癌的概率是没有倍,有胆囊病史
43、者患子宫内膜癌的概率是没有胆囊病史者的胆囊病史者的6.2706.270倍,但倍,但P P=0.042=0.042,下结论要小心,可以,下结论要小心,可以扩大样本含量再对这一因素进行研究。扩大样本含量再对这一因素进行研究。重庆交通大学管理学院2022年11月27日星期日17:54:25在在SPSS中用中用Multinomial Logistic 过程处理配对过程处理配对logistic回归模型时,回归模型时,:数据库结构与运用数据库结构与运用Cox过程不同。数据库中每一条记录过程不同。数据库中每一条记录包括一个对子中的两个观察对象。包括一个对子中的两个观察对象。所拟合的模型不能包含常数项!所拟合
44、的模型不能包含常数项!条件条件logistic回归回归重庆交通大学管理学院2022年11月27日星期日17:54:25我们要讨论的是SPSS建立方程检验方程总体和各自变量的统计学意义自变量的筛选Case的剔除(强影响点)共线性诊断重庆交通大学管理学院2022年11月27日星期日17:54:25多元统计方法 线性回归 Logistic 回归v注:完全可以用于单因素分析,从这一点也可以看出统计学的方法是相通的。v SPSS无法进行条件条件Logistic回归回归,就像sas没有专门针对配对资料的语句一样,任何统计软件均有局限性。建立方程的建立方程的计算量很大,计算量很大,一般需软件一般需软件完成。
45、前人完成。前人手工计算这手工计算这两种回归两种回归(借助科学(借助科学计算器),计算器),精神可嘉精神可嘉80 80 年代,一个年代,一个LogisticLogistic回归即使回归即使用计算机,计算的用计算机,计算的时间也以天计。时间也以天计。重庆交通大学管理学院2022年11月27日星期日17:54:25调整或控制 多变量的控制或调整法就是同时记录可能有影响的因素,把他们与可能的危险因素一起作分析 单因素分析有统计学意义,多因素分析没有意义的解释,举例重庆交通大学管理学院2022年11月27日星期日17:54:25 In univariate analysis,the family his
46、tories of SAH and ICH were positively associated with each of the subtypes of stroke.whereas after adjustment for potential risk factors,family history of ICH no longer showed a significant association with haematoma.单因素分析有意义,多因素没有意义的解释重庆交通大学管理学院2022年11月27日星期日17:54:25 Family history of intracerebral
47、 haematoma was not an independent risk factor for haematoma,but it might be a good predictor,which indirectly influences the pathogenesis of intracerebral haematoma via certain hereditary components such as hypertension,and even lifestyle factors such as alcohol consumption.重庆交通大学管理学院2022年11月27日星期日1
48、7:54:25 Is family history an independent risk factor for stroke?J Neurol Neurosurg Psychiatry.1997 Jan;62(1):66-70.重庆交通大学管理学院2022年11月27日星期日17:54:26指标多,难以理解。在计算指标多,难以理解。在计算自动化时代,这是回归的难自动化时代,这是回归的难点,我们不懂如何判断我们点,我们不懂如何判断我们的模型的好坏的模型的好坏重庆交通大学管理学院2022年11月27日星期日17:54:26回归的实际应用 在影响因素分析中 一种是探索模式,在回归模型中探索所有可能
49、的自变量与应变量的关系 一种是控制模式,即控制混杂因素的影响后者对回归模型的要求要小的多,不出现异常情况,可仅对模型拟合稍作考虑。重庆交通大学管理学院2022年11月27日星期日17:54:26SPSS菜单 analyze-regression-linear重庆交通大学管理学院2022年11月27日星期日17:54:26(1 1)自变量为连续型变量)自变量为连续型变量 :必要时作变换:必要时作变换(2 2)自变量为有序变量:依次赋值,如疗效好)自变量为有序变量:依次赋值,如疗效好中差,可分别赋值中差,可分别赋值3 3、2 2、1 1(3 3)自变量为二分类:如令男)自变量为二分类:如令男1 1
50、,女,女0 0(4 4)自变量为名义分类:需要采用哑变量()自变量为名义分类:需要采用哑变量(dummy variablesdummy variables)进行编码进行编码 重庆交通大学管理学院2022年11月27日星期日17:54:26 假如职业分类为工、农、商、学、兵假如职业分类为工、农、商、学、兵5 5类,类,则可定义比分类数少则可定义比分类数少1 1个,即个,即4 4个哑变量。编码方个哑变量。编码方法如下:法如下:重庆交通大学管理学院2022年11月27日星期日17:54:26数据格式重庆交通大学管理学院2022年11月27日星期日17:54:26回归的一些定义 应变量(应变量(dep