Logistic-回归模型-课件.ppt

上传人(卖家):ziliao2023 文档编号:5961676 上传时间:2023-05-19 格式:PPT 页数:81 大小:406.50KB
下载 相关 举报
Logistic-回归模型-课件.ppt_第1页
第1页 / 共81页
Logistic-回归模型-课件.ppt_第2页
第2页 / 共81页
Logistic-回归模型-课件.ppt_第3页
第3页 / 共81页
Logistic-回归模型-课件.ppt_第4页
第4页 / 共81页
Logistic-回归模型-课件.ppt_第5页
第5页 / 共81页
点击查看更多>>
资源描述

1、ppt课件1Logistic 回归模型回归模型赵耐青赵耐青复旦大学公共卫生学院复旦大学公共卫生学院ppt课件2数据分析的背景数据分析的背景 计量资料单因素统计分析计量资料单因素统计分析对于两组计量资料的比较,一般采用对于两组计量资料的比较,一般采用t检检验或秩和检验。验或秩和检验。对于两个变量的相关分析采用对于两个变量的相关分析采用Pearson相关分析或相关分析或Spearman相关分析相关分析 考虑多因素的影响,对于应变量考虑多因素的影响,对于应变量(反应变反应变量量)为计量资料,一般可以考虑应用多重为计量资料,一般可以考虑应用多重线性回归模型进行多因素分析。线性回归模型进行多因素分析。p

2、pt课件3数据分析的背景数据分析的背景 单因素的分类资料统计分析,一般采用单因素的分类资料统计分析,一般采用Pearson 2进行统计检验,用进行统计检验,用Odds Ratio及其及其95%可信区间评价关联程度。可信区间评价关联程度。考虑多因素的影响,对于反应变量为分考虑多因素的影响,对于反应变量为分类变量时,用线性回归模型类变量时,用线性回归模型P=a+bx就不就不合适了,应选用合适了,应选用Logistic回归模型进行统回归模型进行统计分析。计分析。ppt课件4Logistic回归模型回归模型 按研究设计分类按研究设计分类非配对设计:非条件非配对设计:非条件Logistic回归模型回归模

3、型配对的病例对照:条件配对的病例对照:条件Logistic回归模型回归模型 按反应变量分类按反应变量分类二分类二分类Logistic回归模型回归模型(常用常用)多分类无序多分类无序Logistic回归模型回归模型多分类有序多分类有序Logistic回归模型回归模型ppt课件5基础知识基础知识 通过下例引入和复习相关概念通过下例引入和复习相关概念 例如:研究患某疾病与饮酒的关联性例如:研究患某疾病与饮酒的关联性 患病率患病率 P1=a/m1 P2=b/m2 饮饮酒酒(X=1)不不饮饮酒酒(X=0)合合计计 患患病病(y=1)a b n1 未未患患病病(y=0)c d n2 合合计计 m1 m2

4、N ppt课件6基础知识基础知识 Odds(优势)(优势)(1)111111PPOddsPPP 1POddsPP越大越大,则则Odds越大;越大;P越小越小,则则Odds越小越小 并且并且 0Odds+ppt课件7基础知识基础知识 P与与Odds一一对应一一对应 对于两个对于两个Odds的比较,一般用它们的的比较,一般用它们的Ratio,并称为并称为Odds Ratio(OR),其定义,其定义如下:如下:其样本估计统计量为其样本估计统计量为1OddsPOdds12OddsOROddsadORbcppt课件8基础知识基础知识 故比较两个率故比较两个率 比较比较OR=1?OR1?OR1?12121

5、PPOddsOddsOR12121PPOddsOddsORppt课件9(二分类二分类)Logistic回归模型回归模型 因为因为0Odds+所以所以 -ln(Odds)|z|x.4117232.1780719 2.31 0.021 _cons-7.962891.1162679-68.49 0.000 2.31()bzse bppt课件18Logistic模型的单个回归系数检验模型的单个回归系数检验 关键是如果关键是如果 0,意味自变量,意味自变量X与与Y无关联无关联性。性。由于由于 的估计存在抽样误差,即使的估计存在抽样误差,即使=0,其估计值其估计值b一般不为一般不为0,故,故需检验需检验

6、0?H0:0 H1:0 0.05 检验统计量检验统计量 可以证明:可以证明:H0:0 为真时,为真时,z近似服从标近似服从标准正态分布,即:准正态分布,即:|z|1.96,P0.05,拒绝拒绝H0()bzse bppt课件19实例实例1:用用Logistic模型进行统计分析模型进行统计分析 实例实例1的回归系数估计为的回归系数估计为 se(b)=0.1780719,z=b/se=2.31,P=0.021 则拒绝则拒绝H0。如果对模型中所有的自变量进行检验,如果对模型中所有的自变量进行检验,则称为模型检验。如实例则称为模型检验。如实例2,对两个自变,对两个自变量进行检验,故这是模型检验。量进行检

7、验,故这是模型检验。20.05,dfppt课件26实例实例2应用应用Logistic模型模型校正混杂作用校正混杂作用 应用应用Stata软件进行最大似然估计,得到软件进行最大似然估计,得到模型拟合的主要结果如下模型拟合的主要结果如下 似然函数比为似然函数比为2ln(L)76.32,df=2,P0.001,因此拒绝,因此拒绝H0:1=2=0,可以,可以认为认为 1和和 2不全为不全为0。ppt课件27实例实例2应用应用Logistic模型模型校正混杂作用校正混杂作用 应用应用Stata软件进行最大似然估计,得到软件进行最大似然估计,得到回归系数估计的主要结果如下回归系数估计的主要结果如下 饮酒饮

8、酒:-0.000021 0.999979OReppt课件28多自变量多自变量Logistic模型的模型的OR解释解释 在本例中,对于同为吸烟或不吸烟的对象在本例中,对于同为吸烟或不吸烟的对象而言而言(x2相对固定不变相对固定不变),饮酒饮酒(x1=1)的对数的对数Odds为为 不饮酒不饮酒(x1=0)的对数的对数Odds为为1 10122()xLog Oddsx1 0022()xLog Oddsxppt课件29多自变量多自变量Logistic模型的模型的OR解释解释 则饮酒的对数则饮酒的对数Odds Ratio为为 即:饮酒的即:饮酒的 意义:对于同为吸烟的对象或者同意义:对于同为吸烟的对象或

9、者同为不吸烟的对象,其饮酒的为不吸烟的对象,其饮酒的 故称校正吸烟后故称校正吸烟后OR,而前者未考虑,而前者未考虑吸烟的单因素吸烟的单因素OR称为称为crude OR1 11 01ln()()()xxORLog OddsLog Odds1ORe1OReppt课件30实例实例2应用应用Logistic模型模型校正混杂作用校正混杂作用 饮酒饮酒:P=1 校正了吸烟因素的情况下,没有足够的校正了吸烟因素的情况下,没有足够的证据推断饮酒与证据推断饮酒与AMI患病有关联性。患病有关联性。吸烟:吸烟:P1OReppt课件31Logistic模型中的交互作用模型中的交互作用 实例实例3:采用病例对照设计研究

10、吸烟和家:采用病例对照设计研究吸烟和家属史与患肺癌的关联性。属史与患肺癌的关联性。用用x1=1,0分别表示吸烟和不吸烟;分别表示吸烟和不吸烟;x2=1,0分别表示有无家属史;用分别表示有无家属史;用y=1,0分别表示分别表示患肺癌和未患肺癌。患肺癌和未患肺癌。有有家家属属史史 无无家家属属史史 患患肺肺癌癌 未未患患肺肺癌癌 患患肺肺癌癌 未未患患肺肺癌癌 吸吸烟烟 200 50 80 6 不不吸吸烟烟 300 450 270 310 合合计计 500 500 350 316 ppt课件32实例实例3:Logistic模型的交互作用模型的交互作用 一般而言,吸烟和家属史均是肺癌的重要一般而言,

11、吸烟和家属史均是肺癌的重要相关因素,很有可能这两个因素对患肺癌相关因素,很有可能这两个因素对患肺癌有交互作用,因此采用下列含有交互作用有交互作用,因此采用下列含有交互作用项的项的Logistic模型。模型。其中其中x1和和x2的乘积项的乘积项x1x2称为交互作用项称为交互作用项01 1223 1 2()Logit Pxxx xppt课件33应用应用Logistic模型分析实例模型分析实例3 用用Stata软件对实例软件对实例3的资料拟合上述模型,得的资料拟合上述模型,得到下列结果:到下列结果:3=0.955825,P0.04,差别有统计学意义,差别有统计学意义,可以认为吸烟和家属史对患肺癌有交

12、互作用。可以认为吸烟和家属史对患肺癌有交互作用。变变量量 回回归归系系数数.P 95%Conf.Interval x1 1.791759 0.000 1.449155 2.134364 x2.2481449 0.026 0.029683 0.4666067 x12.955828 0.040 0.0436748 1.867981 _cons-.4054651 0.000-0.5515522 -0.259378 ppt课件34实例实例3:Logistic模型的交互作用模型的交互作用 由于本例模型为由于本例模型为 对于无家属史,对于无家属史,x2=0代入模型,得到代入模型,得到 由回归系数与由回归系

13、数与OR的关系,得到吸烟的:的关系,得到吸烟的:11.791759 6ORee01 1223 1 2()Logit Pxxx x01 1()Logit Px95%CI=(4.3,8.5)P =3.84,故拒绝,故拒绝H0,可,可以认为以认为 1+3 0,差别有统计学意义,可,差别有统计学意义,可以认为吸烟者患肺癌的风险更大。以认为吸烟者患肺癌的风险更大。221313()40.58var()20.05,1ppt课件37实例实例3:Logistic模型的交互作用模型的交互作用 同理,为了评价家属史与肺癌的关联性,同理,为了评价家属史与肺癌的关联性,根据下列根据下列Logistic模型模型 对于不吸

14、烟对于不吸烟x1=0,则上述,则上述Logistic模型为模型为 家属史的家属史的 P=0.认为认为0260.05,两个药的疗效差异无统计学意义。两个药的疗效差异无统计学意义。模型模型 病情重病情重x2=1代入模型,得到代入模型,得到1.2047944 02131()()Logit Px01 12 23 1 2()Logit Pxxx xppt课件45Logistic模型中的交互作用模型中的交互作用 即:病情重时的药物变量即:病情重时的药物变量x1的回归系数为的回归系数为 对于在病情重的情况下,两个药的疗效是否对于在病情重的情况下,两个药的疗效是否有差异需检验有差异需检验 1+3=0,用,用S

15、tata软件计算得:软件计算得:检验统计量检验统计量 242.16,df=1,P0ppt课件46实例实例4小结小结 在病情轻的情况下,两个药的疗效差异在病情轻的情况下,两个药的疗效差异无统计学意义。无统计学意义。在病情重的情况下,可以认为在病情重的情况下,可以认为A药的疗效药的疗效优于优于B药。药。即:不能简单地称即:不能简单地称A药优于药优于B药或两个药药或两个药的疗效差异无统计学意义。的疗效差异无统计学意义。请注意:在有交互作用的模型中,其主请注意:在有交互作用的模型中,其主效应效应(本例本例x1)解释应谨慎。)解释应谨慎。ppt课件47交互作用的小结交互作用的小结1.交互作用的意义就是不

16、同层(某因交互作用的意义就是不同层(某因素的不同水平)另一个研究因素与素的不同水平)另一个研究因素与应变量的之间的关联程度是不同的。应变量的之间的关联程度是不同的。2.在回归分析和方差分析中,在回归分析和方差分析中,经统计经统计检验得到交互作用项有统计学意义检验得到交互作用项有统计学意义只是统计分析的中间结果,只是统计分析的中间结果,不要简不要简单归结为协同作用或拮抗作用,一单归结为协同作用或拮抗作用,一般要做进一步分析般要做进一步分析。ppt课件48交互作用的小结交互作用的小结3.在有交互作用的在有交互作用的Logistic模型中,对交模型中,对交互作用项要根据研究目的进行解释,一互作用项要

17、根据研究目的进行解释,一般应进行分层作简单效应检验,特别很般应进行分层作简单效应检验,特别很可能某个层有统计学意义而另一个层没可能某个层有统计学意义而另一个层没有统计学意义。主效应的解释要特别注有统计学意义。主效应的解释要特别注意,要结合回归模型和变量定义进行谨意,要结合回归模型和变量定义进行谨慎地解释。慎地解释。4.应用交互作用模型可以比较多个应用交互作用模型可以比较多个OR。ppt课件49多分类无序自变量的处理多分类无序自变量的处理 例例5:用横断面调查设计,分析职业与患:用横断面调查设计,分析职业与患糖尿病的关联性。糖尿病的关联性。职业:用职业:用x1=1,2,3分别表示农民,工人和分别

18、表示农民,工人和干部干部(含知识分子含知识分子)。用用x2表示年龄。表示年龄。由于由于x1是分类无序变量,必须用亚元变是分类无序变量,必须用亚元变量表示。量表示。ppt课件50多分类无序自变量的处理多分类无序自变量的处理 职业变量职业变量x1直接引入直接引入Logistic模型是不合适的,模型是不合适的,因为模型中引入因为模型中引入x1后,模型为后,模型为 若若 10,导致,导致x1越大,患病概率相对越大;越大,患病概率相对越大;若若 10.05,即:对于,即:对于职业为工人与农民而言,其与患病之间的职业为工人与农民而言,其与患病之间的关联性无统计学意义。关联性无统计学意义。y 回归系数 P

19、值 95%CI x12.3021807 0.401-0.4034157 1.007777 x13 1.164267 0.003 0.4093795 1.919155 x2.0458908 0.000 0.0236281 0.0681536 _cons-2.449857 0.000-3.557851 -1.341864 ppt课件53多分类无序自变量的处理多分类无序自变量的处理 x13的回归系数P0.0030.05,说明干部与农民的职业与患糖尿病有关联,其 干部与工人比较,用Stata软件检验12=13,P=0.0230.05,差异有统计学意义。X2的回归系数P0.001,说明年龄与患病也有关联

20、,其OR=1.04。1.1642673.20OReppt课件54引用亚元变量应注意的问题引用亚元变量应注意的问题 在在Logistic模型中,二分类变量是不区分有序模型中,二分类变量是不区分有序和无序的,因为回归系数的正负号能处理两和无序的,因为回归系数的正负号能处理两分类变量所对应的概率大小问题。分类变量所对应的概率大小问题。在在Logistic模型中,用亚元处理多分类自变量模型中,用亚元处理多分类自变量时,对同一个因素的一组亚元而言,必须同时,对同一个因素的一组亚元而言,必须同时引入模型或同时不引入模型,不能若干个时引入模型或同时不引入模型,不能若干个亚元在模型中,其它亚元不在模型中,这样

21、亚元在模型中,其它亚元不在模型中,这样会导致模型的参数意义发生改变以致错误解会导致模型的参数意义发生改变以致错误解释参数意义。释参数意义。ppt课件55多分类有序自变量的处理多分类有序自变量的处理 例例6:用横断面调查设计,分析肥胖与患:用横断面调查设计,分析肥胖与患糖尿病的关联性。糖尿病的关联性。职业:用职业:用x1=0,1,2分别表示体重正常,超分别表示体重正常,超重和肥胖。重和肥胖。用用x2表示年龄。表示年龄。x1是有序的分类变量是有序的分类变量(等级变量等级变量)Y=1表示患糖尿病,表示患糖尿病,Y=0表示未患糖尿病。表示未患糖尿病。ppt课件56多分类有序自变量的处理多分类有序自变量

22、的处理 有序分类变量可以直接引入有序分类变量可以直接引入Logistic模型,也模型,也可以按无序分类变量方式采用亚元变量引入可以按无序分类变量方式采用亚元变量引入模型,一般视资料而决定。模型,一般视资料而决定。有序分类变量直接引入模型:有序分类变量直接引入模型:体重正常体重正常x1=0,体重超重体重超重x1=1,体重超重与正常的对数体重超重与正常的对数OR为为01 122ln()()OddsLogit Pxx|0022ln()Oddsx|10122ln()Oddsxppt课件57多分类有序自变量的处理多分类有序自变量的处理 由由 体重正常体重正常x1=0 体重超重体重超重x1=1,体重超重与

23、正常的对数体重超重与正常的对数OR为为 作对数反变换,得到体重超重与正常的作对数反变换,得到体重超重与正常的|0022ln()Oddsx|10122ln()Oddsx|1|01ln()ln()ln()OROddsOdds1ORe01 122ln()Oddsxxppt课件58多分类有序自变量的处理多分类有序自变量的处理 由由 体重超重体重超重x1=1,体重肥胖体重肥胖x1=2,体重肥胖与超重的对数体重肥胖与超重的对数OR为为 作对数反变换,得到体重肥胖与超重的作对数反变换,得到体重肥胖与超重的|10122ln()Oddsx|20122ln()2Oddsx|2|11ln()ln()ln()OROd

24、dsOdds1ORe01 122ln()Oddsxxppt课件59多分类有序自变量的处理多分类有序自变量的处理 由此可见,如果直接将有序多分类变量由此可见,如果直接将有序多分类变量引入模型,就是假定相邻两个等级的总引入模型,就是假定相邻两个等级的总体体OR相同,并且不难验证:体重肥胖与相同,并且不难验证:体重肥胖与体重正常的体重正常的 。综合上述,若满足相邻两个等级的总体综合上述,若满足相邻两个等级的总体OR相同的条件下可以直接将有序多分类相同的条件下可以直接将有序多分类变量引入模型,对于不满足这个条件,变量引入模型,对于不满足这个条件,则应采用亚元变量引入模型。则应采用亚元变量引入模型。12

25、OReppt课件60多分类有序自变量的处理多分类有序自变量的处理 对于多分类有序自变量,可以用似然比检对于多分类有序自变量,可以用似然比检验的方法检验相邻两个等级的总体验的方法检验相邻两个等级的总体OR是是否相同。否相同。在模型在模型1中引入亚元变量,其定义如下中引入亚元变量,其定义如下:体重正常体重正常体重超重体重超重体重肥胖体重肥胖x1012X11010 x12001ppt课件61多分类有序自变量的处理多分类有序自变量的处理 模型模型1 用最大似然法得到的似然函数值为用最大似然法得到的似然函数值为L1 模型模型2:用最大似然法得到的似然函数值为用最大似然法得到的似然函数值为L2 显然两个模

26、型等价意味显然两个模型等价意味 1=11且且2 1=12 似然比检验统计量为似然比检验统计量为2ln(L)=2(ln(L1)-ln(L2)011 1112 1222()Logit Pxxx0122()Logit Pxxppt课件62多分类有序自变量的处理多分类有序自变量的处理 H0:模型:模型1等价于模型等价于模型2 H1:模型:模型1不等价不等价模型模型2 =0.05 H0为真时,为真时,2ln(L)近似服从自由度为近似服从自由度为1(自自变量的分类数变量的分类数2)的的 2分布,即:分布,即:检验统检验统计量计量 ,则拒绝,则拒绝H0,选用引,选用引入亚元的模型入亚元的模型1。20.05,

27、2()dfLn Lppt课件63逐步回归分析逐步回归分析 在多因素统计分析中,多个自变量之间存在多因素统计分析中,多个自变量之间存在相关性,往往相互影响,研究者希望寻在相关性,往往相互影响,研究者希望寻找主要影响应变量找主要影响应变量Y的因素。的因素。理论上,只要把各种因素组合都试一遍,理论上,只要把各种因素组合都试一遍,寻找变量个数最多,每个变量均有统计学寻找变量个数最多,每个变量均有统计学意义,并且模型拟合程度最好的模型,这意义,并且模型拟合程度最好的模型,这种模型称为最佳预测模型,这种方法称为种模型称为最佳预测模型,这种方法称为寻找最优子集,当变量较多时很难实现。寻找最优子集,当变量较多

28、时很难实现。ppt课件64逐步回归逐步回归 为了比较方便地找到最佳预测回归模型,为了比较方便地找到最佳预测回归模型,一般采用逐步回归的分析策略建立拟最一般采用逐步回归的分析策略建立拟最佳预测回归模型。佳预测回归模型。逐步回归采用逐个增加最佳变量的方式逐步回归采用逐个增加最佳变量的方式或逐个减少最差的变量方式找到最佳或或逐个减少最差的变量方式找到最佳或拟最佳回归模型。拟最佳回归模型。ppt课件65逐步回归逐步回归逐步回归有逐步回归有4种方式:种方式:1.前进法前进法:最开始时,模型中无任何自变量,然后逐最开始时,模型中无任何自变量,然后逐个引入变量进入模型,每次在未进入模型个引入变量进入模型,每

29、次在未进入模型的所有变量中挑选一个变量,其的所有变量中挑选一个变量,其P是最小是最小且且P值值,每引入一个变量,重新拟合一,每引入一个变量,重新拟合一次模型,逐步引入变量直至没有满足上述次模型,逐步引入变量直至没有满足上述条件的变量可以引入模型为止。条件的变量可以引入模型为止。ppt课件66逐步回归逐步回归2.后退法:最开始时,把所有的变量引入后退法:最开始时,把所有的变量引入模型,然后逐次把模型,然后逐次把P值最大并且值最大并且P 的的变量剔除出模型,每次只剔除一个变量,变量剔除出模型,每次只剔除一个变量,每次剔除一个变量后重新拟合模型,按每次剔除一个变量后重新拟合模型,按照上述剔除标准继续

30、剔除变量,直至模照上述剔除标准继续剔除变量,直至模型中的所有变量的型中的所有变量的P 为止。为止。ppt课件67逐步回归逐步回归3.前进逐步回归法前进逐步回归法 最开始时,模型中无任何自变量,然后逐最开始时,模型中无任何自变量,然后逐个引入变量进入模型,每次在未进入模型个引入变量进入模型,每次在未进入模型的所有变量中挑选一个变量,其的所有变量中挑选一个变量,其P是最小且是最小且P值值 的变量,若有将其剔出模型,然的变量,若有将其剔出模型,然后重新拟合一次模型,逐步引入变量直至后重新拟合一次模型,逐步引入变量直至没有满足上述条件的变量可以引入模型为没有满足上述条件的变量可以引入模型为止。止。pp

31、t课件68逐步回归逐步回归4.后退逐步回归法后退逐步回归法 最开始时,把所有的变量引入模型,然后逐最开始时,把所有的变量引入模型,然后逐次把次把P值最大并且值最大并且P 的变量剔除出模型,的变量剔除出模型,每次只剔除一个变量,每次剔除一个变量后每次只剔除一个变量,每次剔除一个变量后考察未在模型中的变量中是否存在考察未在模型中的变量中是否存在P 的变的变量,若有重新引入模型,然后量,若有重新引入模型,然后重新拟合模型,重新拟合模型,按照上述剔除标准继续剔除变量,直至模型按照上述剔除标准继续剔除变量,直至模型中的所有变量的中的所有变量的P0.05,故剔除,故剔除X1ppt课件72实例实例6:逐步回

32、归:逐步回归y y 回归系数回归系数 P P 9595 CI CI x2x2 .0513415.0513415 0.0010.001 .0212178.0212178 .0814652.0814652 x3x3 .0804055.0804055 0.3860.386 -.1013013.1013013 .2621124.2621124 x4x4 .9146755.9146755 0.0040.004 .2882838.2882838 1.5410671.541067 x5x5 .8314381.8314381 0.0040.004 .263405.263405 1.3994711.399471

33、 x6x6 .1943919.1943919 0.7180.718 -.8616064.8616064 1.250391.25039 x7x7 -.5055541.5055541 0.3690.369 -1.6082291.608229 .5971208.5971208 _cons_cons -8.546978.546979 9 0.0030.003 -14.2197214.21972 -2.874242.87424 X6的的P值最大并且值最大并且P0.05,故剔除,故剔除X6ppt课件73实例实例6:逐步回归:逐步回归y y 回回归归系系数数 P P 值值 9 95 5%C CI I x x

34、2 2 .0 05 51 13 35 58 82 2 0 0.0 00 01 1 .0 02 21 12 27 74 41 1 .0 08 81 14 44 42 22 2 x x3 3 .0 08 80 00 03 35 57 7 0 0.3 38 87 7 -.1 10 01 14 41 19 9 .2 26 61 14 49 90 05 5 x x4 4 .9 90 04 41 16 61 18 8 0 0.0 00 04 4 .2 28 80 07 74 49 97 7 1 1.5 52 27 75 57 74 4 x x5 5 .8 84 41 11 11 18 83 3 0 0.0

35、 00 04 4 .2 27 75 53 32 22 29 9 1 1.4 40 06 69 91 14 4 x x7 7 -.5 54 40 02 28 88 88 8 0 0.3 33 30 0 -1 1.6 62 26 66 64 43 3 .5 54 46 60 06 65 58 8 _ _c co on ns s -8 8.2 26 65 59 97 73 3 0 0.0 00 03 3 -1 13 3.7 71 11 11 12 2 -2 2.8 82 20 08 82 24 4 X3的的P值最大并且值最大并且P0.05,故剔除,故剔除X3ppt课件74实例实例6:逐步回归:逐步回

36、归y y 回回归归系系数数 P P 值值 9 95 5%C CI I x x2 2 .0 05 50 07 73 32 23 3 0 0.0 00 01 1 .0 02 20 07 72 26 6 .0 08 80 07 73 38 86 6 x x4 4 .8 89 91 13 39 94 43 3 0 0.0 00 05 5 .2 26 69 92 26 66 66 6 1 1.5 51 13 35 52 22 2 x x5 5 .8 82 23 34 44 43 36 6 0 0.0 00 04 4 .2 26 60 05 50 06 67 7 1 1.3 38 86 63 38 8 x

37、 x7 7 -.4 45 57 71 16 66 61 1 0 0.4 40 01 1 -1 1.5 52 24 47 76 68 8 .6 61 10 04 43 35 58 8 _ _c co on ns s -6 6.3 38 80 06 64 49 9 0 0.0 00 00 0 -9 9.6 68 86 62 25 5 -3 3.0 07 75 50 04 48 8 X7的的P值最大并且值最大并且0.05,故剔除,故剔除X7ppt课件75实例实例6:逐步回归:逐步回归y y 回归系数回归系数 P P 95%CI95%CI x2x2 .0492955.0492955 0.0010.00

38、1 .0195836.0195836 .0790075.0790075 x4x4 .9214579.9214579 0.0030.003 .3036946.3036946 1.5392211.539221 x5x5 .8396782.8396782 0.0030.003 .2778044.2778044 1.4015521.401552 _cons_cons -6.9949566.994956 0.0000.000 -9.9975319.997531 -3.9923813.992381 所有变量的所有变量的P值均值均=0.0510 removing x13.p=0.7183=0.0510 re

39、moving x64.p=0.3873=0.0510 removing x35.p=0.4013=0.0510 removing x7ppt课件77实例实例6:逐步回归:逐步回归 得到下列回归系数的估计得到下列回归系数的估计 由上述结果可知与糖尿病患病的主要影响由上述结果可知与糖尿病患病的主要影响因素是年龄因素是年龄x2,家属史,家属史x4和总胆固醇和总胆固醇x5。y y 回回归归系系数数 P P 值值 9 95 5%C CI I x x4 4 .9 92 21 14 45 57 79 9 0 0.0 00 03 3 0 0.3 30 03 36 69 94 46 6 1 1.5 53 39

40、92 22 21 1 x x2 2 .0 04 49 92 29 95 55 5 0 0.0 00 01 1 0 0.0 01 19 95 58 83 36 6 0 0.0 07 79 90 00 07 75 5 x x5 5 .8 83 39 96 67 78 82 2 0 0.0 00 03 3 0 0.2 27 77 78 80 04 44 4 1 1.4 40 01 15 55 52 2 _ _c co on ns s -6 6.9 99 94 49 95 56 6 0 0.0 00 00 0 -9 9.9 99 97 75 53 31 1 -3 3.9 99 92 23 38 81

41、1 ppt课件78逐步回归小结逐步回归小结 逐步回归是寻找主要影响因素的一种回逐步回归是寻找主要影响因素的一种回归策略,又称建立最佳预测模型。归策略,又称建立最佳预测模型。进入回归模型的变量可以推断这些变量进入回归模型的变量可以推断这些变量与应变量与应变量Y有关联,但是没有进入回归模有关联,但是没有进入回归模型的变量不能称这些变量与应变量型的变量不能称这些变量与应变量Y没有没有关联性。关联性。一般设定变量进入模型的一般设定变量进入模型的 0.05,剔除,剔除变量的变量的 0.05。ppt课件79Logistic回归模型小结回归模型小结 对于应变量为二分类,可以用对于应变量为二分类,可以用Log

42、istic回归回归模型进行统计分析。模型进行统计分析。在在Logistic模型中,自变量可以是二分类的,模型中,自变量可以是二分类的,也可以是连续型变量和有序多分类变量,也可以是连续型变量和有序多分类变量,但无序多分类变量应用一组亚元变量取代。但无序多分类变量应用一组亚元变量取代。逐步回归是寻找主要影响因素的回归策略,逐步回归是寻找主要影响因素的回归策略,没有进入模型的变量不能作推断。没有进入模型的变量不能作推断。ppt课件80Logistic回归模型小结回归模型小结 模型中出现有交互作用,不是统计模型中出现有交互作用,不是统计分析的最终结果,只是中间结果,分析的最终结果,只是中间结果,一般要

43、根据研究目的进行简单效应一般要根据研究目的进行简单效应分析。分析。条件条件Logistic模型只适用于配对病例模型只适用于配对病例对照研究,其回归系数解释与非条对照研究,其回归系数解释与非条件的件的Logistic模型相同。模型相同。ppt课件81Logistic回归模型小结回归模型小结 病例对照研究的资料可以用病例对照研究的资料可以用Logistic回归模型回归模型分析暴露因素与应变量之间的关联性,但不分析暴露因素与应变量之间的关联性,但不可以直接应用可以直接应用Logistic模型进行预测或估计患模型进行预测或估计患病率。病率。Logistic回归模型在拟合的过程中经常会提到回归模型在拟合的过程中经常会提到拟合优度拟合优度(goodness of fiting)的问题的问题,拟合优度拟合优度没有统计学意义,只说明当前在模型中的变没有统计学意义,只说明当前在模型中的变量情况下,该模型与最优模型无统计学差异,量情况下,该模型与最优模型无统计学差异,但不能说明模型中再增加变量的情况。但不能说明模型中再增加变量的情况。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(Logistic-回归模型-课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|