1、 回归分析回归分析1Logic回归分析回归分析1以某项社会调查为例以某项社会调查为例1以本论文的研究方法为例以本论文的研究方法为例1一元线性回归一元线性回归多元线性回归多元线性回归非线性回归非线性回归线性回归线性回归回归分析回归分析回归分析回归分析多分类多分类(y(y为多分类变量为多分类变量) )二分类二分类(y(y为二项分类为二项分类) )条件条件logiclogic回归(配对设计)回归(配对设计)非条件非条件logiclogic回归(非配对设计)回归(非配对设计)LogicLogic回归回归无序多分类无序多分类logisticlogistic回归回归有序多分类有序多分类logisticlo
2、gistic回归回归12,mXXX自变量),| 1(21mXXXYPP因变量因变量y=y=1 1 发生发生 0 不发生不发生在在m m个自变量的作用下个自变量的作用下Y=1(Y=1(发生发生) )的概率记作的概率记作: :1P0Logic回归(非条件logic回归)011011exp()1exp()ppppXXpXX011111 exp()pppXXlln= og1itPPPLogicLogic回归(非条件回归(非条件logiclogic回归)回归)二二. .回归模型回归模型01122ln=logit1mmPXXXPP m:, 0, : 0, 0.5, 1PZ01122log ( )mmit
3、pXXX四四 .logistic.logistic函数的图形函数的图形LogicLogic回归(非条件回归(非条件logiclogic回归)回归)1ppodds1100/(1)/(1)PPORPP1111111ppoddsppp 1110010010001/(1)()/(1)log ()log ()()()ppLn ORLnppit pit pxxn 0 0,OR OR 1 1,影响因素的取值越大,事,影响因素的取值越大,事件的发生的概率越大件的发生的概率越大n 0 0,OR OR 1 1,影响因素的取值越大,事,影响因素的取值越大,事件的发生的概率越小件的发生的概率越小1expORP1(y=
4、1/x=1)的概率的概率P0(y=1/x=0)的概率的概率lln= og1itPPPLogicLogic回归(非条件回归(非条件logiclogic回归)回归)六六.logistic.logistic回归模型的参数估计回归模型的参数估计l1.1.最大似然法估计最大似然法估计, ,最大似然法的基本思想是先建立似然函数或对数似然函数,最大似然法的基本思想是先建立似然函数或对数似然函数,似然函数或对数似然函数达到极大时参数的取值,即为参数的最大似然估计值。似然函数或对数似然函数达到极大时参数的取值,即为参数的最大似然估计值。 l 表示第个对象处于事件发生时的概率。概率为表示第个对象处于事件发生时的概
5、率。概率为1 1时,时, , ,概率为概率为0 0时,时,l2.2.优势比估计优势比估计, ,可反映某一因素两个不同水平(可反映某一因素两个不同水平( , , )的优势比。)的优势比。11(1)iinYYiiiLPP1,2,in1lnln(1)ln(1)niiiiiLYPYPiP1iY 0iY 10exp()jjORb cc1c0clnlL2(lnln)plGLL lnpLibbiS/ibiubS多重线性回归模型多重线性回归模型LogicLogic回归模型回归模型概念概念简单线性模型的推广简单线性模型的推广概率型非线性模型概率型非线性模型变量特点变量特点自变量:自变量:2 2个或个或2 2个以
6、上,最好是数值变个以上,最好是数值变量,也可以有序或无序变量量,也可以有序或无序变量因变量:因变量:1 1个,数值变量(正态分布)个,数值变量(正态分布)自变量:自变量:2 2个或个或2 2个以上;数值变量、二分类变个以上;数值变量、二分类变量、有序或无序变量量、有序或无序变量总体回归模型总体回归模型回归系数估计的方法回归系数估计的方法最小二乘法最小二乘法最大似然法最大似然法回归模型系数的检验回归模型系数的检验方差检验、方差检验、t t检验检验似然比检验、似然比检验、WaldWald检验、比分检验检验、比分检验回归模型的拟合度效果评价回归模型的拟合度效果评价关系系数、复相关系数、校正决定系数关
7、系系数、复相关系数、校正决定系数总符合率、总符合率、Homer-femeshowHomer-femeshow拟合优度统计量拟合优度统计量分类分类非条件非条件logiclogic回归、条件回归、条件logiclogic回归回归(因变量)无序多分类资料(因变量)无序多分类资料logiclogic回归回归(因变量)有序多分类资料(因变量)有序多分类资料logiclogic回归回归回归分析提供的结果回归分析提供的结果1.1.建立回归方程建立回归方程, ,筛选自变量的方法筛选自变量的方法.a=?.a=?1.2.1.2.变量赋值表变量赋值表3.3.回归系数表回归系数表4.4.模拟方差分析的结果模拟方差分析
8、的结果5.5.决定系数决定系数, ,调整过后的回归系数调整过后的回归系数6.6.自变量对因变量的相对重要性自变量对因变量的相对重要性7.7.回归过程中发现的问题回归过程中发现的问题, ,解决的办法解决的办法1.1.建立回归方程建立回归方程, ,进行进行logiclogic回归分析回归分析, ,筛选自筛选自变量的方法变量的方法.a=?.a=?2.2.变量赋值表变量赋值表3.3.模型拟合的检验和指标模型拟合的检验和指标4.4.参数估计表参数估计表5.5.结果的解释结果的解释6.6.要比较变量的相对重要性用标化系数要比较变量的相对重要性用标化系数7.7.分析过程中发现的问题和解决的办法分析过程中发现的问题和解决的办法01122mmYXXX01122logit(p)=mmXXX2x1x3x03x13x1x2x3x以某社会调查为例1212exp( 2.6290.1022.224)1 exp( 2.6290.1022.224)xxpxx1x单击此处添加文本单击此处添加文本