1、第三章 混合模型的纵向数据分析线性模型分成数据的混合模型这里这里 是协方差矩阵,即是协方差矩阵,即 的的元素不需要独立元素不需要独立纵向数据(Longitudinal Data)的混合模型 常见的是和时间有关,如 中的元素服从时间序列模型,自回归模型,滑动平均模型等,并有周期。 例如模型 的选取对于AR(1)令 其中 独立。假设 则时间序列平稳且时间序列有单位根即 。AR(1)简介令 和 为给定t-1时刻前的条件期望和方差,则因此AR(1)模型的数值特征均值方差为分布为无条件期望方差定义协方差相关系数 因为自相关系数协方差 d阶自相关系数 d阶自相关系数对于ARMA(1,1)模型 其中一般形式
2、 其中 ARMA(1,1)简介假设其中 , ARMA(1,1) 另一种形式为自协方差函数 其中MA( )方差方差自协方差函数自相关系数第一层模型分层模型第二层模型混合模型截距项组间(时间不变)组内(时变的)交互说明记为其中4个组群,随机部分随机部分方差模型的矩阵形式1这里矩阵形式2矩阵形式3矩阵形式4广义最小二乘(GLS) 极大似然估计,同时估计 , 采用 anova 函数, 其中 为固定效应, 为随机效应,常被低估. 限制的极大似然估计,先估计 然后采用GLS估计 ,采用函数lme, 更精确两种估计算法程序数据集描述(畸齿畸齿矫,orthodontics) Investigators at
3、the University of North Carolina Dental School followed the growth of 27 children (16 males, 11 females) from age 8 until age 14. Every two years they measured the distance between the pituitary(脑垂体,脑下腺) and the pterygomaxillary fissure(翼上颌列)(单位mm), two points that are easily identified on x-ray exp
4、osures of the side of the head. 数据续distance a numeric vector of distances from the pituitary to the pterygomaxillary fissure (mm). These distances are measured on x-ray images of the skull. age a numeric vector of ages of the subject (yr). Subject an ordered factor indicating the subject on which th
5、e measurement was made. The levels are labelled M01 to M16 for the males and F01 to F13 for the females. The ordering is by increasing average distance within sex. Sex a factor with levels Male and Female 文献Pinheiro, J. C. and Bates, D. M. (2000), Mixed-Effects Models in S and S-PLUS, Springer, New
6、York. (Appendix A.17) Potthoff, R. F. and Roy, S. N. (1964), “A generalized multivariate analysis of variance model useful especially for growth curve problems”, Biometrika, 5151, 313326. 数据预处理plot(dd)tab(dd,Sex)fit1-lm(distanceage*Sex,dd)summary(fit)wald(fit,Sex)fit2-lm(distanceage+Sex,dd)summary(f
7、it2)fit3-lm(distanceage/Sex,dd)summary(fit3)混合效应模型fit-lme(distanceage*Sex,dd,random=1+age|Subject,correlation=corAR1(form=1|Subject)summary(fit)intervals(fit)#区间估计getVarCov(fit)#得到G矩阵 去掉Sex主效应fit1-lme(distanceage/Sex,dd,random=1+age|Subject,correlation=corAR1(form=1|Subject)summary(fit1)intervals(fi
8、t1)#区间估计getVarCov(fit1)#G矩阵去掉异常数据fit.dropM09-update(fit,subset=Subject!=M09)summary(fit.dropM09)intervals(fit.dropM09)去掉异常数据2fit1.dropM09-update(fit1,subset=Subject!=M09)summary(fit1.dropM09)intervals(fit1.dropM09)Wald检验L=rbind(Male at 14=c(1,14,0,0),Female at 14=c(1,14,1,14)wald(fit,L)L1=rbind(Male
9、 at 14=c(1,14,0),Female at 14=c(1,14,14)wald(fit1,L1)Wald检验2L.gap-rbind(Gap at 12=c(0,0,1,12)wald(fit,L.gap)wald(fit,Sex)L1.gap-rbind(Gap at 12=c(0,0,12)wald(fit1,L1.gap)wald(fit1,Sex)一些模型总结令X为组内因子(时变),W为组间因子(时间不变)一因子混合模型第一层第二层合并条件方差和无条件方差条件方差无条件方差 的估计, 的加权平均定义估计值为一般结构条件方差估计的期望方差EBLUPs(Empirical Best Linear Unbiased Predictor)最佳线性预测 BLUPEBLUP of OLS 估计方差 分布的均值为0 方差为EBLUP 最佳线形无偏估计(BLUPS)Best linear unbiased predictor estimateOLS HLMBLUPEBLUPEmpirical BLUP (经验最佳线型无偏估计)一些方差结论