1、单核苷酸多态性与疾病关联研究及利用Stata软件进行Meta分析金飞SNP 单核苷酸多态性(single nucleotide polymorphism,SNP)是基因组突变最常见的形式,是指单个碱基(A,T,C,G)的替换。包括转换(同类碱基间的变化,如A/G,C/T)和颠换(不同类型碱基间的变化,如A/C,G/T)。tagSNP 狭义的SNP指次等位基因频率(minor allele frequency,MAF)大于0.01的单碱基突变。广义SNP包含MAF小于0.01的单碱基突变。在NCBI数据库dbSNP中注册的广义SNP超过1300万个。常见SNP(common SNP)指MAF大于
2、0.05的SNP,估计在人类基因组中大于700万个。人类基因组-马赛克样结构 现在,被dbSNP数据库收录的每一个SNP均会被分配给一个不重复的,以rs加上阿拉伯数字组成的号码,如rs2120243。检索SNP最常用的网站是dbSNP数据库:www.ncbi.nlm.nih.gov/projects/SNP和HapMap网站:http:/hapmap.ncbi.nlm.nih.govHapMap计划 由于人类基因组中SNP太多,目前直接测序价格昂贵,尚不可能应用于大规模人群。HapMap计划旨在通过数个人种共数百人的全基因组测序,建立单个SNP和由多个SNP构成的单体型(haplotype)。
3、人类基因组是由一个个相连的马赛克样block组成的,在减数分裂时作为一个整体遗传。Haplotype,即单体型,是一个block中的多个SNP的分型的结合。由于连锁遗传的存在,单体型数目实际类型明显少于理论组合数(2的n次方)。人类基因组的block约1-100kb,亚洲人平均18kb。每个block常见单体型(出现频率大于0.05)一般仅5-6个。单体型由专门软件,多种方法计算得来。标签SNP(tagSNP)是指单体型中可以俘获临近SNP状态的少部分SNP。由于单体型和标签SNP的存在,不需要检测1000多万个SNP,仅需要约50-100万个SNP即可以获得整个基因组的SNP信息,使得全基因
4、组关联研究(genome wide association study,GWAS)成为可能。Haploview软件显示单体型结构 基因多态性(最常见的就是SNP)与疾病的关联研究,通常采用病例-对照研究的方法,检测SNP的状态在两组中是否有差异。经过统计学处理,得到P值,优势比(odds ratio,OR)等信息。下面举例常见的候选基因法进行的SNP关联研究方法(通常位点少,样本数少)。举例病例组病例组331人人对照组对照组324人人AAABBBABAAABBBAB1301465544821017612523380270stata命令:logit a b fw=f;logit,or di ch
5、i2tail(1,22.60)P=1.995e-06 有的研究还进行包括临床资料(性别,年龄,烟酒等)的多元logit回归。需要把每一例的基因型输入(AA,AB,BB可以分别用0,1,2表示)。基因-疾病关联研究的meta分析 简介使用stata 软件进行meta分析的方法 1.文献检索:pubmed,embase,cochrane,中文数据库等。2.文献质量评估:3.得到合格研究,从中提取有用数据,主要是基因型分布情况(AA,AB,BB)。4.检验对照组基因型分布是否符合哈迪-温伯格平衡律(Hardy-Weinberg Equilibrium),(excel表见下页)。5.寻找最适合的遗传模
6、型(OR1,OR2,OR3的相互关系)。6.利用stata软件进行分析。7.对结果进行解释。数据录入excel输入stataMeta分析森林图Odds ratio.1110Study%Weight Odds ratio(95%CI)6.15(1.60,23.68)Au(1999)1.6 1.32(0.61,2.86)Jack(2002)10.0 0.45(0.22,0.93)GUo(2003)20.5 1.13(0.66,1.93)Lou(2003)22.4 3.16(1.40,7.12)Mei(2004)5.9 1.24(0.71,2.16)Fiek(2005)19.5 3.32(1.32,
7、8.37)Dior(2006)5.5 2.83(1.33,6.00)Bob(2008)6.0 1.56(0.72,3.36)Jun(2009)8.6 1.49(1.18,1.88)Overall(95%CI)发表偏倚漏斗图分析Beggs funnel plot with pseudo 95%confidence limits lnors.e.of:lnor0.2.4.6.8-1012累积meta分析odds ratio.1110 Jun Bob Dior Fiek Mei Lou GUo Jack Au敏感性分析 1.07 1.49 1.17 1.90 2.24 Au Jack GUo Lou Mei Fiek Dior Bob Jun Study ommited Meta-analysis fixed-effects estimates(exponential form)Meta回归分析寻找研究异质性来源