1、微生物分子进化及系统发育山西大学山西大学杨晓青杨晓青进化的分子基础进化的分子基础系统发育树系统发育树MEGA介绍介绍建树实例建树实例 构建进化树的意义进化树:用来表示物种之间的进化关系,又称进化树:用来表示物种之间的进化关系,又称“系系统树统树”、“系谱树系谱树”。根据各类生物间的亲缘关系。根据各类生物间的亲缘关系的远近,把各类生物安置在有分枝的树状的图表上的远近,把各类生物安置在有分枝的树状的图表上,简明地表示生物的进化历程和亲缘关系。,简明地表示生物的进化历程和亲缘关系。 意义:研究从单细胞有机体到多细胞有机体的生物意义:研究从单细胞有机体到多细胞有机体的生物进化过程,而且可以粗略估计现存
2、的各类种属生物进化过程,而且可以粗略估计现存的各类种属生物的分歧时间。通过蛋白质的分子进化树分析,为从的分歧时间。通过蛋白质的分子进化树分析,为从分子水平研究物种进化提供了新的手段,可以比较分子水平研究物种进化提供了新的手段,可以比较精确的确定某物种的进化地位。精确的确定某物种的进化地位。 构建构建进化树的基本步骤:进化树的基本步骤:1、核酸序列的获取:数据库查询、测序、核酸序列的获取:数据库查询、测序2、序列比对:、序列比对:BLAST、Clustal X、Clustal W2等。等。3、进化树分析:、进化树分析:MEGA、PAUP4.0 、Phylip 、NETWORK4.11 、Spli
3、tsTree4 、TCS1.8 等。等。参考序列选择注意事项:参考序列选择注意事项:1、不选非培养、不选非培养(unclutured)微生物为参比;微生物为参比;2、不选未定分类地位的微生物,最相近的仅作、不选未定分类地位的微生物,最相近的仅作参考参考;在;在保证同属的前提下,优先选择保证同属的前提下,优先选择16S rDNA全长测序或全基因组测序的种全长测序或全基因组测序的种;每个;每个种属种属选择一个参考序列,如果自己的序列中同一属的选择一个参考序列,如果自己的序列中同一属的较多,可适当选择两个参考序列。较多,可适当选择两个参考序列。3、 使用使用clustalx1.83进行序列比对进行序
4、列比对 MEGA简要介绍 MEGA是有亚利桑那州立大学生命科学是有亚利桑那州立大学生命科学学院的学院的Sudhir Kumar教授主持开发和维护的教授主持开发和维护的一款免费的构建进化树软件。一款免费的构建进化树软件。 主要功能:序列比对、格式转换、数据修主要功能:序列比对、格式转换、数据修订、距离计算、系统树重建和可行度评估等订、距离计算、系统树重建和可行度评估等全套功能,能对全套功能,能对DNA、mRNA 、 氨基酸序氨基酸序列及遗传距离进行系统发生分析。列及遗传距离进行系统发生分析。 MEGA 5.1 主界面 ClustaX主界面 核酸序列的获取 保存文件并命名XXXXAGGCTTAAC
5、ACATGCAAGTCGAGCGGAGCGAGGGTGCTTGCACCTTAGCTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGgi|289469964|gb|GU388381.1| Acinetobacter tandoii strain DSM 14970 16S ribosomal RNA gene, partial
6、sequenceACTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGGATGCTAATACCGCATACGCCCTACGGGGGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGA 合并文件点击File/load sequences,将整理好的*.txt序列文件导入clustalx1.83,如图接着点击Alignment/Do Complet
7、e Aligment程序自动运行,得出结果,自动输出程序自动运行,得出结果,自动输出*.aln 和和* .dnd 为后缀的两个文件,并自动存入你为后缀的两个文件,并自动存入你*.txt文件所在的文件夹内。文件所在的文件夹内。序列比对也可以直接用序列比对也可以直接用MEGA来做。来做。4、运行程序MEGA 5.0,如下图所示: 点击:File导入Clustal程序得到的*.aln文件。再点File/Convert to MEGA Format,打开转换文件对话框,从目的文件夹中选中Clustal 对比分析后所产生的*.aln文件,转换为*.meg文件。转换时一路确认相关界面。最后查看meg序列文
8、件最后是否正常,命名新文件存盘保存*.meg文件,*.meg文件会和aln文件保存在上述*.txt同一个文件夹中。5、 关闭转换窗口,回到主窗口,现在从File中打开刚才保存的*.meg文件。 如果为核酸序列,选择“Nucleotide sequence”,点击“OK”,得到以下图示。 选择默认的Standard,点击OK后,如图所示。点击程序中的 ,可以得到下图在另外一个窗口内,出现以下数据文件点击选择和编辑数据分类图标, 可对所选择的序列进行编辑,完成后点击close即可。序列编辑完成后,可进行保存,点击保存后出现以下界面,点击ok即可。 常用的构树方法常用的构树方法1、邻接法:是居于最小
9、进化原理经常被使用的一种算法、邻接法:是居于最小进化原理经常被使用的一种算法,它不检查素有可能的拓扑结构,同时给出拓扑结构和,它不检查素有可能的拓扑结构,同时给出拓扑结构和分支长度。可以通过确定距离最近的成对分类单位来使分支长度。可以通过确定距离最近的成对分类单位来使系统树的总距离达到最小。优点是重建的树相对准确,系统树的总距离达到最小。优点是重建的树相对准确,假设少,计算速度快,只得一棵树,而缺点是在将序列假设少,计算速度快,只得一棵树,而缺点是在将序列上的所有位点等同对待,且所分析序列的进化距离不能上的所有位点等同对待,且所分析序列的进化距离不能太大。太大。2、最大简约法:是居于形态特征分
10、类的需要发展起来的、最大简约法:是居于形态特征分类的需要发展起来的,优点是该法无需引入处理核苷酸或者氨基酸替代时所,优点是该法无需引入处理核苷酸或者氨基酸替代时所必须的假设,对分析某些特殊的分子数据(如插入序列必须的假设,对分析某些特殊的分子数据(如插入序列和插入和插入/缺失)等特别有用,在分析的序列位点上没有回缺失)等特别有用,在分析的序列位点上没有回复突变或平行突变,并且在被检查的序列位点树很大时复突变或平行突变,并且在被检查的序列位点树很大时,也能获得正确的系统树。,也能获得正确的系统树。3、最大似然法:该法是考虑到每个位点出现残、最大似然法:该法是考虑到每个位点出现残基的似然性,将每个
11、位置所有可能出现的残基替基的似然性,将每个位置所有可能出现的残基替换概率进行累加,产生特定位点的似然性。该法换概率进行累加,产生特定位点的似然性。该法是与进化事实吻合最好的建树算法,其缺点是计是与进化事实吻合最好的建树算法,其缺点是计算强度非常大,耗时。算强度非常大,耗时。4、贝叶斯法:保留了最大似然法的基本原理,、贝叶斯法:保留了最大似然法的基本原理,又引进了马尔科夫链的蒙特卡洛方法,来模拟演又引进了马尔科夫链的蒙特卡洛方法,来模拟演化树的较晚期可能性分布,并使计算时间大大缩化树的较晚期可能性分布,并使计算时间大大缩短。短。(1) phylogenyUPGMA 具体构建过程如下具体构建过程如
12、下参数的设置:点击, 选择该菜单中的Construct/test Neighbor-Joining tree,选择前面转换得到的*meg文件,得到下图对下图的参数进行设置:对下图的参数进行设置:说明:说明:系统进化树的测试方法系统进化树的测试方法Test of Phylogeny,通常要选择,通常要选择Bootstrap method,也可以选择不进行测试;,也可以选择不进行测试;重复次数重复次数No. of bootstrap Replications通常设定至少要大于通常设定至少要大于100比较好,随机数种子可以自己随比较好,随机数种子可以自己随意设定,不会影响计算结果。一般选意设定,不会
13、影响计算结果。一般选择择500或或1000。Model/Method通常选择通常选择Kimura 2-parameter。设定完成,点compute,开始计算得到进化树构建的结果。如下图所示;该窗口中有两个属性页,一个是原始树Original tree,一个是bootstrap验证过的一致树Bootstrap concensus tree。树枝上的数字表示bootstrap验证中该树枝可信度的百分比。得到构建的进化树后可以对该进化树进行优化。(本文参考网友的文章,本文参考网友的文章,同同Mega的其它版本使用的其它版本使用基本相同,在此表示感基本相同,在此表示感谢。以下进化树的优化谢。以下进化
14、树的优化部分直接引用部分直接引用)(1)利用该软件可得到不同树型,如下图所示: 除此之外,还可以有多种树型,根据需要来选择。除此之外,还可以有多种树型,根据需要来选择。 )显示建树的相关信息:点击图标i。)点击优化图标,可进行各项优化: Tree栏中,可以进行树型选择:rectangular tree/circle tree/radiation tree。每种树都可以进行长度,宽度或角度等的设定 Branch:可对树枝上的信息进行修改。 Lable:可对树枝的名字进行修改。 Scale:标尺设置 Cutoff:cut off for consensus tree。一般为50%。 9、进化树的分
15、类优化 Place root on branch:可以来回转换。 Flip subtree:180度翻转分枝,名字翻转度翻转分枝,名字翻转180度。度。 Swab subtree:交换分枝,名字不翻转。:交换分枝,名字不翻转。 Compress/expand subtree与与Set divergent time:可以把同一分枝的基因压缩或扩展。:可以把同一分枝的基因压缩或扩展。 所得到的结果,可以在压缩和扩展之间转换。10. 调整进化树调整进化树 根据所的进化树的效果,要进行调整,包括根据所的进化树的效果,要进行调整,包括多余序列删除、不足序列添加、种属名称标注多余序列删除、不足序列添加、种属名称标注等等,还要根据投稿杂志要求在等等,还要根据投稿杂志要求在PHOTOSHOP中修改等。完成后的进化树应包含充足的信息中修改等。完成后的进化树应包含充足的信息。