生物信息学分子进化分析课件.pptx

上传人(卖家):三亚风情 文档编号:3273122 上传时间:2022-08-15 格式:PPTX 页数:44 大小:2.91MB
下载 相关 举报
生物信息学分子进化分析课件.pptx_第1页
第1页 / 共44页
生物信息学分子进化分析课件.pptx_第2页
第2页 / 共44页
生物信息学分子进化分析课件.pptx_第3页
第3页 / 共44页
生物信息学分子进化分析课件.pptx_第4页
第4页 / 共44页
生物信息学分子进化分析课件.pptx_第5页
第5页 / 共44页
点击查看更多>>
资源描述

1、1859年英国生物学家达尔文发表物种起源,第一次用大量事实和系统的理论论证了生物进化的普遍规律。大规模的测序给进化研究带来了丰富的资源,使进化研究不仅能够基于宏观的表型,更能利用微观的分子结构,进化进入了分子进化阶段!随着基因组数据的不断丰富,比较基因组学也在蓬勃发展。一场进化革命即将序列比对与进化分析1.GAATC2.GAGTT共同的祖先GA(A/G)T(C/T)有根树和无根树 Rooted Unrooted序列A序列B序列C序列D序列D序列B序列A序列C序列D序列B序列A序列C序列D序列B序列A序列C序列D序列B序列A序列C穷举一组序列的进化树序列数目序列数目有根树有根树无根树无根树331

2、4153510515710395954152134580467678757905853580625序列D序列B序列A序列C序列D序列C序列A序列B序列B序列D序列A序列C进化分析的步骤相似性分析多重比对确定待分析的近似序列最大简约法最大近似法距离法高度相似中度相似低度相似验证进化预测与原始数据的匹配程度最大简约法Taxa1234123456789AAGAGTGCAAGCCGTGCGAGATATCCAAGAGATCCG列出所有的无根树序列4序列2序列1序列3序列4序列3序列1序列2序列3序列4序列1序列2区分有义列和无义列甲树丙树乙树最大简约法Taxa1234123456789AAGAGTGCA

3、AGCCGTGCGAGATATCCAAGAGATCCG对位点5的分析A 序列4序列2 G序列1 GA 序列3A 序列4序列3 A序列1 GG 序列2A 序列3序列4 A序列1 GG 序列2GAAAAA甲树丙树乙树最大简约法Taxa1234123456789AAGAGTGCAAGCCGTGCGAGATATCCAAGAGATCCG对位点7的分析C 序列4序列2 G序列1 GC 序列3C 序列4序列3 C序列1 GG 序列2C 序列3序列4 C序列1 GG 序列2GCCCCC甲树丙树乙树Taxa1234123456789AAGAGTGCAAGCCGTGCGAGATATCCAAGAGATCCG对位点9

4、的分析G 序列4序列2 G序列1 AA 序列3G 序列4序列3 A序列1 AG 序列2A 序列3序列4 G序列1 AG 序列2AAAAGA甲树丙树乙树最大简约法进化树进化树位点位点5位点位点7位点位点9总计总计甲1124乙2215丙2226选择进化树中变化最少的作为候选最大简约法 序列4序列2 序列1 序列3最大简约法距离法序列序列ABCDA C G C G T T G G G C G A T G G C A A CA C G C G T T G G G C G A C G G T A A TA C G C A T T G A A T G A T G A T A A TA C A C A T

5、T G A G T G A T A A T A A T距离分布表距离分布表ABCDA378B67C3DDBAC24121计算方法:Fitch and Margoliash Method(FM)Neighbor-joining Method(NJ)The Unweighted Pair Group Method with Arithmetic Mean(UPGMA)距离法Fitch and Margoliash Methoda+b=22a+c=39b+c=41a=10,b=12,c=29Fitch and Margoliash MethodDEABCd+e=10d+x=32.7e+x=34.7d

6、=4,e=6dexFitch and Margoliash MethodDEf+(d+e)/2+c=19f+(d+e)/2+y=41c+y=40f=5,c=9decABCfyFitch and Margoliash MethodDE(f+(d+e)/2+c)/2+g+a=119/3(f+(d+e)/2+c)/2+g+b=125/3a+b=22a=10,b=12,g=20decCfABabgABCDEA22119/3B125/3CDENeighbor-joining Method优选原则:各树枝的平均距离总和最短AB+AC+AD+AE+BC+BD+BE+CD+CE+DE=314a,b,c,d,e

7、五个分枝总和平均长度为S=314/4a+b+c+d+e=a+b+a+c+a+d+a+e+b+c+b+d+b+e+c+d+c+e+d+e=4a+4b+4c+4d+4eNeighbor-joining MethodAB+AC+AD+AE+BC+BD+BE+CD+CE+DE=a+b+(a+f+c)+(a+f+d)+(a+f+e)+(b+f+c)+(b+f+d)+(b+f+e)+(c+d)+(c+e)+(d+e)=6f+4a+4b+4c+4d+4e 6f+4a+4b+4c+4d+4e=314CDEABcdefab假设一平均长度SAB=(314+2AB+CD+CE+DE)/6=67.7Neighbor-

8、joining MethodADEBCadefbc假设三平均长度SBC=81ABEDCabefdc假设二平均长度SCD=76SDE,SAC,SAD,SAE,SBDNeighbor-joining Method最小值为SAB=67.7 故进化树应为:CDEABcdefab将AB枝看作一个,再寻找CDE分枝中的树形(S最小)ABCDEAB404042C1820D10ENeighbor-joining MethodCDEABcdefabgCDEABcdefabgDCEABdcefabgThe Unweighted Pair Group Method with Arithmetic Mean(UPGM

9、A)d=e=10/2=5The Unweighted Pair Group Method with Arithmetic Mean(UPGMA)c=LC-DE/2=19/2=9.55+g+c=LC-DE=19 g=4.5The Unweighted Pair Group Method with Arithmetic Mean(UPGMA)a=b=22/2=11The Unweighted Pair Group Method with Arithmetic Mean(UPGMA)ABCDEAB40.7CDE外类群(Outgroup)能提高预测的准确性有助于确定根节点的位置应与待分析的序列存在较大

10、差异必需与待分析的序列存在一定的相似性Outgroup距离值(D)的确定:两两序列间碱基差异数目的百分比值由序列比对程序产生的相似性分值(S)计算S=e-DD=-ln(s)不同进化速率的修正随着序列差异的增加,同一位点可能发生多次突变或回复突变,看似保守的位点可能已经有个别序列发生过突变。ACTGAACGTAACGCACTGAACGTAACGCACTGAACGTAACGCCTTCCTTKAB=-3/4ln(1-4/3dAB)KAB=(1-(fA2+fG2+fC2+fT2)ln(1-4/3dAB)KAB=1/2ln(1/(1-2dABtransition-dABtransversion)+1/4

11、ln(1/(1-2dABtransversion)最大近似法TT AGAGTTT AGCAATT AGTGTTT AGGGG进化树的检验自举(bootstrap)检验 BootStrap重采样法进化分析软件PhylipPAUPMacClade利用进化树进行重组分析ADCBE使用距离法逐段进行进化树的构建 逐段扫描 量化新序列在各段进化树中的位置 0G1,Ga+Gb+Gc+Gn=1 G越大,表示新序列埋在某个基因型的分枝中越深。G很小则表示新序列不在这个基因型分枝中G 新序列相对于基因型A的位置分值N 新序列到基因型A的某条序列所经过的节点数Y 基因型A的样本数00.10.20.30.40.50

12、.60.70.80.911 4 7 10131619222528313437Tag_1Tag_22Tag_3Tag_4Tag_5Tag_6Tag_7Tag_8Tag_900.10.20.30.40.50.60.70.80.911 7 13192531374349556167Tag_1Tag_2Tag_3Tag_4Tag_5Tag_6Tag_7Tag_8Tag_900.10.20.30.40.50.60.70.80.911 7 13 19 25 31 37 43 49 55 61 67Tag_21Tag_22Tag_23Tag_24Tag_25Tag_26Tag_27Tag_28Tag_29AF

13、46104300.10.20.30.40.50.60.70.80.911357911 13 15 17 19 21 23 25 27 29 31Tag_1Tag_2Tag_3Tag_4Tag_5Tag_6Tag_7Tag_8Tag_900.10.20.30.40.50.60.70.80.9113579 11 13 15 17 19 21 23 25 27 29 31Tag_1Tag_2Tag_3Tag_4Tag_5Tag_6Tag_7Tag_8Tag_9AB231908Exercise 下载并安装MEGA软件 使用MEGA比对序列 使用MEGA显示比对后的序列 使用不同方法对HBV参考序列做树

14、HOMEWORK 利用已知的ABCDEFGHI型的参考序列:下载并比对,使用MEGA做进化树 下载一条今年报道的HBV全基因组序列,加入到参考序列比对中(profile比对),使用MEGA重新做树,判断他的基因型。AAB076679AB194950FM199977BAB073852AB287314DQ993684CAB112472FJ562317X75656DAB188241AM494716DQ486024EAB032431DQ060826EU239225FAB036905AF223962DQ899142GAB056513AF160501EF464097HAB205010AY090454FJ356716

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(生物信息学分子进化分析课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|