ImageVerifierCode 换一换
格式:PPT , 页数:74 ,大小:5.08MB ,
文档编号:3194325      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-3194325.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(生物信息学在分子诊断中的应用课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

生物信息学在分子诊断中的应用课件.ppt

1、生物信息学在分子诊断中的应用第一节第一节 生物信息学概论生物信息学概论 生物信息学的定义生物信息学的定义 生物信息学研究的范畴生物信息学研究的范畴第一节第一节 生物信息学概论生物信息学概论一、生物信息学的定义一、生物信息学的定义生物信息学是结合了生物学和信息技术,利用生物信息学是结合了生物学和信息技术,利用计算机和互联网技术,分析海量的并且还在快计算机和互联网技术,分析海量的并且还在快速积累的生物数据,从中获取生物科学新知识速积累的生物数据,从中获取生物科学新知识的一门新的交叉科学。的一门新的交叉科学。人类基因组计划的意义人类基因组计划的意义人类基因研究的意义在于它可以人类基因研究的意义在于它

2、可以支持和推动生命科学中支持和推动生命科学中一系列重要的基础性研究一系列重要的基础性研究。如基因组遗传语言的破译,。如基因组遗传语言的破译,基因的结构与功能关系,生命的起源和进化,细胞发育、基因的结构与功能关系,生命的起源和进化,细胞发育、生 产、分 化 的 分 子 机 理,疾 病 发 生 的 机 理 等。生 产、分 化 的 分 子 机 理,疾 病 发 生 的 机 理 等。为推动医学长足进步带来前所未有的机遇为推动医学长足进步带来前所未有的机遇,基因诊断、,基因诊断、基因疗法和基因药物的开发,有可能成为未来医学发展基因疗法和基因药物的开发,有可能成为未来医学发展的重要分支。的重要分支。人类基因

3、组计划的进一步成功将人类基因组计划的进一步成功将促进生命科学与信息科学促进生命科学与信息科学、材料科学的融合、材料科学的融合,从而带动一批高技术产业的发展,从而带动一批高技术产业的发展第一节第一节 生物信息学概论生物信息学概论第一节第一节 生物信息学概论生物信息学概论二、生物信息学研究的范畴二、生物信息学研究的范畴第一、各种生物数据库的建立和管理;第二、研究高效率的统计工具,分析算法,发展方便、快捷的分析程序;第三、从海量的原始生物数据中发掘新知识。第二节第二节 计算机和互联网计算机和互联网 计算机常识和互联网计算机常识和互联网 常用搜索引擎常用搜索引擎 文件的压缩和解压文件的压缩和解压 文件

4、和数据的传送文件和数据的传送 编程和语言编程和语言第二节第二节 计算机和互联网计算机和互联网一、计算机常识:硬件和软件一、计算机常识:硬件和软件计算机的主要硬件由中央处理器(CPU)、存储器、输入设备和输出设备组成。常用的操作系统:windows、UNIX、Linux 第二节第二节 计算机和互联网计算机和互联网二、互联网和常用搜索引擎二、互联网和常用搜索引擎WWW是World Wide Web的缩写,即通常我们所说的国际互联网,它的每个节点在逻辑上都与任何其他节点保持联系,可以相互交换信息。第二节第二节 计算机和互联网计算机和互联网二、互联网和常用搜索引擎二、互联网和常用搜索引擎名称名称地址地

5、址特色特色GoogleGoogle宜于查询名词术语和专业网站Openfindopenfind宜于查询名词术语和专业网站Yahooyahoo可按分类搜索Sohu可按分类搜索Sinasina可按分类搜索可按分类搜索第二节第二节 计算机和互联网计算机和互联网三、文件的压缩和解压三、文件的压缩和解压传输或保存较大的数据时,常对文件进行压缩,以减少数据量。特别是对于图形文件,压缩尤其重要。在UNIX或Linux系统中,压缩命令是compress myfile,压缩后的文件自动加上后缀.Z。解压缩命令是uncompress myfile.Z。PC机上的Windows操作系统没有标准的压缩和解压软件,但网上

6、有许多针对Windows的免费或代免费试用期的压缩软件,如FreeZip、WinZip等 第二节第二节 计算机和互联网计算机和互联网四、文件和数据的传送四、文件和数据的传送用户需要递交一条或多条核酸或蛋白质序列去做数据库查询或比对。用户需要递交一条或多条核酸或蛋白质序列去做数据库查询或比对。这时常用的方法有:这时常用的方法有:使用视窗系统的剪切、复制和粘贴的功能使用视窗系统的剪切、复制和粘贴的功能.对于不太长的序列,这对于不太长的序列,这 种方法比较方便;种方法比较方便;网页的输入窗口旁常有一个网页的输入窗口旁常有一个“浏览目录浏览目录”按钮,点击该按钮,会弹按钮,点击该按钮,会弹 出一个对话

7、框,找到需要上传的序列文件,再按出一个对话框,找到需要上传的序列文件,再按“提交提交”钮完成递钮完成递 交。用这种方法可以一次递交较长的序列;交。用这种方法可以一次递交较长的序列;有些大型信息中心和研究单位还有远程文件传送服务,即遵从文件有些大型信息中心和研究单位还有远程文件传送服务,即遵从文件 传输协议传输协议(file transfer protocol,ftp)的服务器地址,用户可以无记的服务器地址,用户可以无记1.名的方式访问公用的目录,读取文件,下载软件或数据。名的方式访问公用的目录,读取文件,下载软件或数据。第二节第二节 计算机和互联网计算机和互联网五、编程和语言五、编程和语言 在

8、众多的计算机语言中,在众多的计算机语言中,C语言无疑是最常用的,它具有语言无疑是最常用的,它具有 代码精炼,执行效率高的特点,网上还有大量的现成模块代码精炼,执行效率高的特点,网上还有大量的现成模块 供免费使用。供免费使用。对于非计算机专业人员,还可以选择对于非计算机专业人员,还可以选择Visual BASIC(VB)语言。语言。VB语言具备了高级语言的特点,语句结构类似自然语言具备了高级语言的特点,语句结构类似自然 语言,对于生物背景的专业人员可能较容易掌握。语言,对于生物背景的专业人员可能较容易掌握。如果在研究中大量使用网络资源,则需要掌握一定的网络如果在研究中大量使用网络资源,则需要掌握

9、一定的网络 编程语言,例如:编程语言,例如:Perl语言、语言、PHP语言和语言和JAVA语言等语言等 第三节第三节 数据的获得数据的获得 DNA、RNA、蛋白质的测序、蛋白质的测序 蛋白质结构的分析蛋白质结构的分析 基因和蛋白质的表达数据基因和蛋白质的表达数据 蛋白质相互作用蛋白质相互作用第三节第三节 数据的获得数据的获得一、一、DNA、RNA和蛋白质的测序和蛋白质的测序基因组基因组DNA直接来源于细胞核基因组,它的组成包括直接来源于细胞核基因组,它的组成包括 基因和基因间区域,基因序列中还包括内含子和外显子。基因和基因间区域,基因序列中还包括内含子和外显子。cDNA是由是由mRNA逆转录而

10、来,全长逆转录而来,全长cDNA应该包括应该包括5端端 非编码区,非编码区,3 端的多聚腺苷酸序列和编码序列。端的多聚腺苷酸序列和编码序列。重组重组DNA序列序列是基因重组到质粒、病毒和是基因重组到质粒、病毒和cosmid等载体等载体 后经测序得到的后经测序得到的DNA序列。序列。2009-4-282009-4-28第三节第三节 数据的获得数据的获得一、一、DNA、RNA和蛋白质的测序和蛋白质的测序2009-4-28C CTGGTTCTG10A T TAC TGTT A20A T GT T G C T A C30TA C TGC TG A C40AAT G C T G C TG50C TG C

11、 T T CT C C60T CA C TG T C T C70CA C T T C C T TG80A A CA ATG CG C90CG T CA TG C T T100C T T T T G C C T C110CCG C TG C T C C120C120A G A A A G C TA G130G C C GC AG A T C140A G A A C CA C CA150C A G T CA A T A T160CA C CA C CT T C170CT C T TA T A G A180T T C G G A A T CT190CA T G A T A G G G200G C T

12、 CA G C C T C210TG T G C GA G T G220G A G A G A A G T T230T G CA G G C GA G240C TG AAG G A G CA250A T TG CA G G T G260A TA T GA T G T G270C T CG G C T CA A280G A A G C GG G C C290CG G A G A GG A A300G A A G T CG T G C310C GG G G C TAA T320TA T T G G CA A A330A C GA G C T C T T340G T T GT AA A CA350T

13、 T G A T C CA A C360TG G A A T G T CA370CC TA A T G G C GA380A T CA A T A T T C390CA T A A G G CA T400G A T G G T T G C T410CA G A G G CA G G420A G A A G A G CA A430C GA A T A C GA T440C C TA TA A A A G450A T A A A A CA T A460A A TA A A CA G T470CT T G A T TA TA480T T C T G G G TA T490TA A A G C CCA

14、 CA500A T CA G A A CA A510A TA T A T G C T T520TG T A T C T T T T530C T T G C C T T C T540T CA T T A C CA A550C T G C T T CC G C560G G C CA CA T TA570A G A G A A C T T G580T G G T A A G A TA590A G A A G A T A T T600T T A T T CG T T C610T G C T GA C T TG620CLane 2Points 2385 to 18997 Base 1:2385Spaci

15、ng:20.00第三节第三节 数据的获得数据的获得一、一、DNA、RNA和蛋白质的测序和蛋白质的测序2009-4-28第三节第三节 数据的获得数据的获得一、一、DNA、RNA和蛋白质的测序和蛋白质的测序 RNA的序列可以从基因组序列或cDNA序列推导出来;直接 的RNA测序涉及修饰核苷酸的识别,可通过质谱分析获得。蛋白质的序列可以通过DNA序列推导而来,但从DNA序列 推导的蛋白质序列不能反应真实的蛋白质序列情况,蛋白质 测序主要依靠质谱分析(mass spectrometry,MS)技术,基本原 理是通过准确测定真空中的离子质量或电荷量来测算出分 子组成。2009-4-28第三节第三节 数据

16、的获得数据的获得二、蛋白结构的分析二、蛋白结构的分析X射线晶体学技术:射线晶体学技术:通过研究通过研究X射线对射线对蛋白质晶体蛋白质晶体的扫描后的扫描后产生的衍射模式来测定蛋白质的结构;产生的衍射模式来测定蛋白质的结构;核磁共振谱法核磁共振谱法(NMR)spectroscopy):该方法常用于较小该方法常用于较小(25kDa)的,可溶性蛋白质结构的测定;)的,可溶性蛋白质结构的测定;有些蛋白质很难结晶,不能用有些蛋白质很难结晶,不能用X射线晶体学技术测定,又太射线晶体学技术测定,又太大而不能用核磁共振谱技术测定,大而不能用核磁共振谱技术测定,其它技术方法其它技术方法:X射线纤维衍射技术;电子显

17、微镜射线纤维衍射技术;电子显微镜(electron microscopy);环形双色色谱技术环形双色色谱技术(circular dichroism(CD)spectroscopy)2009-4-28第三节第三节 数据的获得数据的获得三、基因和蛋白质表达数据三、基因和蛋白质表达数据 表达文库的测序表达文库的测序 基因表达连续分析技术基因表达连续分析技术(serial analysis of gene expression,SAGE)DNA芯片芯片 双向电泳分析技术(双向电泳分析技术(2D gel electrophoresis)2009-4-28基因表达连续分析技术原理基因表达连续分析技术原理第

18、三节第三节 数据的获得数据的获得三、基因和蛋白质表达数据三、基因和蛋白质表达数据双向电泳分析技术原理双向电泳分析技术原理:1个方向是个方向是SDS-聚丙烯酰胺凝胶聚丙烯酰胺凝胶 主要是把蛋白质主要是把蛋白质按照按照 分子量分开分子量分开;1个方向是等点聚焦个方向是等点聚焦 把蛋白质按照等电点的不同把蛋白质按照等电点的不同分开分开,这样就可以把不同的蛋白质尽可能的分开,这样就可以把不同的蛋白质尽可能的分开。2009-4-28第三节第三节 数据的获得数据的获得四、蛋白质相互作用四、蛋白质相互作用1、遗传学方法:、遗传学方法:2、亲和性方法:、亲和性方法:亲和色谱法(亲和色谱法(Affinity c

19、hromatography)免疫共沉淀法免疫共沉淀法(coimmunoprecipitation)免疫共沉淀基本原理免疫共沉淀基本原理:细胞裂解液中加入抗体,与抗原形成特异免疫复合物,细胞裂解液中加入抗体,与抗原形成特异免疫复合物,经过洗脱,收集免疫复合物,然后进行经过洗脱,收集免疫复合物,然后进行SDS-PAGE及及 Western blotting分析。分析。2009-4-283、分子和原子法:、分子和原子法:X射线晶体法和核磁共振法射线晶体法和核磁共振法 4、基于文库法:、基于文库法:酵母双杂交系统(酵母双杂交系统(yeast two-hybrid(Y2H)system)第三节第三节 数

20、据的获得数据的获得四、蛋白质相互作用四、蛋白质相互作用酵母双杂交系统的建立得力于对真核细胞调控转录起始过程的认识。研究发现,许多真核生物的转录激活因子都是由两个可以分开的、功能上相互独立的结构域(domain)组成的。例如,酵母的转录激活因子GAL4,在N端有一个由147个氨基酸组成的DNA结合域结合域(DNA binding domain,BD),C端有一个由113个氨基酸组成的转录激活域转录激活域(transcription activation domain,AD)。当GAL4分子的DNA结合域和上游激活序列(upstream activating sequence,UAS)结合,转录激

21、活域则能激活UAS下游的基因进行转录。但是,单独的DNA结合域不能激活基因转录,单独的转录激活域也不能激活UAS的下游基因,它们之间只有通过某种方式结合在一起才具有完整的转录激活因子的功能。2009-4-28XYX转化到转化到Y文库中文库中 重要生物信息中心重要生物信息中心 数据库检索工具数据库检索工具第四节第四节 生物信息数据库生物信息数据库2009-4-28第四节第四节 生物信息数据库生物信息数据库一、重要生物信息中心一、重要生物信息中心 美国国家信息中心美国国家信息中心(National Center of Biotechnology Information,NCBI)的的GenBank

22、 (http:/nchi.nlm.nih.gov/web/GenBank/index.html);欧洲分子生物学室验室欧洲分子生物学室验室(European Molecular Biology Laboratory-European Bioinformatics Institute,EMBL-EBI)的的EMBL(ebi.ac.uk/databases/index.html);日本日本 DNA数据库数据库(DNA Data Bank of Japan,DDBJ)(http:/ddbj.nig.ac.jp/)2009-4-28第四节第四节 生物信息数据库生物信息数据库一、重要生物信息中心一、重要

23、生物信息中心 最重要的蛋白质氨基酸序列数据库是瑞士的最重要的蛋白质氨基酸序列数据库是瑞士的SWISS-PROT(au.expasy.org/sprot/);蛋白质数据库蛋白质数据库PIR(Protein Information Resource),包含包含 所有序列已知的自然界中野生型蛋所有序列已知的自然界中野生型蛋 白质的信息白质的信息 (pir.georgetown.edu);PDB蛋白质结构数据库:收集由蛋白质结构数据库:收集由X射线衍射和核磁共振射线衍射和核磁共振 技术测定的蛋白质大分子三维结构技术测定的蛋白质大分子三维结构(rcsb.org/pdb)。第四节第四节 生物信息数据库生物

24、信息数据库二、数据库检索工具二、数据库检索工具 Entrez检索工具:检索工具:Entrez是美国国家生物技术信息中心是美国国家生物技术信息中心(NCBI)提供的集成检索工具)提供的集成检索工具 ncbi.nlm.nih.gov/Entrez/SRS(Sequence Retrieval System)检索工具:是欧洲)检索工具:是欧洲 分子生物学网分子生物学网EMBnet的主要数据库检索工具,可以从的主要数据库检索工具,可以从 EMBnet的主页进入。的主页进入。DBGET/LinkDB检索工具:是日本京都工具大学建立的检索工具:是日本京都工具大学建立的 GenomeNet数据库,该数据库主

25、要针对代谢途径。数据库,该数据库主要针对代谢途径。genome.ad.jp/dbget/dbget_manual.html。第四节第四节 生物信息数据库生物信息数据库二、数据库检索工具二、数据库检索工具图图16-1:NCBI网页的网页的Entrez界面界面第五节第五节 核酸序列分析核酸序列分析 核酸序列的基本分析核酸序列的基本分析 核酸序列的比对分析和功能预测核酸序列的比对分析和功能预测 开放阅读框的分析开放阅读框的分析 引物设计引物设计 向数据库提交序列向数据库提交序列第五节第五节 核酸序列分析核酸序列分析一、核酸序列的基本分析一、核酸序列的基本分析 核酸序列的分子量、碱基组成、碱基分布等基

26、本分析:核酸序列的分子量、碱基组成、碱基分布等基本分析:BioEdit(mbio.ncsu.edu/BioEdit/bioedit.html)DNAMAN(lynnon/)限制性酶切分析限制性酶切分析:限制性酶数据库:限制性酶数据库(Restriction Enzyme DataBase,REBASE)(rebase.neb;neb/rebase)测序峰图的查看、核实与修改测序峰图的查看、核实与修改:Chromas,BioEdit,DNAMAN 测序结果需要识别与去除测序时使用的载体序列测序结果需要识别与去除测序时使用的载体序列:VecScreen(ncbi.nlm.nih.gov/VecSc

27、reen.html)第五节第五节 核酸序列分析核酸序列分析一、核酸序列的基本分析一、核酸序列的基本分析EST序列进行电子延伸序列进行电子延伸:将待分析的核酸序列(称为种子序列)采用Blast软件 搜索GenBank的EST数据库,获得与种子序列有较高 同源性的EST序列,一般要求在重叠40个碱基范围内 有95以上的同源性,称匹配序列;将匹配序列与种子序列装配成新序列,即片段重叠 群分析(contig analysis);再以新产生的序列为种子序列,重复上述过程,直 至没有新的匹配序列为止。EST序列进行电子延伸序列进行电子延伸种子序列种子序列第五节第五节 核酸序列分析核酸序列分析一、核酸序列的

28、基本分析一、核酸序列的基本分析对核酸序列进行电子基因定位对核酸序列进行电子基因定位:利用序列标签位点利用序列标签位点(Sequence Tagged Site,STS);利用利用UniGene数据库进行基因电子定位数据库进行基因电子定位;直接利用基因组序列进行基因电子定位。直接利用基因组序列进行基因电子定位。NCBI网页的网页的Map Viewer界面界面程序名称查询序列搜索的数据库BLASTN核酸核酸BLASTP蛋白质蛋白质BLASTX核酸的六读框蛋白质TBLASTN蛋白质核酸的6个读框TBLASTX核酸的6个读框核酸的6个读框第五节第五节 核酸序列分析核酸序列分析二、核酸序列的比对分析和功

29、能预测二、核酸序列的比对分析和功能预测BLAST(Basic Local Alignment Search Tool)是)是基本局域联配搜索工具;基本局域联配搜索工具;Blast 功能有:功能有:NCBI网页的网页的BLAST界面界面NCBI网页的网页的BLAST2 SEQUENCES界面界面第五节第五节 核酸序列分析核酸序列分析二、核酸序列的比对分析和功能预测二、核酸序列的比对分析和功能预测 FASTA:根据用户提交的单个序列进行:根据用户提交的单个序列进行 数据库搜索比对的程序。数据库搜索比对的程序。网上服务器和电子邮件服务:网上服务器和电子邮件服务:ebi.ac.uk/mailto:fa

30、staebi.ac.uk fasta.genome.ad.jp mailto:fastanig.ac.jp第五节第五节 核酸序列分析核酸序列分析二、核酸序列的比对分析和功能预测二、核酸序列的比对分析和功能预测进行多序列联配进行多序列联配:ClustalW:ebi.ac.uk/clustalw/index.html,iubio.bio.indiana.edu/soft/molbio/align/clustal/,ftp:/ftp.ebi.ac.uk/pub/software/dos/clustalw。ClustalX:CluastalW程序的程序的UNIX版本,它使用版本,它使用X窗口图形界面,

31、窗口图形界面,ftp:/ftp.ebi.ac.uk/pub/software ftp:/ftp-igbmc.u-strassbg.fr/pub/clustalX。对联配结果进一步编辑,形成适于发表的形式,可用的软件有:对联配结果进一步编辑,形成适于发表的形式,可用的软件有:SeaView:ftp:/biom3.univ-lyon1.frBOXSHADE:ch.embnet.org/software/box_form.html)CINEMA:bioinf.man.ac.uk/dbbrowser/cinema2.1/cinema2hdr.html第五节第五节 核酸序列分析核酸序列分析三、开读框的分

32、析三、开读框的分析GT-AG法则法则:外显子与内含子之间的连接区序列高度保守,如大部分内含子5端起始的两个碱基是GT,3端最后两个碱基是AG。基因识别软件,常用的有:ORF Finder(ncbi.nlm.nih.gov/gorf/gorf.html)GRAIL(avalon.epm.ornl.gov/grainbin/)GeneFinder(genomic.sanger.ac.uk)Glimmer(cs.jhu.edu/labs/compbio/glimmer.html/)GenScan(genes.mit.edu/genscan.html)GeneLang(cbil.upenn.edu/g

33、enlang/)用用GeneFinde进行开放阅读框分析进行开放阅读框分析用用GeneFinde进行开放阅读框分析进行开放阅读框分析第五节第五节 核酸序列分析核酸序列分析四、引物设计四、引物设计Primer Premier软件软件:premierbiosoft Primer3软件软件:genome.wi.mit.edu/cgi-bin/primer/primer3Oligo、Vector NT、Omiga等等第五节第五节 核酸序列分析核酸序列分析五、向数据库提交核酸序列五、向数据库提交核酸序列 向向EMBL提交数据的网络表格可参见:提交数据的网络表格可参见:ebi.ac.uk/subs/emb

34、lsubs.tml 向向GenBank数据库提交核酸序列可联网进行数据库提交核酸序列可联网进行 ncbi.nlm.nih.gov/GenBank/index.html 也可用也可用Sequin软件制作好序列提交文件,向软件制作好序列提交文件,向NCBI 发送发送E-mail(gb-subncbi.nlm.nih.gov)提交提交 第六节第六节 蛋白质序列分析蛋白质序列分析 蛋白质基本性质分析蛋白质基本性质分析 蛋白质功能预测蛋白质功能预测 蛋白质结构预测蛋白质结构预测 蛋白质分子进化分析蛋白质分子进化分析第六节第六节 蛋白质序列分析蛋白质序列分析一、蛋白质基本性质分析一、蛋白质基本性质分析 蛋

35、白质的氨基酸组成、分子量、等电点等方面的分析蛋白质的氨基酸组成、分子量、等电点等方面的分析:OMIGA、DNAMAN、BioEdit、MacVector等等 蛋白质疏水性分析蛋白质疏水性分析:ProtScale,expasy.org/cgi-bin/protscale.pl 预测跨膜区预测跨膜区:genome.cbs.dtu.dk/services/TMHMM-2.0/ch.embnet.org/software/TMPRED_form.html emblheidelberg.de/services/sander/predictprotein ftp:/ftp.biochem.ucl.ac.u

36、k。用用TMHMM 软件预测的软件预测的SARS-CoV 的的E蛋白的跨膜区蛋白的跨膜区第六节第六节 蛋白质序列分析蛋白质序列分析一、蛋白质基本性质分析一、蛋白质基本性质分析预测信号肽:预测信号肽:genome.cbs.dtu.dk/services/SignalP/蛋白质亚细胞定位蛋白质亚细胞定位:predict.sanger.ac.uk/nnpsl/预测信号肽预测信号肽预测信号肽预测信号肽蛋白质亚细胞定位蛋白质亚细胞定位蛋白质亚细胞定位蛋白质亚细胞定位第六节第六节 蛋白质序列分析蛋白质序列分析二、蛋白质功能预测二、蛋白质功能预测蛋白质序列分析和功能预测的一般流程蛋白质序列分析和功能预测的一

37、般流程 第六节第六节 蛋白质序列分析蛋白质序列分析二、蛋白质功能预测二、蛋白质功能预测磷酸化位点、糖基化位点,特殊的结构区(磷酸化位点、糖基化位点,特殊的结构区(motif)的分析:)的分析:PROSITE:expasy.org/prosite/BLOCKS:blocks.fhcrc.org/blocks/PFAM:sanger.ac.uk/software/pfam/PESCAN:isrec.isb-sib.ch/software/pfscanInterProScan:ebi.ac.uk/interpro/scan.htmlSMART:smart.embl-heidberg.de/第六节第六

38、节 蛋白质序列分析蛋白质序列分析三、蛋白质结构预测三、蛋白质结构预测 蛋白质的立体结构数据库蛋白质的立体结构数据库PDB(Protein Data Bank):(umass.edu/microbio/rasmol)PDBFinder (sander.embl-heideberg.de/pdbfinder)蛋白质分子模型数据库蛋白质分子模型数据库(Molecular Modeling Database);三维结构显示程序三维结构显示程序Cn3D (ncbi.nlm.nih.gov/structure)同源建模同源建模(Homology modeling)分析服务分析服务 (expasy.ch/s

39、wissmod/sm_toppage.html)常用的有以下几个工具:常用的有以下几个工具:TOPITS:embl-heidelberg.de/predictprotein frsvr:mbi.ucla.edu/people/frsvr/frsvr.html THREADER:globin.warwick.ac.uk/jones/第六节第六节 蛋白质序列分析蛋白质序列分析三、蛋白质结构预测三、蛋白质结构预测第六节第六节 蛋白质序列分析蛋白质序列分析四、蛋白质分子进化分析四、蛋白质分子进化分析 DNAMAN ClustalW PHYLIP(evolution.genetics.washingto

40、n.edu/)PAUP MrBayes(morphbank.ebc.uu.se/mrbayes/)亲缘树显示程序:亲缘树显示程序:TreeView(taxonomy.zoology.gla.ac.uk/rod/treeview)Phylodraw(iubio.bio.indiana.edu/treeapp/)第六节第六节 蛋白质序列分析蛋白质序列分析四、蛋白质分子进化分析四、蛋白质分子进化分析 SARS病毒病毒M蛋白与冠状病毒蛋白与冠状病毒M蛋白的进化分析蛋白的进化分析.A:采用采用ClustalW软件软件分析分析,用用Treeview软件输出;软件输出;B:采用采用ClustalW软件分析,用软件分析,用Phylodraw软件输出软件输出

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|