真核生物基因结构预测分析方法(软件)课件.ppt

上传人(卖家):三亚风情 文档编号:2949706 上传时间:2022-06-14 格式:PPT 页数:51 大小:2.41MB
下载 相关 举报
真核生物基因结构预测分析方法(软件)课件.ppt_第1页
第1页 / 共51页
真核生物基因结构预测分析方法(软件)课件.ppt_第2页
第2页 / 共51页
真核生物基因结构预测分析方法(软件)课件.ppt_第3页
第3页 / 共51页
真核生物基因结构预测分析方法(软件)课件.ppt_第4页
第4页 / 共51页
真核生物基因结构预测分析方法(软件)课件.ppt_第5页
第5页 / 共51页
点击查看更多>>
资源描述

1、1实习二真核生物基因结构的预实习二真核生物基因结构的预测分析测分析浙江加州国际纳米技术研究院浙江加州国际纳米技术研究院20102010年年1111月月苏锟楷楼小燕韩序蒋琰苏锟楷楼小燕韩序蒋琰2实习一实习一基因组数据注释和功能分析基因组数据注释和功能分析实习二实习二真核生物基因结构的预测分析真核生物基因结构的预测分析 实习三实习三芯片的基本数据处理和分析芯片的基本数据处理和分析实习四实习四蛋白质结构与功能分析蛋白质结构与功能分析实习五实习五蛋白质组学数据分析蛋白质组学数据分析实习六实习六系统生物学软件实习系统生物学软件实习课程内容课程内容基因组学基因组学转录物组学转录物组学蛋白质组学蛋白质组学系

2、统生物学系统生物学3编码区预测编码区预测Codon biasGC Content限制性酶切位点限制性酶切位点基因结构分析基因结构分析选择性剪切选择性剪切转录调控因子转录调控因子序列比对序列比对功能注释功能注释KEGGGO系统发育树系统发育树蛋白质序列蛋白质序列翻翻译译蛋白质理化性质蛋白质理化性质二级结构预测二级结构预测结构域分析结构域分析重要信号位点分析重要信号位点分析三级结构预测三级结构预测基因组功能分析基因组功能分析4真核生物基因的主要结构真核生物基因的主要结构5基因结构分析基因结构分析开放读码框开放读码框GENSCANGENOMESCANCpG岛岛CpGPlot转录终止信号转录终止信号P

3、OLYAH启动子启动子/转录起始位点转录起始位点PromoterScan密码子偏好分析密码子偏好分析CodonWmRNA剪切位点剪切位点NETGENE2Spidey选择性剪切选择性剪切ASTD基因结构分析常用软件基因结构分析常用软件6开放读码框的识别开放读码框的识别 开放读码框(open reading frame, ORF) 是一段起始密码子和终止密码子之间的碱基序列 ORF 是潜在的蛋白质编码区7基因开放阅读框基因开放阅读框/ /基因结构分析识别工具基因结构分析识别工具ORF Finder NCBI通用BestORFSoftberry真核GENSCANMIT脊椎、拟南芥、玉米脊椎、拟南芥、

4、玉米Gene FinderZhang lab人、小鼠、拟南芥、酵母FGENESHSoftberry真核(基因结构)GeneMarkGIT原核GLIMMER Maryland原核FgenesSoftberry人(基因结构)FgeneSVSoftberry病毒Generation ORNL原核FGENESBSoftberry细菌(基因结构)GenomeScan MIT脊椎、拟南芥、玉米脊椎、拟南芥、玉米GeneWise2EBI人GRAILORNL人、小鼠、拟南芥、果蝇8ORF识别识别:GENSCAN结果返回到邮箱(可选)结果返回到邮箱(可选)提交序列提交序列提交序列文件提交序列文件运行运行GENS

5、CAN显示氨基酸或显示氨基酸或CDS序列序列序列名称(可选)序列名称(可选)是否显示非最优外显子是否显示非最优外显子选择物种类型选择物种类型9 9GENSCAN输出结果:文本输出结果:文本1010GENSCAN输出结果:图形输出结果:图形11ORF识别识别: GenomeScan提交待分析序列提交待分析序列提交同源蛋白质序列提交同源蛋白质序列运行运行GenomeScan12GenomeScan输出结果输出结果:文本:文本预测外显子位置、可预测外显子位置、可信度等信息信度等信息同源比同源比对信息对信息预测结果的氨基酸序列预测结果的氨基酸序列13GenomeScan输出结果输出结果:图形:图形14

6、课堂练习 1使用GENESCAN预测序列中可能的ORF。 2使用GENOMESCAN预测序列中可能的ORF。 练习用的序列文件在c:zcnishixi2文件下,名字为clone.fasta,使用写字板打开查看。15转录调控序列分析转录调控序列分析 CpG岛、转录终止信号和启动子区域的预测16CpG岛的预测 CpG岛 常位于真核生物基因转录起始位点,GC含50% ,长度200bp的一段DNA序列。17CpG Island 分析常用软件分析常用软件CpG Island WebCpGPlotWebCpG finderWebCpGi130webCpGproDweb提交序列文件提交序列文件提交序列提交序

7、列参数选项参数选项CpG岛的预测:CpGPlot19GENESCAN 预测结果起始为532bp 终止于51783bp20转录终止信号转录终止信号 上游作用元件:AAUAAA 下游作用元件:GC rich二重对称区、UUUUUUC-GC-GG-CG-CU-AG-CG-CC-GG-CUUUUUUUUURNA53AAUAAACAAAAAAAAAAAAA成熟mRNA53AAUAAACAGUmRNA前体5321转录终止信号预测:POLYAH 提交序列文件提交序列文件提交序列提交序列22polyA位置GENESCAN预测结果PolyA位点52490bpPOLYAH输出结果23启动子区结构启动子区结构启动子

8、(Promoter) 位于结构基因5端上游,能活化RNA聚合酶,使之与模板DNA结合并具有转录起始的特异性。转录起始位点(Transcription start site, TSS)PYCAPY(嘧啶)核心启动子元件(Core promoter element)TATA box,Pribnow box (TATAA)上游启动子元件(Upstream promoter element,UPE)CAAT box,GC box,SP1,Otc增强子(Enhancer)24原核和真核生物基因转录起始位点上游区原核和真核生物基因转录起始位点上游区结构结构原核生物原核生物真核生物真核生物TTGACATAT

9、AATAmRNA11035PyAPyTATAATGC区 CAAT区mRNA14025110增强子增强子上游启动子元件,上游启动子元件,UPE核心启动子元件核心启动子元件转录起始转录起始位点位点25PromoterScanWebPromoserWebNeural Network Promoter PredictionWebSoftberry: BPROM, TSSP, TSSG, TSSWWebMatInspectorWebRSATWebCisterWeb 启动子结合位点分析常用软件启动子结合位点分析常用软件26启动子预测:PromoterScan 提交序列提交序列27PromoterScan输

10、出结果找到的TATA box和转录起始位点预测可能的转录因子预测可能的转录因子转录因子在提交序列中的位置转录因子在提交序列中的位置28课堂练习 1 使用CpG Plot预测基因的CpG island位置。 2 使用PolyAH预测基因可能的转录终止的位置。 3 使用PromotorScan寻找基因上游序列里可能的转录因子调控区域。29基因密码子偏好性基因密码子偏好性1.研究研究蛋白质结蛋白质结构功能构功能中的作用中的作用2.在在表达外源基表达外源基因因方面的作用方面的作用3.在在生物信息学生物信息学研究中的作用研究中的作用30基因密码子偏好性基因密码子偏好性: CodonW粘帖目的序列粘帖目的

11、序列密码子表的选择密码子表的选择如需计算如需计算FOP/CBIFOP/CBI选择相应物种选择相应物种如需计算如需计算CAICAI选择选择相应物种相应物种输出格式输出格式( (默认不选默认不选) )汇总所有基因的信息汇总所有基因的信息31参 数 选 择计算所有指数计算所有指数选择导入对应物种选择导入对应物种CAICAI FOPFOP CBICBI数据数据计算有效密码子数计算有效密码子数计算计算GCGC含量含量计算计算GC3sGC3s含量含量计算同义密码子数量计算同义密码子数量计算同义密码子计算同义密码子第三位碱基组成第三位碱基组成密码子总数密码子总数32各项指数输出结果各项指数输出结果密码子使用

12、频率密码子使用频率CodonW结果界面33课堂练习 使用CodonW分析基因的密码子使用偏好,了解密码子偏好分析中各指数的含义。34内含子内含子/外显子剪切位点识别外显子剪切位点识别 如何分析核酸序列中的外显子组成?通过对特征序列(GT-AG)的分析进行直接的预测基因预测软件(NetGene2)与相应的基因组序列比对,分析比对片段的分布位置(Spidey)3536剪切位点识别:剪切位点识别:NetGene2http:/提交序列提交序列选择物种选择物种37NetGene2输出结果输出结果供体位点供体位点受体位点受体位点可信度可信度 相位相位38mRNA剪切位点识别:剪切位点识别:Spidey N

13、CBI开发的在线预测程序 用于mRNA序列同基因组序列比对分析 39Spidey同源序列的获得同源序列的获得:序列比对序列比对 通过BLAST进行序列比对,找到可能同源的相似性好的一系列mRNA序列。BLAST比对到的三条mRNA序列40输入基因组序列或序列数据库号输入基因组序列或序列数据库号输入相似性序列输入相似性序列判断用于分析的序列间的判断用于分析的序列间的差异,并调整比对参数差异,并调整比对参数不受默认内含子长度限不受默认内含子长度限制,制,默认长度:内部内含子默认长度:内部内含子为为35kb, 35kb, 末端内含子为末端内含子为100kb100kb比对阈值比对阈值选择物种选择物种输

14、出格式选择输出格式选择41Spidey输出结果第一条蓝色序列第一条蓝色序列为基因组序列,为基因组序列,橘黄色为外显子橘黄色为外显子外显子对应于外显子对应于基因组上的基因组上的起始起始/ /结束位置结束位置外显子对应于外显子对应于mRNA/cDNAmRNA/cDNA上的上的起始起始/ /结束位置结束位置供体、受体位点供体、受体位点外显子外显子长度长度一致性一致性百分比百分比错配和错配和gapgap外显子外显子序号序号序列联配结果序列联配结果42课堂练习 1 练习两种预测剪切位点的软件的使用,NetGene2和Spidey。 2 Spidey的同源序列文件保存在c:zcnishixi2文件下,名字

15、为Spidey.txt,使用写字板打开查看。43选择性剪切选择性剪切(Alternative splicing)分析分析 选择性剪接是调控基因表达的重要机制 了解不同物种、细胞、发育阶段、环境压力下基因的调控表达机制44选择性剪接的类型选择性剪接的类型选择性剪切的五种基本类型: 内含子保留. 5端选择性剪切位点. 3端选择性剪切位点. 外显子遗漏. 互斥外显子. 45查询选择性剪切相关的网站查询选择性剪切相关的网站 综合综合综合综合综合综合人人线虫线虫拟南芥拟南芥从已知基因的功能推测剪切机制从已知基因的功能推测剪切机制46选择性剪切查询:选择性剪切查询:ASTD数据库数据库 输入基因名称输入基因名称选择物种类型选择物种类型47ASTD数据库检索结果:基因描述信息 导出序列文件导出序列文件48ASTD数据库检索结果:选择性剪切的mRNA十十一一种种选选择择性性剪剪切切产产物物49ASTD数据库检索结果:表达的组织特异性在不同组织中各在不同组织中各种选择性剪切体种选择性剪切体的表达差异的表达差异十一种不同的选十一种不同的选择性剪切产物择性剪切产物50Thanks!51

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(真核生物基因结构预测分析方法(软件)课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|