ImageVerifierCode 换一换
格式:PPT , 页数:60 ,大小:1.64MB ,
文档编号:4966379      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-4966379.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(晟晟文业)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(基因组测序与分析课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

基因组测序与分析课件.ppt

1、西北农林科技大学农学院遗传教研组西北农林科技大学农学院遗传教研组主讲人:胡银岗主讲人:胡银岗基因组基因组 一个物种中所有基因的整体组成一个物种中所有基因的整体组成2.人类基因组测序策略采集采集5个自愿者的个自愿者的DNA样品样品构建构建3种不同插入子大小的基种不同插入子大小的基因组文库因组文库2Kb,10Kb和和50Kb随机测序与序列组装方法随机测序与序列组装方法指导测序与序列组装方法指导测序与序列组装方法相结合进行序列组装相结合进行序列组装A.Celera Genomics 人类基因组人类基因组的测序策略的测序策略两种策略的比较两种策略的比较不需背景信息不需背景信息构建克隆群构建克隆群(遗传

2、、物理图谱遗传、物理图谱)时间短时间短 需要几年的时间需要几年的时间 需要大型计算机需要大型计算机得到的是草图得到的是草图(Draft)得到精细图谱得到精细图谱3.人类基因组研究的惊人发现 19号染色体号染色体是是含基因最丰富含基因最丰富的染色的染色体,而体,而13号染色体号染色体含基因量最少含基因量最少目前已经发现和定位了目前已经发现和定位了26000多个多个功能基因,其中尚有功能基因,其中尚有42%的基因尚的基因尚不知道功能不知道功能人类基因组中存在人类基因组中存在“热点热点”和大片和大片“荒漠荒漠”。在染色体上有基因成簇密。在染色体上有基因成簇密集分布的区域,也有大片的区域只有集分布的区

3、域,也有大片的区域只有“无用无用DNA”不包含或含有极少不包含或含有极少基因的成分。基因的成分。基因组上大约有基因组上大约有14的区域没有基因的片段的区域没有基因的片段。353的基因包含重复的序列的基因包含重复的序列。这说明那些原来被认为是这说明那些原来被认为是“垃圾垃圾”的的DNA也起重要作用,应该被进一步研也起重要作用,应该被进一步研究。究。4.单核苷酸多态性DNA整体整体切成切成小段小段小段和载体结合小段和载体结合结合后进行测序结合后进行测序解决办法解决办法:通过相邻已知通过相邻已知顺序作为探针筛选已有顺序作为探针筛选已有的基因组文库的基因组文库解决办法解决办法:利用其它宿主菌利用其它宿

4、主菌与载体重新构建文库与载体重新构建文库酵母大肠杆菌果蝇线虫老鼠 水稻基因组测序水稻基因组测序水稻是全球半数以上人口的主食,水稻是全球半数以上人口的主食,对解决全球粮食问题具有重要意义。对解决全球粮食问题具有重要意义。2002年我国科学家完成了水稻基因年我国科学家完成了水稻基因组定序和初步分析组定序和初步分析。出人意料的是,。出人意料的是,水稻的基因竟比人类基因还要多得水稻的基因竟比人类基因还要多得多。多。人类基因大约有人类基因大约有3万多个万多个,水水稻有稻有4万多个基因万多个基因。水稻基因组可说是继人类基因组之水稻基因组可说是继人类基因组之后,完成定序的最大基因组,也是后,完成定序的最大基

5、因组,也是至今已知最大的植物基因组。至今已知最大的植物基因组。8.人类基因组计划对医学事业的影响人类基因组计划对医学事业的影响促进对致病基因的克隆促进对致病基因的克隆疾病的预测与诊断疾病的预测与诊断如果掌握了与某种疾病相关的基因及突变,则如果掌握了与某种疾病相关的基因及突变,则可以对该疾病进行预测、诊断。可以对该疾病进行预测、诊断。基因疗法的发展与应用基因疗法的发展与应用通过生物学、医学等技术对疾病相关基因进行通过生物学、医学等技术对疾病相关基因进行抑制或调控,即可达到治疗某一疾病的效果。抑制或调控,即可达到治疗某一疾病的效果。基因变异与疾病基因变异与疾病第二节第二节 DNADNA片段组装片段

6、组装大规模基因组测序大规模基因组测序得到待测序列的一系列序列片段得到待测序列的一系列序列片段这些序列片段覆盖待测序列这些序列片段覆盖待测序列序列片段之间也存在着相互覆盖或者重叠。序列片段之间也存在着相互覆盖或者重叠。目标序列目标序列序列碎片序列碎片(1)碱基标识错误)碱基标识错误1.片段组装片段组装的的4个主要问题个主要问题(2)不知道片段的方向)不知道片段的方向(3)存在重复区域)存在重复区域(4)缺少覆盖()缺少覆盖(gap)2、序列片段组装过程、序列片段组装过程1、基因组、基因组DNA的奥秘的奥秘u 遗传信息存贮在遗传信息存贮在4种字符组成的核酸序列中种字符组成的核酸序列中 u“天书天书

7、”用遗传语言书写的人类遗传蓝本用遗传语言书写的人类遗传蓝本 包含的信息量巨大包含的信息量巨大 更重要的是目前人类对它了解甚少更重要的是目前人类对它了解甚少 天书中只有天书中只有4个字符(碱基个字符(碱基A、T、G、C)既没有段落,也没有标点符号既没有段落,也没有标点符号 是一个长度为是一个长度为3109的一维序列。的一维序列。第三节第三节 基因组基因组DNA序列分析序列分析 科学家对这本天书了解最多的部分就是遗传密码科学家对这本天书了解最多的部分就是遗传密码 密码子的特点密码子的特点(1)密码子的使用是非随机的)密码子的使用是非随机的 如果密码子的第一、第二位碱基是如果密码子的第一、第二位碱基

8、是A、U,那么第,那么第三位将尽可能使用三位将尽可能使用G、C;反之亦然。;反之亦然。如果三位都用如果三位都用G、C,则配对容易,分解难;三位,则配对容易,分解难;三位都用都用A、U,则相反。,则相反。一般地说,高表达的基因,要求翻译速度快,要一般地说,高表达的基因,要求翻译速度快,要求密码子和反密码子配对快、分手也快。求密码子和反密码子配对快、分手也快。(2)密码子的使用有一定的统计规律)密码子的使用有一定的统计规律 对同义密码子的使用存在着偏爱对同义密码子的使用存在着偏爱不同种属偏爱的密码子不同不同种属偏爱的密码子不同 人类基因组:人类基因组:密码子第三位取密码子第三位取A、U的情况占的情

9、况占90%而第三位取而第三位取G、C仅占仅占10%密码子的使用偏爱性与密码子的使用偏爱性与基因功能基因功能 蛋白质结构蛋白质结构相关相关(3)密码子中的密码)密码子中的密码 三个碱基的位置与所编码的氨基酸性质存在着联系三个碱基的位置与所编码的氨基酸性质存在着联系例如:例如:芳香族氨基酸芳香族氨基酸u以以U作为第一位碱基作为第一位碱基u中间位置碱基的性质与氨基酸是亲疏水性相关中间位置碱基的性质与氨基酸是亲疏水性相关u疏水氨基酸的密码子,其第二位碱基是疏水氨基酸的密码子,其第二位碱基是Uu亲水氨基酸的密码子,其第二位碱基是亲水氨基酸的密码子,其第二位碱基是Au第二位碱基是第二位碱基是G、C的密码子

10、所编码的氨基酸亲水的密码子所编码的氨基酸亲水性、疏水性居中。性、疏水性居中。基因组信息基因组信息人类基因组:人类基因组:编码区域只占编码区域只占1%-3%对于非编码序列,尚不清楚其含义或功能对于非编码序列,尚不清楚其含义或功能 非编码区域对于生命活动具有重要的意义非编码区域对于生命活动具有重要的意义包括包括内含子内含子、简单重复序列、移动元件、伪基因、简单重复序列、移动元件、伪基因 重复序列重复序列:u 卫星(卫星(satellite)DNAu 小卫星(小卫星(mini-satellite)DNAu 微卫星(微卫星(micro-satellite)顺式调控元件顺式调控元件:启动子、增强子、沉默

11、子启动子、增强子、沉默子2、探索遗传语言、探索遗传语言 用语言学的方法进行研究用语言学的方法进行研究 自然语言自然语言 计算机程序设计语言计算机程序设计语言 遗传语言遗传语言n 二进制序列二进制序列0、1的长程关联性分析结果:的长程关联性分析结果:编码区域编码区域 自然语言自然语言蛋白质编码区域所包含的信息相当于待加工的蛋白质编码区域所包含的信息相当于待加工的“数据数据”,数,数据经过加工处理以后产生对应的蛋白质;据经过加工处理以后产生对应的蛋白质;非编码区域非编码区域 程序设计语言程序设计语言而非编码区域则相当于而非编码区域则相当于“程序程序”或或“指令指令”,确定如何在时,确定如何在时间和

12、空间方面控制基因的表达和蛋白质的合成间和空间方面控制基因的表达和蛋白质的合成 n 用密码学方法进行研究用密码学方法进行研究是否存在其它密码?是否存在其它密码?调控信息密码?调控信息密码?蛋白质结构的密码?蛋白质结构的密码?n 编码在编码在DNA上的一维程序如何在四维时空中上的一维程序如何在四维时空中控制生命体的生长发育?控制生命体的生长发育?3、关于生物复杂性、关于生物复杂性生物的复杂性不仅仅是基因的数目生物的复杂性不仅仅是基因的数目 人类基因约为人类基因约为30000个个 线虫有线虫有20000个基因个基因230000/220000=210000 103000 4、基因组计划带来的希望、基因

13、组计划带来的希望n 实验数据的积累速度在迅速地增加实验数据的积累速度在迅速地增加n 计算机科学和技术也在不断地发展计算机科学和技术也在不断地发展 单个基因组分析单个基因组分析 基因序列基因序列 基因功能基因功能 基因的表达调控基因的表达调控 基因产物基因产物 基因多态性基因多态性比较基因组分析比较基因组分析 物种关系物种关系 物种进化物种进化 物种起源物种起源人、鼠基因组比较人、鼠基因组比较 人基因组人基因组 鼠基因组鼠基因组 注:鼠染色体上的颜色和数字代表在人染色体上对应的片段。注:鼠染色体上的颜色和数字代表在人染色体上对应的片段。老鼠约老鼠约75%的基因的基因与人类相同。与人类相同。问问

14、题题n基因组序列所包含的全部遗传信息是什么?基因组序列所包含的全部遗传信息是什么?n基因组作为一个整体如何行使其功能?基因组作为一个整体如何行使其功能?n用什么方法寻找基因,研究基因地功能呢?用什么方法寻找基因,研究基因地功能呢?u寻找基因寻找基因u获取基因的全长获取基因的全长cDNA序列序列u确定确定DNA顺序中基因的位置顺序中基因的位置u研究基因的功能研究基因的功能u基因表达基因表达u蛋白质组学蛋白质组学1.1 1.1 根据开放读码框预测基因根据开放读码框预测基因u 起始密码子起始密码子 ATGn第一个第一个ATG的确定则依据的确定则依据Kozak规则(基于已知规则(基于已知数据的统计结果

15、,即第一个数据的统计结果,即第一个ATG侧翼序列的碱基侧翼序列的碱基分布所满足的统计规律。)分布所满足的统计规律。)n若将第一个若将第一个ATG中的碱基中的碱基A,T,G分别标为分别标为1,2,3位,则位,则Kozak规则规则可描述如下:可描述如下:第第4位的偏好碱基为位的偏好碱基为G;ATG的的5端约端约15bp范围的侧翼序列内不含碱基范围的侧翼序列内不含碱基T;在在-3,-6和和-9位置,位置,G是偏好碱基;是偏好碱基;除除-3,-6和和-9位,在整个侧翼序列区,位,在整个侧翼序列区,C是偏好碱基。是偏好碱基。信号肽分析软件信号肽分析软件(SignalP http:/www.cbs.dtu

16、.dk/services/signalP)把预测过程中证实含完整把预测过程中证实含完整mRNA 5端的端的Contig翻译为蛋白序列翻译为蛋白序列;然后用然后用SignalP软件对前软件对前50个氨基酸序列个氨基酸序列(从第从第一个一个ATG对应的甲硫氨酸对应的甲硫氨酸Met开始开始)进行评估,进行评估,如果如果SignalP分析给出正面结果,则测试序列有分析给出正面结果,则测试序列有可能为信号肽可能为信号肽;假如在该测试序列的第一个假如在该测试序列的第一个Met 5端存在端存在终止终止密码子密码子,该序列为信号肽的可能性更大。,该序列为信号肽的可能性更大。u终止密码子终止密码子终止密码子终止

17、密码子:TAA,TAG,TGA GC%=50%终止密码子每终止密码子每 64 bp出现一次;出现一次;GC%50%终止密码子每终止密码子每100200 bp 出现一次;出现一次;由于多数基因由于多数基因 ORF 均多于均多于50个密码子,因此最可能的选择应该是个密码子,因此最可能的选择应该是 ORF 不少于不少于100 个密码子。个密码子。u 3端的确认端的确认3端的确认主要根据端的确认主要根据Poly(A)尾序列尾序列,若测试若测试Contig不含不含Poly(A)序列,序列,则根据加尾信号序列则根据加尾信号序列“AATAAA”和和BLAST同源性比较结果共同判断。同源性比较结果共同判断。外

18、显子和内含子的边界有一些明显的特征,如:外显子和内含子的边界有一些明显的特征,如:内含子的内含子的5端或称供体位(端或称供体位(donor site)常见的顺序为)常见的顺序为 5AGGTTAAGT-3;3端又称受体位(端又称受体位(acceptor site),多为多为5PyPyPyPyPyPyCAG-3(“Py”嘧啶核苷酸,嘧啶核苷酸,T或或C);u上游控制顺序上游控制顺序几乎所有基因(或操纵子)上游都有调控序列,它们可与几乎所有基因(或操纵子)上游都有调控序列,它们可与DNA结合蛋白作用,控制基因表达。结合蛋白作用,控制基因表达。另外个别生物的基因组特有组成也可作为判别依据,如脊椎另外个

19、别生物的基因组特有组成也可作为判别依据,如脊椎动物基因组许多基因的上游都有动物基因组许多基因的上游都有CpG岛。岛。1.2 mRNA的的5端即转录起始位点区端即转录起始位点区通过同源性比较来预测通过同源性比较来预测mRNA的的5端,最端,最常用的与转录起始位点相关的数据库是真核启常用的与转录起始位点相关的数据库是真核启动子数据库。动子数据库。The TRADAT Project,Eukaryotic Promoter Database,EPD.(http:/www.epd.unil.ch/)1.3 1.3 同源查询途径同源查询途径 通过已存入数据库中的基因顺序与待查的基因组序列通过已存入数据库

20、中的基因顺序与待查的基因组序列进行比较,从中查找可与之匹配的碱基顺序及其比例,用进行比较,从中查找可与之匹配的碱基顺序及其比例,用于界定基因的方法称为同源查询。于界定基因的方法称为同源查询。同源有如下几种情况:同源有如下几种情况:DNA序列某些片段完全相同;序列某些片段完全相同;开放读码框(开放读码框(ORF)排列类似,如有长外显子;)排列类似,如有长外显子;开放读码框翻译成氨基酸序列的相似性;开放读码框翻译成氨基酸序列的相似性;模拟多肽高级结构相似模拟多肽高级结构相似1.4 试验分析试验分析uNorthern 杂交确定杂交确定DNA片段是表达序列:片段是表达序列:注意事项:注意事项:当某一基

21、因的转录产物进行可变剪接时,由于连接的当某一基因的转录产物进行可变剪接时,由于连接的外显子不同,会产生好几条长度不一的杂交带,如果外显子不同,会产生好几条长度不一的杂交带,如果该基因是某一基因家族的成员也会出现多个信息;该基因是某一基因家族的成员也会出现多个信息;考虑组织专一性和发育阶段的问题;考虑组织专一性和发育阶段的问题;基因表达产物丰度的问题基因表达产物丰度的问题l如果丰度较低,用拟如果丰度较低,用拟Northern 杂交和动物杂交(杂交和动物杂交(Zoo-blotting)分析;)分析;l拟拟Northern 杂交杂交 根据已知的根据已知的DNA顺序设计引物,从顺序设计引物,从mRNA

22、群体中扩增基因产物,再以群体中扩增基因产物,再以DNA为探针与之杂交。为探针与之杂交。2 获取基因全长获取基因全长cDNA序列序列构建构建cDNA文库,用目的基因文库,用目的基因DNA片段筛片段筛选文库。选文库。根据已知片段设计引物,根据已知片段设计引物,RACE 技术得到技术得到基因的全长基因的全长cDNA序列。序列。3.确定确定DNA顺序中基因的位置顺序中基因的位置通过对全长通过对全长cDNA序列的测序、对比,序列的测序、对比,以及与基因组以及与基因组DNA的比较,确定基因所的比较,确定基因所在的区域;在的区域;通过物种已建立遗传图和物理图来确定通过物种已建立遗传图和物理图来确定基因的位置;基因的位置;4.研究基因的表达研究基因的表达u功能基因组学研究功能基因组学研究u基因的差异表达基因的差异表达ucDNA/AFLPuDDRT-PCRu基因表达的整体分析基因表达的整体分析u基因芯片基因芯片uSAGE(基因表达的序列分析)(基因表达的序列分析)5.基因的功能基因的功能u构建相应的表达载体构建相应的表达载体u原核表达载体系统原核表达载体系统u真核表达载体系统真核表达载体系统u建立相应的突变体库建立相应的突变体库u代谢途径代谢途径u基因产物基因产物6.蛋白质组学蛋白质组学

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|