基因组学与比较基因组学演示文稿课件.ppt

上传人(卖家):晟晟文业 文档编号:5029116 上传时间:2023-02-04 格式:PPT 页数:67 大小:2.48MB
下载 相关 举报
基因组学与比较基因组学演示文稿课件.ppt_第1页
第1页 / 共67页
基因组学与比较基因组学演示文稿课件.ppt_第2页
第2页 / 共67页
基因组学与比较基因组学演示文稿课件.ppt_第3页
第3页 / 共67页
基因组学与比较基因组学演示文稿课件.ppt_第4页
第4页 / 共67页
基因组学与比较基因组学演示文稿课件.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

1、第十一章第十一章 基因组学与比较基因组学基因组学与比较基因组学By Hongwei Guo,Peking University,2008.12.29Genomics and Comparative Genomics基础分子生物学期末安排考试时间:2009 年 1 月 12 日 下 午 2:00-4:00 考试地点:三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)基因组计划 基因组(genome)是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和。基因组学(genomics)是指研究并解析生物体整个基因组的所有遗传信息的学科。基因组计

2、划(Genome Project)是指对人类以及其它生物体全基因组的测序工作(sequencing)。人类基因组计划(Human Genome Project,HGP):90年代提出并已基本完成,同40年代原子弹爆炸,60年代人类登月一起被认为是二十世纪科技发展史上的三大创举。History of the Human Genome Project1990 Official start of HGP with 3 billion$and a 15 year horizon.1999 Sanger Centre publishes chromosome 222001 Draft Genome pu

3、blished:Celera&Public2003 Completion(almost)of Human GenomeCelera:Craig VenterIntl.Cons:Francis CollinsPublic effort-strategy:Celera-strategy:Sequencing StrategiesCeleras view of International ConsortiumInternational Consortiums view of CeleraUnfair competition:IC delivering the same goods but with

4、state funding.Unfair competition:Celera delivering the same goods but can use IC data,while IC cannot use Celera data.Public effort-strategy:基因组基因组DNA大片段文库的构建大片段文库的构建 YAC(yeast artificial chromosome,酵母人工染色体):含有三种必需成分:着丝粒、端粒和复制起点。是迄今容量最大的克隆载体,插入片段平均长度为200-1000 Kbp,最大的可以达到2 Mbp。BAC(Bacterial artificia

5、l chromosome),用细菌的F质粒及其调控基因构建了细菌染色体克隆载体,其克隆能力在125150 Kbp左右。以BAC为基础的克隆载体形成嵌合体的频率较低,转化效率高,而且以环状结构存在于细菌体内,易于分辨和分离纯化,已被科学界广泛接受。BACBAC的构建的构建pBAC108L来自细菌的一个小型F质粒,其中oriS和repE控制了质粒的复制起始,parB和parA控制了拷贝数。100-150 Kbp insertion遗传图谱(Genetic Map)vs 物理图谱(Physical Map)遗传图又称为连锁图(Linkage Map),是指基因或DNA标志在染色体上的相对位置相对位置

6、(或(或距离距离),通常以基因或DNA片段在染色体交换过程中的分离频率(cM)来表示。cM值越大,两者之间遗传距离越远。物理图谱是指以已知序列的DNA片段(序列标签位点,sequence-tagged site,STS)在染色体上的实际位置实际位置,位点之间的距离(图距)以碱基对(bp,kb,Mb)作为测量单位的基因组图。DNA遗传标记(DNA marker)第一代DNA遗传标记是RFLP(Restriction Fragment Length Polymorphism)。DNA序列上的微小变化,甚至1个核苷酸的变化,也能引起限制性内切酶切点限制性内切酶切点的丢失或产生,导致酶切片段长度的变化

7、。第二代DNA遗传标记SSLP(Simple Seqeuce Length Polymorphism)利用了存在于人类基因组中的大量重复序列重复序列,包括重复单位长度在15-65个核苷酸左右的小卫星DNA(minisatellite DNA),重复单位长度在2-6个核苷酸之间的微卫星DNA(microsatellite DNA)。第三代DNA遗传标记SNP(single nucleotide polymorphism),也是最广泛的遗传标记,是分散于基因组中的单个碱基单个碱基的差异。这种差异包括单个碱基的缺失和插入,但更常见的是单个核苷酸的替换,即单核苷酸的多态性。到目前为止已经在人类基因组发

8、现了超过1000万个SNP位点,平均每300bp中就有一个SNP!RFLP markerSSLP markersWTmutSNP marker酵母第三号染色体遗酵母第三号染色体遗传图(右)和物理图传图(右)和物理图(左)的比较(左)的比较 由于实验方法不同,不少由于实验方法不同,不少markers之间的遗之间的遗传距离并不等于它们在物理图上的距离。传距离并不等于它们在物理图上的距离。鸟枪法序列测定技术鸟枪法序列测定技术 全基因组鸟枪法测序(shotgun sequencing)技术:随机挑选带有基因组DNA的质粒进行末端序列测定,然后用计算机程序进行序列拼接。鸟枪法测序的主要缺点是,随着所测基

9、因组总量增大,所需测序的片段大量增加;其次,高等真核生物(如人类)基因组中有大量重复序列,导致判断失误 590bp10,000bpMate-Pair Shotgun DNA Sequencing大规模大规模DNA序列拼接序列拼接 DNA序列拼接问题与组合数学中的最短超串问题相似。最短超串问题即给定一个字符串的集合,找出一最短的字符串称为超串,并将集合中的任何一元素作为其子串。Popular Assemblers TIGR Assembler(TIGR)Phrap(Wash U)Celera Assembler(Celera,TIGR)Arachne(MIT Broad)Phusion(Sang

10、er uses Phrap)Atlas(Baylor HGSC)Assembly of the Individual SequencesIndividual sequencing reads are compared to eachother and where they overlap can be assembled to create contigsAssembly of the Individual SequencesKeep adding individual sequencing reads to build larger and fewer contigsAssembly of

11、the Individual SequencesEventually all sequencing reads merge to a single consensus sequence(a large contig)for each chromosome.鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列 改进后的鸟枪法改进后的鸟枪法(adopted by both(adopted by both IC and Celera)IC and Celera)高通量高通量DNA序列分析技术序列分析技术 人类基因组计划的成功很大程度上得益于有效减少

12、DNA测序成本的技术更新。通过改良测序方法,不断提升其自动化程度,DNA测序的成本降低了100倍,从20世纪70-80年代$10/bp降低到本世纪初$0.1/bp!如果一个熟练的DNA序列分析人员采取早期80年代方法每天测定1000 bp计算,人类基因组(约3109bp)的全序列分析,至少也得需要100名这样的工人花上100年的时间才能完成。而2000年代的高通量测序仪可达到月测序1-6 Mbp!目前?目前?$2/1 Mbp3 Gbp/machine/dayDNA sequencing technologies “Classical”Sanger dideoxy sequencing“Next

13、 Generation”,commercialized Roche 454 Pyrosequencing Solexa/Illumina cyclical base addition ABI SOLiD sequencing by ligation Single molecule(tethered DNA polymerase)Heliscope(cyclical base addition)VisiGen(real time,FRET-based)Illumina/Solexa Genetic Analyzer2000 Mb/runApplied Biosystems ABI 3730XL1

14、 Mb/day Roche/454 Genome Sequencer FLX100 Mb/runApplied BiosystemsSOLiD3000 Mb/runSanger sequencing13maybe 800 bp long42Roche/454:Genome Sequencer FLX Real Time Sequencing by Synthesis Chemiluminescence detection in pico titer plates Amplification:emulsion PCR Pyrosequencing up to 400,000 reads/run

15、on average 250 bases/read up to 100 Mb/runRoche/454 Genome Sequencer FLX100 Mb/runPyrosequencing-454 SequencingGenome sequencing in microfabricated high-density picolitre reactors Margulies,M.Eghold,M.et al.Nature.2005 Sep 15;437(7057):326-7A section of Pyrosequencing readsIllumina/Solexa:Genetic An

16、alyzer Real Time Sequencing by Synthesis Clonal Single Molecule Array Amplification:bridging PCR 60 million reads/run up to 50 bases/read 2 Gb/run 8 channels,app.5 mio reads/channel Fluorescent labels Reversible 3OH blockingIllumina/Solexa Genetic Analyzer2000 Mb/runReversible terminator-based seque

17、ncing(Solexa)Fragment DNA and ligate adaptors ComparisonWGS454SolexaCloningYesNoNoChemistrySangerpyrosequencing reversible terminatorsCost$to$AccuracyConsensus 99.99%Single read 99.5%;Consensus 99.99%?AssemblyBestBetterBadGap Closure and FinishingToughTougherPossible?Real Time Sequencing by Ligation

18、 Emulsion PCR and Beads on slides 85 million reads/run Up to 35 bases/read 3 Gb/run dual fluorescent labels 8 individual channels/flowcell 2 flowcells/runApplied BiosystemsSOLiD3000 Mb/runOligonucleotide Ligation&Detection(SOLiD)SOLiD:Substrate attachment;dibase probesMake sequencing library by shea

19、ring and adapter ligationAttach DNA fragments to beads and amplify polonies in emulsionAttach beads to slideSOLiD:Sequencing ligation cyclesSOLiD:Data Collection and Image AnalysisSOLiD:Decoding thesequenceMardis 2008Comparison of“Next Generation”Sequencing TechnologiesApplications Genetic AnalyzerS

20、ingle Molecule Sequencing Technologies:on the horizon Array of tethered DNA polymerase molecules Bound to template strand+primer Heliscope Cyclical base addition(similar to Solexa)VisiGen Real time,imaging FRET flashes Hopeful prediction:1 Mb/sec“Next Generation”Sequencing Technologies:Rate Limiting

21、 Factors Front end:Making the sequencing library Back end:Bioinformatics to make sense of the“sequence tsunami”-essemblyWhat do we sequence?de novo genome sequencing genome resequencing(SNP identification)metagenomes or complex samples transcriptome profiling small RNA identification(applications)Ex

22、amples of Applications of“Next Generation”Sequencing TechnologiesBest for“re-sequencing”,i.e.,aligning generated sequence to a reference genomeNext generation DNA technologies may replace microarrays for some applicationsShendure&Ji 2008The“$10,000 human genome sequencing”prize To the first team tha

23、t can build a device and use itto sequence:100 human genomes within 10 days or less,Accuracy:at most 1 error per 100,000 bases,Accurate coverage of at least 98%of the genome,Recurring cost of no more than$10,000(US)per genome.Prize:$10 million Deadline:12:01 AM PST,October 4,2013.Donors:X Foundation

24、,J.Craig Venter FoundationHuman HapMap ProjectHapMap的构建分为三个步骤:(a)在多个个体的DNA样品中鉴定单核苷酸多态性(SNPs);(b)将群体中频率大于1%的那些共同遗传的相邻SNPs组合成单体型;(c)在单体型中找出用于识别这些单体型的标签SNPs。通过对图中的三个标签SNPs进行基因分型,可以确定每个个体拥有哪一个单体型。SCIENCE 315:1781(30 MARCH 2007)Metagenomes or complex samples转录图(转录图(transcript profiling)基因转录图(cDNA图),或者基因的

25、cDNA片段图,即表达序列标签图(EST,expressed sequence tag),是基因组图的重要组成部分。大规模生产EST的主要程序如下:分离特定组织在某一发展阶段或某种生理条件下的总mRNA,合成双链cDNA,克隆到plasmid中并进行两端测序。Pyrosequencing Provides Evidence for Novel Transcripts and Transcript Architecturesmall RNA identification(i.e.microRNA)到到2006年底已完成的基因组项目年底已完成的基因组项目(http:/www.genomesonli

26、ne.org/)根据根据2007年年1月的数据,全球已启动月的数据,全球已启动2296个个基因组项目,其中基因组项目,其中607个项目已经完成,已个项目已经完成,已经公开发表经公开发表481个基因组序列,包括个基因组序列,包括403个个细菌基因组,细菌基因组,33个古细菌基因组和个古细菌基因组和45个真个真核生物基因组。核生物基因组。其它基因组计划其它基因组计划到到2006年年12月全世界主要基因组计划的进展情况月全世界主要基因组计划的进展情况 Why do we sequence genomes?To catalog all the genes present in one organism

27、.To compare the gene content of one organism to another organism.To study gene/genome evolution.To study organismal evolution.As a foundation for future experimentation.不同模式生物基因组的比较不同模式生物基因组的比较物 种基因组大小估计基因数尿殖道支原体 Mycoplasma genitalium580 Kb467肺炎支原体 Mycoplasma pneumoniae816 Kb677流感嗜血杆菌 Haemophilus in

28、fluenzae1.8 Mb1709枯草芽孢杆菌 Bacillus subtilis4.2 Mb4100大肠杆菌 Escherichia coli4.6 Mb4288酿酒酵母 Saccharomyces cerevisiae13 Mb6275线 虫 Caenorhabditis elegans100 Mb18891拟南芥 Arabidopsis thaliana125 Mb25498果 蝇 Drosophila melanogaster165 Mb14113人 类 Homo sapiens3 Gb约2.5万比较基因组学(比较基因组学(Comparative genomics)比较基因组学的威力

29、在于它能根据对一种生物相关基因的认识来理解、诠释甚至克隆分离另一种生物的基因。远缘基因组间的比较为认识生物学机制的普遍性,寻找研究复杂生理和病理过程所需的实验模型提供了理论依据,而近缘基因组间的比较则为认识基因结构与功能等细节提供了参数。物种名基因数目转录因子数量比例拟南芥约2938815335.9酵母约58852093.5线虫约188916693.5果蝇约133796354.5Functional Categories in Eukaryotic ProteomesApplications to Medicine A key application of human genome resea

30、rch is to find disease genes by positional cloning This method involves mapping the chromosomal region containing the gene by linkage analysis in affected families The human genomic sequence in public databases allows rapid identification in silico of candidate genes,followed by mutation screening o

31、f relevant candidates,aided by information on gene structure For a mendelian disorder,a gene search can now often be carried out in a matter of months with only a modestly sized teamNext Steps on HGP Finish the human sequence Large-scale identification of regulatory regions Sequencing of additional

32、large genomes Completing the catalogue of human variation From sequence to functionFuture Technology Development Functional genomics -aims to understand how genes are regulated and what they do,largely through massively parallel studies of gene expression in a variety of tissues Proteomics promises to make the identity of each protein known and elucidate protein-protein interactions Bioinformatics enhance the ability of researchers to manipulate,collect and analyze data more quickly and in new ways祝同学们新年快乐!考试顺利!祝同学们新年快乐!考试顺利!个人观点供参考,欢迎讨论!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(基因组学与比较基因组学演示文稿课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|