1、Genome and Genomics概念 GenomeGene+Chromesome 一个配子中染色体遗传物质的总和;细菌或噬菌体:单个染色体所含的全部 DNA分子或遗传信息二倍体生物:维持配子或配字体正常功能 的最基本的一套染色体DNA 及其遗传信息。C值矛盾C值:基因组的大小通常以一个基因组中的DNA含量来表示,成为生物体的C值(C Value)。基因组的基因数目基因组的基因数目表表3-3 不同生物的基因数目不同生物的基因数目基因组1%编码蛋白,99垃圾序列非结构基因的DNA序列的结构与功能?C值矛盾匝生物学功能和进化中的意义?基因组学基因组学研究的发展基因组学(genomics)转录组
2、学(transcriptomics)蛋白质组学(proteomics)表型组学(phenomics)系统生物学(System Biology)基因型环境=表型第二节 基因组的序列组织基因组的复杂性C值矛盾的解释:基因数量是否随着C值的增加而增加复性动力学C值的差异主要反映了重复序列DNA含量的差异基因的结构基因组的结构同一个基因能产生同一个基因能产生不止一个蛋白分子不止一个蛋白分子内含子/外显子单一序列(单一序列(unique sequence)又称非重复序列,)又称非重复序列,在一个基因组中只有一个或几个拷贝在一个基因组中只有一个或几个拷贝DNA的序列。的序列。重复序列重复序列(repeti
3、tive sequence)重复序列的特点重复序列的特点重复单位的长度多样性重复单位的长度多样性,短的短的仅几个甚至两个核苷酸仅几个甚至两个核苷酸,长的有长的有几百乃至上千个核苷酸。几百乃至上千个核苷酸。重复的次数多样性重复的次数多样性,少的可重少的可重复几十次复几十次,多的上百万次。多的上百万次。单一序列单一序列(unique sequence)真核生物DNA的分类短分散重复序列(短分散重复序列(short interspersed repeated sequence,SINES)Alu家族(Alu family)长分散重复序列(长分散重复序列(long interspersed repea
4、ted sequence,LINES)Kpn家族(Kpn family)中度重复序列中度重复序列高度重复序列高度重复序列卫星卫星DNA由重复单位长度为由重复单位长度为2-200bp 的重复序的重复序列组成。列组成。卫星卫星DNA:DNA:由长的串联重复序列组成。由长的串联重复序列组成。微卫星微卫星DNA(microsatellite):以):以2-6个核苷酸为核心序列的串联重复序列。个核苷酸为核心序列的串联重复序列。小卫星小卫星DNA(minisatellite):以):以6-25个核苷酸为核心序列的串联重复序列。个核苷酸为核心序列的串联重复序列。基因家族基因家族(gene family)是真
5、核生物基因组中来)是真核生物基因组中来源相同,结构相似,功能相关的一组基因。源相同,结构相似,功能相关的一组基因。基因家族与基因簇基因家族与基因簇成簇存在的基因家族基因簇基因簇(gene cluster)是指基因家族的各成员紧是指基因家族的各成员紧密成簇排列成大段的串联重复单位,定位于染色密成簇排列成大段的串联重复单位,定位于染色体的特殊区域,它们是同一个祖先基因扩增的产体的特殊区域,它们是同一个祖先基因扩增的产物(物(MHC class I)。)。Orphon孤独基因孤独基因HLA gene familyImmunoglobulin gene familyFigure10.The organ
6、ization of the immunoglobulin heavy chain locus in vertebrates.Figure12.Comparison of the IGHC locus in the hominoid line.The existence of the gene has been proved only in human.Gene duplication including the-genes occurred in the common ancestor of hominoids and subsequent deletion of the Cgene(in
7、orangutan,including one of the Cgenes)occurred independently in each hominoid species散布的基因家族 编码密切相关的蛋白,但成员的序列并不相同,且散在分布于不同的染色体上。如血红蛋白基因家族。两个成员具有共同的起源。假基因(pseudogene)存在于基因家族中结构与功能基因具有同源性无转录产物或转录产物失活由突变产生Alu家族是人类基因组中十分典型的散布基因家族特点:成员众多,平均6kb一个;300bp,以Alu I特征识别序列AGCT分为两个片 段,170bp/130bp;非串联重复;具转录活性,可能与转录
8、调控、hnRNA加工以 及DNA复制有关;具转座子结构特征。卫星DNA的应用DNA fingerprinting(小卫星)Jeffreys等(1985)用人的肌红蛋自基因第一个内含子中的重复序列(重复单位长33bp)作探针,从人的基因文库中筛选出数个重复序列DNA,每个重复序列都是由许多碱基组成相似或相同的基本序列串联重复构成。由一种重复单位头尾相连构成的序列称为小卫星DNA(minisatellite DNA),重复单位长约10-60bp。同一小卫星位点上重复单位的重复次数变化,使之在群体中表现出高度多态性。Nakamura等(1987)称小卫星DNA为VNTR(Variable numbe
9、r of tandem repeat),并使这一概念沿用至今。小卫星DNA中每一重复单位均含有一个相似或相同的核心序列(core sequence),长约l0-l5bp,并且在同一物种不同小卫星位点之间和不同物种的小卫星位点之间表现高度保守性。迄今为止的许多研究业已证实,小卫星DNA在染色体上的随机性因物种而异,因不同的小卫星家族而异。用克隆的小卫星DNA做探针,可以与同一物种或不同物种基因组中多个位点的小卫星DNA杂交,获得具有个体专一性的限制性片段杂交谱带图,即DNA指纹图(DNA fingerprinting)。DNA指纹图具有高度变异性,个体专一性,组织稳定性,因此成为了一种较为广泛应
10、用的遗传标记 全基因组鸟枪法:全基因组鸟枪法:在一定作图信息基础在一定作图信息基础上,绕过大片段连续上,绕过大片段连续克隆系的构建而直接克隆系的构建而直接将基因组分解成小片将基因组分解成小片段随机测序,利用超段随机测序,利用超级计算机进行组装级计算机进行组装(美国(美国Celera公司)。公司)。随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备序列分析技术是一个包括制备DNA片段化及碱基分析、片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的信息翻译的多阶段的过程。通过测序得到基因
11、组的序列序列图谱图谱。基因图谱基因图谱是在识别基因组所包含的蛋白质编码序列的基础是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具在人类基因组中鉴别出占具2%5%长度的全部基因的位置、长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物结构与功能,最主要的方法是通过基因的表达产物mRNA反追反追到染色体的位置。到染色体的位置。(Postgenome era)*人类基因组计划完成之后,生物学被重新划分为人类基因组计划完成之后,生物学被重新划分为前基因组和后基因
12、组两部分。前基因组和后基因组两部分。*利用生物在进化上的亲缘关系利用生物在进化上的亲缘关系,来比较它们与来比较它们与人类之间的相似与相异人类之间的相似与相异,即比较基因组学。即比较基因组学。1.1.蛋白质分离和鉴定:蛋白质分离和鉴定:2.2.翻译后修饰:翻译后修饰是蛋白质调节功能的重要方式,翻译后修饰:翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。要作用。3.3.蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子的生物分析的生物分析/配基配基
13、-受体结合分析。可以利用基因敲除和反义受体结合分析。可以利用基因敲除和反义技术分析基因表达产物技术分析基因表达产物-蛋白质的功能。另外对蛋白质表达出蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。的了解。4.4.对人类而言,蛋白质组学的研究最终要服务于人类的健康,对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展。如寻找药物的靶分子。很多药主要指促进分子医学的发展。如寻找药物的靶分子。很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质也可以干预蛋白质-蛋白质相互作用。蛋白质相互作用。G.J.Mendel 18221884Thomas Hunt Morgan18661945Crick 1916 Watson 1928基因组学为人类了解自我提供了基础