1、中基本概念l基因组(基因组(GenomeGenome):):一个生物体、细胞器或病毒的一个生物体、细胞器或病毒的整套基因和染色体组成,即全部基因的总称(包括整套基因和染色体组成,即全部基因的总称(包括所有的编码区和非编码区)所有的编码区和非编码区)l基因组学(基因组学(GenomicsGenomics):):以基因组分析为手段,对以基因组分析为手段,对所有基因进行基因组作图、核苷酸序列分析、基因所有基因进行基因组作图、核苷酸序列分析、基因定位、时序表达模式和基因功能分析的一门科学。定位、时序表达模式和基因功能分析的一门科学。l分子遗传学的分支学科分子遗传学的分支学科l提供有关生物物种及其细胞功
2、能的进化信息提供有关生物物种及其细胞功能的进化信息l生命科学的前沿和热点领域生命科学的前沿和热点领域1中基因组学l最早最早19861986年,由美国霍普金斯大学著名人年,由美国霍普金斯大学著名人类遗传学家和内科教授类遗传学家和内科教授McKusickMcKusick(1921-1921-20082008)提出来的)提出来的l随着人类基因组计划的实施,基因组学逐随着人类基因组计划的实施,基因组学逐渐成为渐成为一门以一门以结构基因组学结构基因组学为主的高度综为主的高度综合和跨学科的科学合和跨学科的科学l功能基因组学、比较基因组学、环境基因功能基因组学、比较基因组学、环境基因组学、药物基因组学等都纷
3、纷出台。组学、药物基因组学等都纷纷出台。2中 什么是基因组?一个物种中所有基因的整体组成。一个物种中所有基因的整体组成。人类基因组的两层意义:遗传信息和人类基因组的两层意义:遗传信息和遗传物质。遗传物质。揭开生命的奥秘,需要从整体水平研揭开生命的奥秘,需要从整体水平研究基因的存在、基因的结构与功能、究基因的存在、基因的结构与功能、基因之间的相互关系。基因之间的相互关系。3中 基因组研究内容基因表达研究,即比较不同组基因表达研究,即比较不同组织和不同发育阶段、正常状态织和不同发育阶段、正常状态与疾病状态,以及体外培养的与疾病状态,以及体外培养的细胞中基因表达模式的差异。细胞中基因表达模式的差异。
4、基因产物基因产物-蛋白质功能研究,包蛋白质功能研究,包括单个基因的蛋白质体外表达括单个基因的蛋白质体外表达方法。方法。蛋白质蛋白质-蛋白质功能研究。蛋白质功能研究。4中基因组学的分类l分类:分类:l结构基因组学结构基因组学(Structural Genomics)(Structural Genomics)l比较基因组学比较基因组学(Comparative Genomics)(Comparative Genomics)l功能基因组学功能基因组学(Functional Genomics)(Functional Genomics)l药物基因组学药物基因组学(Medical Genomics)(Med
5、ical Genomics)l营养基因组学营养基因组学(Nutritional Genomics)(Nutritional Genomics)l生物信息学生物信息学(Bioinformatics)(Bioinformatics)l蛋白质组学蛋白质组学(Proteomics)(Proteomics)5中基本概念l结构基因组学:结构基因组学:l通过基因作图、核苷酸序列分析确定基因组成、基通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。因定位的科学。l将基因组分解成小的易操作的结构区域,构建高分将基因组分解成小的易操作的结构区域,构建高分辨率的遗传图、物理图、转录本图,一个生物体基辨率的遗
6、传图、物理图、转录本图,一个生物体基因组的最终图就是它的全部因组的最终图就是它的全部DNADNA序列序列 。l人类基因组计划人类基因组计划l果蝇基因组果蝇基因组l拟南芥菜基因组拟南芥菜基因组6中基本概念l遗传连锁图:通过遗传重组所得到的基因线性排列遗传连锁图:通过遗传重组所得到的基因线性排列图称为遗传连锁图。通过计算连锁的遗传标志之间图称为遗传连锁图。通过计算连锁的遗传标志之间的重组频率的重组频率,确定它们的相对距离。确定它们的相对距离。l物理图谱:是利用限制性内切酶将染色体切成数个物理图谱:是利用限制性内切酶将染色体切成数个片段,根据重叠序列把片段连接成染色体,确定遗片段,根据重叠序列把片段
7、连接成染色体,确定遗传标志之间物理距离传标志之间物理距离 碱基对碱基对(bp)(bp)或千碱基或千碱基(kb)(kb)或或兆碱基兆碱基(Mb)(Mb)的图谱。的图谱。l转录本图谱:由基因转录本转录本图谱:由基因转录本mRNAmRNA反转录建立反转录建立cDNAcDNA文文库,通过库,通过cDNAcDNA克隆测序得到基因组的表达序列图谱。克隆测序得到基因组的表达序列图谱。7中基本概念l比较基因组学:比较基因组学:l在基因组图谱和测序基础之上,对已知的基因和基在基因组图谱和测序基础之上,对已知的基因和基因组结构进行比较,了解基因的功能、表达机理和因组结构进行比较,了解基因的功能、表达机理和物种的进
8、化的学科。物种的进化的学科。l比较分析比较分析7 7种生物的基因组,结果表明:在进化上,古细种生物的基因组,结果表明:在进化上,古细菌、真菌和真核生物有一个共同的具有自养能力的最近菌、真菌和真核生物有一个共同的具有自养能力的最近祖先。祖先。8中基本概念l功能基因组学功能基因组学l后基因组学后基因组学(Post genomics)(Post genomics),利用结构基因组,利用结构基因组学提供的信息和产物,通过在基因组系统水平上学提供的信息和产物,通过在基因组系统水平上全面分析基因的功能。全面分析基因的功能。l基因功能发现、基因表达分析、突变检测、基因基因功能发现、基因表达分析、突变检测、基
9、因组的表达与调控研究。组的表达与调控研究。l单一基因单一基因-蛋白质蛋白质 基因组基因组-蛋白质组,系蛋白质组,系统研究。统研究。l对成千上万的基因表达进行分析和比较,从基因对成千上万的基因表达进行分析和比较,从基因组组整体整体水平上对基因的活动规律进行阐述。水平上对基因的活动规律进行阐述。l一个细胞的转录表达水平能够精确特异地反映类一个细胞的转录表达水平能够精确特异地反映类型、发育阶段以及状态。型、发育阶段以及状态。9中细胞总 DNA细胞总 RNA输卵管细胞成红细胞胰岛细胞输卵管细胞成红细胞胰岛细胞卵清蛋白基因 +-珠蛋白基因 +-+-胰岛素基因 +-+实验方法 Southern 杂交 No
10、rthern 杂交10中基本概念l药物基因组学药物基因组学:l根据不同个体间的基因组差异与基因多态性,阐明个体间在药物代谢和效应方面发生差别的遗传基础。l不同的个体间药物的疗效和副作用存在差异。l促使新药的发现。l根据个体的遗传背景来优化药物治疗方案,即“个体化治疗”。11中基本概念l营养基因组学营养基因组学:l研究对人类营养有重要作用的植物研究对人类营养有重要作用的植物次级代谢次级代谢途径的途径的相关基因。相关基因。l与铁吸收转运有关的基因与铁吸收转运有关的基因l与生物素、维生素与生物素、维生素B1B1和维生素和维生素E E合成有关酶的基因合成有关酶的基因12中基本概念l生物信息学生物信息学
11、:l以计算机为工具,用数学和信息科学的观点、理论和方法去以计算机为工具,用数学和信息科学的观点、理论和方法去研究生命现象,对生物信息进行储存、检索和分析的科学。研究生命现象,对生物信息进行储存、检索和分析的科学。l以基因组以基因组DNADNA序列信息分析作为源头,破译隐藏在序列信息分析作为源头,破译隐藏在DNADNA序列中序列中的遗传语言发现新的基因和新的功能的遗传语言发现新的基因和新的功能 ,进行蛋白质空间结,进行蛋白质空间结构模拟和预测。构模拟和预测。l认识生命的起源、进化、遗传和发育的本质。认识生命的起源、进化、遗传和发育的本质。l揭示人体生理和病理过程的分子基础,为人类疾病的预测、揭示
12、人体生理和病理过程的分子基础,为人类疾病的预测、诊断、预防和治疗提供合理有效的方法。诊断、预防和治疗提供合理有效的方法。l依据特定蛋白质的功能进行必要的药物设计依据特定蛋白质的功能进行必要的药物设计l13中基本概念l蛋白质组学蛋白质组学:l蛋白质组蛋白质组(Proteome)(Proteome):在一种细胞内存在的全部蛋:在一种细胞内存在的全部蛋白质。白质。l蛋白质组学:研究细胞内所有蛋白质及其动态变化蛋白质组学:研究细胞内所有蛋白质及其动态变化规律的科学。规律的科学。l功能蛋白质组功能蛋白质组(Functional Proteome)(Functional Proteome):在特定时:在特
13、定时间、特定环境和实验条件下基因组活跃表达的蛋白间、特定环境和实验条件下基因组活跃表达的蛋白质。功能蛋白质组是总蛋白质组的一部分。蛋白质质。功能蛋白质组是总蛋白质组的一部分。蛋白质组和功能蛋白质组是生命科学的新的研究内容。组和功能蛋白质组是生命科学的新的研究内容。14中基因组计划基因组计划l模式微生物基因组计划模式微生物基因组计划l模式植物基因组计划模式植物基因组计划l模式动物基因组计划模式动物基因组计划l人类基因组计划人类基因组计划15中 基因组计划基因组计划?l获得全基因组序列:获得全基因组序列:为基因组的全面测序提为基因组的全面测序提供工作框架供工作框架l构建基因组图:在长链构建基因组图
14、:在长链DNA分子上寻找特征分子上寻找特征性标记,根据分子标记将包括这些序列的克性标记,根据分子标记将包括这些序列的克隆进行连锁定位,绘制基因组图。隆进行连锁定位,绘制基因组图。l根据基因组图,基因组区段分解、逐个测序,根据基因组图,基因组区段分解、逐个测序,最后进行组装最后进行组装16中l重叠群法重叠群法:contig,指相互间存在重叠顺序的,指相互间存在重叠顺序的一组克隆。根据重叠顺序的相对位置将各个克一组克隆。根据重叠顺序的相对位置将各个克隆首尾连接,覆盖的物理长度可达百万级碱基隆首尾连接,覆盖的物理长度可达百万级碱基对。在单个的重叠群中,采用鸟枪法测序,然对。在单个的重叠群中,采用鸟枪
15、法测序,然后在重叠群内进行组装。后在重叠群内进行组装。由上至下由上至下。l直接鸟枪法直接鸟枪法:首先进行全基因组鸟枪法:首先进行全基因组鸟枪法测序测序,再以基因组图的再以基因组图的分子标记分子标记为起点,将鸟枪法为起点,将鸟枪法DNA片段进行片段进行组装组装。根据高密度的基因组图分。根据高密度的基因组图分子标记,检测组装片段是否处在正确的位置,子标记,检测组装片段是否处在正确的位置,校正因重复顺序的干扰产生的序列误排。由下校正因重复顺序的干扰产生的序列误排。由下至上至上17中l重叠群法重叠群法:contig,指相互间存在重叠顺序的,指相互间存在重叠顺序的一组克隆。根据重叠顺序的相对位置将各个克
16、一组克隆。根据重叠顺序的相对位置将各个克隆首尾连接,覆盖的物理长度可达百万级碱基隆首尾连接,覆盖的物理长度可达百万级碱基对。在单个的重叠群中,采用鸟枪法测序,然对。在单个的重叠群中,采用鸟枪法测序,然后在重叠群内进行组装。后在重叠群内进行组装。由上至下由上至下。l直接鸟枪法直接鸟枪法:首先进行全基因组鸟枪法:首先进行全基因组鸟枪法测序测序,再以基因组图的再以基因组图的分子标记分子标记为起点,将鸟枪法为起点,将鸟枪法DNA片段进行片段进行组装组装。根据高密度的基因组图分。根据高密度的基因组图分子标记,检测组装片段是否处在正确的位置,子标记,检测组装片段是否处在正确的位置,校正因重复顺序的干扰产生
17、的序列误排。由下校正因重复顺序的干扰产生的序列误排。由下至上至上18中19中 基因组作图的方法l遗传作图遗传作图l物理作图物理作图l序列作图序列作图l基因作图基因作图20中基因组学(genomes)l基因组图基因组图l遗传作图(遗传作图(genetic mapping):采用遗传):采用遗传学分析方法(杂交实验和家系分析),将基学分析方法(杂交实验和家系分析),将基因或其他因或其他DNA顺序标定在染色体上,构建连顺序标定在染色体上,构建连锁图。遗传图距单位为厘摩(锁图。遗传图距单位为厘摩(cM),每单位),每单位厘摩定义为厘摩定义为1%交换率。交换率。l物理作图(物理作图(phisical m
18、apping):采用分):采用分子生物学技术,直接将子生物学技术,直接将DNA分子标记、基因分子标记、基因或克隆标定在基因组实际位置。限制性片段或克隆标定在基因组实际位置。限制性片段作图与克隆作图的图距单位为碱基对。作图与克隆作图的图距单位为碱基对。21中第二章第二章 遗传作图遗传作图1.基因组作图的方法基因组作图的方法2.遗传作图中使用的标记遗传作图中使用的标记3.遗传作图的方法遗传作图的方法22中2.1 基因组作图的方法l遗传图谱遗传图谱(genetic map)genetic map)又称又称连锁图谱连锁图谱(linkage map)linkage map)或遗传或遗传连锁图谱连锁图谱(
19、genetic linkage map)genetic linkage map):指基因组内基因和专一:指基因组内基因和专一的多态性的多态性DNADNA标记标记(marker)marker)相对位置的图谱相对位置的图谱l遗传作图遗传作图(genetic mapping)(genetic mapping):采用遗传学分析方法将基因:采用遗传学分析方法将基因或其它或其它DNADNA顺序标定在染色体上构建成连锁图顺序标定在染色体上构建成连锁图l遗传图谱表明基因之间连锁关系和相对距离遗传图谱表明基因之间连锁关系和相对距离,早期早期 绘制绘制的经典遗传图谱的单位是重组率,的经典遗传图谱的单位是重组率,1
20、%1%的重组率为的重组率为1 1个遗个遗传单位。现代遗传图谱的单位为厘摩传单位。现代遗传图谱的单位为厘摩(centi Morgancenti Morgan,cM)cM),1cM1cM相当于相当于1%1%的重组率,约为的重组率,约为1 000 0001 000 000个碱基对个碱基对(base base pairspairs,bp)bp)23中2.1 基因组作图的方法l通过遗传图谱,我们可以大致了解各个基因或通过遗传图谱,我们可以大致了解各个基因或DNADNA片断片断之间的相对距离与方向,如哪个基因更靠近着丝粒,那个之间的相对距离与方向,如哪个基因更靠近着丝粒,那个更靠近端粒等更靠近端粒等l遗传
21、距离是通过遗传连锁分析获得的,使用的遗传距离是通过遗传连锁分析获得的,使用的DNADNA厘摩厘摩标志越多,越密集,所得到的遗传连锁图的分辨率就越高标志越多,越密集,所得到的遗传连锁图的分辨率就越高l遗传图谱不仅是现阶段定位基因的重要手段,即使在人类遗传图谱不仅是现阶段定位基因的重要手段,即使在人类基因组全物理图谱建立起来之后,它依然是研究人类基因基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的重要手段组遗传与变异的重要手段24中2.2遗传作图中使用的标记l遗传标记(遗传标记(Genetic MarkersGenetic Markers):):遗传图有特征性遗传图有特征性的位置标
22、记,用于表示基因组中特定顺序所在的位置标记,用于表示基因组中特定顺序所在的位置。这些标记按孟德尔方式遗传,标记位的位置。这些标记按孟德尔方式遗传,标记位点应是多态的点应是多态的l基因标记基因标记lDNADNA标记标记25中2.2.1 基因标记l表型(表型(phenotype)phenotype):一个遗传性状必须以两种替换形式一个遗传性状必须以两种替换形式或表型存在才能用于遗传学分析或表型存在才能用于遗传学分析l等位基因(等位基因(alleleallele):每种表型是由不同的等位基因控制每种表型是由不同的等位基因控制l肉眼分辨的表型:肉眼分辨的表型:颜色、形状等。如用于果蝇遗传图的颜色、形状
23、等。如用于果蝇遗传图的构建构建l生化表型:生化表型:微生物遗传学研究微生物遗传学研究26中2.2.1 基因标记l人类的生化性状人类的生化性状lABOABO血型血型lHLAHLA(人类白细胞抗原)人类白细胞抗原)l复等位基因(复等位基因(multiple allelesmultiple alleles):人类白细胞人类白细胞抗原(抗原(HLAHLA)是最复杂最具多态性的体系,位是最复杂最具多态性的体系,位于于6 6 号染色体号染色体lHLA-DRBIHLA-DRBI(human leukocyte antigens-DRBIhuman leukocyte antigens-DRBI)基因位基因位
24、点至少有点至少有5959个等位基因个等位基因lHLA-BHLA-B抗原编码位点有抗原编码位点有6060多个等位基因多个等位基因27中ABO 血型基因座上具有编码不同半乳糖转移酶复等位基因血型基因座上具有编码不同半乳糖转移酶复等位基因其特异性决定了血型的差别其特异性决定了血型的差别28中ABO 血型基因座上具有编码不同半乳糖转移酶复等位基因血型基因座上具有编码不同半乳糖转移酶复等位基因其特异性决定了血型的差别其特异性决定了血型的差别29中2.2.2 DNA(分子)标记l基因标记:有用、有效,并非理想。基因标记:有用、有效,并非理想。l高等生物,可用作标记的基因十分有限高等生物,可用作标记的基因十
25、分有限l许多性状都涉及多基因。许多性状都涉及多基因。l高等生物基因组中存在大量的基因间隔区,用基因高等生物基因组中存在大量的基因间隔区,用基因标记将在遗传图中留下大片的标记将在遗传图中留下大片的无标记无标记区段。区段。l并非所有等位基因可以通过常规实验予以区分,因并非所有等位基因可以通过常规实验予以区分,因而是而是l产生的遗传图不完整,产生的遗传图不完整,必须必须寻找其他更有效的寻找其他更有效的标记标记30中2.2.2 DNA(分子)标记l限制性片段长度多态性限制性片段长度多态性(restriction fragment length restriction fragment length p
26、olymorphisms,RFLPpolymorphisms,RFLP)l简单序列长度多态性简单序列长度多态性(simple sequenece length simple sequenece length polymorphisrns,SSLPs)polymorphisrns,SSLPs)l小卫星序列:(小卫星序列:(Minisatellite DNAMinisatellite DNA)l微卫星序列:(微卫星序列:(Microsatellite DNA,MSMicrosatellite DNA,MS)l单核苷酸多态性标记单核苷酸多态性标记(single nucleotide polymorp
27、hisms,SNPsingle nucleotide polymorphisms,SNP)31中2.2.3 遗传作图中标记的发展l遗传标记的发展:遗传标记的发展:l第一代标记第一代标记l 经典的遗传标记(蛋白质和免疫学的标记)经典的遗传标记(蛋白质和免疫学的标记)l 70 70年代中后期,限制酶片段长度多态性(年代中后期,限制酶片段长度多态性(RFLPRFLP)l第二代标记第二代标记l 85 85年,年,“小卫星序列小卫星序列(minisatelliteminisatellite)l 89 89年,年,“微卫星序列微卫星序列(microsatellitemicrosatellite)l第三代标
28、记第三代标记l 单核苷酸多态性标记(单核苷酸多态性标记(single nucleotidesingle nucleotide polymorphism polymorphism,SNPSNP)32中2.2.3 遗传标记中的第一代标记l经典的遗传标记(蛋白质和免疫学的标记)经典的遗传标记(蛋白质和免疫学的标记)lABOABO血型位点标记血型位点标记lHLAHLA位点标记位点标记l存在问题:存在问题:l已知多态的蛋白质很少已知多态的蛋白质很少l等位基因的数目有限等位基因的数目有限l无法获得足够的信息量无法获得足够的信息量l检测技术的繁琐等检测技术的繁琐等限制了人类基因组的遗传分析工作限制了人类基因
29、组的遗传分析工作促使人们直接在促使人们直接在DNADNA上寻找新的遗传标记上寻找新的遗传标记33中2.2.3 遗传标记中的第一代标记l7070年代发展起来的年代发展起来的DNADNA重组技术、重组技术、DNADNA克隆技术和克隆技术和DNADNA探针技术探针技术l为拓展遗传图谱的构建途径创造了技术条件为拓展遗传图谱的构建途径创造了技术条件l使人类基因定位的方法从使人类基因定位的方法从细胞及染色体细胞及染色体水平过渡到水平过渡到分子水平分子水平lDNADNA水平的多态性标记位点作为绘制现代遗传图谱的主要界标,提高水平的多态性标记位点作为绘制现代遗传图谱的主要界标,提高图谱的图谱的 精确度、准确性
30、。遗传图谱的绘制进入了一个崭新的时代精确度、准确性。遗传图谱的绘制进入了一个崭新的时代 l现代遗传图谱的概念现代遗传图谱的概念由由Botstein DBotstein D等等(1980)(1980)首先提出,在此基础首先提出,在此基础上,限制性片段长度多态性(上,限制性片段长度多态性(RFLPRFLP)作为遗传图谱的第一代崭新作为遗传图谱的第一代崭新标记得以问世标记得以问世 。l限制性位点限制性位点能够用作基因标记。广泛应用到基因组研究中。基因或能够用作基因标记。广泛应用到基因组研究中。基因或基因组可以用基因组可以用重叠的限制性片段重叠的限制性片段来作图。最终扩展到整个序列,构来作图。最终扩展
31、到整个序列,构建连锁图谱建连锁图谱34中l同源染色体同一区段DNA 序列的差异,l限制酶识别的碱基顺序有专一性35中2.2.3遗传标记中的第二代标记简单序列长度多态性简单序列长度多态性 SSLPsl发现:发现:l小卫星序列小卫星序列minisatellite minisatellite(19851985年)年)l微卫星序列微卫星序列microsatellite microsatellite(19891989年)年)lmicrosatellite markermicrosatellite marker又称简单串连重复(又称简单串连重复(short tandem repeatshort tande
32、m repeat,STRSTR),),最重要的优点是高度多态性,提供的信息量相对很大;另外可用最重要的优点是高度多态性,提供的信息量相对很大;另外可用PCRPCR技术使操作实现自动化,遗传图与物理图研究中非常有用的工具技术使操作实现自动化,遗传图与物理图研究中非常有用的工具l2020世纪世纪8080年代后期年代后期,人们开始应用人们开始应用微卫星序列微卫星序列(microsatellite,MS)microsatellite,MS)绘制图绘制图谱。谱。19941994年底,美、法完成了以年底,美、法完成了以RFLPRFLP及微卫星为标志的遗传及微卫星为标志的遗传图谱图谱.图谱包含了图谱包含了5
33、8265826位点,覆盖位点,覆盖40004000cMcM,分辨率高达分辨率高达0.70.7cMcM19961996年年法国报道了完全以微卫星法国报道了完全以微卫星DNADNA标志构建的遗传连锁图,包含标志构建的遗传连锁图,包含23352335位位点,分辩率为点,分辩率为1.61.6cMcM36中37中2.2.3遗传标记中的第三代标记单核苷酸多态性标记(单核苷酸多态性标记(single nucleotide single nucleotide polymorphismspolymorphisms,SNPsSNPs)l点突变,位于密码子的摇摆位置,表现为沉默突变而被点突变,位于密码子的摇摆位置,
34、表现为沉默突变而被大量保留下来。大多数不能被限制酶识别,必须采取测大量保留下来。大多数不能被限制酶识别,必须采取测序或寡聚核苷酸杂交检测序或寡聚核苷酸杂交检测l在人类基因组中可达到在人类基因组中可达到300300万个,平均每万个,平均每10001000个碱基对个碱基对就有一个就有一个l数目多,覆盖密度大,它的开发和应用摒弃了遗传标记数目多,覆盖密度大,它的开发和应用摒弃了遗传标记分析技术的分析技术的 瓶颈瓶颈 凝胶电泳,为凝胶电泳,为DNADNA芯片技术应用于遗芯片技术应用于遗传作图提供了基础传作图提供了基础38中39中2.3 遗传作图的方法l连锁分析是遗传作图的基础:连锁分析是遗传作图的基础
35、:1905,Bateson,Saunder和和Punnett;1911年年Morgan揭示了连锁分析的意义揭示了连锁分析的意义l在同一条染色体上的基因间表现出在同一条染色体上的基因间表现出遗传连锁遗传连锁(Genetic linkage),因为它们都是在同一条长的因为它们都是在同一条长的DNA分子上分子上l部分连锁与重组:部分连锁与重组:l比利时细胞学家比利时细胞学家Janssens发现减数分裂时同源染色体的交换发现减数分裂时同源染色体的交换lSturtevant:2 个彼此靠近的基因之间因交换而分离的频率,要个彼此靠近的基因之间因交换而分离的频率,要比相互远离的比相互远离的2个基因之间发生分
36、离的频率要小个基因之间发生分离的频率要小l重组率则可成为测量基因之间相对距离的尺度,只要获得不同重组率则可成为测量基因之间相对距离的尺度,只要获得不同基因之间的重组率,就可绘制一份基因位于染色体上相对位置基因之间的重组率,就可绘制一份基因位于染色体上相对位置的地理图的地理图40中41中部分连锁与遗传作图l构建遗传图谱的基本原理构建遗传图谱的基本原理l真核生物遗传过程中会发生减数分裂,此过程中染色体要进行重组真核生物遗传过程中会发生减数分裂,此过程中染色体要进行重组和交换,这种重组和交换的概率会随着染色体上任意两点间相对距和交换,这种重组和交换的概率会随着染色体上任意两点间相对距离的远近而发生相
37、应的变化。根据概率大小,人们就可以推断出同离的远近而发生相应的变化。根据概率大小,人们就可以推断出同一条染色体上两点间的相对距离和位置关系。正因为如此,我们得一条染色体上两点间的相对距离和位置关系。正因为如此,我们得到的这张图谱也就只能显示标记之间的相对距离。我们称这一距离到的这张图谱也就只能显示标记之间的相对距离。我们称这一距离(概率概率)为遗传距离为遗传距离(cM)cM),由此构建的图谱也称为遗传图谱。由此构建的图谱也称为遗传图谱。42中连锁遗传图的做法l一般以最左端的基因位置为一般以最左端的基因位置为0,如发现有新的基因在更左端的位置,如发现有新的基因在更左端的位置时,把时,把0点让给新
38、基因,其余的基因座位作相应移动点让给新基因,其余的基因座位作相应移动l重组率在重组率在0-50%之间,但图谱上出现之间,但图谱上出现50以上的图距。这是由于较以上的图距。这是由于较远的两基因之间发生偶数次交换,但没有出现重组类型,所以交换远的两基因之间发生偶数次交换,但没有出现重组类型,所以交换值要大于重组率。绘制连锁遗传图时,需根据重组率进行图距的校值要大于重组率。绘制连锁遗传图时,需根据重组率进行图距的校正正l公式为公式为 RF=1/2(1-e-m)RF为重组率为重组率 m:平均交换数平均交换数 m值说明在两值说明在两个基因座之间每次减数分裂有个基因座之间每次减数分裂有8次交换,因每次交换
39、只包括次交换,因每次交换只包括4条染色条染色单体中的两条非姐妹染色体,所以由单体中的两条非姐妹染色体,所以由m转换成的真实图距应为转换成的真实图距应为1/2m43中不同模式生物的连锁分析l有性杂交实验有性杂交实验l系谱分析系谱分析lDNA转移转移44中杂交实验的连锁分析l选择已知基因型的亲本,设计杂交方案,获得交配的子选择已知基因型的亲本,设计杂交方案,获得交配的子代并分析其表型和基因型代并分析其表型和基因型l对于高等真核生物的常规连锁分析并不是直接检查配子,对于高等真核生物的常规连锁分析并不是直接检查配子,而是检测分别来自两个亲本配子融合形成的二倍体基因而是检测分别来自两个亲本配子融合形成的
40、二倍体基因型,即进行遗传杂交型,即进行遗传杂交l两点杂交和多点杂交两点杂交和多点杂交45中系谱分析l系谱分析法即对某家庭性状相关成员进行系谱分析法即对某家庭性状相关成员进行 统计,分析统计,分析性状之间的连锁关系,通过重组率进行相关基因定位,性状之间的连锁关系,通过重组率进行相关基因定位,这种方法又称这种方法又称家系分析法家系分析法(pedigree method)l不能进行有计划的遗传实验,只能收集家系成员的相关不能进行有计划的遗传实验,只能收集家系成员的相关资料进行连锁分析,主要涉及人类和多年生树木资料进行连锁分析,主要涉及人类和多年生树木l优势对数值(优势对数值(lod score)分析
41、:分析:lod值是基因连锁可能性值是基因连锁可能性的对数,用于判定所研究的两个标记是否在同一染色体的对数,用于判定所研究的两个标记是否在同一染色体上,换句话说就是基因是否连锁。如果优势对数分析确上,换句话说就是基因是否连锁。如果优势对数分析确定了连锁,然后可以提供最可能的重组频率程度。理想定了连锁,然后可以提供最可能的重组频率程度。理想的情况是资料来自不同系谱的情况是资料来自不同系谱46中细菌的遗传作图l转化(转化(transformation):):供体细胞释放的一段供体细胞释放的一段DNA(通常小于通常小于50kb),),经受体细胞摄取后整合到基经受体细胞摄取后整合到基因组中,可借助抗性培
42、养基筛选重组克隆因组中,可借助抗性培养基筛选重组克隆l转导(转导(transduction):通过噬菌体将小片段通过噬菌体将小片段DNA从从供体细胞转移到受体细胞供体细胞转移到受体细胞l接合转移接合转移(conjugation):两个细菌形成物理接触,两个细菌形成物理接触,DNA从供体转移到受体从供体转移到受体47中细菌的遗传重组细菌的遗传重组48中l细菌遗传作图中采用的都是细菌遗传作图中采用的都是生化标记生化标记(如合成色氨酸的(如合成色氨酸的能力、对抗生素的敏感性等),隐性表型(如不能合成能力、对抗生素的敏感性等),隐性表型(如不能合成色氨酸)是可以互补的性状。色氨酸)是可以互补的性状。l
43、基因转移在具有基因转移在具有野生野生型等位基因的型等位基因的供体供体品系与具有品系与具有隐性隐性等位基因的等位基因的受体受体品系之间进行,根据受体细胞是否获得品系之间进行,根据受体细胞是否获得基因指令的生化功能来监测转移的基因指令的生化功能来监测转移的DNA是否进入受体细是否进入受体细胞胞l接合:根据野生型基因进入受体的时间表,可以确定基接合:根据野生型基因进入受体的时间表,可以确定基因所在的位置因所在的位置l转导及转化:依据所研究的基因是否同时出现在受体细转导及转化:依据所研究的基因是否同时出现在受体细胞中,紧密连锁的基因总是有最高的机率被同时转移。胞中,紧密连锁的基因总是有最高的机率被同时
44、转移。49中RFLP连锁图lRFLP是第一种用于研究的是第一种用于研究的DNA标记(标记(David Bostein,1980)l基本设想:基本设想:由于同源染色体同一区段由于同源染色体同一区段DNA顺序的差异,顺序的差异,用限制酶消化时,会得到长度各不相同的限制性片段。用限制酶消化时,会得到长度各不相同的限制性片段。经过琼脂糖凝胶电泳分离,可直接显示不同个体同一位经过琼脂糖凝胶电泳分离,可直接显示不同个体同一位点点DNA组成的差异组成的差异l由于限制酶的专一性,用不同的限制酶处理同一由于限制酶的专一性,用不同的限制酶处理同一DNA样样品时,可以产生与之对应的不同限制性片断,从而提供品时,可以
45、产生与之对应的不同限制性片断,从而提供大量位点多态性信息大量位点多态性信息50中DNA限制酶分析限制酶分析51中l亲本:亲本:A1/B1和和A2/B2,个体,个体231;新组合:;新组合:A1/B2和和A2/B1,个体,个体39l交换率:交换率:39/(231+39)=14%;A与与B相距相距14cM52中RFLP连锁图l我们直接检验由限制图谱获得的基因型,而不是检测其表型的特点l左图表示三个世代限制图谱之间的血缘关系,其限制片段长限制片段长度多态性度多态性(RFLP)可以按孟德尔方式遗传,四种等位基因在每代中独立地分离,但图中经限制酶消化后所有等位基因之间的组合在凝胶电泳中都存在53中基因与
46、分子标记的共分离l共分离:共分离:如果限制酶多态性在基因组中自由发生,则有如果限制酶多态性在基因组中自由发生,则有些会在特定基因附近产生。我们可以确定这样的限制性些会在特定基因附近产生。我们可以确定这样的限制性标记,因为该标记与突变表型密切相关。如果比较患病标记,因为该标记与突变表型密切相关。如果比较患病者的和正常人的者的和正常人的DNA DNA 限制图谱,可能发现一个特定的限制图谱,可能发现一个特定的限制性位点通常出现限制性位点通常出现(或者丢失或者丢失)在患者在患者DNA DNA 中,原因是中,原因是限制性标记与表型间限制性标记与表型间100%100%相关。它暗示限制性标记与相关。它暗示限
47、制性标记与突变基因距离很紧,以至于它们在重组中不能分离突变基因距离很紧,以至于它们在重组中不能分离54中简单序列长度多态性简单序列长度多态性l小卫星小卫星DNADNA的核心序列一般为几个到几十个核苷酸,不同个体的核心序列一般为几个到几十个核苷酸,不同个体的不同基因座位重复次数不同的不同基因座位重复次数不同 ,每个重复单位的组成可略有变异。,每个重复单位的组成可略有变异。这类重复单位数目分布有限,有些染色体上还未发现这类这类重复单位数目分布有限,有些染色体上还未发现这类 小卫星小卫星DNADNA。它的位置一般在染色体端粒部位。亦已证明,这一序列广它的位置一般在染色体端粒部位。亦已证明,这一序列广
48、泛存在于人体基因组中泛存在于人体基因组中55中56中2.4 人类遗传图l人类基因组计划的最初目标人类基因组计划的最初目标-完成一份遗完成一份遗传图,其密度至少为每传图,其密度至少为每1000kb 一个标记一个标记l1994年完成,密度达到年完成,密度达到600kb一个标记一个标记l含有含有5264个微卫星序列个微卫星序列l不久,另一份物理图也随之问世,其密度不久,另一份物理图也随之问世,其密度为每为每100kb一个标记一个标记l含有含有7000个微卫星序列个微卫星序列57中第三章 物理作图l限制酶作图限制酶作图l基于克隆的基因组作图基于克隆的基因组作图l荧光原位杂交(荧光原位杂交(FISH)l
49、序列标记位点(序列标记位点(STS)l人类基因组物理图人类基因组物理图58中l遗传图的分辨率有限:基因组大,人类及遗传图的分辨率有限:基因组大,人类及大多数高等真核生物不可能获得大量的子大多数高等真核生物不可能获得大量的子代代l遗传图的精确性低:重组热点遗传图的精确性低:重组热点59中3.1 限制性作图l比较不同限制酶产生的比较不同限制酶产生的DNA片段的大小片段的大小l单酶切、双酶切、对比组装单酶切、双酶切、对比组装l部分酶切:多个相同酶切位点区段只发生一部分酶切:多个相同酶切位点区段只发生一次酶切次酶切l末端同位素标记(或其他标记)结合部分酶末端同位素标记(或其他标记)结合部分酶切:形成梯
50、形分布带切:形成梯形分布带60中l样品中仅存在较少的限制性位点样品中仅存在较少的限制性位点/小分子量小分子量DNA分子,用常规的限制酶即可绘制物理图分子,用常规的限制酶即可绘制物理图l稀有切点限制酶稀有切点限制酶61中l稀有切点限制酶稀有切点限制酶l特殊的凝胶电泳技术:脉冲凝胶电泳特殊的凝胶电泳技术:脉冲凝胶电泳PFGE(电场方(电场方向不断变换)向不断变换)62中63中3.2 基于克隆的基因组作图基于克隆的基因组作图3.2.1 载体载体l质粒、噬菌体、粘粒质粒、噬菌体、粘粒l啤酒酵母基因组主要是先构建粘粒文库,啤酒酵母基因组主要是先构建粘粒文库,然后建立克隆重叠群完成测序然后建立克隆重叠群完