1、1 1、基因座基因座:一条染色体的特定位置。:一条染色体的特定位置。2 2、等位基因等位基因:在同源染色体的特定基因座上的不同形式的:在同源染色体的特定基因座上的不同形式的基因,它们影响同一类表型,但产生不同的表型效应。基因,它们影响同一类表型,但产生不同的表型效应。3.3.复等位基因复等位基因:在群体中当一个基因座上的等位基因数目:在群体中当一个基因座上的等位基因数目有三个或三个以上。有三个或三个以上。4.纯合子纯合子/体体:如果在同一个:如果在同一个位点上两个等位基因是相位点上两个等位基因是相同 的,称 为 纯 合 子同 的,称 为 纯 合 子(Homozygous),这样的),这样的个
2、体 称 为 纯 合 体个 体 称 为 纯 合 体(Homozygotes)5.杂合子杂合子/体体:如果在同一个:如果在同一个位点上两个等位基因是不位点上两个等位基因是不同的,称为杂合子同的,称为杂合子(Heterozygous),这样),这样的个体称为杂合体的个体称为杂合体(Heterozygote)6.基因型(基因型(Genotype):是个体的遗传结构:是个体的遗传结构或组成。也认为是在个体特异性的遗传位或组成。也认为是在个体特异性的遗传位点上的等位基因点上的等位基因7.表现型(表现型(Phonotype):是基因型和环境因:是基因型和环境因素相互作用所观察到的结果,尤其是一个素相互作用所
3、观察到的结果,尤其是一个或几个特殊基因可见的表达。或几个特殊基因可见的表达。8 8、显性显性:一个等位基因在杂合状况下可以决定性:一个等位基因在杂合状况下可以决定性状,则由这一等位基因所决定的、在杂合子中表现状,则由这一等位基因所决定的、在杂合子中表现出的形状为显性。(大写英文字母代表显性基因)出的形状为显性。(大写英文字母代表显性基因)9 9、隐性隐性:一个等位基因在杂合状况下不可以决定:一个等位基因在杂合状况下不可以决定性状,则由这一等位基因所决定的形状为隐性。性状,则由这一等位基因所决定的形状为隐性。(小写英文字母代表隐性基因)(小写英文字母代表隐性基因)基因是遗传的基本单位 (重组单位
4、,突变单位,功能单位)是负载特定遗传信息的DNA片段 在一定条件下可以表达,从而控制或调节生物体的性状 “Humans,like cells,could read the messages of genes”J.WatsonHuman Genome Project“人类能象细胞那样阅读基因的信息人类能象细胞那样阅读基因的信息”Life sciences re-begin by sequencing “All biology in the future will start with the knowledge of genomes and proceed hopefully.”J.D.Wats
5、on,2003“未来所有生物学只有以基因组知识未来所有生物学只有以基因组知识(重新)开始才有希望发展重新)开始才有希望发展”No sequence,no knowledge!“The precise sequence of the bases is the code which carries the genetic information.”Watson&Crick,May 30,1953“GENETIC IMPLICATIONS OF THE STRU-CTURE OF DEOXYRIBONUCLEIC ACIDS”“Life is sequence-based”“碱基的排列顺序就是碱基的
6、排列顺序就是携带遗传信息的密码携带遗传信息的密码”“the instructions for making a life from one generation to the next is digital,NOT analogue”John Sulston,2003“生命指令是数据的,而不是模拟的生命指令是数据的,而不是模拟的”10101010101010010101010100110101010101010010101010100101001110000111000001110000011000101010101010010101010101010100101010101001010011
7、100001110000011100000110001001010101001010101010101010010101010100101001110000111000001110000011000101010101010010101010101010100101010101001010011100001110000011101001110000111000001110000011000101010101010010101010101010100101010101001010011100001110000011100000110001001010101001010101010101010010
8、101010100101001110000111000001110000011000101010101010010101010101010100101010101001010011100001110000011100000110001010101010100101010101010101001010101010010100111000011100000111000001100010101010101001010101010101010010101010100101001110000111000001110000110001010110000111000001110000011000101010
9、101010010101010101010100010101010101001010101010100010101010101001010101010101010010101010100101001110000111000001110000110001010110000111000001110000011000101010101010010101010101010111001011001010101010101010101010100010111010100000000001011100000010001000001010101001010100110010101010010010100100
10、101001010100100101001000010101001010101010101010101010010000001010100100101001010010100100101001001010000010101010A language for information!基因具有自我复制(self-replication)的重要特性。复制发生在细胞分裂周期的S期,DNA双螺旋结构解旋为两条单股的多核苷酸链,以DNA分子自身的每一股单链为模板进行自我复制合成新的DNA分子。复制的起点由特定的碱基序列组成。真核生物的复制从多个位点同时开始进行。基因表达基因表达(gene expressi
11、on):是把基因所储存的遗传信息转变为由特定的氨基酸种类和序列构成的多肽链,再由多肽链构成蛋白质或酶分子,从而决定生物各种性状(表型)的过程。基因表达包括两个步骤:以DNA为模板转录合成mRNA;将遗传信息翻译成多肽链中相应的氨基酸种类和序列 在整个生物界中,绝大部分生物(包括人类)基因的化学本质是DNA;在某些仅含有RNA和蛋白质的病毒中,基因的化学本质是RNA。DNA分子的基本单位是脱氧核苷酸,依各自所携碱基的不同,可以分成A A、G G、C C、T T 4种。将它们按一定顺序排列连接后即构成DNA单链。它们的排列顺序是DNA遗传的核心。1.结构基因-决定某种蛋白质或酶分子结构的基因2.调
12、控基因-调控结构基因表达的基因3.只转录而不翻译的基因-指专门转录tRNA,mRNA,rRNA的基因,它们并不翻译,参与蛋白质的生物合成 真核生物基因的编码序列往往被非编码序列所分割,呈现断裂状的结构,故而也称断裂基因断裂基因(split gene)。编码序列称为外显子外显子(exon),间隔的非编码序列称为内含子内含子(intron)。内含子在转录后的加工中会被切除。断裂基因的结构 转录及其加工过程 DNA分子中碱基对的排列顺序蕴藏着遗传信息,决定了基因的基本功能和特性。基因复制与表达构成了基因的主要功能。1、含两份同源的基因组 2、结构复杂,基因数庞大,具有许多复制起点,每个复制子大小不一
13、。3、真核基因由一个结构基因与相关的调控区组成,转录产物为单顺反子。4、含有大量重复序列。5、非编码序列(non-coding sequence NCS)占90%以上。6、断裂基因(split gene)。基因与基因间的非编码序列为间隔DNA(spacer DNA).7、功能相关的基因构成各种基因家族,可串联在一起,也可相距很远。ProkaryocyteGenome(kb)ORFOryza sativa L.ssp.Indica420,00050,000Arabidopsis thaliana115,42825,498Caenorhabditis elegans97,00019,099Dros
14、ophila melanogaster137,00014,100Homo sapiens3,000,00030,000真核生物基因组的大小真核生物基因组的大小“Jungle-Desert”Or“Big Small”?“Jungle-Desert”Or“Big Small”?Many Small GenesMany Small GenesTwo Big GenesTwo Big GenesIntronicIntronicIntergenicIntergenicIntergenicIntergenicIntergenicGene Space 50%Gene Space 50%Gene Space
15、90%Gene Space 90%The Gene“JungleThe Gene“JungleThe Gene“Desert”The Gene“Desert”Plant and animal genomes are very different Plant and animal genomes are very different with respect to the fraction that is transcribedwith respect to the fraction that is transcribed.Gene SizeTranscribedO.sativa4.5 Kb55
16、%A.thaliana2.6 Kb54%D.melanogaster9.5 Kb97%C.elegans5.0 Kb90%结构基因 顺式作用元件(cis-acting element)基因家族(gene family)重复序列(repeat sequence)端粒(telomere)顺式作用元件(cis-acting element)指与结构基因表达调控相关、能够被基因调控蛋白特异性识别和结合的DNA序列。并非都位于转录起始点上游,包括启动子、增强子、上游启动子元件、反应元件、加尾信号等。反式作用因子(trans-acting elements):可通过结合顺式作用元件而调节基因转录活性的蛋白
17、质因子。是RNA聚合酶特异性识别和结合的DNA序列,位于结构基因转录起始点的上游-25bp处,本身不被转录。启动子必须与转录因子结合才能被RNA聚合酶识别与结合。TATA盒:TATA 盒子启动子是一段特定的直接与RNA 聚合酶及其转录因子相结合决定基因转录起始与否的DNA序列.不同的启动子对RNA聚合酶的亲和力不同所结合的反式作用因子(trans-acting factors)也不同因此基因转录活性也很不相同.TATA盒上游的一些特定的DNA序列,反式作用因子能与这些元件结合调控基因的转录效率。上游启动子元件包括CAAT盒、CACA盒及GC 盒。CAAT盒:5GCNCAATCT3 GC盒:5C
18、CGCC3 CACA盒:GCCACACCC 一些信息分子的受体被细胞外信息分子激活后,能与特异的DNA序列结合,调控基因的表达。由于能介导基因对细胞外的某种信号产生反应,称为反应元件。具有较短的保守序列。糖皮质激素反应元件(GRE)序列为:GGTACANNTGTTCT。是一段DNA序列,其中含有多个能被反式作用因子识别与结合的顺式作用元件,能调控(常为增强)邻近基因的转录。一般位于转录起始点上游-100-300bp处,但在基因外或某些内含子中也有增强子序列。负增强子(negative enhancer)又称沉默子(silencer):负调控序列。结构基因的最后一个外显子中有一个保守序列AATA
19、AA与下游一段GT丰富区或T丰富区共同构成polyA加尾信号。与RNA聚合酶结合的延长因子能识别这种结构并与之结合,然后在AAUAAA下游1030个碱基的部位切断RNA并加上polyA 尾巴。1、高度重复序列:重复次数105的DNA序列如卫星DNA和反向重复序列。2、中度重复序列:重复次数为101105。3、单拷贝序列:大多数编码蛋白质的结构基因属这一类。1、反向重复序列(inverted repeats):5%2、串联重复序列(tandem repeats):具有一个固定的重复单位,头尾相连。10%(1)编码区串联重复顺序 (2)非编码区串联重复顺序 3、散在重复顺序(intersperse
20、d repeats)指两个顺序相同的互补拷贝在DNA链上呈反向排列。一种形式为两个反向排列的拷贝之间隔着一段间隔顺序如:5AAACCACCGCTGGTAGCGGTGGTTT3 3TTTGGTGGCGACCATCGCCACCAAA5另一种是两个拷贝反向串联在一起,也称为回文结构(palindrome).1、编码区串联重复顺序:如组蛋白基因。编码五种组蛋白的基因密集在一个基本的7.0kb的重复单位上,各重复单位之间有高度的序列一致性。2、非编码区串联重复顺序:常存在于间隔DNA和内含子内。是组成卫星DNA(satellite DNA)的基础。如果DNA分子之间存在浮力密度的差异,在氯化铯密度梯度离
21、心将会沉降于不同的位置。DNA的浮力密度()与其G-C含量存在关系:=1.660+0.00098(G-C%)。因此经过密度梯度离心,高度重复序列DNA可以在基因组DNA的主带旁形成一条或多条小带,这取决于其G-C含量及重复程度,故又称为卫星DNA或随机DNA。根据核心顺序的长短分为大卫星DNA、小卫星DNA、微卫星DNA。大卫星DNA(macrosatellite DNA)又称为经典DNA。总长度100kb几个Mb。根据浮力密度的不同分为、和、卫星DNA。各类型都由不同的重复顺序家族组成。小卫星DNA(minisatellite DNA)由中等大小 的串联重复序列构成,总长约0.120kb,分
22、布在所有染色体,往往近于端粒处。高度可变的卫星DNA、端粒DNA(串联的短片段重复序列(TTAGGGG)n 微卫星DNA(microsatellite DNA):重复单位为15 bp,重复次数为1060次,总长度小于150bp,常见以(AC)n和(TG)n二聚核苷酸为重复单位,由Miesfeld 1981年发现。1、短散在核元件(short interspersed nuclear elements SINEs),主要是Alu 重复序列家族。序列中有限制酶Alu的酶切位点(AGCT)而得名。重复次数3050万,散在分布于基因组中,与基因表达调控有关。2、长散在核元件(long interspe
23、rsed nuclear elements,LINEs):它们是“反转位子”。这些流动的遗传元素首先被转录成RNA,然后再被由该反转位子本身产生的一种逆向转录酶重新转变成DNA。该DNA版本可在任何位置结合进基因组中。3kb DNA位点多态性(DNA site polymorphism)限制性片段长度多态性(restriction fragment length polymorphism RFLP)串联重复顺序多态性(tandem repeats polymorphism)单核苷酸多态性(Single Nucleotide Polymorphism,SNP)由于等位基因间在特定位点上DNA序列
24、存在差异造成的。ABO血型组是发现的第一个人类多态性。人类白细胞抗原(HLA)是最复杂最具多态性的体系,位于6 号染色体。仅其中的DR抗原编码位点有60多个等位基因。用同一种限制酶消化不同个体的DNA时,会得到长度各不相同的限制性片段类型。当碱基组成的变化改变了限制性内切酶识别位点时,就会得到不同的限制性片段类型,这样的位点称为多态性位点。通过限制酶酶切片段的长度多态性来揭示DNA碱基组成不同的技术称为限制性片段长度多态性技术(RFLP技术)。PFLP的基础是高度重复序列和点突变。小分子小分子DNA,如细胞器基因如细胞器基因,将纯化的将纯化的DNA 样品用样品用限制性内切酶消化成长度不等的片段
25、进行琼脂糖限制性内切酶消化成长度不等的片段进行琼脂糖凝胶电泳分离凝胶电泳分离,经溴化乙锭染色后在紫外光下直接经溴化乙锭染色后在紫外光下直接观察其多态性观察其多态性;大分子核大分子核DNA 需要借助分子杂交手段需要借助分子杂交手段,用某一标用某一标记记DNA 片段的探针与被转移到硝酸纤维薄膜上的片段的探针与被转移到硝酸纤维薄膜上的DNA 片段进行杂交片段进行杂交,只有与探针有高度同源性的只有与探针有高度同源性的片段被检测出来片段被检测出来.呈孟德尔遗传呈孟德尔遗传;不受环境影响不受环境影响,是一种共显性标记是一种共显性标记,共显性(共显性(codominancecodominance):在杂合子
26、状态下,):在杂合子状态下,两个基因的作用都表现出来。两个基因的作用都表现出来。结果稳定可靠结果稳定可靠,重复性好重复性好.RFLP 需要大量的需要大量的DNA,样品要求高样品要求高 多态性频率较低多态性频率较低,判读有一定困难判读有一定困难 实验室之间结果比较有一定困难实验室之间结果比较有一定困难 制备放射性探针进行制备放射性探针进行Southern 杂交杂交,因而因而比较费时比较费时,对人体健康有影响对人体健康有影响,对环境有污染对环境有污染 RFLP 标记适用于构建表达图谱,在分析群体内和群体间遗传变异度、群体间基因流评价和亲缘关系时是强有利的评价,也可用于人类遗传疾病的诊断.如cDNA
27、 探针进行血红蛋白病产前诊断 NOG基因基因rs4794665位点的位点的PCR产物的酶切图谱产物的酶切图谱.泳道泳道1-5为不同产物的酶为不同产物的酶切图:切图:泳道泳道1不被酶切,呈一条带(不被酶切,呈一条带(433bp)为野生型纯合子)为野生型纯合子A/A型;型;泳道泳道2,3被完全酶切,呈两条带(被完全酶切,呈两条带(288bp,144bp)为突变型纯合子)为突变型纯合子G/G型型;泳道泳道3:不完全酶切呈三条带(:不完全酶切呈三条带(443p,288bp,144bp)为杂合子)为杂合子A/G型。型。泳道泳道M为为DNA分子量标记:所用分子量标记:所用DNA对照标准品为对照标准品为DL
28、2000。重复单位很小,但重复次数有较大的变化,主要发生在小卫星DNA和微卫星DNA中,也称为可变数目的串联重复序列(variable number of tandem repeats VNTRS)。小卫星DNA多态性:由于重复单位的数目不同引起。微卫星DNA多态性:由于重复单位的重复次数不同而具有高度的遗传多态性。STR 为共显性遗传为共显性遗传 有丰富的多态性有丰富的多态性,绝大多数不受选择压绝大多数不受选择压力的影响力的影响 较均匀地分布人类全基因组较均匀地分布人类全基因组 可经可经PCR 扩增扩增 用于构建遗传图谱用于构建遗传图谱.用于疾病诊断用于疾病诊断.用于法医鉴定用于法医鉴定 用
29、于分子进化分析用于分子进化分析VNTR D1S80应用实例应用实例IL-1RN genotypes in the studied population.IL-1RN*1/*2 genotype(lanes 1-2),IL-1RN*1/*4(lanes 3-4),IL-1RN*1/*1(lanes 5-6),IL-1RN*1/*3(lane 7)and IL-1RN*2/*2(lane 8).DNA Marker:GeneRulerTM 100bp DNA Ladder(lane 9).VNTR D1S80应用实例应用实例 复合扩增电泳分型结果照片1.TH01、TPOX和CSF1PO基因座在汉、
30、藏、回、东乡各民族群体中的分型的分型照片2.D16S539、D7S820和D13S317基因座复合扩增在汉、藏、回、东乡各民族群体中的分型 照片3 F13A01、FESFPS和vWA基因座复合扩增在汉、藏、回、东乡各民族群体的分型表:表:2 基于基于11个个STR数据的两两遗传距离数据的两两遗传距离Rst 值值(下三角)(下三角)(显著性水平显著性水平=0.05)和两两地理距离(上三角)和两两地理距离(上三角)结果表明了两两遗传距离(结果表明了两两遗传距离(Rst矩阵)和两两地理距离呈显著的正相关矩阵)和两两地理距离呈显著的正相关(r=0.646,P=0.003),地理上临近的人群表现出遗传上
31、的亲近性。这暗),地理上临近的人群表现出遗传上的亲近性。这暗示骊靬人和邻近的人群遗传关系较近。示骊靬人和邻近的人群遗传关系较近。人群 蒙古族汉族(宁夏)汉族(辽宁)汉族(河南)骊靬裕固族汉族(闽南)蒙古族1622.7866.21681.11869.21939.22704.2汉族(宁夏)0.035 1506.1769.4374.7580.71886.4汉族(辽宁)0.035 0.000 1152.61860.12034.51930.1汉族(河南)0.086 0.009 0.008 1114.71329.51192.1骊靬0.070 0.007 0.002 0.005 214.92155.2裕固族
32、0.079 0.024 0.016 0.034 0.007 2358.2汉族(闽南)0.171 0.049 0.043 0.018 0.041 0.079图图4 欧亚人群两两欧亚人群两两Rst遗传距离的多维尺度分析图遗传距离的多维尺度分析图。图图5 基于邻接法构建的系统进基于邻接法构建的系统进化树。枝内侧的数字是模拟化树。枝内侧的数字是模拟1000次后所得的支持率(次后所得的支持率(%)。)。突尼斯人被设为外群。突尼斯人被设为外群。SNP 是指基因组内DNA 中某一特定核苷酸在位置上存在置换、插入、缺失等变化,而且其中最少有一种等位基因在群体中突变频率不小于1%.SNP 一般以替换为主,颠换与
33、转换之比为1:2.转换(转换(transition):嘌呤代替嘌呤,或嘧啶代替嘧啶):嘌呤代替嘌呤,或嘧啶代替嘧啶 颠换(颠换(transversion):嘌呤被嘧啶所替代或嘧啶被嘌):嘌呤被嘧啶所替代或嘧啶被嘌呤所替代。呤所替代。SNP用作遗传标记具有以下优点:(1)SNP在人群中是二等位基因性的,在任何人群中其等位基因频率都可估计出来。(2)它在基因组中的分布较微卫星标记广泛得多。(3)与串联重复的微卫星位点相比,SNP是高度稳定的,尤其是处于编码区的SNP(cSNP),而前者的高突变率容易引起对人群的遗传分析出现困难。(4)部分位于基因内部的SNP可能会直接影响产物蛋白质的结构或基因表达
34、水平,因此,它们本身可能就是疾病遗传机制的候选改变位点。(5)易于进行自动化、规模化分析,缩短了研究时间。由于SNP的二态性,非此即彼,在基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,这就利于发展自动化技术筛选或检测SNPs。用于构建遗传图谱用于构建遗传图谱.用于疾病诊断用于疾病诊断.用于分子进化分析用于分子进化分析rs10181656DHPLC法检测SNPrs10181656CCGGCGGG+GGCC+CCCC+GG 测序法检测SNP 以线性染色体形式存在的真核基因组DNA的末端的一种特殊结构,是一段DNA序列和蛋白质形成的一种复合体。保守序列:TTAGGG重复序列.指核苷
35、酸序列或编码产物的结构具有一定程度同源性的一组基因。假基因(pseudogene):在多基因家族中有的成员并不能表达出有功能的产物。球蛋白基因球蛋白基因 1、核酸序列相同:即为多拷贝基因如rRNA基因家族,tRNA基因家族,组蛋白基因家族。2、核酸序列高度同源:如人类生长激素基因家族包括三种激素的基因,人生长激素、人胎盘促乳素和催乳素,它们之间高度同源。3、编码产物有同源功能:基因序列的相似性可能较低,但基因编码的产物具有高度保守的功能区。如src癌基因家族 4、编码产物具有小段保守基序:有些基因家族中各成员的DNA序列可能不明显相关,而所编码的产物却有共同的功能特征,存在小段保守的氨基酸基序
36、。基因超家族(gene superfamily)指一组由多基因家族及单基因组成的更大的基因家族,它们的结构有不同的同源性,功能并不一定相同。如免疫球蛋白基因超家族。可移动的基因成分,指能在一个可移动的基因成分,指能在一个DNADNA分子内部分子内部或两个或两个DNADNA分子之间移动的片段。在细菌中可分子之间移动的片段。在细菌中可指在质粒和染色体之间或在质粒和质粒之间移指在质粒和染色体之间或在质粒和质粒之间移动的片段。动的片段。主要类型主要类型 插入序列(插入序列(insertion sequence,IS)insertion sequence,IS)转座子(转座子(transposon,Tn
37、)transposon,Tn)逆转录转座子(逆转录转座子(retroposons or retro retroposons or retro transposon transposon)转座的噬菌体(转座的噬菌体(transposable phage)transposable phage)一类简单转位因子,长度约一类简单转位因子,长度约7002000bp7002000bp,由一个转位酶基因及两侧的反向重复序列由一个转位酶基因及两侧的反向重复序列(inverted repeat sequence,IR)inverted repeat sequence,IR)组成,组成,不带任何其它基因。不带任何
38、其它基因。转位时复制宿主靶位点一小段转位时复制宿主靶位点一小段DNADNA(415bp415bp)形成两端的正向重复序列。形成两端的正向重复序列。一类较大的可移动成分。除有关转座的一类较大的可移动成分。除有关转座的基因外,至少带有一个与转座作用无关基因外,至少带有一个与转座作用无关并决定宿主菌遗传性状的基因。并决定宿主菌遗传性状的基因。转座子中的转位酶常称为转座酶,其功转座子中的转位酶常称为转座酶,其功能是介导转座子插入到能是介导转座子插入到DNADNA的其它部位。的其它部位。逆转录转座子逆转录转座子又称又称“反转位子反转位子”。这些流。这些流动的遗传元素首先被转录成动的遗传元素首先被转录成R
39、NARNA,然后再被,然后再被由该反转位子本身产生的一种逆向转录酶由该反转位子本身产生的一种逆向转录酶重新转变成重新转变成DNADNA。该。该DNADNA版本可在任何位置版本可在任何位置结合进基因组中。结合进基因组中。在结构、转录特性和转座机制上十分类似在结构、转录特性和转座机制上十分类似于逆转录病毒的原病毒,在其两端具有长于逆转录病毒的原病毒,在其两端具有长的同相重复序列(的同相重复序列(LTRsLTRs)有与逆转录转座子类似的序列结构,但两有与逆转录转座子类似的序列结构,但两端缺少长的同相重复序列。典型的是长散端缺少长的同相重复序列。典型的是长散布元件(布元件(long intersper
40、sed elementlong interspersed element,LINELINE)具有转座功能的溶源性噬菌体具有转座功能的溶源性噬菌体 插入编码区 插入5侧向序列 可在不同个体中起作用 19841984年年McClintockMcClintock就提出转座子在植物基因组的重建就提出转座子在植物基因组的重建中起着很重要的作用。转座子在调节和编码区域的插中起着很重要的作用。转座子在调节和编码区域的插入和切除都能改变基因的编码功能和表达模式,但在入和切除都能改变基因的编码功能和表达模式,但在抗病基因分子生物学的研究中,尚未有证据直接证明抗病基因分子生物学的研究中,尚未有证据直接证明抗病基因
41、座中新的专化性抗性基因的产生是由转座子抗病基因座中新的专化性抗性基因的产生是由转座子的插入或切除所致。的插入或切除所致。不过已有试验表明,由转座子诱发的基因改变能引起不过已有试验表明,由转座子诱发的基因改变能引起抗病基因的失活和多样化。抗病基因的失活和多样化。例如,玉米抗圆斑病基因例如,玉米抗圆斑病基因HmlHml的突变等位基因中发现有的突变等位基因中发现有一个一个315bp(dHBr)315bp(dHBr)的插入,在一玉米近交系中正是一个的插入,在一玉米近交系中正是一个256bp256bp的转座子的插入改变了的转座子的插入改变了HmlHml的抗性,导致的抗性,导致19381938年年叶斑和穗
42、腐病的发生。叶斑和穗腐病的发生。亚麻中,也发现亚麻中,也发现2 2个个L6L6突变体由于小片段突变体由于小片段(300bp)(300bp)因子因子的插入导致该抗性基因失活。的插入导致该抗性基因失活。转座子通常会造成破坏。而在本例中,它们看来对寄转座子通常会造成破坏。而在本例中,它们看来对寄主有利。主有利。加州大学戴维斯分校进化遗传学家加州大学戴维斯分校进化遗传学家 和同事和同事 偶然间发现果偶然间发现果蝇加州种群体内有一条含万个碱基对的染蝇加州种群体内有一条含万个碱基对的染色体片段,所包含的全部基因不存在个体差异。色体片段,所包含的全部基因不存在个体差异。原因可能是该相同区域中某个特别的等位基
43、因迅速扩原因可能是该相同区域中某个特别的等位基因迅速扩散到了整个种群,同时捎带上它附近的各等位基因散到了整个种群,同时捎带上它附近的各等位基因 基因,它与一个基因,它与一个“跳跃基因跳跃基因”相连,负相连,负责清除杀虫剂和其他毒物的毒性。试验表明,当转座责清除杀虫剂和其他毒物的毒性。试验表明,当转座子存在时,基因比较活跃,这可能是由子存在时,基因比较活跃,这可能是由于跳跃过程打开了某个于跳跃过程打开了某个“基因开关基因开关”,而,而基因通常是处于关闭状态的。基因通常是处于关闭状态的。20042004年年7 7月发表于月发表于Proceedings of the National Proceed
44、ings of the National Academy of SciencesAcademy of Sciences(PNASPNAS)论文指出:转座子是一)论文指出:转座子是一种可以在染色体上移动的种可以在染色体上移动的DNADNA序列。它们长久以来被认序列。它们长久以来被认为是一段无用的基因。但是经研究发现,转座子对于为是一段无用的基因。但是经研究发现,转座子对于有机体的适应和生存而言是有利的。有机体的适应和生存而言是有利的。在这个研究计划中,在这个研究计划中,UABUAB的科学家显示转座子被插的科学家显示转座子被插入果蝇的染色体中,会使基因沉默,也就是显着地减入果蝇的染色体中,会使基因
45、沉默,也就是显着地减少基因的表现量。少基因的表现量。根据研究人员观察,转座子刺激与正常信使根据研究人员观察,转座子刺激与正常信使RNARNA互互补的一种分子。科学家称之为反对称补的一种分子。科学家称之为反对称RNARNA。这个新的互。这个新的互补分子可以阻止正常的补分子可以阻止正常的RNARNA合成蛋白质。研究显示,这合成蛋白质。研究显示,这种机制可以使有机体更适应环境。种机制可以使有机体更适应环境。(1)为环状DNA,长度为16569bp,双链DNA中,富含G的称为重链(heavy chain,H),富含C的为轻链(light chain,L);(2)能自主复制,在细胞内具有多拷贝;(3)编
46、码序列占93%,编码37个基因,其中13个编码蛋白质基因,2个rRNA基因和22个tRNA基因;28个基因由重链编码,9个基因由轻链编码;(4)基因内无内含子,基因排列紧凑,基因之间间隔极短或无间隔,有些甚至重叠;(5)部分密码子不同于核基因组密码子。mtDNA突变率比突变率比nDNA高的原因有以下高的原因有以下几点:几点:(1)mtDNA中基因排列非常紧凑,任何mtDNA的突变都可能会影响到其基因组内的某一重要功能区域。(2)mtDNA是裸露的分子,不与组蛋白结合,缺乏组蛋白的保护。(3)mtDNA位于线粒体内膜附近,直接暴露于呼吸链代谢产生的超氧离子和电子传递产生的烃自由基中,极易受氧化损伤。线粒体病可以有多种遗传模式:母系遗传、孟德尔遗传,或者两者均有。使其更为复杂的是线粒体疾病的表型也是多种多样的和相互重叠的。也就是说同样mtDNA 突变可以产生不同的表型,不同的mtDNA 突变可以产生相似的表型。因此对线粒体疾病因此对线粒体疾病,用遗传水平上的缺陷用遗传水平上的缺陷来分析病人比用临床表现来分析病人更来分析病人比用临床表现来分析病人更有益处。有益处。