ImageVerifierCode 换一换
格式:PPT , 页数:68 ,大小:968.89KB ,
文档编号:4226036      下载积分:28 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-4226036.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(晟晟文业)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(分子生物学第1章细胞核基因组课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

分子生物学第1章细胞核基因组课件.ppt

1、1.1 核基因组大小核基因组大小1.2 重复序列重复序列1.3 基因家族基因家族1.4 真核基因的断裂结构真核基因的断裂结构1细胞核基因组1.1 核基因组大小 一个物种中所包含的基因就是一个基因组,确一个物种中所包含的基因就是一个基因组,确切地说,基因组是指一个物种的单倍体的染色体所切地说,基因组是指一个物种的单倍体的染色体所包含的全部基因。对于只有一个染色体的原核生物包含的全部基因。对于只有一个染色体的原核生物来说,它的一个细胞中(一个染色体)的全部基因来说,它的一个细胞中(一个染色体)的全部基因组成其基因组;对于通常的二倍体生物来说,是指组成其基因组;对于通常的二倍体生物来说,是指能维持配

2、子或配子体正常功能的最低数目的一套染能维持配子或配子体正常功能的最低数目的一套染色体所包含的全部基因。真核生物基因组包括核基色体所包含的全部基因。真核生物基因组包括核基因组和细胞器基因组。因组和细胞器基因组。衡量基因组大小的单位 一个真核生物的核基因组的大小可以通过化学一个真核生物的核基因组的大小可以通过化学分析、分析、DNA复性动力学等方法进行测定。如果一复性动力学等方法进行测定。如果一个个DNA分子(双链)重分子(双链)重1pg(1012g),就意味着),就意味着它长约它长约31cm,含有,含有10 9 bp(base pair,碱基对),碱基对),分子量为分子量为6.11011道尔顿。道

3、尔顿。C值的概念 一个单倍体基因组的一个单倍体基因组的DNA含量是恒定的,它代含量是恒定的,它代表着一个生物种的特征,称为物种表着一个生物种的特征,称为物种DNA的的C值。值。C值值可以用可以用pg为单位表示,也可以用为单位表示,也可以用bp为单位表示。各为单位表示。各种生物的种生物的C值相差很大,并有随着有机体复杂度增加值相差很大,并有随着有机体复杂度增加而而C值增大的趋势,说明随着有机体复杂度的增加,值增大的趋势,说明随着有机体复杂度的增加,对遗传物质对遗传物质DNA量的需要也随之增加。量的需要也随之增加。DNA是遗传是遗传信息的载体,较复杂的有机体需要较多的遗传信息信息的载体,较复杂的有

4、机体需要较多的遗传信息是好理解的。是好理解的。表表11 一些生物物种的一些生物物种的DNA质量质量生物物种生物物种DNA质量质量(2C值)值)/pg染色体数染色体数(2n)生物物种生物物种DNA质量质量(2C值)值)/pg染色体数染色体数(2n)两栖鲵两栖鲵168.024贝母贝母196.724蝾螈蝾螈85.324百合百合72.224赤蛙赤蛙10.926小麦小麦34.614牛牛6.460玉米玉米11.020人人6.446烟草烟草7.824羊羊5.754油菜油菜3.238鼠鼠5.040水稻水稻2.024果蝇果蝇0.28亚麻亚麻1.430拟南芥拟南芥0.1410粘菌粘菌0.384(1C)7(1n)大

5、肠杆菌大肠杆菌0.0040酵母酵母0.026(1C)15(1n)噬菌体噬菌体0.000055图图11 不同有机体的不同有机体的C值大小值大小C值悖论 一般来说,一种生物的形态学复杂性应该与其一般来说,一种生物的形态学复杂性应该与其C值的大小大致相关,因为一种生物的形态学复杂性必值的大小大致相关,因为一种生物的形态学复杂性必然是它基因复杂性的反映。然而仔细研究有机体复杂然是它基因复杂性的反映。然而仔细研究有机体复杂度和度和C值的关系,就会发现难以解释的问题。如人与值的关系,就会发现难以解释的问题。如人与两栖动物两栖动物C值的比较。另外,一些密切相关的种属的值的比较。另外,一些密切相关的种属的C值

6、呈现出惊人的差异,如两栖类动物中值呈现出惊人的差异,如两栖类动物中C值可相差值可相差50倍,豆科植物中的蚕豆比百脉根的倍,豆科植物中的蚕豆比百脉根的C值大值大100倍。只倍。只有低等生物的情况符合这种设想。这就是有低等生物的情况符合这种设想。这就是C值悖论。值悖论。对基因数目的估计 通过估计不同种类通过估计不同种类mRNA的数目,可以估计出的数目,可以估计出一个特定哺乳动物细胞中能表达的基因总数约为一个特定哺乳动物细胞中能表达的基因总数约为10,000个,考虑到不同细胞类型有些不同的基因表个,考虑到不同细胞类型有些不同的基因表达,我们可以认为哺乳动物细胞基因组有功能的基达,我们可以认为哺乳动物

7、细胞基因组有功能的基因数目在因数目在30,00040,000个之间。假设哺乳类基因的个之间。假设哺乳类基因的平均大小为平均大小为5,0008,000bp(它们实际上比大多数(它们实际上比大多数已知的基因要长些),根据已知的基因要长些),根据C值计算,哺乳类基因值计算,哺乳类基因组中的基因数目理论上应在组中的基因数目理论上应在40万万60万个之间。万个之间。对基因数目的估计 果蝇必需的基因总数约为果蝇必需的基因总数约为5000个,由于对昆个,由于对昆虫基因大小的合理估计为虫基因大小的合理估计为2,000bp,那么,那么,5,000个个基因的总长度为基因的总长度为107bp,而果蝇的,而果蝇的C值

8、为值为108bp。这。这些分析说明,基因组中大部分些分析说明,基因组中大部分DNA是不表达的。是不表达的。DNA变性 在受到加热、高浓度盐处理时,在受到加热、高浓度盐处理时,DNA双螺旋碱双螺旋碱基配对结合的氢键会断裂,双螺旋链分开成单链,基配对结合的氢键会断裂,双螺旋链分开成单链,这个过程称为变性(这个过程称为变性(denaturation)或解链作用)或解链作用(melting)。)。DNA的热变性增色效应 核酸中的碱基有很强的紫外吸收,它的吸核酸中的碱基有很强的紫外吸收,它的吸收峰在收峰在260nm。当。当DNA以双螺旋形式存在时,以双螺旋形式存在时,浓度为浓度为50g/ml的的A260

9、=1.00(光径(光径1cm),变),变性成单链后,同样浓度的核酸溶液的性成单链后,同样浓度的核酸溶液的A260=1.37,这就是增色效应。,这就是增色效应。影响Tm值的因素 G-C对含量越高,对含量越高,Tm就越高,就越高,G-C对含量对含量每增加每增加1%,Tm大约增加大约增加0.4。在近似生理条。在近似生理条件下,件下,DNA的的Tm一般在一般在8595之间。溶液之间。溶液中的离子强度对中的离子强度对Tm有很大影响,在一定的范有很大影响,在一定的范围内,一价阳离子浓度每增加围内,一价阳离子浓度每增加10倍,倍,Tm增加增加16.6。若要降低。若要降低Tm,可加入甲酰胺,因为甲,可加入甲酰

10、胺,因为甲酰胺能降低氢键的稳定性。酰胺能降低氢键的稳定性。复性与杂交 在适宜的条件下,两条分开的互补链可重新在适宜的条件下,两条分开的互补链可重新形成双螺旋,这个反应称为复性(形成双螺旋,这个反应称为复性(renaturation)。)。使两条互补的单链形成双螺旋的过程称为退火使两条互补的单链形成双螺旋的过程称为退火(anneal)。两条不同来源的互补单链经退火形)。两条不同来源的互补单链经退火形成双链的反应称为杂交(成双链的反应称为杂交(hybridization),杂交),杂交可以在可以在DNA单链之间进行,也可以在单链之间进行,也可以在DNA单链和单链和RNA单链之间进行。单链之间进行。

11、复性动力学 复性动力学指的是复性核酸的量随着时复性动力学指的是复性核酸的量随着时间变化的情况。它可以用来检测间变化的情况。它可以用来检测DNA的复杂的复杂性。高度重复序列多则复杂性低,单一序列性。高度重复序列多则复杂性低,单一序列多则复杂性高。多则复杂性高。复性动力学的测定 首先将纯化的首先将纯化的DNA通过高速搅拌或小孔喷通过高速搅拌或小孔喷射,以取得大小均匀的片段;射,以取得大小均匀的片段;100瞬间处理瞬间处理后(使其变性)迅速冷却到适当温度复性,如后(使其变性)迅速冷却到适当温度复性,如温度控制在低于温度控制在低于Tm 20左右,在标准的磷酸缓左右,在标准的磷酸缓冲液中保温,每隔一定时

12、间测定冲液中保温,每隔一定时间测定DNA复性的数复性的数量。量。复性动力学的测定 测测DNA复性的方法有两种,一种是测复性的方法有两种,一种是测A260的变化,另一种是用羟基磷灰石柱分离双链和的变化,另一种是用羟基磷灰石柱分离双链和单链单链DNA,双链,双链DNA吸附而单链吸附而单链DNA流出,流出,再测定流出单链再测定流出单链DNA的量。的量。复性动力学方程的推导 DNA复性取决于两条单链的随机碰撞,因此它复性取决于两条单链的随机碰撞,因此它遵循二级反应动力学,其反应符合下列方程式:遵循二级反应动力学,其反应符合下列方程式:式中式中C为时间为时间t t时,单链时,单链DNA的浓度;的浓度;k

13、 k为反应速为反应速度常数。度常数。2kCdtdC kdtdCC21001ttCCktCCCttkdtdCC0021,(2)0011tktkCC,00t 011CktC0011CtkCC1100tkCCC,(1)当复性完成一半时,当复性完成一半时,带入(,带入(1 1)式得)式得 21,021CCtt1121210tkC12210tkC1210tkCktC1210,复性动力学方程的推导复性动力学方程的意义 从(从(1)式和()式和(2)式可以看出,控制复性反)式可以看出,控制复性反应的参数是单链应的参数是单链DNA初始浓度初始浓度 和复性时间和复性时间 的的乘积,称为乘积,称为 。越大,越大,

14、越小。越小。0CttC0k210tC1100tkCCC(1)(2)ktC1210简单基因组的Co o t曲线横坐标横坐标C 0 0 tC0t1/2值与基因组大小的比例关系 可以作为衡量一个基因组大小的尺度,但必可以作为衡量一个基因组大小的尺度,但必须注意前提条件须注意前提条件(非重复序列)(非重复序列)。210tC真核生物基因组的单一序列和重复序列 当基因组中存在有重复序列时,情况就复杂当基因组中存在有重复序列时,情况就复杂了。由于重复序列相互碰撞的几率较高,复性速了。由于重复序列相互碰撞的几率较高,复性速率也就较快。既有单一序列又有重复序列的基因率也就较快。既有单一序列又有重复序列的基因组的

15、组的 曲线会出现若干个拐点。曲线会出现若干个拐点。tC0假设的真核基因组的Cot曲线 三个部分的表观三个部分的表观 分别为分别为0.0013、1.9和和630,分别占基因组的百分数为分别占基因组的百分数为25%、30%和和45%。210tC高度重复序列高度重复序列中度重复序列中度重复序列单一序列单一序列重复序列单位长度的计算 为了推算每一部分为了推算每一部分DNA所对应的所对应的bp数,必须把每数,必须把每一部分当成独立的组成来考虑。三个部分的实际一部分当成独立的组成来考虑。三个部分的实际应为应为0.001325%=0.00033,1.930%=0.57,63045%=283。以大肠杆菌的。以

16、大肠杆菌的 =4.0作为标准,作为标准,则三个部分的则三个部分的bp数应为(视作单一序列):数应为(视作单一序列):210tC210tCbp340102.4400033.06bp100.6102.4457.056bp100.3102.4428386重复频率的计算 以上三个结果为动力学复杂长度。此模式基因以上三个结果为动力学复杂长度。此模式基因组的复杂度记为组的复杂度记为“3.01086.0105340 bp”重复频率(重复频率(f)=化学复杂长度化学复杂长度动力学复杂长度动力学复杂长度 用化学法测得的用化学法测得的DNA总长度为总长度为7.0108 bp,其,其中中25%为为1.75108 b

17、p,30%为为2.1108 bp,45%为为3.15108 bp。这三个结果为化学复杂长度。代入上。这三个结果为化学复杂长度。代入上式可以计算出三部分的重复频率分别为式可以计算出三部分的重复频率分别为500,000、350、1。重复频率的计算 在同一条复性曲线中,任何两个组分的重复频在同一条复性曲线中,任何两个组分的重复频率和它们的表观率和它们的表观 成反比关系。因此,如果我们成反比关系。因此,如果我们假设非重复组分假设非重复组分DNA确实是单拷贝的(确实是单拷贝的(f=1),那),那么可以用下式计算其它重复组分的重复频率。么可以用下式计算其它重复组分的重复频率。210tC212100DNAD

18、NA1tCtCf组分的重复组分的非重复(这里的(这里的 应为表观应为表观 )210tC210tC非重复序列 在基因组中只有一个拷贝的序列称为单一序列在基因组中只有一个拷贝的序列称为单一序列或非重复序列。在原核细胞基因组中,都是非重复或非重复序列。在原核细胞基因组中,都是非重复序列;而在真核细胞基因组中,非重复序列占有不序列;而在真核细胞基因组中,非重复序列占有不同的比例。用从烟草叶子同的比例。用从烟草叶子mRNA制备的制备的cDNA与不与不同同 部分的烟草基因组变性部分的烟草基因组变性DNA杂交试验观察到,杂交试验观察到,杂交只在单一序列杂交只在单一序列DNA组分中形成,这表明烟草叶组分中形成

19、,这表明烟草叶子中表达的基因大部分是单一序列基因。子中表达的基因大部分是单一序列基因。表达基因的比例 比较单一序列的总比较单一序列的总bp数和表达的数和表达的bp数可以发数可以发现,表达的基因只占单一序列总量的很少一部分,现,表达的基因只占单一序列总量的很少一部分,在烟草中这个比例为在烟草中这个比例为5%。单一序列中有很多是。单一序列中有很多是非编码序列,如调控序列、内含子等,还有沉默非编码序列,如调控序列、内含子等,还有沉默基因。基因。1.2 重复序列 基因组中具有基因组中具有2个以上拷贝数的序列称为重复个以上拷贝数的序列称为重复序列,其中有些重复序列是有编码功能的,如序列,其中有些重复序列

20、是有编码功能的,如rRNA基因、基因、tRNA基因、人的珠蛋白基因、组蛋白基因、人的珠蛋白基因、组蛋白基因等。大部分重复序列是没有编码功能的。根据基因等。大部分重复序列是没有编码功能的。根据重复频率的大小,又将重复序列分为中度重复序列重复频率的大小,又将重复序列分为中度重复序列和高度重复序列。和高度重复序列。图图14 不同生物基因组中不同生物基因组中 不同序列组分的比例不同序列组分的比例重复序列家族 基因组中(真核细胞)含有许多重复序列家族,基因组中(真核细胞)含有许多重复序列家族,每个家族含有数目不等的成员,各个家族之间成员的每个家族含有数目不等的成员,各个家族之间成员的大小也不一样。要注意

21、的是。同一家族成员之间的序大小也不一样。要注意的是。同一家族成员之间的序列不一定完全一样,可以是具有很高的同源性、并具列不一定完全一样,可以是具有很高的同源性、并具有某些共同特点的序列。人类基因组中有一个有某些共同特点的序列。人类基因组中有一个Alu序列序列家族,它有家族,它有3105个成员,每个成员长个成员,每个成员长300bp;在;在170bp处均有处均有AGCT序列,此序列是序列,此序列是Alu内切酶的识别内切酶的识别序列,经序列,经Alu内切酶可切割成内切酶可切割成170bp和和130bp两个片段;两个片段;各成员之间有各成员之间有87%的同源性。在人类基因组中它散布的同源性。在人类基

22、因组中它散布在非重复序列之间在非重复序列之间(散布重复)(散布重复),它有什么功能还不,它有什么功能还不清楚。清楚。串联重复序列图图15 小麦小麦rRNA基因大转录单位的基因大转录单位的 串联重复排列串联重复排列rRNA基因大转录单位的数目和分布 在典型的作物中,每个基因组含有在典型的作物中,每个基因组含有5000个这样的个这样的成员;而在大多数动物基因组中,含有成员;而在大多数动物基因组中,含有100200个这个这样的成员。这些串联的成员可以只存在于一个染色体样的成员。这些串联的成员可以只存在于一个染色体上,也可以存在于两个染色体上。如拟南芥中上,也可以存在于两个染色体上。如拟南芥中rDNA

23、串联重复存在于串联重复存在于2号和号和4号染色体上,占核基因组的号染色体上,占核基因组的8%;而玉米中只存在于;而玉米中只存在于1个染色体上。转录时三个编个染色体上。转录时三个编码基因合在一起,转录出一个码基因合在一起,转录出一个45S的前体的前体rRNA,然后,然后从中剪切出从中剪切出5.8S、18S和和25S rRNA,所以三者是等当,所以三者是等当量产生的。量产生的。卫星DNA 当把生物体中提取的当把生物体中提取的DNA进行氯化铯密度梯度进行氯化铯密度梯度离心,达到平衡时,不同浮力密度的离心,达到平衡时,不同浮力密度的DNA形成不同形成不同的区带。的区带。DNA所含的所含的G+C对比例越

24、高,则浮力密度对比例越高,则浮力密度越大;越大;A+T对比例越高,则浮力密度越小。核基因对比例越高,则浮力密度越小。核基因组组DNA的氯化铯密度梯度离心结果显示,在某一浮的氯化铯密度梯度离心结果显示,在某一浮力密度处有一条力密度处有一条DNA的主带,在其上下有一条或几的主带,在其上下有一条或几条次带,这些次带称为卫星条次带,这些次带称为卫星DNA。对卫星。对卫星DNA进行进行复性动力学分析表明,它们是高度重复序列。复性动力学分析表明,它们是高度重复序列。Satellite DNA卫星DNA 卫星卫星DNA一般是串联的重复序列,而中度重复一般是串联的重复序列,而中度重复序列(转座子和逆转录转座子

25、)一般是散在分布序序列(转座子和逆转录转座子)一般是散在分布序列。用原位杂交和放射自显影,发现大部分卫星列。用原位杂交和放射自显影,发现大部分卫星DNA位于染色体着丝粒附近或其端粒区。卫星位于染色体着丝粒附近或其端粒区。卫星DNA常位于分裂间期核的异染色质区,而异染色质区是常位于分裂间期核的异染色质区,而异染色质区是不表达的区域。不表达的区域。卫星DNA举例 鼠富鼠富含含A+T的卫星的卫星DNA,占鼠总核,占鼠总核DNA的的10%左右,它由左右,它由20bp长的重复单位组成,其序列为长的重复单位组成,其序列为AAATTGCATAGATTTTGAATT TTAACGTATC TAAAACTTA

26、甜瓜卫星甜瓜卫星DNA由基本的由基本的400bp序列组成,重复序列组成,重复次数约次数约10 6。从从拟南芥中分离到拟南芥中分离到3个卫星个卫星DNA,即,即180bp(3100-5600拷贝)、拷贝)、500bp(280-560拷贝)、拷贝)、160bp(875-1750拷贝)。拷贝)。Mouse satellite DNA forms a distinct band 小卫星DNA 小卫星小卫星DNA是更短的串联重复序列,其重复单是更短的串联重复序列,其重复单位的长度为数十个位的长度为数十个bp,重复次数在相同物种不同个,重复次数在相同物种不同个体中是可变的。如人类中存在体中是可变的。如人类

27、中存在15-100bp的重复序列,的重复序列,重复次数重复次数20-50次。次。微卫星微卫星DNA的重复单位更短,为的重复单位更短,为1-3个个bp,重,重复次数从数十到数千。复次数从数十到数千。微卫星DNA复制滑动改变重复次数端粒重复序列 真核细胞染色体的末端具有端粒重复序列,其真核细胞染色体的末端具有端粒重复序列,其重复单位的长度为重复单位的长度为67个个bp,可重复上千次。,可重复上千次。人人 类类 TTAGGG TTAGGG TTAGGG 锥锥 虫虫 TTAGGG TTAGGG TTAGGG 拟南芥拟南芥 TTTAGGG TTTAGGG TTTAGGG 小小 麦麦 TTTAGGG TT

28、TAGGG TTTAGGG 染色体的两端是端粒,端粒是高度重复序列。染色体的两端是端粒,端粒是高度重复序列。端粒的作用是维持基因组的正常复制,在基因组复端粒的作用是维持基因组的正常复制,在基因组复制时,染色体的末端会缩短,通过端粒酶的反转录制时,染色体的末端会缩短,通过端粒酶的反转录作用,可维持染色体末端的长度。作用,可维持染色体末端的长度。散布重复序列 散布重复序列主要是一些可移位的遗传因子,散布重复序列主要是一些可移位的遗传因子,也称为转座子。它们是一些可以在染色体上移动也称为转座子。它们是一些可以在染色体上移动位置的位置的DNA片段。不同的转座子的长度不同,重片段。不同的转座子的长度不同

29、,重复次数也有很大差异。如拟南芥基因组中的复次数也有很大差异。如拟南芥基因组中的Tal因子只有约因子只有约10个拷贝,而百合的个拷贝,而百合的del 2因子约有因子约有240,000个拷贝。个拷贝。1.3 基因家族 在真核生物中,相关的基因可以归在基因家族在真核生物中,相关的基因可以归在基因家族中。具体地说,基因家族是指基因组中许多来源相中。具体地说,基因家族是指基因组中许多来源相同、结构相似、功能相关的一套基因。基因家族的同、结构相似、功能相关的一套基因。基因家族的成员是从某个原祖基因通过倍增和突变而遗传下来成员是从某个原祖基因通过倍增和突变而遗传下来的,它们可以分散在不同的染色体上,也可以

30、成簇的,它们可以分散在不同的染色体上,也可以成簇地排列在一起,形成基因簇(地排列在一起,形成基因簇(gene cluster)。各基)。各基因家族所拥有的成员数目不等,如大豆球蛋白基因因家族所拥有的成员数目不等,如大豆球蛋白基因家族有家族有5个成员,玉米醇溶蛋白基因家族有个成员,玉米醇溶蛋白基因家族有100个左个左右的成员。右的成员。图图110 与油菜茉莉酸诱导蛋白基因与油菜茉莉酸诱导蛋白基因相似的基因家族相似的基因家族kb简单的多基因家族 简单的多基因家族是指在家族中有一个或几个简单的多基因家族是指在家族中有一个或几个基因以串联排列的方式重复,基因以串联排列的方式重复,每一个重复由一个启每一

31、个重复由一个启动子控制转录,动子控制转录,如前述如前述18S、5.8S、25S rRNA基因,基因,以及以及5S rRNA基因都是这样。基因都是这样。5S rRNA基因之间有间基因之间有间隔序列隔开,这些间隔序列也是重复序列。每一个隔序列隔开,这些间隔序列也是重复序列。每一个5S rRNA基因单独进行转录。基因单独进行转录。图图111 简单的多基因家族简单的多基因家族复杂的多基因家族 复杂的多基因家族由几个相关的基因组成基因簇,复杂的多基因家族由几个相关的基因组成基因簇,也就是一个重复单位。在这个重复单位中,基因之间也就是一个重复单位。在这个重复单位中,基因之间被间隔序列隔开。被间隔序列隔开。

32、一个重复单位中的各个基因有各自一个重复单位中的各个基因有各自的启动子,的启动子,分别转录出各自的分别转录出各自的mRNA。组蛋白基因和。组蛋白基因和tRNA基因就属于这种类型。基因就属于这种类型。一个基因簇中的不同基因可以是按同一方向转录,一个基因簇中的不同基因可以是按同一方向转录,也可以是按两个方向转录(图也可以是按两个方向转录(图1-12)。一个基因簇中)。一个基因簇中的某个基因也可以有若干个拷贝,如果蝇的某个基因也可以有若干个拷贝,如果蝇tRNA基因基因簇,但不是所有的簇,但不是所有的tRNA基因都在一个基因簇中。基因都在一个基因簇中。图图112 复杂的多基因家族复杂的多基因家族DNA上

33、的基因 在在DNA长链上,排列着许多基因长链上,排列着许多基因 基因之间往往有间隔序列基因之间往往有间隔序列 基因之间也有重叠的现象基因之间也有重叠的现象 就一个基因而言,就一个基因而言,DNA双链的一条链为模板链,双链的一条链为模板链,另一条链为编码链(意义链),另一条链为编码链(意义链),但我们不能说基但我们不能说基因位于某一条链上。因位于某一条链上。在一个在一个DNA长链上,不同基因的编码链可以位长链上,不同基因的编码链可以位于不同的单链上于不同的单链上 描述一个基因的结构是描述其编码链描述一个基因的结构是描述其编码链DNA链上基因的排列模板链、编码链与RNA的关系受发育控制的复杂多基因

34、家族 人人及及珠蛋白基因簇珠蛋白基因簇The two g g genes differ in their coding sequence in only one amino acid;the G variant has glycine at position 136,where the A variant has alanine.不同发育阶段的血红蛋白亚型发育阶段发育阶段血红蛋白亚基组成血红蛋白亚基组成胚胎期(胚胎期(8周以前)周以前)22、2 2、2 2 胎儿期(胎儿期(841周)周)22成人期(出生以后)成人期(出生以后)22、22 有许多基因家族成员是随发育阶段变化而先后表有许多基因家族

35、成员是随发育阶段变化而先后表达的。珠蛋白(脱辅基血红蛋白)由达的。珠蛋白(脱辅基血红蛋白)由4个亚基组成,两个亚基组成,两个个类亚基和两个类亚基和两个类亚基,在人的不同发育阶段中类亚基,在人的不同发育阶段中有不同的亚基组合。有不同的亚基组合。不同发育阶段的血红蛋白亚型图图114 人体发育过程中不同类型人体发育过程中不同类型珠蛋白的浓度变化珠蛋白的浓度变化假基因的产生1.4 真核基因的断裂结构 1977年,当时在纽约冷泉港实验室从事研究年,当时在纽约冷泉港实验室从事研究工作的工作的Richard Roberts发现,单个基因不仅可以发现,单个基因不仅可以由一个由一个DNA片段组成,而且可以由数个

36、受到不相片段组成,而且可以由数个受到不相干干DNA片段隔离的片段隔离的DNA片段组成。生物体内存在片段组成。生物体内存在的这种间断的基因,比早期研究的那些基因更加的这种间断的基因,比早期研究的那些基因更加复杂,从而使上述有关遗传物质及其功能的流行复杂,从而使上述有关遗传物质及其功能的流行概念发生了彻底的改变。概念发生了彻底的改变。断裂基因的发现断裂基因的发现断裂基因的发现 同年,同年,Phillip Sharp在研究腺病毒时,发现腺在研究腺病毒时,发现腺病毒的基因组由一条很长的病毒的基因组由一条很长的DNA分子组成;在分子组成;在DNA分子中,至少有分子中,至少有4个完全间断的个完全间断的DN

37、A片段与片段与1个个RNA分子相对应。由此得出结论认为,基因遗分子相对应。由此得出结论认为,基因遗传信息在基因组内是间断编码的。这一科学发现传信息在基因组内是间断编码的。这一科学发现激励了科研人员的深入研究,不久便证实断裂的激励了科研人员的深入研究,不久便证实断裂的基因结构事实上是高等生物最常见的基因结构。基因结构事实上是高等生物最常见的基因结构。The Nobel Prize in Physiology or Medicine 1993for their discoveries of split genesRichard J.RobertsNew England Biolabs Beverl

38、y,MA,USAb.1943Phillip A.SharpMIT,Center for Cancer Research Cambridge,MA,USAb.1944断裂基因的外显子和内含子 我们把一个基因中最终出现在成熟的我们把一个基因中最终出现在成熟的RNA中中的序列称为外显子(的序列称为外显子(extron or exon),而把转录),而把转录后 从 原 初 转 录 本 中 去 掉 的 序 列 称 为 内 含 子后 从 原 初 转 录 本 中 去 掉 的 序 列 称 为 内 含 子(intron)。)。断裂基因可以通过异源双链分析得到检测,断裂基因可以通过异源双链分析得到检测,即把克隆了

39、的基因组即把克隆了的基因组DNA与与mRNA杂交,电镜观杂交,电镜观察未互补的环。察未互补的环。真核基因的断裂结构鸡卵清蛋白鸡卵清蛋白mRNA与其基因与其基因DNA杂交形杂交形成的异源双链产物的电镜照片成的异源双链产物的电镜照片鸡卵清蛋白鸡卵清蛋白mRNA与与DNA杂交形成的异杂交形成的异源双链产物的模式图源双链产物的模式图外显子、内含子分析法内含子的特点 在一个基因中,内含子的位置和数目往往是保守在一个基因中,内含子的位置和数目往往是保守的,但内含子的序列十分不同。也有许多真核细胞基的,但内含子的序列十分不同。也有许多真核细胞基因没有内含子。内含子的功能和存在的意义还不清楚。因没有内含子。内

40、含子的功能和存在的意义还不清楚。真核生物编码蛋白质的核基因内含子的两端具有保守真核生物编码蛋白质的核基因内含子的两端具有保守的的5GTAG3序列,称为序列,称为GT-AG法则。另外还法则。另外还有有tRNA基因、基因、rRNA基因、线粒体、叶绿体以及酵母基因、线粒体、叶绿体以及酵母的 一 些 蛋 白 质 基 因 的 内 含 子,它 们 不 具 有的 一 些 蛋 白 质 基 因 的 内 含 子,它 们 不 具 有 5 GTAG3序列,而是具有其他一些特点,其中序列,而是具有其他一些特点,其中的的类内含子和类内含子和类内含子能够自我剪接。类内含子能够自我剪接。同源基因举例 类珠蛋白基因和类珠蛋白基因和类珠蛋白基因都是由类珠蛋白基因都是由3个个外显子和外显子和2个内含子组成。脊椎动物肌红蛋白(只个内含子组成。脊椎动物肌红蛋白(只有一个亚基)的结构与血红蛋白亚基结构很相似,有一个亚基)的结构与血红蛋白亚基结构很相似,它们可能有着相同的来源。豆科植物中的豆血红蛋它们可能有着相同的来源。豆科植物中的豆血红蛋白,从蛋白质一级结构、内含子数目和位置上看,白,从蛋白质一级结构、内含子数目和位置上看,似乎与珠蛋白起源于同一祖先基因。似乎与珠蛋白起源于同一祖先基因。珠蛋白基因与豆血红蛋白基因内含子位置的比较两种玉米乙醇脱氢酶内含子的比较

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|