1、第第3章章 分子图谱的构建分子图谱的构建一、作图群体的发展一、作图群体的发展二、图谱构建的基本理论二、图谱构建的基本理论三、数据处理三、数据处理四、图谱的完善四、图谱的完善五、比较基因作图五、比较基因作图 遗传作图遗传作图(Genetic mapping)即遗传图谱的构即遗传图谱的构建。它是利用遗传学的原理和方法,构建能反映建。它是利用遗传学的原理和方法,构建能反映基因组中遗传标记之间遗传关系的图谱。基因组中遗传标记之间遗传关系的图谱。传统遗传图中的遗传标记主要是形态学标记。传统遗传图中的遗传标记主要是形态学标记。形态学标记的数量不多,但利用形态学标记作图形态学标记的数量不多,但利用形态学标记
2、作图的时间很长,在二十世纪的前八十年主要是利用的时间很长,在二十世纪的前八十年主要是利用形态学标记作图。形态学标记作图。传统遗传图传统遗传图 分子遗传图谱:分子遗传图谱:不同分子标记在染色体上的相对位不同分子标记在染色体上的相对位置或排列情况。置或排列情况。遗传图谱只显示基因间在染色体上的相对遗传图谱只显示基因间在染色体上的相对位置,并不反映在染色体上的实际距离。位置,并不反映在染色体上的实际距离。基本步骤:基本步骤:标记选择标记选择 亲本多态性分析与亲本组合选择亲本多态性分析与亲本组合选择 发展作图群体发展作图群体 群体标记基因型分析群体标记基因型分析 数据分析处理数据分析处理 图谱绘制与完
3、善图谱绘制与完善 一、作图群体的发展一、作图群体的发展 作图群体的基本要求:作图群体的基本要求:群体要足够大;群体要足够大;群体随机分离;群体随机分离;双亲间的多态性高。双亲间的多态性高。1 1、亲本的选择、亲本的选择 (1)亲本之间的多态性:)亲本之间的多态性:一般取决于其亲缘关系,一般取决于其亲缘关系,可用地理、形态、血缘等关系或同工酶多态性作为判断依可用地理、形态、血缘等关系或同工酶多态性作为判断依据。不同作物多态性表现不同,所要求的双亲亲缘关系远据。不同作物多态性表现不同,所要求的双亲亲缘关系远近也不同。近也不同。(2)亲本的纯合性。)亲本的纯合性。(3)杂交后代的育性。)杂交后代的育
4、性。(4)亲本及其)亲本及其F1细胞学特性,避免染色体变异。细胞学特性,避免染色体变异。2、分离群体的类型、分离群体的类型暂时性分离群体暂时性分离群体:F2、F3、F4、BC、三交群体等;、三交群体等;永久性群体永久性群体:RI、DH群体等;群体等;(1)F2群体群体群体的分离特点群体的分离特点:P:F1:F2:F2P1P2F11 2 34 52006 7P1P2ABH H A B H H HBGenotypesCAPS251A:H:B=1:2:1基因型的读数(基因型的读数(scorescore):1-亲本亲本1的纯合基因型(的纯合基因型(aa)2-杂合体(杂合体(ab)3-亲本亲本2的纯合基
5、因型(的纯合基因型(bb)0-缺资料缺资料 1 3 1 3 2P1 P2 F2群体的特点群体的特点:优点:优点:群体容易产生;群体容易产生;群体分离符合孟德尔规律;群体分离符合孟德尔规律;基因型(带型)容易识别。基因型(带型)容易识别。缺点:缺点:非永久性群体,难以长期保存;非永久性群体,难以长期保存;每个个体提供的每个个体提供的DNA数量有限;数量有限;存在杂合基因型,对显性标记将出现信息简并;存在杂合基因型,对显性标记将出现信息简并;表型鉴定误差大,特别是对于数量性状而言。表型鉴定误差大,特别是对于数量性状而言。(2)BC1群体(回交一代群体群体(回交一代群体)群体的分离特点群体的分离特点
6、:P:F1:BC1:BC1P1P2XF1P1 AH HH H A HAA:H=1:11 2 34 52006 7P1P2ABGenotypesCAPS251 1 3 1 2 0 P1 P2 BC1基因型的读数(基因型的读数(scorescore):1-轮回亲本的纯合基因型(轮回亲本的纯合基因型(aa)2-杂合体(杂合体(ab)3-非轮回亲本的纯合基因型(非轮回亲本的纯合基因型(bb)0-缺资料缺资料 群体的特点群体的特点:优点:优点:群体容易产生;群体容易产生;直接反映了直接反映了F1代配子的分离比例,作图效率高;代配子的分离比例,作图效率高;适合亲缘关系较远的亲本;适合亲缘关系较远的亲本;缺
7、点:缺点:非永久性群体;非永久性群体;当显性时表现型和基因型鉴定都有麻烦;当显性时表现型和基因型鉴定都有麻烦;对人工杂交困难的植物,不易建立大的群体,且易对人工杂交困难的植物,不易建立大的群体,且易出现假杂种。出现假杂种。(3)RI群体群体 RI群体,即重组近交系群体,即重组近交系(Recombinant inbred lines)群体,是由重组近交系组成群体,是由重组近交系组成的分离群体。系由的分离群体。系由F F2 2经多代经多代自交一粒传自交一粒传(single seed descendant)使后代基因组使后代基因组相对纯合的群体。相对纯合的群体。P:F1:Fn:群体的分离群体的分离
8、特点特点:F2P1P2XF1F2F3F4F8纯合度纯合度1-(1/2)8 =99.61%1 23 456 789 10200A:B=1:1GenotypesA A BAB BAAB A BP1 P2RA1962/EcoRIAB基因型的读数(基因型的读数(scorescore):1-亲本亲本1的纯合基因型(的纯合基因型(aa)3-亲本亲本2的纯合基因型(的纯合基因型(bb)0-缺资料缺资料 1 3 1 3 0 P1 P2 RIL群体的特点群体的特点:优点:优点:永久性群体,可重复使用;永久性群体,可重复使用;以品系作为分离单元,表现型鉴定较可靠;以品系作为分离单元,表现型鉴定较可靠;缺点:缺点:
9、群体不易产生;群体不易产生;群体通常会出现偏态分离,这是在群体通常会出现偏态分离,这是在RI群体发展过程群体发展过程 中自然选择和人工选择的结果。中自然选择和人工选择的结果。(4)DH群体群体 群体的分离特点群体的分离特点:P:F1:花粉花粉(单倍体单倍体):加倍加倍:DHL:DH(Doubled Haploid,双单倍体)P1P2XF1花药培养单倍体双单倍体(DH)自然加倍秋水仙素处理株系号株系号1 23 456 789 10200GenotypesA B B A B B A A B ABmarker1B B AAABBBABAA:B=1:1纯合度纯合度100%marker2基因型的读数(基
10、因型的读数(scorescore):1-亲本亲本1的纯合基因型(的纯合基因型(aa)3-亲本亲本2的纯合基因型(的纯合基因型(bb)0-缺资料缺资料 1 3 1 3 0 P1 P2 DHL群体的特点群体的特点:优点:优点:永久性群体,可重复使用;永久性群体,可重复使用;群体分离通常符合孟德尔规律;群体分离通常符合孟德尔规律;以品系作为分离单元,表现型鉴定较可靠以品系作为分离单元,表现型鉴定较可靠。缺点:缺点:群体不易产生;群体不易产生;花粉培养过程可能会对基因型产生选择和引起变异。花粉培养过程可能会对基因型产生选择和引起变异。3、群体大小的确定、群体大小的确定 (1)作图效率:)作图效率:从随
11、机分离结果从随机分离结果可以辨别的最大可以辨别的最大图距图距(群体过小,易判断为不同连锁群);两个标记(群体过小,易判断为不同连锁群);两个标记间间可检测到重组的最小图距可检测到重组的最小图距(群体过小,易判断为共(群体过小,易判断为共分离标记)分离标记)(2)作图目的:)作图目的:分子标记连锁骨架图分子标记连锁骨架图小群体;小群体;基因组序列分析或基因分离基因组序列分析或基因分离大群体大群体 (3)群体类型:)群体类型:达到相当的作图精度,所需群体达到相当的作图精度,所需群体大小的顺序为:大小的顺序为:F2RIBC1DH二、图谱构建的理论基础二、图谱构建的理论基础1、染色体遗传理论、染色体遗
12、传理论(W S Sutton&T Boveri,1903)体细胞中染色体成对存在,两个成员是同源的;体细胞中染色体成对存在,两个成员是同源的;在生命周期中,染色体保持结构上的恒定性和遗传上的在生命周期中,染色体保持结构上的恒定性和遗传上的连续性;连续性;在减数分裂中,同源染色体的两个成员相互配对,随后在减数分裂中,同源染色体的两个成员相互配对,随后又发生分离,走向细胞的两极,从而形成两个单倍体性细胞。又发生分离,走向细胞的两极,从而形成两个单倍体性细胞。2、基因重组和连锁理论、基因重组和连锁理论 细胞减数分裂中,非同源染色体上的基因相互独立,细胞减数分裂中,非同源染色体上的基因相互独立,自由组
13、合;同源染色体上的基因产生交换和重组,交换的频自由组合;同源染色体上的基因产生交换和重组,交换的频率随基因间的距离的增加而增大。率随基因间的距离的增加而增大。位于同一染色体上的基因在遗传中一般倾向于维系位于同一染色体上的基因在遗传中一般倾向于维系在一起,表现为连锁(在一起,表现为连锁(linkage);它们之间的重组是通过);它们之间的重组是通过一对同源染色体的两个非姊妹染色单体之间的交换来实现的。一对同源染色体的两个非姊妹染色单体之间的交换来实现的。重组型配子占总配子的比例称为重组型配子占总配子的比例称为重组率重组率(r)重组型配子数重组型配子数 重组率重组率(%)=x 100 配子总数配子
14、总数 重组率的高低取决于交换的频率,而两对基因之间的重组率的高低取决于交换的频率,而两对基因之间的交换频率取决于它们之间的直线距离。交换频率取决于它们之间的直线距离。重组率可用来表示基因间的遗传图距,图距单位用厘重组率可用来表示基因间的遗传图距,图距单位用厘摩(摩(centi-Mogan,cM)表示,)表示,1 cM的大小大致符合的大小大致符合1%的重组率。的重组率。3、图谱制作的统计学原理、图谱制作的统计学原理 (1)两点测验:对两个基因座之间的连锁关系)两点测验:对两个基因座之间的连锁关系进行检测。进行检测。2检测标记座位是否符合孟得尔分离比例,严重异常检测标记座位是否符合孟得尔分离比例,
15、严重异常分离的标记一般不能用于连锁作图;分离的标记一般不能用于连锁作图;重组率是根据分离群体中重组型个体占个体总数的比重组率是根据分离群体中重组型个体占个体总数的比率来估算的。这种估算方法无法得到估算值的标准误,因此率来估算的。这种估算方法无法得到估算值的标准误,因此无法对估算进行显著性检验。无法对估算进行显著性检验。采用采用最大似然法估计最大似然法估计(maximum likelihood estimation,MLE)方法)方法进行重组率进行重组率的估计可以解决这一问题。的估计可以解决这一问题。似然比与连锁检验似然比与连锁检验:似然(似然(likelihood),定义为特定观测表现型出现的
16、可,定义为特定观测表现型出现的可能性。能性。最大似然,最大似然,定义为以满足其估计值在观察结果中出现定义为以满足其估计值在观察结果中出现的概率最大为条件。的概率最大为条件。即比较假设两座位间存在连锁(即比较假设两座位间存在连锁(r0.5)的概率与假设没有连锁(的概率与假设没有连锁(r=0.5)的概率。)的概率。似然比似然比=L(r)/L(1/2)L(r):假设两个标记间以):假设两个标记间以r的重组率相连锁的概率;的重组率相连锁的概率;L(1/2):假设两个标记间为非连锁的概率。):假设两个标记间为非连锁的概率。连锁检验:连锁检验:L(r)LOD=log -L(1/2)LOD为为L(r)/L(
17、1/2)取以)取以10为底的对数。为底的对数。在实际应用技术中,要求似然比在实际应用技术中,要求似然比L(r)/L(1/2)大于)大于1000:1,即,即LOD3.0,才能证实这两标记间存在连锁。即,才能证实这两标记间存在连锁。即 LOD=log L(r)/L(1/2)=log 1000 =3.0(2)多点测验:同时分析多个基因座之间的连锁)多点测验:同时分析多个基因座之间的连锁关系。关系。在多点分析(在多点分析(mutiple analysis)中,假设)中,假设有有m个标记座个标记座位,并按正确或假定的染色体顺序排列,则对于位,并按正确或假定的染色体顺序排列,则对于m个基因个基因座位,一共
18、有座位,一共有m!/2种可能的排列顺序。种可能的排列顺序。用两点测验方法难以完成,且结果不可靠;用两点测验方法难以完成,且结果不可靠;采用计算机可以同时分析多种基因排列顺序,从而构建采用计算机可以同时分析多种基因排列顺序,从而构建一个最佳的连锁图谱。一个最佳的连锁图谱。多点测验通常也采用似然比检验法。多点测验通常也采用似然比检验法。对于对于m!/2种可能的基因排列顺序,都可以得到一种可能的基因排列顺序,都可以得到一个各自最大的对数似然值(个各自最大的对数似然值(log-likelihood)。)。比较这些可能的排列,对数似然值最大者即为比较这些可能的排列,对数似然值最大者即为最佳的顺序最佳的顺
19、序。(3)交换干扰与作图函数)交换干扰与作图函数 随着两基因间距离的增大,染色体上两基因座位之随着两基因间距离的增大,染色体上两基因座位之间便有可能在两个地方同时发生遗传物质的交换,即间便有可能在两个地方同时发生遗传物质的交换,即双双交换交换。在染色体某区段上发生双交换,其实际频率往往少在染色体某区段上发生双交换,其实际频率往往少于由单交换概率相乘所估得的理论值。这是因为一个位于由单交换概率相乘所估得的理论值。这是因为一个位置上所发生的交换会减少其周围另一个单交换是发生,置上所发生的交换会减少其周围另一个单交换是发生,这种现象称为这种现象称为交换干扰。交换干扰。干扰的程度用符合系数干扰的程度用
20、符合系数C表示。表示。C=实际双交换值实际双交换值/理论双交换值理论双交换值 要计算两个相距较远的基因座之间的图距时,要计算两个相距较远的基因座之间的图距时,如如果中间没有其他基因座可用,则两个基因座之间实际果中间没有其他基因座可用,则两个基因座之间实际发生的双交换就不能被鉴定出来。发生的双交换就不能被鉴定出来。而由于双交换的结而由于双交换的结果,会使根据重组值估计的两个基因座位间的距离估果,会使根据重组值估计的两个基因座位间的距离估计值偏低。计值偏低。因此,采用一些数学的方法矫正。因此,采用一些数学的方法矫正。HaldaneHaldane作图函数作图函数 :假定假定C=1,Haldane(1
21、919)给出了两基因座位之间的)给出了两基因座位之间的真实图距(真实图距(x)与重组值)与重组值r之间的关系:之间的关系:X=-(1/2)ln(1-2r)利用利用Haldane的公式,的公式,22%的重组率相当于的重组率相当于29.0cM。KosambiKosambi作图函数:作图函数:假设:考虑交叉干扰存在的因素,假设:考虑交叉干扰存在的因素,C C与与r r之间存在之间存在线性关系,线性关系,C C值随值随r r的增加而增加,干扰相应减弱。的增加而增加,干扰相应减弱。Kosambi(1944)给出了作图函数:给出了作图函数:(1+2r)X=(1/4)ln-(1-2r)当当r=0.22 时,
22、时,X=23.6 cM。三、数据处理三、数据处理 1、分离数据的收集与数字化、分离数据的收集与数字化 分离群体中不同个体的分离群体中不同个体的DNA多态性信息。多态性信息。电泳带型的数字化电泳带型的数字化:必须区分所有可能的类:必须区分所有可能的类型,并赋予相应的数字或符号。型,并赋予相应的数字或符号。应避免利用没有把握的数据。应避免利用没有把握的数据。共显性标记共显性标记F2:P11;P23;F1(杂合)(杂合)2;缺失数据;缺失数据0 显性标记显性标记F2:P1 对对P2显性,显性,P1和和F1(杂合)(杂合)4 P2 对对P1显性,显性,P2和和F1(杂合)(杂合)5 2、作图软件的利用
23、作图软件的利用 下载网址:下载网址:http:/linkage.Rockefeller.edu/soft/list.html LINKAGE MAPMAKER/EXP Lander等(等(1987)设计,)设计,可对各类群体进行遗传可对各类群体进行遗传作图,应用广泛。作图,应用广泛。准备资料(准备资料(prepare dataprepare data):):如果是如果是F2群体的资料,阅读资料后,屏幕上将出现:群体的资料,阅读资料后,屏幕上将出现:data type f2 intercross 146 362 0 symbols 1=A 2=H 3=B 0=-(个体数(个体数 座位数座位数 Q
24、TL数)数)其中:其中:1=A亲本亲本A的纯合基因型(的纯合基因型(aa)2=H杂合基因型(杂合基因型(ab)3=B亲本亲本B的纯合基因型(的纯合基因型(bb)4=C非亲本非亲本B纯合基因型(纯合基因型(ab,aa)5=D非亲本非亲本A纯合基因型(纯合基因型(ab,bb)0=-缺资料缺资料 通过两点分析,计算各座位之间的连锁关系,并把基因通过两点分析,计算各座位之间的连锁关系,并把基因座位划分为若干个连锁群。屏幕上将出现:座位划分为若干个连锁群。屏幕上将出现:group 1:1 4 12 35 group 2:2 7 18 42 通过设置通过设置LOD值,可以改变连锁群的数目。值,可以改变连锁
25、群的数目。LOD值值增大,连锁群的数目也会增大。增大,连锁群的数目也会增大。LOD值值3.0时,其分群的时,其分群的可靠性较大。可靠性较大。当座位数足够大时,连锁群的数目与单倍体当座位数足够大时,连锁群的数目与单倍体的染色体数目相同。的染色体数目相同。分群(分群(groupgroup):):排序(排序(sequencesequence):):通过多点分析,可以计算出在同一连锁群内不同排列通过多点分析,可以计算出在同一连锁群内不同排列顺序下,各座位之间的距离和连锁群的总长度。顺序下,各座位之间的距离和连锁群的总长度。比较(比较(comparecompare):):通过比较同一连锁群内不同排列顺序
26、的作图结果,通过比较同一连锁群内不同排列顺序的作图结果,找出找出log-likelihood(对数似然值)为最大的排列方式为(对数似然值)为最大的排列方式为最合理的排列方式最合理的排列方式。作图(作图(mapmap):显示最后的作图结果):显示最后的作图结果 DistMarkercMIdName(71)RG47219.2(50)RG24616.1(154)K54.8(159)U104.7(75)RG53215.3(160)W115.5(39)RG17315.0(163)Amy1B3.8(108)RZ2763.3(32)RG14634.3(57)RG3452.5(60)RG38123.5(102
27、)RZ198.2(84)RG69013.2(141)RZ73033.1(143)RZ8012.6(90)RG8109.2(55)RG3311DistMarkercMIdName(66)RG43713.0(76)RG5445.3(37)RG17122.2(33)RG15727.4(110)RZ3186.3(167)PalI29.3(129)RZ5810.2(12)CDO6868.8(162)Amy1A/C12.8(95)RG958.4(82)RG6545.1(52)RG25610.0(104)RZ2135.4(99)RZ12313.1(74)RG5202DistMarkercMIdName(25
28、)RG1047.7(58)RG34813.2(111)RZ3296.9(145)RZ8929.8(23)RG1002.8(43)RG19117.5(139)RZ67841.6(128)RZ57437.1(109)RZ28415.6(115)RZ39418.5(156)pRD10A2.5(118)RZ4035.0(40)RG17928.6(4)CDO3371.9(112)RZ337A22.5(121)RZ44815.0(124)RZ51932.1(173)Pgi-17.1(13)CDO879.2(94)RG91017.9(62)RG418A3DistMarkercMIdName(47)RG218
29、8.1(107)RZ2628.6(42)RG19012.6(92)RG90813.7(93)RG913.2(67)RG44916.1(89)RG7888.4(127)RZ56516.8(138)RZ67521.4(35)RG16328.2(130)RZ5902.7(46)RG21412.2(31)RG1435.9(79)RG62043、图谱分析、图谱分析标记总数:标记总数:图谱上包含的标记(座位)总数。图谱上包含的标记(座位)总数。图谱长度(单位:图谱长度(单位:centi-Morgan,cM):):各连锁群的长度;各连锁群的长度;基因组的总长度。基因组的总长度。标记密度(座位标记密度(座位/
30、cM):):分子标记的平均距离。当分子标记的密度足够大时,分子标记的平均距离。当分子标记的密度足够大时,通常称为高密度图谱。通常称为高密度图谱。标记分布的均匀程度:标记分布的均匀程度:遗传图谱上希望分子标记的分布比较均匀,不要出遗传图谱上希望分子标记的分布比较均匀,不要出现距离较大的间隙(现距离较大的间隙(gap)。)。几个水稻遗传图谱的比较几个水稻遗传图谱的比较 Mapping population MarkerMap Length CrossType Size Type No.(cM)Co1994 BS125/WL02/BS125BC1F1 113RFLP 7261491Co2000 IR
31、64/AzucenaDH 135SSR 4591792RGP1994 Nipponbare/kasalathF2 186RFLP13831575RGP1998 Nipponbare/kasalathF2 186RFLP22751501RGP2000 Nipponbare/kasalathF2 186RFLP32671530Co2000 e-PCR SSR 2457 15264、遗传图距与物理距离对应关系的估计、遗传图距与物理距离对应关系的估计 1 1cM图距所对应的实际物理距离(碱基对数图距所对应的实际物理距离(碱基对数量),受许多因素的影响。量),受许多因素的影响。物种物种基因组基因组(kb
32、)遗传图距遗传图距(cM)Kb/cM(染色体染色体)Arabidopsis1.5105630140(5)Rice4.3 1051575280(12)Tomato9.5 1051267750(12)Bean6.5 105830780(11)Rapeseed1.2 10610161200(19)Maize2.5 10618601400(10)Wheat1.6 10735004600(21)Pine2.4 107180013000(12)Rat3.0 10617001800(平均)(平均)(1)不同物种)不同物种不同生物中单位图距所相当的物理距离不同生物中单位图距所相当的物理距离()不同染色体长度(
33、)不同染色体长度Higher ratios between physical and geneticdistance result from larger chromosomes.Asthe distance between two loci on a chromosome segment increases,the possibility of a second crossover taking place is greater.Interference encompasses the interaction between crossovers such that the incidenc
34、e of one crossover between chromosomes could increase or reduce the possibility of another one occurring in its vicinity.()染色体不同区域,如着丝点区域,交换热点()染色体不同区域,如着丝点区域,交换热点 One factor refers to the centromere effect that restricts crossing over in intervals close to the centromere.This condition was clearly
35、demonstrated by Cynthia on N.crassa,where the ratio of the physical and genetic distances between two genes(ser-1 and pro-1,determining amino acid metabolism)mapped near the centromere is 114 kbmu-1.Meanwhile,for two other genes(pro-1 and ace-2)mapped farther from the centromere,the ratio is 18 kbmu
36、-1.Recombination hot spots(distinct sites in thechromosome favouring recombination)take place in gene rich regions.()同一种生物中,两个特定基因座间的()同一种生物中,两个特定基因座间的遗传图距会因遗传背景的不同而改变。遗传图距会因遗传背景的不同而改变。四、图谱的完善四、图谱的完善 1、DNA标记连锁群的染色体定位标记连锁群的染色体定位 2、着丝粒在染色体上位置的确定、着丝粒在染色体上位置的确定 3、端粒在染色体上位置的确定、端粒在染色体上位置的确定 图距 座位水稻第水稻第12染
37、色体的染色体的分子标记连锁图分子标记连锁图4、饱和分子标记图谱的制作、饱和分子标记图谱的制作 (1)遗传图谱饱和度:单位长度染色体上已定)遗传图谱饱和度:单位长度染色体上已定位的标记数或标记在染色体上的密度。位的标记数或标记在染色体上的密度。连锁框架图:标记平均间隔连锁框架图:标记平均间隔20cM;主基因定位:标记平均间隔主基因定位:标记平均间隔1020cM;QTL定位:标记平均间隔定位:标记平均间隔10cM;基因克隆:标记平均间隔基因克隆:标记平均间隔1cM;(2)遗传图谱绘制所需标记数)遗传图谱绘制所需标记数 基因组大小,如要构建一个平均图距为基因组大小,如要构建一个平均图距为0.5cM的
38、水稻的水稻分子遗传图谱,所需分子遗传图谱,所需3000个标记,而人类为个标记,而人类为6600个;个;标记间平均距离;标记间平均距离;标记间最大距离,通过提高平均密度来缩小最大标记标记间最大距离,通过提高平均密度来缩小最大标记间距是很困难的,一般应有针对性地在间隔区寻找标记。间距是很困难的,一般应有针对性地在间隔区寻找标记。(3)分子标记连锁图与经典遗传连锁图的整合)分子标记连锁图与经典遗传连锁图的整合 通过将传统的遗传标记基因一个一个地定位到分子图通过将传统的遗传标记基因一个一个地定位到分子图谱中去的策略来进行。谱中去的策略来进行。选择各种传统的遗传标记材料建立作图群体选择各种传统的遗传标记
39、材料建立作图群体 寻找与传统遗传标记紧密连锁的分子标记寻找与传统遗传标记紧密连锁的分子标记 根据分子标记在分子连锁图上的位置确定传统遗传根据分子标记在分子连锁图上的位置确定传统遗传标记的位置。标记的位置。五、比较基因作图(五、比较基因作图(comparative mapping)1、概念与基础、概念与基础 利用一种物种的分子标记对另一物种进行遗利用一种物种的分子标记对另一物种进行遗传或物理作图。传或物理作图。物种间物种间DNA序列尤其是编码序列的保守性。序列尤其是编码序列的保守性。同一物种内异源染色体间或不同物种染色体间在基同一物种内异源染色体间或不同物种染色体间在基因含量、排列次序和方向上具
40、有保守性。因含量、排列次序和方向上具有保守性。同线性:同线性:定位在一个物种的染色体上的两个定位在一个物种的染色体上的两个或多个标记又被定位于另一物种的同源染色体区或多个标记又被定位于另一物种的同源染色体区域上,但这些标记间的域上,但这些标记间的相对顺序可变化相对顺序可变化。共线性:共线性:定位在一个物种的染色体上的两个定位在一个物种的染色体上的两个或多个标记又被定位于另一物种的同源染色体区或多个标记又被定位于另一物种的同源染色体区域上,但这些标记间的域上,但这些标记间的相对顺序是保守的相对顺序是保守的。(1)普通小麦:)普通小麦:AABBCC,X=7 非整倍体研究:非整倍体研究:A、B、D功
41、能相似,并可相互功能相似,并可相互 补偿;部分同源关系,构成补偿;部分同源关系,构成7个部分同源群;个部分同源群;比较基因组研究(比较基因组研究(RFLP):):三个基因组间基三个基因组间基因数目和排列顺序一致性;因数目和排列顺序一致性;2、研究实例、研究实例(2)Moor等(等(1995)对水稻、小麦、玉米、谷)对水稻、小麦、玉米、谷子、甘蔗和高粱子、甘蔗和高粱6种禾本科物种的比较作图研究:种禾本科物种的比较作图研究:The main focus of grass comparative studies in the past few years has been on comparison
42、s at the DNA-sequence level and on the effect of whole-genome or segmental duplications.禾本科作物的基因顺序在水稻连锁区段中得禾本科作物的基因顺序在水稻连锁区段中得到保留;到保留;如将水稻染色体分成如将水稻染色体分成20个区段(个区段(19个不同),个不同),则禾本科植物基因组的保守性可归结到水稻基因组则禾本科植物基因组的保守性可归结到水稻基因组的的19个连锁区段上,由这个连锁区段上,由这19个区段可实现对所研究个区段可实现对所研究的全部禾谷类作物进行染色体重建,并可构成一个的全部禾谷类作物进行染色体重建,
43、并可构成一个禾谷类作物祖先中的染色体骨架;禾谷类作物祖先中的染色体骨架;speciationAncestral cereal“chromosome”R1aR1bR3cR8R5aR5bR6bR6aR11aR2R10R3aR3bR4bR4aR7R9R11bR12bR12aR1aR1bR2R3aR3bR3cR4bR4aR5aR5bR6aR6bR7R8R9R10R11aR11bR12aR12bRice chromosomesR1aR1bR3cR8R5bR5aR6aR6bR11aR2R10R3aR3bR4bR4aR7R9R11bR12bR12aR12aM3R1aR1bR6aM6R6bR5aR5bM1R3
44、cR8R10R3bR3aM4R11aR2M2R4aR4bR9R7R1aM8R5aR5bR6aM9R6bR8R3cM5R2R10R3bR3aM7R11aR9M10R4aR4bR12aR1bR7R5aW1R10R5bR4aW2R7R4bW3R1aR3bR3cW5R12aR11aR9R3aR2R1bR11bW4W6R6aW7R8R6bR12bMaize chromosomesWheat chromosome groupsFoxtail milletSorghumSugarcaneThe evolution of the ancestor progenitor genome to modern cer
45、eal genomes based on linkage blocks Comparisons of cereal genome evolution based on rice linkage segments.(a)Rice chromosomes dissected into linkage blocks.(b)Wheat,(c)maize,(d)foxtail millet,(e)sugar cane and(f)sorghum chromosomes represented as rice blocks on the basis of homology and/or conservat
46、ion of gene order.原始染色体在不同的区段连接处短原始染色体在不同的区段连接处短裂并发生一些区段的倒位,易位,缺失和重裂并发生一些区段的倒位,易位,缺失和重复,使同一套连锁区段,分化成禾本科作物复,使同一套连锁区段,分化成禾本科作物中彼此生殖隔离的不同物种。中彼此生殖隔离的不同物种。Grass phylogeny showing the four subfamilies that include most of the cereals.The timing of some of the rearrangements that differentiate lineages has
47、 been indicated.Alignment of the genomes of six major grass crop species with 19 rice linkage segments,whose order reflects the circularized ancestral grass genome.W1 W2 W3 W4 W5 W6 W7 510547413121112932686小麦小麦1-7染色体与水稻染色体与水稻1-12染色体的同源区域染色体的同源区域 禾本科作物间的差异不是由于功能基禾本科作物间的差异不是由于功能基因的差别引起的(保守基因的共线性或同线性;因
48、的差别引起的(保守基因的共线性或同线性;基因序列的同源性),而是由于大量的重复序基因序列的同源性),而是由于大量的重复序列差异引起的表明:重复序列有一定的功能,列差异引起的表明:重复序列有一定的功能,与结构基因的表达调控密切相关。与结构基因的表达调控密切相关。Boxes represent exons and lines represent introns,whereas the arrowheads indicate transcriptional orientation.Dotted lines connect two exons in rice and maize that have b
49、een fused by intron loss in the Triticeae lineage that gave rise to barley and wheat.Intron number variation but exon content conservation in the Waxy genes of several cereal species.Most of the rearrangements that have been detected in comparisons between rice and another cereal have occurred in th
50、e other cereal rather than in rice.Hence,rice may contain a relatively stable genome that reflects the ancestral grass genome better than do the genomes of other cereals.Further studies are needed to test this theory.3、研究意义与应用:、研究意义与应用:(1)揭示不同物种基因组同线性或共线揭示不同物种基因组同线性或共线性,了解不同物种基因组结构的相似性及基性,了解不同物种基因组结