1、博士专题:基因功能研究技术之博士专题:基因功能研究技术之 基因敲除、基因编辑技术基因敲除、基因编辑技术1II、基因敲除:可以使基因的功能完全缺失、基因敲除:可以使基因的功能完全缺失 基因敲除,又称基因打靶,是一种遗传工程技术,是在转染细基因敲除,又称基因打靶,是一种遗传工程技术,是在转染细胞中发生外源打靶基因与核基因组目标基因之间的胞中发生外源打靶基因与核基因组目标基因之间的DNA同源重同源重组组,能够使外源基因定点地整合到核基因组的特定位置上,从,能够使外源基因定点地整合到核基因组的特定位置上,从而达到改变细胞遗传特性的目的。而达到改变细胞遗传特性的目的。传统的基因敲除技术传统的基因敲除技术
2、依赖于细胞内自然发生的同源染色体的随依赖于细胞内自然发生的同源染色体的随机交换,但在体细胞内,基因同源重组的效率特别低(低于机交换,但在体细胞内,基因同源重组的效率特别低(低于10-6),增加了实际操作的工作量,限制了该项技术的应用。),增加了实际操作的工作量,限制了该项技术的应用。1987年,年,Thompsson首次建立了完整的首次建立了完整的ES细胞基因敲除的小鼠细胞基因敲除的小鼠模型,此后基因敲除技术得到进一步的发展和完善,目前该技模型,此后基因敲除技术得到进一步的发展和完善,目前该技术已经成为研究基因功能最直接、最有效的方法之一。术已经成为研究基因功能最直接、最有效的方法之一。2 基
3、因敲除技术分为基因敲除技术分为完全基因敲除完全基因敲除、条件型基因敲除、诱导条件型基因敲除、诱导型基因敲除型基因敲除。完全基因敲除完全基因敲除是指通过同源重组法是指通过同源重组法完全消除完全消除细胞或动物个细胞或动物个体中的靶基因活性。体中的靶基因活性。条件型基因敲除条件型基因敲除是指通过定位重组系统实现是指通过定位重组系统实现特定时间和空特定时间和空间的基因敲除间的基因敲除。诱导型基因敲除诱导型基因敲除是通过对诱导剂给予时间的控制,在动物是通过对诱导剂给予时间的控制,在动物的一定发育阶段和一定组织细胞中实现对特定基因进行敲的一定发育阶段和一定组织细胞中实现对特定基因进行敲除的技术。除的技术。
4、3 基因载体的构建:把目的基因和与细胞内靶基因特异片段同基因载体的构建:把目的基因和与细胞内靶基因特异片段同源的源的DNA 分子都重组到带有标记基因分子都重组到带有标记基因(如如neo 基因,基因,TK 基因基因等等)的载体上,成为重组载体。基因敲除是为了使某一基因失的载体上,成为重组载体。基因敲除是为了使某一基因失去其生理功能,所以一般设计为去其生理功能,所以一般设计为替换型载体替换型载体。(一)完全基因敲除(一)完全基因敲除4基因被完全敲除之后使得表型分析受到很多限制:基因被完全敲除之后使得表型分析受到很多限制:有些重要的靶基因被敲除后有些重要的靶基因被敲除后会引起胚胎早期死亡会引起胚胎早
5、期死亡,使得,使得无法分析该基因在胚胎发育晚期和成年期的功能;某些基无法分析该基因在胚胎发育晚期和成年期的功能;某些基因在不同的细胞类型中执行不同的功能,完全敲除会导致因在不同的细胞类型中执行不同的功能,完全敲除会导致突变小鼠出现复杂的表型,突变小鼠出现复杂的表型,使研究者很难判断异常的表型使研究者很难判断异常的表型是由一种细胞引起的,还是由几种细胞共同引起的。是由一种细胞引起的,还是由几种细胞共同引起的。5(二)条件型基因敲除(二)条件型基因敲除 条件型基因敲除法条件型基因敲除法可定义为将某个基因的敲除限可定义为将某个基因的敲除限制于小鼠某些制于小鼠某些特定类型的细胞特定类型的细胞或或发育的
6、某一特定发育的某一特定阶段阶段的一种特殊的基因敲除方法。的一种特殊的基因敲除方法。该系统在该系统在80年代被引入后,已成功被应用于酵母年代被引入后,已成功被应用于酵母菌、植物、哺乳动物细胞及小鼠身上。菌、植物、哺乳动物细胞及小鼠身上。现阶段条件型基因敲除以噬菌体的现阶段条件型基因敲除以噬菌体的Cre/Loxp系统系统和酿酒酵母的和酿酒酵母的FLP/FRT系统系统应用最为广泛。应用最为广泛。6Cre-LoxP重组酶系统重组酶系统 Cre-LoxP重组酶系统在新型基因打靶中获得广泛重组酶系统在新型基因打靶中获得广泛应用,是条件型基因打靶、诱导型基因打靶、时应用,是条件型基因打靶、诱导型基因打靶、时
7、空特异性基因打靶策略的技术核心。空特异性基因打靶策略的技术核心。7Cre-LoxP重组酶系统重组酶系统 Cre重组酶重组酶:于:于1981年从年从P1噬菌体噬菌体中发现,属于中发现,属于 Int酶超酶超基因家族。基因家族。Cre重组酶基因重组酶基因编码区编码区序列全长序列全长1029bp(EMBL数据库登录号数据库登录号X03453),编码),编码38kDa蛋白质。蛋白质。Cre 重组酶是一种由重组酶是一种由 343 个个氨基酸氨基酸组成的单体蛋白。它不组成的单体蛋白。它不仅具有仅具有催化活性催化活性,而且与限制酶相似,而且与限制酶相似,能识别特异的能识别特异的 DNA 序列,即序列,即 lo
8、xP 位点,使位点,使 loxP位点间的位点间的基因基因序列被序列被删除或重组。删除或重组。Cre重组酶有重组酶有70%的重组效率,不借助任何的重组效率,不借助任何辅助因子,可作用于多种结构的辅助因子,可作用于多种结构的 DNA 底物,如线形、环底物,如线形、环状甚至状甚至超螺旋超螺旋 DNA。8Cre-LoxP重组酶系统重组酶系统 LoxP(locus ofX-overP1)序列)序列:来源于:来源于P1噬菌体,是噬菌体,是有有两个两个13bp反向重复序列反向重复序列和和中间间隔的中间间隔的8bp序列序列共同组成,共同组成,8bp的间隔序列同时也确定了的间隔序列同时也确定了LoxP的方向。的
9、方向。Cre在催化在催化DNA链交换过程中与链交换过程中与DNA共价结合,共价结合,13bp的反向重复序的反向重复序列是列是Cre酶的结合域。其序列如下酶的结合域。其序列如下:5-ATAACTTCGTATA-ATGTATGC-TATACGAAGTTAT-3 3-TATTGAAGCATAT-TACATACG-ATATGCTTCAATA-5 9 Cre-LoxP系统的特性系统的特性 10条件性基因敲除法可定义为将某个基因的修饰限制于小鼠某些特定类型的细胞或发育的某一特定阶段的一种特殊的基因敲除方法。它实际上是在常规的基因敲除的基础上,利用重组酶Cre介导的位点特异性重组技术,在对小鼠基因修饰的时空
10、范围上设置一个可调控的“按钮”,从而使对小鼠基因组的修饰的范围和时间处于一种可控状态。111213 Cre/loxP系统作用原理示意图系统作用原理示意图14FLPFRT 系统系统该系统与该系统与CreloxP系统相同,也是由一个系统相同,也是由一个重组酶重组酶 和和一段特殊的一段特殊的DNA序列序列组成。从进化的角度上考虑,组成。从进化的角度上考虑,FlpFRT系统是系统是CreloxP系统在真核细胞内的同源系统。其中,系统在真核细胞内的同源系统。其中,重组酶重组酶Flp是酵母细胞内的一是酵母细胞内的一个由个由423个个氨基酸氨基酸组成的单体蛋白。组成的单体蛋白。与与Cre相似,相似,Flp发
11、挥作用也不需发挥作用也不需要任何辅助因子,同时在不同的条件下具有良好的稳定性。要任何辅助因子,同时在不同的条件下具有良好的稳定性。该系统的该系统的另一个成分另一个成分Flp识别位点识别位点(Flp recognition target,FRT)与与loxP位点位点非常相似,同样由两个长度为非常相似,同样由两个长度为13bp的反向重复序列和一个长度为的反向重复序列和一个长度为8 bp的核心序列构成。的核心序列构成。在该系统发挥作用时,在该系统发挥作用时,FRT位点的方向决定了目位点的方向决定了目的片段的缺失还是倒转。这两个系统比较明显的区别是它们发挥作用的片段的缺失还是倒转。这两个系统比较明显的
12、区别是它们发挥作用的最佳温度不同,的最佳温度不同,Cre重组酶发挥作用的最佳温度为重组酶发挥作用的最佳温度为37,而,而Flp重重组酶为组酶为30。因此,。因此,CreloxP系统最适宜在动物体内使用。系统最适宜在动物体内使用。loxP和和FRT位点的序列如图所示位点的序列如图所示 15这一技术亦存在一些缺点:这一技术亦存在一些缺点:1.费用太高费用太高2.周期较长周期较长3.许多基因在剔除后并未产生明显的表型改变,可能是这许多基因在剔除后并未产生明显的表型改变,可能是这些基因的功能为其他基因代偿所致些基因的功能为其他基因代偿所致条件型基因打靶的优势:条件型基因打靶的优势:1.克服了重要基因被
13、敲除所导致的早期致死克服了重要基因被敲除所导致的早期致死2.并能客观、系统地研究基因在组织器官发生、发育以及并能客观、系统地研究基因在组织器官发生、发育以及疾病发生、治疗过程中的作用和机制疾病发生、治疗过程中的作用和机制16(三)诱导型基因敲除(三)诱导型基因敲除 诱导型基因敲除法也是利用诱导型基因敲除法也是利用Cre/Loxp系统系统为基础,利用控制为基础,利用控制Cre表达的启动子的活性表达的启动子的活性或所表达的或所表达的Cre酶活性酶活性具有可诱导的特点具有可诱导的特点,通过对诱导剂给予时间的控制从而在动物通过对诱导剂给予时间的控制从而在动物的一定发育阶段和组织细胞中实现对特定的一定发
14、育阶段和组织细胞中实现对特定基因的敲除。基因的敲除。17 由由Cre/Loxp系统系统和和诱导系统诱导系统两个部分组成。两个部分组成。Loxp转基因动物转基因动物是用常规基因打靶技术构建成的,基因是用常规基因打靶技术构建成的,基因组中待修饰区域组中待修饰区域两端各携带两端各携带1个个Loxp位点位点的转基因的转基因动物。诱导系统是指所携带的动物。诱导系统是指所携带的Cre基因的表达基因的表达或所或所表达的表达的Cre的酶活性的酶活性具有可诱导性的转基因动物。具有可诱导性的转基因动物。人们可以通过对诱导剂给予时间的预先设计来对动人们可以通过对诱导剂给予时间的预先设计来对动物基因敲除的时空特异性进
15、行人为控制,以避免出物基因敲除的时空特异性进行人为控制,以避免出现死胎或动物出生后不久即死亡的现象。现死胎或动物出生后不久即死亡的现象。常见的几种诱导型基因敲除类型有:四环素诱导型;常见的几种诱导型基因敲除类型有:四环素诱导型;干扰素诱导型;激素诱导型;腺病毒介导型。干扰素诱导型;激素诱导型;腺病毒介导型。18III、基因编辑技术 ZFN系统系统 TALEN系统系统 CRISPR/Cas 系统19(一)(一)ZFN技术系统技术系统20ZFN 技术原理技术原理锌指核酸酶(Zinc-finger nucleases,ZFN)是人工改造的限制性核酸内切酶,利用不同的锌指结构识别特异DNA序列,利用核
16、酸酶切断靶DNA。锌指结构中每一个螺旋可以特异识别3-4个碱基;人工设计识别特异DNA序列的螺旋采用如上的通用序列,通过改变其中7个X来实现识别不同的三联体碱基,TGEK是多个螺旋间的连接序列;构建成对人工锌指结构域和FokI融合蛋白(ZFN)可以在指定区域切断DNA双链。21 单个单个ZFN的的DNA结合结构域结合结构域一般包含一般包含3-6个个Cys2-His2锌锌指结构域,每个锌指结构域能特异识别指结构域,每个锌指结构域能特异识别1个三联体碱基,个三联体碱基,与锌指蛋白相连接的非特异性核酸内切酶来自与锌指蛋白相连接的非特异性核酸内切酶来自FokI的的C端端96个氨基酸残基组成的个氨基酸残
17、基组成的DNA剪切域剪切域,每个,每个FokI单体与一单体与一个锌指蛋白组相连构成一个个锌指蛋白组相连构成一个ZFN,识别特定的位点识别特定的位点,但但2个识别位点相距个识别位点相距6-8bp距离时,距离时,2个单体个单体ZFN相互作用产生相互作用产生酶切功能。在此特异位点产生酶切功能。在此特异位点产生1个个DNA双链切口,双链切口,然后利然后利用固有的同源重组或非同源末端连接修复机制进行切口修用固有的同源重组或非同源末端连接修复机制进行切口修复复。从而达到对精确位点进行定点修饰的目的。从而达到对精确位点进行定点修饰的目的。22ZFN 技术锌指核酸酶介导的定向染色体删除研究人员可以利用ZFN技
18、术进行各种基因编辑,比如基因敲除。已建立有ZFN库,识别多种DNA序列,但还不能达到识别任意靶DNA的目的,其应用受到一定的限制。23 ZFN技术已成功应用于黑长尾猴、大鼠、小鼠、技术已成功应用于黑长尾猴、大鼠、小鼠、中国仓鼠、斑马鱼、果蝇、海胆、家蚕、拟南芥、中国仓鼠、斑马鱼、果蝇、海胆、家蚕、拟南芥、烟草、玉米、猪、牛、人类烟草、玉米、猪、牛、人类iPS细胞等,此外,细胞等,此外,该技术已经有用于治疗该技术已经有用于治疗HIV的的ZFN药物进入二期药物进入二期临床实验。临床实验。但是,该技术制备复杂,成本昂贵,而且其技术但是,该技术制备复杂,成本昂贵,而且其技术专利被少数几家商业公司控制。
19、专利被少数几家商业公司控制。24(二)(二)25崭新的技术崭新的技术-TALEN经典的挑战经典的挑战 染色体染色体DNA序列的人工编辑修改序列的人工编辑修改 (点)突变:(点)突变:Silent;Missense;Nonsense;Frame shift(基因敲除,(基因敲除,Knockout)片段删除片段删除 片段插入片段插入目的与用途:生物模型;表达工具;基因治疗目的与用途:生物模型;表达工具;基因治疗崭新的技术解决经典的挑战26靶向基因技术 经典方法:自杀质粒,同源重组 几率低(1 HR event per 106 cells),难!饱含希望与失望的技术:ZFN,被Sigma公司垄断 新
20、的里程碑:TALEN27TALEN技术技术基于基于TALEN(transcription activator-like(TAL)effector nucleases,类转录因子效应物核酸酶,类转录因子效应物核酸酶)的靶向基因敲除技术是一的靶向基因敲除技术是一种崭新的分子生物学工具,现已应用于细胞、酵母、斑马鱼与大种崭新的分子生物学工具,现已应用于细胞、酵母、斑马鱼与大鼠等各类研究对象。鼠等各类研究对象。技术原理:技术原理:表达一个表达一个重组核酸酶重组核酸酶,在靶点,在靶点识别结构域识别结构域的作用下,核酸酶识别的作用下,核酸酶识别靶点核酸序列,并发挥靶点核酸序列,并发挥内切酶活性内切酶活性,
21、从而打断目标基因,完成基,从而打断目标基因,完成基因敲除的过程。因敲除的过程。28 1989年年 植物病原体植物病原体黄单胞菌属黄单胞菌属(Xanthomonas spp.)avrBs3 基因被克隆。基因被克隆。2007年年 发现其序列特异性核酸结合特性,发现其序列特异性核酸结合特性,avrBs3 TA 2009年年 Xanthomonas TA氨基酸序列与核酸靶序列氨基酸序列与核酸靶序列的对应关系被破译的对应关系被破译 由由34个个aa组成一个单元模块,重复组成一个单元模块,重复17-18次次 34个个aa中的第中的第12和和13个氨基酸(个氨基酸(Repeat Variant Di-res
22、idue,RVD)对应识别一个目标碱基对应识别一个目标碱基 TALEN 发展过程发展过程29人工构建TALE模块识别指定核酸序列102碱基模块单元 14 18个重复真核表达 14 18个重复特异识别指定的14-18 个核酸序列并与之结合34氨基酸单元30TALEN 发展过程31TALEN(TALE+FOK I)表达质粒对 TALEN 基因敲除X 2TALEN 表达质粒对转染、表达切割靶位点切割诱发DNA损伤修复机制(nonhomologous end-joining,NHEJ)。由于在此修过程中总是有一定的错误率存在。在修复中发生移码突变错误的个体即形成目标基因敲除突变体32TALEN介导的同
23、源重组同源重组发生率升高几个数量级Donor plasmidHRDonor plasmidLeft armRight armDonor plasmidLeft armRight arm点突变片段删除基因敲入332011年8月,Nature Biotechnology 上同时发表了用TALEN 技术进行基因敲除的4篇研究文章,另加一篇综述。一篇人类干细胞 Genetic engineering of human pluripotent cells using TALE nucleases 一篇大鼠Knockout rats generated by embryo microinjection o
24、f TALENs 两篇斑马鱼 Targeted gene disruption in somatic zebrafish cells using engineered TALENs Heritable gene targeting in zebrafish using customized TALENs 一篇综述Move over ZFNTALEN的最前沿34TALEN靶向(基因敲除)技术基本流程1.选择、确定靶点2.TALE识别模块串联构建3.TALEN真核表达质粒构建4.TALEN真核表达质粒转入(卵)细胞,表达TALEN重组蛋白5.检测突变效率,筛选(移码)突变体X 2X 2X 235靶
25、点的靶点的DNADNA序列特征:序列特征:相隔17-18bp的两段14-18bp序列作为靶点参考文献:Cermak et al.,Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting,Nucleic Acids Research,2011,Vol.39,No.12,e82.在线靶点选择设计软件:https:/boglab.plp.iastate.edu/node/add/talef-https:/boglab.plp.iastate.edu/
26、node/add/talef-off/off/选择确定TALE靶点36 TAL的核酸识别单元为34aa模块中的双连氨基酸(RVD)RVD与A、G、C、T有恒定的对应关系,即NI识别A,NG识别T,HD识别C,NN识别G,非常简单明确 欲使TALEN特异识别某一核酸序列(靶点),只须按照靶点序列将相应TAL单元(14-18个)串联克隆即可。TALE识别模块串联构建37具专利保护的克隆构建系统具专利保护的克隆构建系统38具专利保护的克隆构建系统具专利保护的克隆构建系统步骤一:靶点识别单元串联39步骤二:TALEN表达质粒构建具专利保护的克隆构建系统具专利保护的克隆构建系统40将靶点识别模块克隆入真
27、核表达载体,得到将靶点识别模块克隆入真核表达载体,得到Talen质粒对质粒对靶点识别模块串接成功后需克隆入真核表达载体中。此真核表达载体含有TAL的其它必需结构域并在C端融合有FokI序列。目前,TALEN系统利用FokI的内切酶活性打断目标基因。因FokI需形成2聚体方能发挥活性,在实际操作中需在目标基因中选择两处相邻(间隔17碱基)的靶序列(14-18个碱基)分别进行TAL识别模块构建。X 2真核表达TALEN质粒对41步骤三步骤三.将将TALEN质粒对共转入细胞中实现靶基因敲除质粒对共转入细胞中实现靶基因敲除TALEN质粒对共转入细胞后,其表达的融合蛋白即可分别找到其DNA靶位点并与靶位
28、点特异结合。此时,两个TALEN融合蛋白中的FokI功能域形成二聚体,发挥非特异性内切酶活性,于两个靶位点之间打断目标基因。FOKI 内切酶打断靶点区42内切酶的切割诱发DNA损伤修复机制(nonhomologous end-joining,NHEJ)。由于在此修过程中总是有一定的错误率存在。在修复中发生移码突变错误的个体即形成目标基因敲除突变体。突变体形成43PCR 酶切法酶切法 利用靶点设计时挑选的,位于相邻靶位点之间的特异性内切酶位点,进行PCR产物酶切鉴定。当左右靶点之间没有合适的酶切位点时可使用CEL-I核酸酶检测。经验规律:=2%可用,=10%很好TALEN切割效率检测44TALE
29、N切割效率检测启动子 ABCDEF stop-Target site-DEFHIJK启动子 ABCDEFHIJK共转染共转染荧光素酶检测质粒荧光素酶检测质粒+TALEN质粒 1+TALEN质粒 2荧光素酶检测法荧光素酶检测法发光倍数与切割效率之间的定量关系尚缺乏充分研究。有文献表明,发光倍数达1.5至2倍即可有效获得突变体。45突变体筛选 有限稀释法获得单细胞克隆 PCR-酶切法鉴定 PCR测序确认46基本工具质粒14 18bp靶点序列怎样做TALEN 1单元模块质粒:A,G,C,T共4种 2单元模块质粒:4X4=16种 TALEN表达载体:基于PCS2质粒2种47怎样做TALEN康为TALE
30、N定制质粒产品1单元模块质粒A,G,C,T 4种选择2单元模块质粒共16种选择pCS2 TALEN真核表达载体TALEN空载体2种/套1+2单元模块质粒套装4+16+2共22种质粒/套多单元模块质粒20以下任意单元数目pCS2 TALEN真核表达质粒将指定TALEN模块插入pCS2 TALEN真核表达载体48怎样做TALEN康为TALEN技术服务TALEN质粒构建提供两个测序证明的14-18碱基TALEN识别域真核表达克隆(pCS2)。且以293T细胞系转染,PCR酶切鉴定,灰度扫描定量证实突变效率高于10%TALEN靶向敲除细胞系构建提供经克隆测序证明的目标基因移码突变细胞系(杂合子)TAL
31、EN靶向敲除斑马鱼构建提供目标基因基因移码突变F1斑马鱼(杂合子)49TALEN技术成功率影响因素 重组TALEN模块与靶位点的 亲合力靶点序列设计原则来自20个天然TLAE的统计规律 细胞系固有特性K562容易,293中等,MC-10困难 细胞转染效率不同细胞系转染效率不同,293高,HeLa低 所期待的目标Heterozygous?Homozygous?Exact point mutation?Selection marker insertion?50TALE技术应用范围 细菌:尚无报道,已另有多种高效靶向技术。真菌:有报道,TALE原理可行。植物:TALE原理发现于植物,需特定转基因技术
32、。动物细胞:TALE原理可行,各细胞系效率不一。斑马鱼:有TALEN基因敲除报道,尚无点突变与敲入报道。小鼠、大鼠原理肯定可行,但尚无报道(技术太新,转基因动物构建实验周期较长)。TALEN应用扩展的技术关键:应用扩展的技术关键:切实可靠的表达系统。高效的转基因及克隆筛选技术。51TALEN的植物应用Ting Li et.al.High-efficiency TALEN-based gene editing produces disease resistant rice,volume 30 number 5 may 2012 Nature Biotechnology 水稻病原菌 Xanthom
33、onas oryzae pv.oryzae(Xoo)导致细菌性白叶枯病。细菌天然 TALE AvrXa7 or PthXo3 与水稻Os11N3基因 启动子结合,调控(hijack)此基因上调表达,促进细胞内糖份向细胞外转运,便于病原菌利用。以TALEN对细菌TALE靶点区做突变,使细菌TALE无法与水稻Os11N3基因 启动子结合。突变水稻获得抵御细菌感染的能力52TALEN与主要类同技术比较siRNA 优于TALEN 可瞬时转染快速观察效果 Knockdown效果确实,可用于必须基因 逊于TALEN 瞬时转染效果短暂 不是彻底knockout 慢病毒稳转发生染色体随机整合ZFN 优于TAL
34、EN 经验积累多,技术较成熟 逊于TALEN 技术复杂,难度高,被Sigma公司垄断 靶点序列要求高,难找 Off-targeting现象严重 经常有显著细胞毒性53基因组精密工程今年来自梅奥医学中心的研究人员第一次利用人工酶切割一段基因序列中的部分DNA,并用合成DNA取代它们,对斑马鱼基因组部分序列进行了定制修改。这种技术称为转录激活因子样效应物核酸酶(transcription activator-like effector nucleases,TALENs)方法,相比ZFNs和 morpholinos,TALENs具有几个优势:它们更便宜、更有效,尤其是以一种开发活性形式应用时。ZFN
35、s只能靶向特异序列,而TALENs有潜力对任何的DNA序列起作用。Morpholinos的效应是短暂的,而TALENs可造成永久性的改变。随后科学家们在蟾蜍等其它动物中展开了这方面的研究,证明这种技术与已证实的基因靶向技术一样有效。国内清华大学的施一公和颜宁等人也于今年在Science杂志上报道了TALE特异识别DNA的分子机理,这提供了TALE蛋白的改造基础,极大地拓宽了TALE蛋白在生物技术应用上的前景。54 2012年,年,TALEN被被科学科学杂质评为十大杂质评为十大科学突破之一。科学突破之一。55新技术介绍新技术介绍(三)(三)CRISPR-CasCRISPR-Cas系系统基因修饰技
36、术统基因修饰技术Clustered regularly Clustered regularly interspaced short interspaced short palindromic palindromic repeats(CRISPR)/CRIrepeats(CRISPR)/CRISPR-associated SPR-associated(Cas)9(Cas)956Biotechnology:Rewriting a genomeNature 495,5051(07 March 2013)doi:10.1038/495050a571 CRISPR-Cas系统的发现:系统的发现:u198
37、7年,日本大阪大学(年,日本大阪大学(Osaka University)在对)在对E.coli K12编码的碱性磷酸酶(编码的碱性磷酸酶(alkaline phosphatase)基因进行研究)基因进行研究时,发现在这个基因编码区域的附近存在一小段不同寻常的时,发现在这个基因编码区域的附近存在一小段不同寻常的DNA片段,片段,这些片段是由简单的重复序列组成的这些片段是由简单的重复序列组成的,而且在片,而且在片段的两端还存在一段不太长的特有的序列。段的两端还存在一段不太长的特有的序列。2002年,科学家年,科学家将其正式命名为将其正式命名为Clustered regularly interspa
38、ced short palindromic repeats(CRISPR)。u随着基因组测序,发现随着基因组测序,发现90%的古细菌、的古细菌、40%的细菌基因组的细菌基因组中含有中含有CRISPR位点。有的甚至含有位点。有的甚至含有2-3个位点。个位点。u2013以后,研究者们在包括以后,研究者们在包括science和和nature biotechnology等著名杂志上发表多篇文章介绍等著名杂志上发表多篇文章介绍CRISPR-Cas系统,并且已成功在人类、小鼠、斑马鱼等物种上实现精确系统,并且已成功在人类、小鼠、斑马鱼等物种上实现精确的基因修饰。的基因修饰。58CRISPR-Cas主要由两
39、部分组成:主要由两部分组成:识别识别切割切割2 CRISPR-Cas系统的组成:系统的组成:CRISPR-Cas CRISPR-Cas是很多细菌和大部分古生菌的是很多细菌和大部分古生菌的天然免疫系天然免疫系统统,通过对入侵的病毒和核酸进行,通过对入侵的病毒和核酸进行特异性特异性的识别,利用的识别,利用CasCas蛋蛋白进行切割,从而达到对自身的免疫。白进行切割,从而达到对自身的免疫。592.1 CRISPR位点的结构位点的结构CRISPRCRISPR:(clustered regularly interspaced short palindromic clustered regularly i
40、nterspaced short palindromic repeatsrepeats)CRISPR CRISPR 是一个特殊的是一个特殊的DNADNA重复序列家族重复序列家族,广泛分广泛分布于细菌和古细菌基因组中。布于细菌和古细菌基因组中。CRISPR CRISPR 位点由一个位点由一个前导区前导区(leaderleader)、多个高度保守的)、多个高度保守的重复序列重复序列(repeatrepeat)和多个)和多个间间隔区(隔区(spacerspacer)组成,重复序列的长度通常组成,重复序列的长度通常 2148 bp,2148 bp,间间隔序列隔序列2672 bp(spacer)2672
41、 bp(spacer)。重复序列具有。重复序列具有二重对称性二重对称性,部,部分间区序列与某些已知的分间区序列与某些已知的质粒、噬菌体序列相匹配质粒、噬菌体序列相匹配。CRISPRCRISPR就是通过这些间隔序列(就是通过这些间隔序列(spacespace)与靶基因进行识别。)与靶基因进行识别。60612.2 Cas家族家族CasCas(CRISPR associatedCRISPR associated):):存在于存在于CRISPRCRISPR位点附近,是一种位点附近,是一种双链双链DNADNA核酸酶核酸酶,能,能在在guide RNAguide RNA引导下对靶位点进行切割。它与引导下对
42、靶位点进行切割。它与folkfolk酶功能类似,酶功能类似,但是它并不需要形成二聚体才能发挥作用。但是它并不需要形成二聚体才能发挥作用。62 根据根据Cas 基因核心元件序列的不同基因核心元件序列的不同,CRISPR/Cas 免疫系统被分为免疫系统被分为3 种类型:种类型:型、型、型和型和型。型。型和型和型型CRISPR/Cas 免疫系统需要多个免疫系统需要多个Cas 蛋白形成复合体切割蛋白形成复合体切割DNA 双链双链,而而型型CRISPR/Cas免疫系统只需要一个免疫系统只需要一个Cas9 蛋白来切蛋白来切割割DNA 双链双链,目前目前型系统是被改造的最为成功型系统是被改造的最为成功的人工
43、核酸酶。的人工核酸酶。63CRISPR/Cas 的基因座结构相的基因座结构相对简单。以产脓链球菌对简单。以产脓链球菌(Streptococcus pyogenes SF370)的典型的典型Type CRISPR/Cas 为例,其基因座为例,其基因座结构可分别三部分,结构可分别三部分,5 端为端为tracrRNA 基因基因,中间为一系列,中间为一系列Cas蛋白编码基因蛋白编码基因,包括包括Cas9、Cas1、Cas2 和和Csn2,3 端为端为CRISPR 基因座基因座,由启动子区域,由启动子区域和众多的间隔序列和众多的间隔序列(spacers)和和重复序列重复序列(direct repeats
44、)顺序顺序排列组成。排列组成。3.Type CRISPR/Cas 系统的结构及作用机理系统的结构及作用机理64 crRNAs:CRISPR 位点的第一个重复序列上游有位点的第一个重复序列上游有CRISPR 前导序列前导序列(Leader sequence),该前导序列可以作为启动子该前导序列可以作为启动子,启动启动CRISPR 序列的序列的转录转录。多个研究表明多个研究表明CRISPR 基因座首先被转录成前体基因座首先被转录成前体CRISPR RNA(pre-crRNA),然后在,然后在Cas 蛋白蛋白或是核酸内切酶的作或是核酸内切酶的作用下被剪切成一些小的用下被剪切成一些小的RNA 单元,这
45、些小单元,这些小RNA 即为即为成熟成熟crRNA,由一个间隔序列和部分重复序列组成,被命名为,由一个间隔序列和部分重复序列组成,被命名为CRISPRRNAs(crRNAs),这些这些crRNA和和Cas 蛋白共同参蛋白共同参与与 CRISPR 免疫防御过程免疫防御过程。65tracrRNA:他们发现他们发现tracrRNA(trans-activating crRNA)对靶点的识别和切割是对靶点的识别和切割是必需的,必需的,tracrRNA 的的5 端与成熟的端与成熟的crRNA 3 端有部分序列端有部分序列(约约13 bp)能够配对进而形成茎环结构,对维持能够配对进而形成茎环结构,对维持c
46、rRNA 与靶点的配对可能十分与靶点的配对可能十分重要。其指导重要。其指导RNase和和Cas9 完成前体完成前体crRNA 的成熟,随后的成熟,随后tracrRNA 还能与成熟的还能与成熟的crRNA 的重复序列配对形成的重复序列配对形成RNA 二聚体,二聚体,进而和进而和Cas9 蛋白结合成核糖核蛋白复合体,发挥识别和降解入侵的蛋白结合成核糖核蛋白复合体,发挥识别和降解入侵的外源外源DNA 功能。功能。根据根据tracrRNA 与与crRNA 的结构特性,他们将的结构特性,他们将tracrRNA 和和crRNA 表表达为一条嵌合的向导达为一条嵌合的向导RNA(guide RNA,gRNA)
47、,并在体外证明并在体外证明gRNA 可以发挥可以发挥tracrRNA 和和crRNA 的功能,在目的基因处切割的功能,在目的基因处切割,形形成成DSBs,该过程是该过程是CRISPR/Cas 对基因组进行编辑的基础。对基因组进行编辑的基础。6667 Cas9:体外实验证明体外实验证明Cas9 基因是参与基因是参与CRISPR 免疫系统的唯一免疫系统的唯一必需基因必需基因,Cas9 是由是由1 409 个氨基酸组成的多结构域蛋白个氨基酸组成的多结构域蛋白,含有含有2 个核酸酶结构域:氨基端的个核酸酶结构域:氨基端的RuvC-like 结构域及位结构域及位于蛋白中间位置的于蛋白中间位置的HNH 核
48、酸酶结构域核酸酶结构域,HNH 核酸酶结构核酸酶结构域可以切割与域可以切割与crRNA 互补配对的模板链互补配对的模板链,切割位点位于原切割位点位于原型间隔序列毗邻基序型间隔序列毗邻基序(Protospacer adjacent motif,PAM)上游上游3nt 处处,RuvC-like 结构域结构域可以对另一条链进行切割可以对另一条链进行切割,切割位点位于切割位点位于PAM 上游上游38nt 处。在处。在crRNA 与与tracrRNA 形成的双链形成的双链RNA 的指导下的指导下,Cas9 蛋白对靶位点进行切割。蛋白对靶位点进行切割。此外,他们还证明,将此外,他们还证明,将RuvC 或是
49、或是HNH 活性突变后活性突变后Cas9 只有单链切割活性,类似于切口酶。只有单链切割活性,类似于切口酶。68到目前为止到目前为止,虽然虽然CRISPR/Cas 系统的详细作用机制尚未完全阐明系统的详细作用机制尚未完全阐明,但已基但已基本明确了该作用机制的整个过程本明确了该作用机制的整个过程,该过程大体分为该过程大体分为3 个阶段个阶段:1.在噬菌体入侵的起始阶段在噬菌体入侵的起始阶段,Cas 蛋白复合物靶向并裂解噬菌体基因组中的蛋白复合物靶向并裂解噬菌体基因组中的原型间隔序列原型间隔序列(protospacer),protospacer接下来接下来整合整合到宿主基因组的到宿主基因组的CRIS
50、PR 位点的位点的5端端;2.然后这些短的掺入的然后这些短的掺入的protospacer 被转录成被转录成crRNA;3.最后阶段是在最后阶段是在Cas 蛋白蛋白复合物的参与下复合物的参与下,靶向和干扰侵入的噬菌体靶向和干扰侵入的噬菌体DNA 序列。序列。当同种噬菌体再次入侵时当同种噬菌体再次入侵时,CRISPR的的repeats 序列截取和保留的入侵噬菌序列截取和保留的入侵噬菌体的某些体的某些DNA 片段形成片段形成spacers,spacers 会转录形成一些小的会转录形成一些小的crRNA,这这些些crRNA 会与会与trans-activatingcrRNA(tracrRNA)形成一种