1、基因组编辑基因组编辑应用基因编辑技术不长角的奶牛基因编辑的定义:基因编辑的定义: 通过精确识别靶细胞通过精确识别靶细胞DNA片段中靶点的核苷酸序列,利用片段中靶点的核苷酸序列,利用核酸内切酶对核酸内切酶对DNA靶点序列进行切割,从而完成对靶细胞靶点序列进行切割,从而完成对靶细胞DNA目的基因片段的精确编辑。目的基因片段的精确编辑。 基因编辑的优势基因编辑的优势与传统的以同源重组和胚胎干细胞(embryonic stem cell,ES)技术为基础的基因打靶技术相比,基因编辑新技术保留了可定点修饰的特点,可应用到更多的物种上,效率更高,构建时间更短,成本更低。基因编辑原理基因编辑原理现代基因组编
2、辑技术的基本原理是相同的,即借助特异性 DNA 双链断裂( DNA double-strand breaks DSBs) 激活细胞天然的修复机制,包括非同源末端连接( NHEJ)和同源重组修复(HDR) 两条途径。第一代: ZFN(锌指核酸酶) 第二代: TALEN(转录激活样效应因子核酸酶)第三代: CRISPR/Cas9(成簇的规律性间隔的短回文重复序列)第四代:NgAgo - gDNA 韩春雨基因编辑发展史基因编辑发展史 ZFN ZFN 基因组编辑技术基因组编辑技术 ZFN 技术是第一代基因组编辑技术,其功能的实现是基于具有独特的DNA序列识别的锌指蛋白发展起来的。 1986年Diaku
3、n 等首先在真核生物转录因子家族的 DNA 结合区域发现了Cys2- His2锌指模块。 1996年,Kim等首次人工连接了锌指蛋白与核酸内切酶。 2005年,Urnov等发现一对由4个锌指连接而成的ZFN可识别24 bp的特异性序列,由此揭开了ZFN在基因组编辑中的应用。ZFN=DNA识别域+核酸内切酶DNA识别域: 由一系列 Cys2-His2锌指蛋白(zinc-fingers)串联组成(一般34个),每个锌指蛋白识别并结合一个特异的三联体碱基。核酸内切酶: 非特异性核酸内切酶FokI,形成二聚体时切割双链DNA。ZFNZFN原理和机制原理和机制ZFN 由锌指蛋白(ZFP)和 Fok核酸内
4、切酶组成。其中,由 ZFP 构成的 DNA 识别域能识别特异位点并与之结合,而由Fok构成的切割域能执行剪切功能,两者结合可使靶位点的双链DNA 断裂(DSB)。于是, 细胞可以通过同源重组(HR)修复机制和非同源末端连接(NHEJ)修复机制来修复 DNA。HR 修复有可能会对靶标位点进行恢复修饰或者插入修饰,而 NHEJ 修复极易发生插入突变或缺失突变。两者都可造成移码突变,因此达到基因敲除的目的。 ZFN 诱导的基因组编辑技术可应用于很多物种及基 因位点,具有较好的发展潜力。 缺点: (1)以现有的策略设计高亲和性的 ZFN,需要投入大量的工作和时间;(2)在细胞中持续表达 ZFN 对细胞
5、有毒性;(3)虽然三联体设计具有一定特异性,但仍然存在不同程度的脱靶效应。TALEN TALEN 基因组编辑技术基因组编辑技术 2009 年,研究者在植物病原体黄单胞菌(Xanthomonas)中发现一种转录激活样效应因子(TAL蛋白),它的核酸结合域的氨基酸序列与其靶位点的核酸序列有恒定的对应关系,一个模块单元识别一个碱基,简单且特异性极好。随后,TALE特异识别 DNA 序列的特性被用来取代 ZFN技术中的锌指蛋白。它可设计性更强,不受上下游序列影响,具备比ZFN 更广阔的应用潜力。 TALENs 包含两个 TALEN 蛋白, 每个 TALEN 都是由 TALE array 与 Fok融合
6、而成. 其中一个 TALEN 靶向正义链上靶标位点, 另一个则靶向反义链上的靶标位点. 然后 Fok形成二聚体, 在靶向序列中间的 spacer 处切割 DNA, 造成双链 DNA 断裂, 随后细胞启动 DNA 损伤修复机制. 针对不同的TALEN 骨架, 其最适宜的spacer长度不同, 其长度范围一般为1220 bp. 实验结果表明, TALENs在靶向DNA时, 第一个碱基为 T 时其结合效果更佳。通过组合各类模块,可对任意核苷酸序列进行靶向特异性敲除或内源基因的表达调控。 目前已在人、大鼠、小鼠、猪、羊、斑马鱼、拟南芥及酵母等多类物种中得到成功应用。CRISPR /Cas9 CRISP
7、R /Cas9 基因组编辑技基因组编辑技术术 CRISPR/Cas9系统的发现可以追溯到1987年,日本学者首次在大肠杆菌(E. coli)基因组中发现一连串短的空间间隔重复序列。随后,在其他细菌和古细菌中也发现了这一特殊的序列。 2002年科学家才将其命名为成簇的规律间隔短回文重复序列(Clustered regularly interspaced short palindromic repeats, CRISPR) ,现有测序结果显示40%的细菌基因组中含有CRISPR位点。 2005年,科学家们发现CRISPR中的许多间隔序列来源于质粒和病毒,CRISPR的基因座能够被转录,并且Cas基
8、因编码的蛋白具有核酸酶和解旋酶结构域,因此推测CRISPR/ Cas 是利用无义的RNAs标记外源核酸序列的防御系统。 2011年,才揭示了CRISPR/Cas系统的分子机制:当病毒首次入侵时,细菌会将外源基因的一段序列整合到自身的CRISPR的间隔区;病毒二次入侵时,CRISPR转录生成crRNA前体(pre-crRNA),pre-crRNA经过加工形成含有与外源基因匹配序列的 crRNA,该crRNA与病毒基因组的同源序列识别后,介导Cas蛋白结合并切割,从而保护自身免受入侵。 2013年,研究者报道了CRISPR/Cas9系统可高效地编辑基因组。其中分别在人类细胞和小鼠细胞中成功对部分基
9、因实现了编辑。 CRISPR/CasCRISPR/Cas系统概述系统概述 CRISPR/ Cas系统广泛存在于细菌和古菌中,是它们的一种适应性免疫系统,能够识别自身和外源入侵DNA片段。CRISPR/ Cas系统有3种类型:型、型和型。 型和型CRISPR/Cas系统较为复杂,需要多个Cas蛋白形成复合体切割DNA双链,而型CRISPR/Cas系统只需要一个Cas9蛋白核酸酶来切割DNA双链,即为现在广泛应用于遗传学基因编辑的CRISPR/Cas9系统。 Type系统中只有一种核酸酶Cas9核酸酶,在该系统中Cas9蛋白与crRNA参与对抗外源噬菌体和质粒的入侵。目前,Type系统在基因组编辑
10、中应用的最为广泛。 CRISPR-Cas主要由两部分组成:CRISPR/Cas的结构CRISPR CRISPR 是一个特殊的是一个特殊的DNADNA重复序列家族重复序列家族, , 广泛分布于细菌和古细菌基广泛分布于细菌和古细菌基因组中。因组中。CRISPR CRISPR 位点通常由短的高度保守的重复序列位点通常由短的高度保守的重复序列(repeats) (repeats) 组成组成, , 重复序列的长度通常重复序列的长度通常 2148 bp, 2148 bp, 重复序列之间被重复序列之间被 2672 bp 2672 bp 间隔序间隔序列列(spacer)(spacer)隔开。隔开。CRISPR
11、CRISPR就是通过这些间隔序列(就是通过这些间隔序列(spacespace)与靶基因进)与靶基因进行识别。行识别。 识别识别切割切割Cas(CRISPR associated): 存在于CRISPR位点附近,是一种双链DNA核酸酶,能在guide RNA引导下对靶位点进行切割。它与folk酶功能类似,但是它并不需要形成二聚体才能发挥作用。 CRISPR/Cas9系统由间隔重复由间隔重复CRISPRCRISPR基因座转录出来基因座转录出来的的pre-crRNApre-crRNA、多功能的、多功能的Cas9Cas9核酸酶和核酸酶和tracrRNAtracrRNA组成,其组成,其中中tracrRN
12、AtracrRNA促进促进pre-crRNApre-crRNA的成熟,以及形成具有切割活的成熟,以及形成具有切割活性的性的crRNA-tracrRNA-Cas9crRNA-tracrRNA-Cas9三元复合体三元复合体。 病毒或质粒入侵细菌后,其基因组DNA暴露于细菌胞浆之中,经过同源重组,CRISPR重复序列转录、翻译出的Cas复合物对外来DNA进行剪切,产生新的spacer序列。如果产生的新spacer序列能够与CRISPR array内部的短重复序列部分互补,将会通过某种未知的方式整合到细菌基因组的CRISPR array 序列中,从而对该病毒或质粒产生特异性免疫记忆。CRISPR/Ca
13、s9系统的工作原理和系统的工作原理和机制机制CRISPR/CasCRISPR/Cas9 9系统的工作原理和系统的工作原理和机制机制 当同类的病毒或者质粒再次入侵该细菌时 首先,tracrRNA与pre-crRNA的重复序列结合; 第二,内源RNase 切割pre-crRNA/ tracrRNAs复合体,切除5末端的间隔序列,形成成熟的crRNA,并与tracrRNA形成被称为向导RNA (Single guide RNA, sgRNA)的嵌合RNA分子; 第三,每一个成熟的sgRNA能够引导Cas9蛋白定位到双链DNA的靶位点上并在原型间隔毗邻序列(Proto-spacer adjacent
14、motif, PAM)的上游38 bp位置对结合的序列进行切割(图2A)。 Cas9Cas9的特异性靶点的特异性靶点 依赖于原型间隔序列3端PAM序列,不同的Cas9突变体在基因组中拥有不同的PAM序列,来源于酿脓链球菌(Streptococcus pyogenes)的Cas9识别一个5- NGG-3的PAM,而来源于嗜热链球菌(Streptococcus thermophilus)和脑膜炎奈瑟氏菌(Neisseria meningi-tidis)的Cas9分别识别5-NNAGAAW-3的PAM和5-NNNNGATT-3的PAM。 Cas9Cas9拥有两个核酸酶结构域拥有两个核酸酶结构域 分别
15、是蛋白中间的HNH结构域和蛋白氨基酸末端附近的RuvC-like结构域,其中HNH切割与crRNA互补的链,切割位点位于PAM序列上游3 bp,RuvC-like切割非互补链,切割位点位于PAM序列上游38 bp,从而造成双链的断裂。 Cas9Cas9的特异性靶点和两个核酸酶结构域的特异性靶点和两个核酸酶结构域 CRISPR/ Cas9产生的DSB能够激活细胞和生物体自身修复机制,产生两种不同的修复途径NHEJ和HDR修复。NHEJ能够高效地引入不同长度的插入或者缺失突变,导致转录阅读框编码序列,转录激活相关的启动子和增强子的损坏;而HDR的修复通常会引入特定位点的突变或者在外源供体DNA模板
16、存在时对靶位点进行可预测的插入。 1. PAM序列区是CRISPR/Cas9系统行使切割功能的基本条件。如果靶序列3端没有PAM序列,即使靶序列与sgRNA序列完全匹配,Cas9蛋白也不会切割该序列位点.2. sgRNA与目标基因组相结合的20nt序列区决定着CRISPR/Cas系统的靶向特异性。CRISPR/Cas9CRISPR/Cas9系统的关键点3. sgRNA的长度也与特异性密切相关。sgRNA的5端额外增加两个鸟嘌呤核苷酸后能够显著提高CRISPR/Cas9系统的特异性。 CRISPR/Cas9基因编辑系统的特异性决定于sgRNA上的识别(20nt)。然而,在复杂的生物基因组中,sg
17、RNA的识别序列可能会与非靶点DNA发生局部匹配(Partial match)。 这种局部匹配,目前可归结为两类:(1)sgRNA与脱靶位点DNA序列长度相同,但存在碱基错配。(2) 脱靶位点DNA序列长度比sgRNA多或少几个碱基,通过形成DNA凸起(DNA bulge)或RNA凸起(RNA bulge)来完成其他碱基的正确配对。CRISPR/Cas9系统的脱靶效应CRISPR/Cas9CRISPR/Cas9系统在基因组系统在基因组DNADNA片段编辑中的应用片段编辑中的应用1. DNA片段靶向删除2. DNA片段靶向反转3. DNA片段靶向重复4. DNA片段靶向插入5. 染色体靶向易位类
18、别类别ZFNTALENCRISPR /Cas9NgAgo-gDNA构成ZF Array Fok1TALEN Array Fok1Cas9 sgRNANgAgo-gDNA靶向元件ZF Array蛋白 TALENArray蛋白sgRNA核糖核苷酸gDNA脱氧核糖核苷酸切割元件Fok 蛋白Fok 蛋白Cas9蛋白Ago蛋白优势单位点编辑单位点编辑多位点编辑多位点编辑靶向序列 18bp30bp23bp20bp切割类型双链断裂,单列缺刻双链断裂,单列缺刻双链断裂,单列缺刻双链断裂,单列缺刻技术难度困难较容易非常容易非常容易商业价格60000每位点10000每位点1000每位点?脱靶效应较轻较轻较严重较轻
19、?编辑技术对比NgAgo-gDNANgAgo-gDNA编辑编辑NgAgo-gDNA是格式嗜盐杆菌(Natronobactricum grogoryi) ACO蛋白(Argonauto)的简称,其本质是一种核酸内切酶,NgAgo根据指导DNA的定位,可以有效地对基因组目标区域进行编辑。 NgAgo-gDNA 概述概述NgAgo-gDNA NgAgo-gDNA 与与 Crispr-C Crispr-Cas9 as9 特点比较特点比较 NgAgo-gDNA Crispr-CAS95-P-ssDNA 介导sgRNA 介导 ssDNA无特殊二级结构要求,除靶序列一致的碱基无需其它碱基参与sgRNA由tr
20、acrRNA和crRNA组成,需求固定的二级结构结合靶序列23-25bp结合靶序列19-21bp无需PAM区需要PAM区NgAgo蛋白 由887个氨基酸组成CAS9蛋白 由1368个氨基酸组成可在哺乳动物细胞水平进行基因组编辑可在哺乳动物细胞水平进行基因组编辑NgAgo-gDNA NgAgo-gDNA 的优势的优势1. 设计更加灵活 由于NgAgo-gDNA系统无PAM要求,5p ssDNA设计相较sgRNA更加灵活2. 理论上精确性会比Crispr-CAS9 高 NgAgo-gDNA识别靶序列的长度会比Crispr-Cas9长约4个碱基,另外DNA-DNA duplex的特异性比RNA-DN
21、A duplex高,所以理论上精确性会更加高。3. 对向导序列-靶序列错配容忍度低4. 脱靶率低5. 针对富含GC的靶序列,NgAgo系统比Cas9系统切割效率更高基因功能研究基因治疗构建模式动物改造和培育新品种基因编辑新技术的用途基因编辑新技术的用途1. 基因功能研究基因敲除是在活体动物上验证基因功能必不可少的逻辑环节, 但是传统的基因敲除方法需要通过复杂的打靶载体构建、 ES 细胞筛选、 嵌合体动物模型选育等一系列步骤, 成功率受到多方面因素的限制。基因编辑新技术则不然, 敲除基因高效快速, 是研究基因功能的有力工具ZFN 技术已在大鼠、小鼠、斑马鱼、果蝇、拟南芥、玉米、烟草 等模式生物或
22、经济物种的细胞或胚胎中以及包括诱导多能干细胞(induced pluripotent stem cells,iPSC)在内的人体外培养细胞系中成功地实现了内源基因的定点突变,其中在果蝇、 斑马鱼、大鼠等物种中还获得了可以稳定遗传的突变体。2. 基因治疗传统的基因治疗是将正常的基因片段引入细胞中替代有缺陷的基因, 但这种方法难以精准控制, 可能产生很大的毒副作用。基因编辑新技术可以精确定位, 在靶位点进行修正或进行基因切除, 达到基因治疗的目的。Bacman 等人利用 TALEN 技术清除了来自于病人线粒体内的有病 DNA。这是 TALEN 首次应用于线粒体基因的编辑,这项研究有望用于治疗母系遗
23、传的线粒体病。Li 等人利用 ZFN 技术能在染色体上精确定位的优势, 通过 “剪切” 和 “粘贴” 基因, 在实验小鼠体内实现了血友病治疗, 避免了传统基因疗法带来的插入诱变风险, 首次取得了基因组编辑在基因疗法上的突破。3. 构建模式动物基因编辑新技术不受 ES 细胞的限制,效率高,速度快,且定点编辑更加精确,可在多种细胞及生物体的特定位点进行切割和修饰。构建转基因小鼠第一人 Jaenisch 与其同事最近利用 CRISPR- Cas 系统又构建了携带特异性突变的小鼠模型。4. 改造和培育新品种 传统的改造动植物品种的转基因技术是将外源 DNA 片段插入受体的基因组中,改造基因功能,使其表达优良的性状,获得人类需要的品种。基因编辑技术则可以进行定点修饰, 达到高效定向。 Shukla 等对玉米进行肌醇磷酸激酶 1(inositol phosphate kinase 1,IPK1)基因的修饰,使其对除草剂的耐性增强,在发育的种子中肌醇磷酸盐表达谱也发生了与预期一样的改变。 ownsend等以烟草中的丙酮醇合酶(acetolactate synthase)基因 SuR (SuRA和SuRB)位点为靶标,育成了对咪唑啉酮(imidazolinone)除草剂和对磺脲(sulphonylurea)除草剂都有抵抗力的新品种。