1、宏基因组技术在宏基因组技术在微生物中的应用微生物中的应用 蒋超 4031031182v1.宏基因组概述v2.环境宏基因组学基本技术v3.环境宏基因组学技术的主要瓶颈1.宏基因组概述宏基因组概述1.1.微生物资源开发应用的新途径v据估计每克土壤样品中可含有高达4,000种的不同微生物,1g土壤就包含6.1107 7个基因。v传统途径培养途径 开发环境微生物基因资源较为传统的研究途径是:分离微生物,获得纯培养,基因表达产物活性检测、活性物质的分离纯化直至开发利用。这一途径被证明是十分有效的,也获得了诸多有应用价值的活性物质。但是,环境中仅有0.1%1%的微生物能够采用现有培养技术进行分离培养,在今
2、天采用传统培养方法已很难发现新的活性物质,极大地限制了未培养微生物基因资源的开发利用。v新途径宏基因组途径 近年来发展起来的宏基因组克隆技术,直接提取环境样品核酸进行遗传操作,避开了微生物分离培养问题,极大地扩展了微生物资源的利用空间。已在土壤生态环境、海洋生态环境和各种极端环境中开展应用。1.2.宏基因组定义v“1998年Handelsman等首次提出宏基因组的概念。一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选和测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系、及与环境之间的关系为研究目的的新的微生物研究方法。v宏基因组文库既包括了可培养的,又包
3、括了未培养的微生物遗传信息,因此增加了获得新生物活性物质的机会。v采用构建宏基因组文库的策略筛选新的基因资源及其表达活性产物的一般流程可以归纳为:样品和基因(组)的富集;提取特定环境中的基因组DNA或mRNA;构建宏基因组DNA或cDNA文库;筛选目的基因;目的基因活性产物表达。图22.环境宏基因组学基本技术v环境宏基因组学研究的基本思路是直接提取环境中所有微生物的基因组DNA,克隆到合适的载体,通过构建宏基因组文库,将环境中全部微生物的核酸信息收集在一起,运用序列筛选或功能筛选方式从文库中获得有用的酶、抗生素等生物活性物质及相关基因。v其前端关键性技术是环境DNA(environmental
4、 DNA,eDNA)的提取,eDNA提取方法的精确程度将直接决定文库中微生物信息的精确度;下游关键性技术是文库的分析与筛选技术。2.1环境样品及目的基因组富集v在宏基因组文库筛选过程中目的基因仅占总DNA的一小部分,对环境样品的预富集可以大大提高目的基因的检出几率。目前预富集技术主要分为细胞水平富集和基因组水平富集。v细胞水平富集主要是通过利用选择培养基对目的微生物进行富集培养,最常用的方法是底物选择,此外还包括营养选择及物理化学指标选择。但是由于富集培养选择性地富集了具有快速生长特性的菌群,因此导致大部分物种多样性信息丢失。目前可以通过先在严格胁迫条件下短期处理,然后改为较温和的处理条件,可
5、以从一定程度上克服这种方法的局限性。v基因组水平富集常用的技术为稳定同位素探针技术(SIP),原理是采用稳定同位素标记底物,其中的“重”原子掺入到具有代谢活性的微生物核酸中,采用密度梯度离心的方法将“重”的DNA与“轻”组分分离,被标记的“重”核酸可以作为PCR的模板,用来构建宏基因组文库。此外,还有报道利用抑制性消减杂交技术、差异显示技术、噬菌体展示技术、亲和捕获技术及DNA微阵技术等技术来富集目的基因。2.2.环境宏基因组文库筛选技术v环境宏基因组文库的筛选策略主要分为序列筛选和功能筛选2种。序列筛选策略是先从文库中获得目的基因,继而对之异源表达,得到具有生物活性的产物;功能筛选策略则是先
6、获得具有生物活性的阳性克隆子,再通过插入片段测序,得到相应的基因结构。2种分析策略对于充分利用宏基因文库资源都是必要的。2.3宏基因组DNA的提取v获得高浓度、大片段、无偏好的环境样品总DNA是宏基因组文库构建的难点之一。v近年已有多种宏基因组DNA的提取纯化方法陆续建立起来,大体可分为两类:一类是直接提取法,又称原位提取法。这类方法不经过样品中微生物的培养和分离,通过化学法、酶解法或物理法直接破碎环境中的微生物细胞而使DNA得以释放,并对DNA进行纯化。v该法操作简便、省时、成本低,所获得DNA具有较好的完整性,并能够代表某一生境的微生物群落多样性。但常会出现细胞裂解不完全或DNA与土壤杂质
7、成分产生共沉淀而无法有效地去除等问题,所以一般需要进一步的DNA纯化处理,同时所提取获得的DNA片段较小(1kb50kb),主要适用于小片段文库的构建。v另一类是间接提取法,即异位提取法,是利用离心介质或者梯度离心等方法先把微生物从环境样品中分离出来,再按处理纯培养细胞的方法裂解微生物细胞提取DNA。v该法获得的宏基因组DNA受到胞外杂质污染干扰较少,纯度较高、DNA完整性好(20kb500kb),适合构建大片段的宏基因组文库。但该法操作较繁琐、费时、成本高、偏差大、DNA得率较低,其产率只是直接裂解法的1%10%,且获得的DNA往往不能完全代表样品所在生境的生态学多样性。2.4宏基因组文库的
8、构建宏基因组文库的构建载体的选择v载体选择在宏基因组技术中占有十分重要的地位。载体系统的选择主要依赖于DNA提取质量、插入片段、质粒拷贝数、宿主菌及筛选方法。根据克隆载体的不同宏基因组文库可分为质粒文库、细菌/酵母人工染色体文库、噬菌体类载体文库。v早期宏基因组文库主要以质粒载体和大肠杆菌宿主细胞构建而成的小片段(15kb)文库。该文库操作简便、拷贝数高、对DNA质量要求不高,适合纯度低或剪切较严重的DNA模版。但插入片段小,筛选量大,活性比率低,对大基因簇无能为力,主要适用于分析新的基因序列信息及筛选编码代谢相关的单一基因或小操纵子。然而,很多微生物活性物质是其次生代谢产物,代谢途径由多基因
9、簇调控,因此尽量插入大片段DNA以获得完整的代谢途径多基因簇是很有必要的。v目前多采用细菌人工染色体(BAC)和粘粒(Cosmid)载体,前者插入片段大(可达350kb),但克隆效率低,后者插入片段中等(2040kb),克隆效率高。BAC和Cosmid载体在宿主细胞中的稳定性高,但拷贝数低,宏基因的扩增困难,表达量低。Fosmid载体的插入片段与Cosmid相当,但Fosmid插入片段在E.coli中的克隆效率和稳定性更高。v外源基因的表达受宿主细胞的遗传类型、细胞基质、细胞的生理状态及初级代谢产物等的影响,利用穿梭载体扩大宿主范围有利于促使和提高外源基因的表达。为提高和调控外源基因的拷贝数与
10、表达量,常需构建不同类型的载体。v此外,-噬菌体和其他病毒也可以作为构建宏基因组克隆文库的载体。噬菌体展示库是一种十分有效的高通量筛选技术,该技术通过对表面展示表达产物的亲和选择分离相应的DNA序列,能够从宏基因组中富集稀有DNA序列,但其局限性在于只能表达分子量小于50 kD的蛋白。宿主细胞的选择v宿主菌株的选择主要考虑转化效率、重组载体在宿主细胞中的稳定性、宏基因的表达、目标性状(如抗菌)缺陷型等因素。v研究经验表明不同微生物种类所产生的活性物质类型有明显差异,不同的研究目标应选择不同的宿主菌株,如70%的抗生素来源于放线菌,如以寻找抗菌抗肿瘤活性物质为目标,选择链霉菌为宿主较理想,而筛选
11、新的酶则采用大肠杆菌为宜。v其中E.coli是最常用的宿主细胞,其优点是操作简单、繁殖迅速、培养代谢易于控制。但是由于环境样品的总DNA有很大一部分为真核基因组DNA,其在细菌宿主中往往不能表达,大大限制了这部分基因的筛选。v最近的生物信息学研究表明,对于一个插入子(100 kbp土壤eDNA的提取技术尚未突破,运用原位裂解法构建更大片段环境宏基因组文库(现有的土壤宏基因组文库中,平均插入片段最大为44.5 kbp)仍是一个难点。v从DNA所包含信息的广泛度分析,eDNA提取技术已经具备区别提取样品中微生物胞外与胞内DNA、活细胞与死细胞DNA的能力,然而,运用现有DNA提取技术到底能回收环境
12、中多少类型微生物的核酸信息仍不清楚。v不可避免地,环境宏基因组文库所包含微生物基因组信息的偏差将直接导致“基因遗漏”现象发生。如海洋中普遍存在的微生物固氮基因,却在测序量高达1.6Gbp的马尾藻海水宏基因组文库中被遗漏,表明仅仅运用宏基因组学技术同样会忽略部分的微生物资源。3.2.环境宏基因组文库下游技术的主要瓶颈v阳性克隆筛选频率低下是宏基因组学下游技术的主要瓶颈。运用经典的功能筛选方式,往往是在数千个,甚至数百万个重组克隆子中才能检测到有用的活性克隆,造成此局面一个重要的原因是外源基因的异源表达水平低下。目前根据核酸序列相似性及基因保守区设计探针或引物的杂交、PCR筛选方法,从文库中发现新基因的比率尚不到已知基因的40%。