1、从基因组学到系统生物学看生命科学发展生物工程研究所合成生物学与微生物基因组学研究室梁龙人类基因组学 历经5年的辩论后,美国国会正式批准美国的“人类基因组计划”于1990年10月1日正式启动。总体计划是在15年内投入至少30亿美元进行人类基因组的分析。这一计划的意义,可以与征服宇宙的计划媲美。我们也应该以征服宇宙的气魄来开展这一计划。最终目标是测定总长度由30亿个核苷酸组成的人类基因组的序列图。确定人类大约30,000个基因为什么要开展人类基因组学 癌症研究的转折点人类基因组的全序列分析Dulbecco R,Science 1986.回顾了70年代以来癌症研究的进展,使人们认识到包括癌症在内的人
2、类疾病的发生,都与基因直接、间接有关。指出要么仍处在用“零打碎敲”的方法(piecemeal approach)开展研究,要么从整体上研究和分析整个人类基因组及其序列。EMBL核酸数据库的增长生物信息学的兴起(基因组信息学)是一个学科领域,包含着基因组信息的获取、处理、储存、分配、分析和解释的所有方面。发展信息分析工具,包括各种新算法和新软件,构建合适的数据库,用于收集、管理和使用。配合实验研究,“读懂”基因组。确定全部约2-4万个人类基因在染色体上的位置以及包括基因在内的各种DNA片断的功能及其表达调控。将数据变成信息,将信息变成知识人类基因组学的成果(2003.4.14)人类基因组全序列的
3、完成仅仅是遗传学革命的开始 我们依然不能确定人类到底有多少个基因,通常认为大约30,000个左右。经过亿万年的进化,人类终于来到了控制我们从一个单细胞经过成人期,最后走向坟墓的“指令集”面前。这套“指令集”是用奇怪语言所写的一部“天书”,到目前我们刚刚开始理解。有利于确定导致癌症、糖尿病、心血管疾病等其他疾病的基因,并开发相应的药物和基因治疗手段 有利于个性化医疗的开展。下一步怎么办?在基因组学开展的时候所提出的美好前景依然没有实现!后基因组时代 基因组信息可以广泛获得,包括人、鼠、模式生物、微生物、病毒等。这些数据可以被广泛应用与基因在不同状态下的表达特征研究-基因功能研究 由于在后基因组时
4、代主要注重与基因的功能研究,因而相关研究又被称为“功能基因组学”功能基因组学的定义 利用基因组学列信息,应用高通量实验技术,定量的确定特定RNA分子、蛋白分子和重要的代谢产物在时间和空间上的聚集模式中心法则功能基因组学的内容 转录组学 从RNA水平来研究基因的表达 蛋白质组学 从蛋白质水平研究基因表达 代谢组学 确定重要的代谢产物的含量 网络与通路 蛋白相互作用网络、调控网络、信号传导通路等。转录组学基因芯片基因芯片点样仪Yellow:equally expressedRed:more expressed in tumor tissue(“over expressed”)Green:more
5、expression in normal tissue(“under expressed”)基因芯片与基因表达Brightness reflects intensity of signal蛋白质组学研究蛋白质组学研究比较蛋白质组学研究Sample2D gels and imagingCuration andinterrogationDifferentialanalysisMass spectrometrycoupled to advanceddatabases to anonotateNomalDiseaseIdentify disease specific proteinsDrug targ
6、ets代谢组学研究网络与通路后基因组时代的生物信息学 高通量技术从RNA水平、蛋白水平、代谢产物水平产生了大量的数据 所面临的挑战:从海量数据中提取有用的信息 整合相应的网络与调控信息 了解代谢网络是如何调控与运作的 生命的运作过程后基因组时代生物信息学的任务 整合RNA水平、蛋白水平、代谢产物水平的数据信息 目前文献信息的挖掘与整合 数据信息知识(分析)建立代谢与调控反应模型(网络)数据与信息的组织(数据库)与可视化研究(代谢与调控地图,网络地图)研究模式的改变:由分析式思维向系统思维的转变;由假说导向向数据导向研究转变。信息化。通过结构基因组学的研究,以获得大量的核酸、蛋白、结构等方面的信
7、息,为功能研究提供基础,data management,data mining。在技术上大量采用高通量筛选技术,如基因表达谱、蛋白质组学研究、核算及蛋白微阵列技术、基因芯片等。多基因整体研究策略,不同于过去一次只研究一个基因或蛋白,注重分子间的相互作用及调控网络。用功能基因组学到系统生物学 功能基因组学的网络是一个静态的网络 系统生物学就是要把一个静态的网络变成一个动态的网络系统生物学研究内容 通过扰动生物系统并监视基因、蛋白、代谢产物及网络与路径的反应 整合这些数据并建立相应的数学模型来表述系统的结构他对单个扰动的反应 从静态网络到动态网络系统生物学研究流程系统生物学的特点 与我们过去30年
8、的研究模式不同,系统生物学不是一次研究一个基因或蛋白的功能,而是研究一个功能系统中的所有元件在其发挥研究一个功能系统中的所有元件在其发挥功能时的表现和关系功能时的表现和关系。所有的数据然后被整合,进行图形显示,最后建立数学模型数学模型。可以简单的理解为数学方程式,但方程式中某一项改变的时候会导致其他的项进行相应的改变,且是定量的。生物学是一种信息科学 生物系统有两种信息所构成:基因:编码完成生命功能的分子机制 网络:决定调控的相互作用以及基因的如何表达。DNA-mRNA-protein-protein interactions-informational pathways-informatio
9、nal networks-cells-tissues or networks of cells-an organism-populations-ecologies.(hierarchical information)生物信息的特点 在多个层级水平上进行组织 在复杂网络系统中运行 这些信息网络通常具有鲁棒性,许多单个的扰动不会影响他的运行 网络中具有一些关键的节点,对他们的扰动会引起较明显的后果生物信息学与系统生物学 发展各种计算工具来获取、储存、分析、图形化表示、建模以及分发生物信息 整合不同水平的生物信息。如基因、mRNA、蛋白、网络与通路等 数据库:核酸与蛋白、蛋白相互作用、mRNA表达、蛋白质组等 整体分析变得越来越重要整体分析变得越来越重要生物信息学变得越来越重要 必须应用计算技术来建模描述生物过程,比如基因表达调控模型等 一个细胞内的相互作用的巨大数量与超级复杂性已超出了仅仅用人脑来处理的能力 高通量技术产生了大量的定量分析数据导致生命科学的发展由描述性科学向预测性科学转变。未来重大的生命科学研究进展都直接或间接未来重大的生命科学研究进展都直接或间接的与生物信息学相关的与生物信息学相关谢谢各位同学!