1、第十九章第十九章 遗传信息传递的遗传信息传递的 整体性整体性 Integration of expression and transmission of genetic information 第一节第一节 基因组学基因组学 Genomics 一、基因组就是一种生物拥有的所有遗一、基因组就是一种生物拥有的所有遗 传信息的总合传信息的总合 是一个细胞是一个细胞(或病毒或病毒)所载的全部遗传信息所载的全部遗传信息,它代表它代表 了一种生物所具有的全部遗传信息了一种生物所具有的全部遗传信息。 真核生物基因组是指一套完整单倍体真核生物基因组是指一套完整单倍体DNA(染色体染色体 DNA)及线粒体或叶绿
2、体及线粒体或叶绿体DNA的全部序列的全部序列,既有编码序列既有编码序列, 也有大量存在的非编码序列也有大量存在的非编码序列。 细菌基因组包含了拟核和质粒中的细菌基因组包含了拟核和质粒中的DNA序列序列。 病毒基因组有的为病毒基因组有的为DNA(DNA病毒病毒),有的则为有的则为RNA (RNA病毒病毒)。 * * 基因组基因组(genome) 二、基因组学包括结构基因组学、功二、基因组学包括结构基因组学、功 能基因组学和比较基因组学能基因组学和比较基因组学 1. 基因组学(基因组学(genomics)是阐明整个基因组的结构、是阐明整个基因组的结构、 结构与功能的关系以及基因之间相互作用的科学。
3、结构与功能的关系以及基因之间相互作用的科学。 2. 研究内容研究内容 结构基因组学(结构基因组学(structural genomics): 遗传图谱、遗传图谱、 物理图谱、序列图谱以及转录图谱和大规模物理图谱、序列图谱以及转录图谱和大规模DNA测序。测序。 功能基因组学(功能基因组学(functional genomics):分析鉴定基分析鉴定基 因组功能。因组功能。 比较基因组学(比较基因组学(comparative genomics):):基因组基因组 之间比较鉴定,研究生物进化,预测新基因。之间比较鉴定,研究生物进化,预测新基因。 三、结构基因组学的主要任务是基因三、结构基因组学的主要
4、任务是基因 组作图和大规模测序组作图和大规模测序 通过基因作图、构建连续克隆系及大规模测序通过基因作图、构建连续克隆系及大规模测序 等方法,结合主要模式生物已知基因组等方法,结合主要模式生物已知基因组DNA序列,序列, 辅以生物信息学和计算生物学技术,解密人类基因辅以生物信息学和计算生物学技术,解密人类基因 组组DNA序列和结构。序列和结构。 人类基因组计划(人类基因组计划(Human Genome Project,HGP):): 1986,Dulbecco,提出人类基因组计划;,提出人类基因组计划; 1990,国际人类基因组计划启动;,国际人类基因组计划启动; 1998,Celera Gen
5、omics成立,挑战国际人类基因组成立,挑战国际人类基因组 测序组织;测序组织; 1999年年9月,中国加入该计划;月,中国加入该计划; 1999年年12月,第月,第22号染色体破译;号染色体破译; 2000年年6月月26日,各国科学家公布人类基因组工作框日,各国科学家公布人类基因组工作框 架图;架图; 2003年年4月月14日,国际人类基因组测序组织宣布人类日,国际人类基因组测序组织宣布人类 基因组序列图绘制成功。基因组序列图绘制成功。 1. to generate physical, genetic, and sequence maps of the human genome; 2. to
6、 sequence the genomes of a variety of model organisms; 3. to develop improved technologies for mapping and sequencing; 4. to develop computational tools for capturing, storing, analyzing, displaying, and distributing map and sequence information; 5. to sequence EST fragments of cDNAs (expressed sequ
7、ence tags, or ESTs, are single-sequence runs 600 bp on the cDNA inserts) and eventually full-length cDNAs encoding the expressed mRNAs in different cell types of humans and mice; 6. to consider the ethical, social, and legal challenges posed by genomic information. 人类基因组计划的六个目标人类基因组计划的六个目标 1遗传作图遗传作图
8、 2物理作图物理作图 (一)遗传作图和物理作图是绘制人类基因(一)遗传作图和物理作图是绘制人类基因 组草图的重要策略组草图的重要策略 染色体染色体DNA很长,不能直接进行测序,必须先很长,不能直接进行测序,必须先 将基因组将基因组DNA进行分解、标记,使之成为可操作的进行分解、标记,使之成为可操作的 较小结构区域,这一过程称为作图。较小结构区域,这一过程称为作图。 遗传作图遗传作图(genetic mapping): 就是确定连锁就是确定连锁 的遗传标志位点在一条染色体上的排列顺序及它的遗传标志位点在一条染色体上的排列顺序及它 们之间的相对遗传距离们之间的相对遗传距离,用厘摩尔根用厘摩尔根(c
9、enti- Morgan,cM)表示表示,当两个遗传标记之间的重当两个遗传标记之间的重 组值为组值为1%时时,图距即为图距即为1 cM。 1遗传作图就是绘制连锁图遗传作图就是绘制连锁图 遗传图遗传图(genetic map)又称连锁图又称连锁图(linkage map)。 * DNA标记标记 限 制 性 片 段 长 度 多 态 性限 制 性 片 段 长 度 多 态 性 ( restriction fragment length polymorphism,RFLP) 可变数目串联重复序列可变数目串联重复序列(variable number of tandem repeat,VNTR) 单 核 苷
10、 酸 多 态 性单 核 苷 酸 多 态 性 ( single nucleotide polymorphism, SNP) 限制性片段长度多态性(限制性片段长度多态性(RFLP):): 利用特定的限制性内切酶识别并切割基因利用特定的限制性内切酶识别并切割基因 组组DNA,得到大小不等的,得到大小不等的DNA片段,所产生的片段,所产生的 DNA数目和各个片段的长度反映了数目和各个片段的长度反映了DNA分子上不分子上不 同酶切位点的分布情况。同酶切位点的分布情况。 可变数目串联重复序列(可变数目串联重复序列(VNTR):): 又称微卫星又称微卫星DNA(minisatellite DNA),是),是
11、 一种重复一种重复DNA短序列。短序列。VNTR基本原理与基本原理与RFLP大大 致相同,通过限制性内切酶的酶切和致相同,通过限制性内切酶的酶切和DNA探针杂探针杂 交,可一次性检测到众多微卫星位点,得到个体交,可一次性检测到众多微卫星位点,得到个体 特异性的特异性的DNA指纹图谱。指纹图谱。 单核苷酸多态性(单核苷酸多态性(SNP):): SNP不以“长度”的差异作为检测手段,而不以“长度”的差异作为检测手段,而 是直接以序列的变异作为标记。是直接以序列的变异作为标记。SNP是指在基因是指在基因 组水平上由单个核苷酸变异所造成的组水平上由单个核苷酸变异所造成的DNA序列多序列多 态性。态性。
12、SNP是人类可遗传的变异中最常见的一种,是人类可遗传的变异中最常见的一种, 也是基因组中最为稳定的变异。也是基因组中最为稳定的变异。SNP最大限度地最大限度地 代表了不同个体之间的遗传差异,因而成为研究代表了不同个体之间的遗传差异,因而成为研究 多基因疾病、药物遗传学及人类进化的重要遗传多基因疾病、药物遗传学及人类进化的重要遗传 标记。标记。 物理作图(物理作图(physical mapping)是在遗传作图基)是在遗传作图基 础上制作的更详细的人类基因组图谱。包括:础上制作的更详细的人类基因组图谱。包括: 荧光原位杂交图(荧光原位杂交图(FISH map) 限制性酶切图(限制性酶切图(res
13、triction map) 连续克隆系图(连续克隆系图(clone contig map) 2 2物理作图就是描绘杂交图、限制性酶切图及物理作图就是描绘杂交图、限制性酶切图及 克隆系图克隆系图 荧光原位杂交图(荧光原位杂交图(fluorescent in situ hybridization map,FISH map):):将荧光标记将荧光标记 的探针与染色体杂交确定分子标记所在的位臵。的探针与染色体杂交确定分子标记所在的位臵。 限制性酶切图(限制性酶切图(restriction map):):将限制性将限制性 酶切位点标定在酶切位点标定在DNA分子的相对位臵。分子的相对位臵。 连续克隆系图(
14、连续克隆系图(clone contig map):): 采用酶采用酶 切位点稀有的限制性内切酶或高频超声破碎技术切位点稀有的限制性内切酶或高频超声破碎技术 将将DNA分解成大片段后,再通过构建酵母人工分解成大片段后,再通过构建酵母人工 染色体(染色体(yeast artificial chromosome,YAC)或)或 细菌人工染色体(细菌人工染色体(bacterial artificial chromosome,BAC)获取含已知基因组序列标)获取含已知基因组序列标 签位点(签位点(sequence tagged site,STS)的)的DNA大大 片段。片段。 * STS(sequenc
15、e tagged site,基因组序列标签位,基因组序列标签位 点):点):是指染色体定位明确,并且可用是指染色体定位明确,并且可用PCR扩增扩增 的单拷贝序列,每隔的单拷贝序列,每隔100 kb距离就有一个标志。距离就有一个标志。 在在STS基础上构建能够覆盖每条染色体的大片段基础上构建能够覆盖每条染色体的大片段 DNA连续克隆系就可绘制精细物理图谱,为大规连续克隆系就可绘制精细物理图谱,为大规 模模DNA测序做好了准备。测序做好了准备。 (二)通过(二)通过BAC克隆系、鸟枪法等完成大规模克隆系、鸟枪法等完成大规模 DNA测序测序 1BAC克隆系的构建是大规模克隆系的构建是大规模DNA测序
16、的基础测序的基础 YAC载体装载量偏大(载体装载量偏大(1 2 Mb),自身稳定性),自身稳定性 不够。不够。 BAC具有插入片段较大(几具有插入片段较大(几kb 350 kb)、嵌)、嵌 合率低、遗传稳定性好、易于操作等优点。合率低、遗传稳定性好、易于操作等优点。 2鸟枪法是大规模鸟枪法是大规模DNA测序的重要方法测序的重要方法 全基因组鸟枪法测序全基因组鸟枪法测序(shotgun sequencing) 直接将整个基因组打成不同大小的直接将整个基因组打成不同大小的DNA片片 段,构建段,构建BAC文库,然后对文库进行随机测序,文库,然后对文库进行随机测序, 最后运用生物信息学方法将测序片段
17、拼接成全基最后运用生物信息学方法将测序片段拼接成全基 因组序列。因组序列。 鸟枪法鸟枪法DNA测序的主要步骤:测序的主要步骤: 建立高度随机、插入片段大小为建立高度随机、插入片段大小为1.6 kb到到4 kb 左右的基因组文库。左右的基因组文库。 高效、大规模的克隆双向测序。高效、大规模的克隆双向测序。 序列组装(序列组装(sequence assembly)产生一定数)产生一定数 量的重叠群(量的重叠群(contig)。)。 缺口填补。缺口填补。 鸟枪法(鸟枪法(shotgun)测序的的原理与策略)测序的的原理与策略 3高通量测序技术大大加快了基因组高通量测序技术大大加快了基因组DNA 测序
18、的进行测序的进行 高通量测序(高通量测序(high-throughput sequencing)技术:)技术: 不仅具备毛细管电泳测序不具备的优点,还不仅具备毛细管电泳测序不具备的优点,还 能进行“平行能进行“平行/多点”、“单分子”和“混合”序多点”、“单分子”和“混合”序 列分析。这种高通量测序一次实验可以读取几十列分析。这种高通量测序一次实验可以读取几十 万到几百万万到几百万DNA片段的序列,极大加速了基因组片段的序列,极大加速了基因组 测序。测序。 (三)生物信息学是预测基因组结构和功能(三)生物信息学是预测基因组结构和功能 的重要手段的重要手段 数据库的建设:数据库的建设:汇集了大量
19、汇集了大量DNA序列、蛋白质信息序列、蛋白质信息 预测基因、基因产物的结构、功能;分析基因预测基因、基因产物的结构、功能;分析基因-基因、基因基因、基因 -产物、产物产物、产物-产物之间的相互作用或联系;描述细胞或整产物之间的相互作用或联系;描述细胞或整 体水平的基因表达谱;推测系统发生关系。体水平的基因表达谱;推测系统发生关系。 主要的生物信息中心主要的生物信息中心 美国国家生物技术信息中心(美国国家生物技术信息中心(NCBI, http:/www.ncbi.nih.gov) 欧洲生物信息研究所(欧洲生物信息研究所(EBI,http:/ebi.ac.uk) 日本日本DNA数据库(数据库(DD
20、BJ,http:/www.ddbj.nig.ac.jp) GenBank(http:/www.ncbi.nih.gov/Genbank) 四、功能基因组学系统探讨基因的四、功能基因组学系统探讨基因的 活动规律活动规律 功能基因组学:功能基因组学:从整体水平上研究一种组织或细从整体水平上研究一种组织或细 胞在同一时间或同一条件下所表达基因的种类、胞在同一时间或同一条件下所表达基因的种类、 数量、功能及在基因组中的定位,或同一细胞在数量、功能及在基因组中的定位,或同一细胞在 不同状态下基因表达的差异。不同状态下基因表达的差异。 主要研究内容包括主要研究内容包括 基因组的表达基因组的表达 基因组功能
21、注释基因组功能注释 基因组表达调控网络及机制基因组表达调控网络及机制 (一)通过全基因组扫描鉴定(一)通过全基因组扫描鉴定DNA序列序列 中的基因中的基因 对测得的基因组序列进行“注释”,包括鉴定和描对测得的基因组序列进行“注释”,包括鉴定和描 述推测的编码序列、非编码序列及其功能。述推测的编码序列、非编码序列及其功能。 技术支持:人类基因组技术支持:人类基因组DNA序列数据库;高性能计序列数据库;高性能计 算机。算机。 改进的十进制计算机进行全基因组扫描,鉴定内含改进的十进制计算机进行全基因组扫描,鉴定内含 子与外显子之间的衔接,寻找全长子与外显子之间的衔接,寻找全长ORFs,确定多肽,确定
22、多肽 链编码序列。链编码序列。 同源基因:同源基因:在进化过程来自共同的祖先的基因,通在进化过程来自共同的祖先的基因,通 过核苷酸或氨基酸序列的同源性比较,可以推测基过核苷酸或氨基酸序列的同源性比较,可以推测基 因组内相似基因的功能。因组内相似基因的功能。 有效工具:有效工具:NCBI的序列局部相似性查询(的序列局部相似性查询(Basic Local Alignment Search,BLAST)程序。)程序。 操作流程:操作流程:GenBank中查找基因序列访问号码中查找基因序列访问号码 (accession number),在),在BLAST界面上输入界面上输入2条或条或 多条访问号码,就
23、可实现两两或多对序列的比对。多条访问号码,就可实现两两或多对序列的比对。 (二)通过(二)通过BLAST等程序搜索同源基因等程序搜索同源基因 (三)通过实验设计验证基因功能(三)通过实验设计验证基因功能 转基因(转基因(transgene) 基因过表达(基因过表达(over expression) 基因敲除(基因敲除(knock-out) 基因敲减(基因敲减(knock-down)或基因沉默)或基因沉默 (gene silencing) 合适的模式生物替代人体进行实验合适的模式生物替代人体进行实验 (四)通过转录组和蛋白质组描述基因(四)通过转录组和蛋白质组描述基因 表达模式表达模式 基因表达
24、:基因表达:RNA的转录和蛋白质的翻译的转录和蛋白质的翻译 基因的表达模式及调控描述:借助转录组学基因的表达模式及调控描述:借助转录组学 和蛋白质组学相关技术与方法和蛋白质组学相关技术与方法 第二节第二节 转录组学转录组学 Transcriptomics 一、转录组学研究全部一、转录组学研究全部RNA的表达及功能的表达及功能 转录组(转录组(transcriptome)指生命单元(通常是一种指生命单元(通常是一种 细胞)所能转录出来的所有细胞)所能转录出来的所有RNA包括指导蛋白包括指导蛋白 质翻译的质翻译的mRNA和非编码和非编码RNA (non-coding RNA, ncRNA)的总和。
25、的总和。 RNA功能基因组学,又称功能基因组学,又称RNA组学(组学(RNomics):): 是分析、鉴定非信使小是分析、鉴定非信使小RNA(small non-messenger RNA, snmRNA)在特定状态下表达差异、功能及)在特定状态下表达差异、功能及 其与蛋白质的相互作用。其与蛋白质的相互作用。 转录组学(转录组学(transcriptomics):):是在整体水平是在整体水平 上研究细胞编码基因转录情况及转录调控规律上研究细胞编码基因转录情况及转录调控规律 的科学。的科学。 转录组的特点:转录组的特点:受到内外多种因素的调节,因受到内外多种因素的调节,因 而是而是动态可变动态可
26、变的。能够揭示不同物种、不同个的。能够揭示不同物种、不同个 体、不同细胞、不同发育阶段及不同生理病理体、不同细胞、不同发育阶段及不同生理病理 状态下的基因差异表达信息。状态下的基因差异表达信息。 二、转录组学的核心工作是分析基因二、转录组学的核心工作是分析基因 表达谱表达谱 大规模表达谱或全景式表达谱(大规模表达谱或全景式表达谱(global expression profile):):是生物体(组织、细胞)在某一状态是生物体(组织、细胞)在某一状态 下基因表达的整体状况。下基因表达的整体状况。 基因功能的研究方法:基因功能的研究方法:基因的差异表达方法;基基因的差异表达方法;基 因表达谱芯片
27、(因表达谱芯片(cDNA芯片、芯片、EST芯片等)。芯片等)。 (一)采用(一)采用cDNA芯片可实现大规模已知(序芯片可实现大规模已知(序 列)基因表达谱分析列)基因表达谱分析 (二)(二)SAGE和和MPSS分析可鉴定未知分析可鉴定未知/新新 基因表达信息基因表达信息 基因表达系列分析基因表达系列分析(serial analysis of gene expression,SAGE)和大规模平行信号测序系统和大规模平行信号测序系统 (massively parallel signature sequencing,MPSS) 可实现基因表达谱芯片很难检测某些特定时段表达可实现基因表达谱芯片很难
28、检测某些特定时段表达 或表达水平较低的基因或未知基因的表达或表达水平较低的基因或未知基因的表达。 (三)推断未知基因功能,探索生命机制(三)推断未知基因功能,探索生命机制 转录组分析可以提供特定条件下(生理、转录组分析可以提供特定条件下(生理、 病理、诱导刺激等)基因表达的信息,通过使病理、诱导刺激等)基因表达的信息,通过使 用基因碱基序列数据和比较已知及未知功能的用基因碱基序列数据和比较已知及未知功能的 基因,推断相应未知基因的功能,揭示特定调基因,推断相应未知基因的功能,揭示特定调 节基因的作用机制。节基因的作用机制。 三、芯片、三、芯片、SAGE和和MPSS是转录组学是转录组学 研究主要
29、技术研究主要技术 转录组学研究重点:转录组学研究重点: 基因转录的区域基因转录的区域 转录因子结合位点转录因子结合位点 染色质修饰点染色质修饰点 DNA甲基化位点等甲基化位点等 研究技术:研究技术: 微阵列(微阵列(microarray) SAGE MPSS (一)微阵列是大规模基因组表达谱研究的(一)微阵列是大规模基因组表达谱研究的 主要技术主要技术 微阵列或基因芯片(微阵列或基因芯片(DNA chip)原理)原理 利用光导化学合成、照相平板印刷以及固相表面利用光导化学合成、照相平板印刷以及固相表面 化学合成等技术,在固相表面合成成千上万个寡化学合成等技术,在固相表面合成成千上万个寡 核苷酸
30、探针,并与放射性同位素或荧光物标记的核苷酸探针,并与放射性同位素或荧光物标记的 来自不同细胞、组织或整个器官的来自不同细胞、组织或整个器官的DNA或或mRNA 反转录生成的第一链反转录生成的第一链cDNA进行杂交,然后用特进行杂交,然后用特 殊的检测系统对每个杂交点进行定量分析。殊的检测系统对每个杂交点进行定量分析。 优点:优点:可同时对大量基因,甚至整个基因组的基因可同时对大量基因,甚至整个基因组的基因 表达进行对比分析。表达进行对比分析。 微阵列技术的基本步骤微阵列技术的基本步骤 (二)(二)SAGE在转录物水平研究细胞或在转录物水平研究细胞或 组织基因表达模式组织基因表达模式 SAGE的
31、基本原理:的基本原理: 用来自用来自cDNA 3端特定位臵端特定位臵910 bp长度的序列所含有长度的序列所含有 的足够信息鉴定基因组中的所有基因的足够信息鉴定基因组中的所有基因 利用锚定酶(利用锚定酶(anchoring enzyme,AE)和位标酶)和位标酶 (tagging enzyme,TE)切割)切割DNA分子的特定位臵(靠分子的特定位臵(靠 近近3端),分离端),分离SAGE标签,并将这些标签串联起来,标签,并将这些标签串联起来, 然后对其进行测序然后对其进行测序 特点:特点: 可全面提供生物体基因表达谱信息可全面提供生物体基因表达谱信息 可用来定量比较不同状态下组织或细胞的所有差
32、异表达可用来定量比较不同状态下组织或细胞的所有差异表达 基因基因 (三)(三)MPSS是以基因测序为基础的是以基因测序为基础的 基因表达谱分析新技术基因表达谱分析新技术 MPSS的原理:的原理: 一个含有能够特异识别转录子的信息标签序列(一个含有能够特异识别转录子的信息标签序列(1020 bp)与长的连续分子连接在一起,测出)与长的连续分子连接在一起,测出mRNA的一端包含一的一端包含一 个个10至至20个碱基的标签序列。每一标签序列在样品中的频率个碱基的标签序列。每一标签序列在样品中的频率 (拷贝数)代表了与该标签序列相应的基因表达水平。(拷贝数)代表了与该标签序列相应的基因表达水平。 基因
33、表达水平是以计算基因表达水平是以计算mRNA拷贝数为基础,是一个拷贝数为基础,是一个 数字表达系统。只要将病理和对照样品分别进行测定,即可数字表达系统。只要将病理和对照样品分别进行测定,即可 进行严格的统计检验,能测定表达水平较低、差异较小的基进行严格的统计检验,能测定表达水平较低、差异较小的基 因,而且不必预先知道基因的序列。因,而且不必预先知道基因的序列。 四、四、RNA组学研究全部非组学研究全部非mRNA小小RNA 的集合的集合 人类基因组序列特点:人类基因组序列特点:2万万 2.5万个基因万个基因,与蛋白与蛋白 质合成有关的序列占整个基因组的质合成有关的序列占整个基因组的2%左右左右,
34、其余其余 98%的基因组序列没有得到注释的基因组序列没有得到注释。 RNA组学研究范畴:组学研究范畴:小分子小分子RNA,包括,包括 snRNA、snoRNA、scRNA、催化性小催化性小RNA (small catalytic RNA)、小片段干涉小片段干涉 RNA (small interfering RNA,siRNA)、微小微小 RNA(microRNA,miRNA) 第三节第三节 蛋白质组学蛋白质组学 Proteomics 以细胞、组织或机体在特定时间和空间上表以细胞、组织或机体在特定时间和空间上表 达的所有蛋白质即蛋白质组(达的所有蛋白质即蛋白质组(proteome)为研究)为研究
35、 对象,分析细胞内动态变化的蛋白质组成、表达对象,分析细胞内动态变化的蛋白质组成、表达 水平与修饰状态,了解蛋白质之间的相互作用与水平与修饰状态,了解蛋白质之间的相互作用与 联系,并在整体水平上研究蛋白质调控的活动规联系,并在整体水平上研究蛋白质调控的活动规 律,故又称为律,故又称为全景式蛋白质表达谱(全景式蛋白质表达谱(global protein expression profile)分析)分析。 蛋白质组学(蛋白质组学(proteomics) 与蛋白质组研究相关的数据库与蛋白质组研究相关的数据库 蛋白序列数据库(蛋白序列数据库(SWISS-PROT/TrEMBL; http:/www.e
36、xpasy.ch) 基因序列数据库(基因序列数据库(Genbank,http:/www.ncbi.nlm.nih.gov/ EMBL; http:/www.ebi.ac.uk/) 蛋白模式数据库(蛋白模式数据库(Prosite; http:/www.expasy.ch/sprot/prosite.html) 蛋白质二维凝胶电泳数据库、蛋白三维结构数据库(蛋白质二维凝胶电泳数据库、蛋白三维结构数据库(PDB, http:/www.pdb.bnl.gov/;FSSP,http:/www.embl-ebi.ac.uk) 蛋白翻译后修饰数据库(蛋白翻译后修饰数据库(O-GLYCBASE, http:/
37、www.cbs.dtu.dk/databases/OGLYCBASE) 一、研究细胞内所有蛋白质组成及其一、研究细胞内所有蛋白质组成及其 活动规律是蛋白质组学的中心任务活动规律是蛋白质组学的中心任务 蛋白质组学的研究内容:蛋白质组学的研究内容: 一是蛋白质组表达模式的研究,即结构蛋白一是蛋白质组表达模式的研究,即结构蛋白 质组学(质组学(structural proteomics) 二是蛋白质组功能模式的研究,即功能蛋白二是蛋白质组功能模式的研究,即功能蛋白 质组学(质组学(functional proteomics) 蛋白质组学的主要任务:蛋白质组学的主要任务: 蛋白质鉴定:蛋白质鉴定:可以
38、利用一维电泳和二维电泳并可以利用一维电泳和二维电泳并 结合生物质谱、结合生物质谱、Western印迹、蛋白质芯片等印迹、蛋白质芯片等 技术,对蛋白质进行全面的鉴定研究。技术,对蛋白质进行全面的鉴定研究。 翻译后修饰的鉴定:翻译后修饰的鉴定:如磷酸化、糖基化、酶原如磷酸化、糖基化、酶原 激活等过程。激活等过程。 蛋白质功能确定:蛋白质功能确定:包括蛋白质定位研究,蛋白包括蛋白质定位研究,蛋白 质活性,蛋白质相互作用,酶活性和确定酶底质活性,蛋白质相互作用,酶活性和确定酶底 物,细胞因子的生物分析,配基物,细胞因子的生物分析,配基-受体结合分析受体结合分析 等。等。 二、二维电泳二、二维电泳生物质
39、谱是蛋白生物质谱是蛋白 质组学研究的常用技术质组学研究的常用技术 蛋白质组学研究三大基本支撑技术:蛋白质组学研究三大基本支撑技术: 二维电泳技术二维电泳技术 生物质谱技术生物质谱技术 大规模数据处理大规模数据处理 (一)二维电泳是分离蛋白质组的有效方法(一)二维电泳是分离蛋白质组的有效方法 二维凝胶电泳(二维凝胶电泳(two-dimensional gel electrophoresis,2-DE)原理)原理: 等电聚焦(等电聚焦(isoelectric focusing,IEF)电泳:)电泳: 利用蛋白质分子的等电点不同使蛋白质得以利用蛋白质分子的等电点不同使蛋白质得以 分离;分离; SDS
40、-聚丙烯酰胺凝胶电泳(聚丙烯酰胺凝胶电泳(SDS-PAGE):): 按蛋白质分子量的大小进行分离。按蛋白质分子量的大小进行分离。 蛋白质的二维电泳蛋白质的二维电泳 (二)生物质谱是蛋白质组鉴定的(二)生物质谱是蛋白质组鉴定的 重要工具重要工具 质谱(质谱(mass spectroscopy,MS)是蛋白质组学中)是蛋白质组学中 分析与鉴定肽和蛋白质最重要的手段。主要方法:分析与鉴定肽和蛋白质最重要的手段。主要方法: 1用肽质量指纹图谱鉴定蛋白质:用肽质量指纹图谱鉴定蛋白质:蛋白质经蛋白质经 过酶解成肽段后,获得所有肽段的分子质量,过酶解成肽段后,获得所有肽段的分子质量, 形成一个特异的肽质量指
41、纹图谱(形成一个特异的肽质量指纹图谱(peptide mass fingerprinting,PMF),通过数据库搜),通过数据库搜 索与比对,便可确定待分析蛋白质分子的性质。索与比对,便可确定待分析蛋白质分子的性质。 2用串联质谱(用串联质谱(MS/MS)鉴定蛋白质)鉴定蛋白质 : 用用PMF方法未能鉴定的蛋白质可通过质谱技方法未能鉴定的蛋白质可通过质谱技 术获得该蛋白质一段或数段多肽的串连质谱术获得该蛋白质一段或数段多肽的串连质谱 信息(氨基酸序列)并通过数据库检索来鉴信息(氨基酸序列)并通过数据库检索来鉴 定该蛋白质。定该蛋白质。 混合蛋白质酶解后的多肽混合物直接通过混合蛋白质酶解后的多
42、肽混合物直接通过 (多维)液相色谱分离,然后进入质谱进行(多维)液相色谱分离,然后进入质谱进行 分析。分析。 蛋白质的质谱分析蛋白质的质谱分析 (MS谱获得蛋白质的谱获得蛋白质的PMF;MS/MS可测定蛋白质的部分氨基酸序列)可测定蛋白质的部分氨基酸序列) 三、蛋白质相互作用研究是认识蛋白质三、蛋白质相互作用研究是认识蛋白质 功能的重要内容功能的重要内容 蛋白质蛋白质-蛋白质相互作用(蛋白质相互作用(protein-protein interaction)是维持细胞生命活动的基本方式,主)是维持细胞生命活动的基本方式,主 要包括受体与配体的结合、信号转导分子间的相互要包括受体与配体的结合、信号
43、转导分子间的相互 作用及其机制等。作用及其机制等。 常用的方法有:酵母双杂交常用的方法有:酵母双杂交(yeast two-hybrid system)、亲和层析、免疫共沉淀、蛋白质交联和、亲和层析、免疫共沉淀、蛋白质交联和 基于绿色荧光蛋白的细胞内蛋白质相互作用研究方基于绿色荧光蛋白的细胞内蛋白质相互作用研究方 法等。法等。 第四节第四节 “组学”在医学中的应用组学”在医学中的应用 Omics Application in Medicine 一、疾病基因组学研究疾病相关基因一、疾病基因组学研究疾病相关基因 揭示疾病发病机制揭示疾病发病机制 疾病基因组学研究的两大任务:疾病基因组学研究的两大任务
44、: 疾病基因或疾病相关基因疾病基因或疾病相关基因 疾病易感性的遗传学基础疾病易感性的遗传学基础 (一)定位克隆技术是发现、鉴定疾病(一)定位克隆技术是发现、鉴定疾病 基因的重要手段基因的重要手段 定位候选克隆(定位候选克隆(positional candidate cloning):): 是将疾病相关位点定位于某一染色体区域后,是将疾病相关位点定位于某一染色体区域后, 根据该区域的基因、根据该区域的基因、EST或模式生物所对应的同或模式生物所对应的同 源区的已知基因等有关信息,直接进行基因突变源区的已知基因等有关信息,直接进行基因突变 筛查,经过多次重复,可最终确定疾病相关基因。筛查,经过多次
45、重复,可最终确定疾病相关基因。 (二)(二)SNPs是疾病易感性的重要遗传学基础是疾病易感性的重要遗传学基础 SNPs 被认为是人类疾病易感性的决定性因素被认为是人类疾病易感性的决定性因素 APOE基因单个碱基变异基因单个碱基变异Alzheimer病病 CCR5单个碱基纯缺失突变单个碱基纯缺失突变HIV的抗性的抗性 慢乙酰化基因型的吸烟者慢乙酰化基因型的吸烟者肝癌肝癌 MPO基因启动子(基因启动子(-463GA) 低肺癌患病低肺癌患病 HER-2 基因编码区的一个基因编码区的一个SNP 胃癌胃癌 二、药物基因组学研究遗传变异对二、药物基因组学研究遗传变异对 药物效能和毒性的影响药物效能和毒性的
46、影响 药物基因组学(药物基因组学(pharmacogenomics) 是功能基因组学与分子药理学的有机结合,它不是以发是功能基因组学与分子药理学的有机结合,它不是以发 现人体基因组基因为主要目的,而是运用已知的基因组现人体基因组基因为主要目的,而是运用已知的基因组 学知识改善患者的治疗。学知识改善患者的治疗。 以药物效应及安全性为目标,研究各种基因突变与药效以药物效应及安全性为目标,研究各种基因突变与药效 及安全性的关系,是研究高效、特效药物的重要途径,及安全性的关系,是研究高效、特效药物的重要途径, 通过它为患者或者特定人群寻找合适的药物。通过它为患者或者特定人群寻找合适的药物。 使药物治疗
47、模式:诊断定向治疗使药物治疗模式:诊断定向治疗基因定向治疗。基因定向治疗。 (一)药物基因组学预测药物反应性并(一)药物基因组学预测药物反应性并 指导个体化用药指导个体化用药 阐明影响药物吸收、转运、代谢、消除等个阐明影响药物吸收、转运、代谢、消除等个 体差异的基因特性体差异的基因特性 阐明基因变异所致的不同病人对药物的不同阐明基因变异所致的不同病人对药物的不同 反应性反应性 指导合理用药和设计个体化用药,以提高药指导合理用药和设计个体化用药,以提高药 物作用的有效性、安全性和经济性物作用的有效性、安全性和经济性 (二)基因多态性是药物基因组学的基础(二)基因多态性是药物基因组学的基础 和重要
48、研究内容和重要研究内容 药物代谢酶多态性:药物代谢酶多态性:其多态性决定表型多态性和药物代谢酶其多态性决定表型多态性和药物代谢酶 的活性,并呈显著的基因剂量的活性,并呈显著的基因剂量-效应关系,从而造成不同个效应关系,从而造成不同个 体间药物代谢反应的差异,是产生药物毒副反应、降低或丧体间药物代谢反应的差异,是产生药物毒副反应、降低或丧 失药效的主要原因;失药效的主要原因; 药物转运蛋白多态性:药物转运蛋白多态性:转运蛋白在药物的吸收、排泄、分布、转运蛋白在药物的吸收、排泄、分布、 转运等方面起重要作用,其变异对药物吸收和消除具有重要转运等方面起重要作用,其变异对药物吸收和消除具有重要 意义;意义; 药物作用靶点多态性药物作用靶点多态性:靶蛋白对特定药物产生不同的亲和力,:靶蛋白对特定药物产生不同的亲和力, 导致药物疗效的不同。导致药物疗效的不同。 (三)鉴定基因序列的变异是药物基因组学(三)鉴定基因序列的变异是药物基因组学 的主要研究策略的主要研究策略 主要策略包括选择药物起效、活化、排泄等相关过主要策略包括选择药物起效、活化、排泄等相关过 程的候选基因进行研究,程的候选基因进行研究,鉴定基因序列的变异。鉴定基因序列的变异。 在生物化学与分子生物学水平进行研究,估测它