1、DNA 芯 片 马永平第八章第八章 基础医学院生物化学与分子生物学教研室内容提要n什么是什么是DNA芯片?芯片?nDNA芯片的原理芯片的原理nDNA芯片的种类芯片的种类nDNA芯片的应用领域芯片的应用领域nDNA表达谱数据分析表达谱数据分析nDNA芯片技术的发展与展望芯片技术的发展与展望第一节第一节 概述概述nDNA芯片也叫基因芯片(芯片也叫基因芯片(Gene chip)是指在固相载体(玻璃、硅等)上有是指在固相载体(玻璃、硅等)上有序地、高密度地(点间距序地、高密度地(点间距500 m)排)排列固定了大量的靶基因或寡核苷酸列固定了大量的靶基因或寡核苷酸,也也叫探针。这些被固定的分子探针在基叫
2、探针。这些被固定的分子探针在基质上形成高密度的质上形成高密度的DNA微阵列,因此,微阵列,因此,DNA芯片又叫芯片又叫DNA微矩阵(微矩阵(DNA Microarray)。第一块基因芯片。第一块基因芯片1992年诞生在美国。年诞生在美国。nDNA芯片属于生物芯片(芯片属于生物芯片(biochip)的)的范畴,生物芯片分为范畴,生物芯片分为DNA芯片、蛋白芯片、蛋白质芯片及其它芯片(样品制备芯片、质芯片及其它芯片(样品制备芯片、核酸扩增芯片、毛细管电泳芯片等)核酸扩增芯片、毛细管电泳芯片等)三类。三类。第二节第二节 DNA芯片的基本原理芯片的基本原理1.基因芯片技术是建立在基因芯片技术是建立在S
3、outhern blot基基础之上的,可以说它是础之上的,可以说它是Southern blot的的改进和发展,它的原理是:改进和发展,它的原理是:变性变性DNA 加加入探针后在一定温度下退火,同源片段入探针后在一定温度下退火,同源片段之间通过碱基互补形成双链杂交分子之间通过碱基互补形成双链杂交分子。nS;DNA-DNA/RNA;N:RNA-DNA/RNA;W:Protein-protein/DNA;E:Genome DNA-DNA/RNA(Dot blot)2.基因芯片与基因芯片与Southern blot之比较之比较n基因芯片的基本原理与基因芯片的基本原理与Southern blot技术一技
4、术一脉相承,脉相承,点样技术和数据读取技术的发展是点样技术和数据读取技术的发展是基因芯片技术对传统核酸杂交的技术性突破,基因芯片技术对传统核酸杂交的技术性突破,因此,基因芯片技术是基因功能研究领域的因此,基因芯片技术是基因功能研究领域的一次革命。通过基因芯片人们可以大规模、一次革命。通过基因芯片人们可以大规模、高通量(海量)地对成千上万个基因进行同高通量(海量)地对成千上万个基因进行同时研究。时研究。n与与Southern blot相比较,相比较,基因芯片具有高密基因芯片具有高密度、高通量、并行性、微量化、自动化的特度、高通量、并行性、微量化、自动化的特点点。3.基因芯片基本操作流程基因芯片基
5、本操作流程n制备制备总总RNA mRNA经经RT-PCR用用Cy3(正常对照组)和(正常对照组)和Cy5(实验组)荧光(实验组)荧光标记目的基因,得到标记目的基因,得到cDNA 探针探针 混混合标记探针合标记探针与表达谱芯片上核苷酸与表达谱芯片上核苷酸片段(或基因)杂交片段(或基因)杂交扫描扫描分析杂分析杂交结果交结果结论结论n载体载体+寡核苷酸寡核苷酸-探针分子探针分子+荧光染料荧光染料-点点样仪样仪-扫描仪扫描仪-计算机计算机+专业软件专业软件第三节第三节 DNA芯片的种类芯片的种类n表达谱芯片表达谱芯片n诊断芯片诊断芯片n检测芯片检测芯片 用于基因功能的研究。用于基因功能的研究。原理原理
6、:用不同的:用不同的荧光染料通过荧光染料通过RT-PCR标记不同来源的细标记不同来源的细胞胞mRNA制备成探针,将探针混合后与芯制备成探针,将探针混合后与芯片上的基因杂交、洗涤、扫描,得到这些片上的基因杂交、洗涤、扫描,得到这些基因在不同组织或个体中的表达谱,再通基因在不同组织或个体中的表达谱,再通过计算机分析这些基因在不同组织或个体过计算机分析这些基因在不同组织或个体中的表达差异,得出这些基因表达的重要中的表达差异,得出这些基因表达的重要信息。即信息。即高表达、低表达或不表达高表达、低表达或不表达。1.表达谱基因芯片表达谱基因芯片HBV、HCV、结核杆菌等病原体检测,商检等。2.诊断芯片诊断
7、芯片在DNA 和/或RNA水平上用于疾病诊断,如肝癌、糖尿病等。3.检测芯片检测芯片 第四节第四节 基因芯片的应用基因芯片的应用n基因测序及基因图绘制基因测序及基因图绘制n检测基因突变检测基因突变n基因表达分析基因表达分析n在药物研究中的应用在药物研究中的应用n在微生物菌种鉴定和致病机制在微生物菌种鉴定和致病机制研究中的应用研究中的应用n在农林业生产中的应用在农林业生产中的应用n在军事、司法领域的应用在军事、司法领域的应用1.杂交测序和基因作图杂交测序和基因作图n杂交测序(SBH)是发展基因芯片技术的初衷,希望能够提供一种新的、快速的测序方法。原理:理论上有4n个长度为n的序列,可以被分析的目
8、标长度大约等于点阵上寡核苷酸数目的平方根。n基因绘图:用光蚀刻技术在载体上合成大规模有序的寡核苷酸序列(标签序列),然后与克隆文库中的每个克隆进行杂交,通过鉴定基因与基因间的大量标签序列(EST,STS等),以较低的等价基因组数把他们绘制成重叠图。附:附:标签序列标签序列nexpressed sequence tags,EST:表达序列标签,表达序列标签,为为cDNA的部分序列,平均为的部分序列,平均为300-500bp,它可以确,它可以确定基因的种类和所代表基因表达的拷贝数。目前,定基因的种类和所代表基因表达的拷贝数。目前,公共数据库中可利用的人类公共数据库中可利用的人类EST超过超过100
9、万个,它万个,它可能代表所有人类基因的可能代表所有人类基因的50%-90%。nsequence tagged site,STS:序列标签位点,是指染序列标签位点,是指染色体定位明确,而且可以用色体定位明确,而且可以用PCR扩增的单拷贝序扩增的单拷贝序列,一般每隔列,一般每隔100kb距离就有一个标记。距离就有一个标记。2.检测基因突变检测基因突变n如果基因易发生突变区段的核苷酸序列是已知的,则DNA芯片能很容易地通过再测序鉴别出仅1个碱基的错配。以下面的15nt的探针为例,每个探针只有中间一个核苷酸不同,以红体下划线表示。1.G C T A C T C A T G C G T A C 2.C
10、T A C T C A T G C G T A C T 3.T A C T C A T G C G T A C T C 4.A C T C A T G C G T A C T C C 5.C T C A T G C G T A C T C C G 6.T C A T G C G T A C T C C G T TACGCA TACTCAACGTA CGT 2.C T A C T C A T G C G T A C T 3.T A C T C A T G C G T A C T C 4.A C T C A T G C G T A C T C C 1.A C T C A T G A G T A C
11、 T C C T A C T C A3.基因表达分析基因表达分析1)肺癌相关基因的表达研究 黄达辉 毛裕民等 用含4096条cDNA基因的表达谱芯片研究一组肺癌组织样本的基因表达谱,共筛选出差异表达的基因370条,包含已知基因146条,未知基因224条,其中107条表达增加,263条表达降低。(第二军医大学学报,2000,21(9):827-830)2)基因芯片对PMA激活的血管内皮细胞早期反应基因的研究 吴超群,李瑶,毛裕民,等.n摘要:用含4096条人类基因的DNA芯片研究PMA激活的血管内皮细胞ERG的表达谱,作用6h后,17条基因表达上调,11条基因下调。数据分析表明17条上调基因中1
12、3条属于蛋白质磷酸酶和转录调控因子基因,而下调基因中9条为细胞分裂相关蛋白,从而证明PMA激活的人血管内皮细胞ERG主要是转录调控因子基因和蛋白质磷酸酶基因。4.基因芯片在肿瘤研究中的应用基因芯片在肿瘤研究中的应用 1)寻找肿瘤相关基因)寻找肿瘤相关基因 2)肿瘤基因表达谱研究)肿瘤基因表达谱研究 3)肿瘤相关基因功能研究)肿瘤相关基因功能研究 4)肿瘤分子生物学研究)肿瘤分子生物学研究 5)肿瘤诊断)肿瘤诊断1)寻找肿瘤相关基因)寻找肿瘤相关基因nWelford 等结合消减杂交技术,用基因芯片分析了两例具有不同生物学活性的Ewing肉瘤标本,一例为生长迅速的转移灶,另一例为被成功治愈的局限灶
13、。经差异表达后,将消减文库插入质粒,制成cDNA文库,与不同荧光标记的肉瘤组织杂交,共得到173条差异表达的基因,其中有50条为新基因(28.9%)。2)肿瘤基因表达谱研究nKononen等用含有4000条已知基因和2000个EST的cDNA芯片对两株分别为激素依赖(CWR22)和非激素依赖(CWR22R)的前列腺癌细胞进行杂交,将其表达谱与269例前列腺癌组织及正常前列腺组织比较,发现在芯片的5148条基因中,有3条基因(0.7%)在非激素依赖中表达超过2倍,有135条基因(2.6%)下调超过50%,其中上调的IGFBP2和HSP27基因在临床激素抵抗复发肿瘤标本中分别有100%和 31%也
14、是上调的。3)肿瘤分子生物学研究)肿瘤分子生物学研究nAlizadeh 等用基因芯片对等用基因芯片对DLBCL(diffuse large B-cell lymphoma)进行的病理分型研进行的病理分型研究发现究发现,依据基因表达差异依据基因表达差异,DLBCL还可以分还可以分为三个亚为三个亚型。(型。(Nature,2000,403:503-511).4)肿瘤诊断)肿瘤诊断n国外有一个病人临床表现出典型的白血病症国外有一个病人临床表现出典型的白血病症状,但形态学检测不典型,根据相关检查,状,但形态学检测不典型,根据相关检查,诊断诊断为为AML(acute myeloid leukaemia)
15、,治疗几个月后未见好转。后来用治疗几个月后未见好转。后来用DNA芯片与芯片与病人骨髓的病人骨髓的mRNA杂交,结果显示杂交,结果显示AML和和ALL(acute lymphoblastic leukaemia)基因都基因都表达较低,而在数据分析中发现,编码原肌表达较低,而在数据分析中发现,编码原肌球蛋白的基因表达极高,从而确诊为球蛋白的基因表达极高,从而确诊为肺泡弹肺泡弹状肌肉瘤状肌肉瘤,改变治疗方案,病情出现缓解。,改变治疗方案,病情出现缓解。5.基因芯片在药物研究中的应用1)药物筛选)药物筛选n直接检测化合物对生物大分子如受体、酶、直接检测化合物对生物大分子如受体、酶、离子通道等的结合及作
16、用。离子通道等的结合及作用。n检测化合物作用于细胞后基因表达变化。检测化合物作用于细胞后基因表达变化。n选择合适的药物作用靶标选择合适的药物作用靶标 有人用有人用5,766个基因的芯片分析正常与癌变的卵巢组织个基因的芯片分析正常与癌变的卵巢组织的的mRNA,发现二者有,发现二者有30%的基因表达差异为的基因表达差异为2倍以上,其倍以上,其中癌变组织中癌变组织9%的基因表达上调,尤以的基因表达上调,尤以CD9、上皮糖蛋白、上皮糖蛋白、P27蛋白等。蛋白等。n不同个体结合药物的靶标存在差异。不同个体结合药物的靶标存在差异。n小分子药物在体内的作用靶标不可小分子药物在体内的作用靶标不可能有绝对专一性
17、。能有绝对专一性。2)指导合理用药)指导合理用药6.基因芯片在微生物菌种鉴定中的应用基因芯片在微生物菌种鉴定中的应用n菌种鉴定n细菌基因分型及菌种鉴定n监测细菌抗药性基因7.基因芯片在病原体致病机制中应用基因芯片在病原体致病机制中应用1)致病机制研究)致病机制研究n研究病原体基因组,了解其致病基因,研究病原体基因组,了解其致病基因,抗药机制及抗药基因等。抗药机制及抗药基因等。n分析药物作用下病原体基因表达情况分析药物作用下病原体基因表达情况n监测宿主在染病状态下基因表达的变监测宿主在染病状态下基因表达的变化化2)病原体致病机制的研究病原体致病机制的研究n1996年年Kozal等首次用基因芯片技
18、术等首次用基因芯片技术发现发现HIV-1包膜包膜B蛋白酶极其多变,蛋白酶极其多变,其中许多氨基酸的改变与抗蛋白酶其中许多氨基酸的改变与抗蛋白酶抑制剂的抗药性有关。抑制剂的抗药性有关。8.基因芯片在军事司法方面的应用基因芯片在军事司法方面的应用n检测生物战病原体,研制生物战检测生物战病原体,研制生物战保护剂。保护剂。nDNA指纹鉴定、血型鉴定;指纹鉴定、血型鉴定;1)DNA指纹指纹nDNA fingerprint:人类基因组内散布着许多:人类基因组内散布着许多串联重复的短小串联重复的短小DNA序列,叫小卫星序列,叫小卫星DNA(MSDNA),由于不受选择压力,卫星),由于不受选择压力,卫星DNA
19、呈现高度的多态性,具有孟德尔式稳呈现高度的多态性,具有孟德尔式稳定遗传的特性。因此,用定遗传的特性。因此,用MSDNA探针与总探针与总DNA限制性酶切片段(酶切位点在限制性酶切片段(酶切位点在MSDNA之外)杂交,可以得到个体特异的之外)杂交,可以得到个体特异的DNA指指纹图谱。纹图谱。第五节第五节 数据分析数据分析1.图象分析图象分析(Image analysis)2.标准化处理标准化处理(Normalization):是指以持是指以持(管)家基因(管)家基因(housekeeping gene)的表达)的表达率为参照,对原始数据进行校正的过程。实率为参照,对原始数据进行校正的过程。实际操作
20、中常常剔除际操作中常常剔除Cy3和和Cy5信号强度均小信号强度均小于于400的基因表达,使数据标准化。的基因表达,使数据标准化。3.散点图分析散点图分析(scatter plot)基因芯片的扫描示意图MMMCy3 Cy5Cy3/Cy5基因芯片扫描结果基因芯片扫描结果图图Scatter plot of differentially expressed gene 1)数据分析数据分析4.Ratio 值分析值分析 Ratio=Cy3/Cy5,一般认为一般认为Ratio 值在值在0.5-2.0范围内(即范围内(即2倍以下)的基因不存在显著表倍以下)的基因不存在显著表达差异,该范围之外的基因表达认为具有
21、显著差达差异,该范围之外的基因表达认为具有显著差异,由于实验条件不同,此域值区间会根据可信异,由于实验条件不同,此域值区间会根据可信度有所调整。度有所调整。5.聚类分析聚类分析(Clustering):就是根据统计分析原理就是根据统计分析原理对具有相同统计行为的多个基因或样本进行归类对具有相同统计行为的多个基因或样本进行归类的分析方法,归为一类(簇)的基因或样本可能的分析方法,归为一类(簇)的基因或样本可能具有相似的功能或类型。具有相似的功能或类型。聚类示意图聚类示意图ABa1a2a3a4 a5b1b2b3b4b52)对基因芯片结果的验证对基因芯片结果的验证nRT-PCRnNorthern b
22、lot第六节 基因芯片的发展与展望n2003年HGP完成后,人们面临的问题是如何了解10万条基因中每一个基因的功能,以及基因之间的相互关系等,从而衍生出人类基因组多样性计划、环境基因组学、肿瘤基因解剖学计划、药物基因组学等。基因芯片以其无可比拟的高信息量、高通量、高自动化和快速准确的优势必将成为后基因组时代最重要最常用的技术,因此,它 被誉为“微缩芯片实验室”(lab-in-a-chip)。1)中药开发)中药开发n中医药体系一直是在中医药体系一直是在“整体观念,辨证施治整体观念,辨证施治”理论指导下完善发展而成的,现代医学也正是理论指导下完善发展而成的,现代医学也正是朝朝“整体观念,辨证施治整
23、体观念,辨证施治”的方向发展。因此,的方向发展。因此,中医药里既有巨大的宝藏,又有无限的商机。中医药里既有巨大的宝藏,又有无限的商机。基因芯片为中医药的研究提供了平行、快速、基因芯片为中医药的研究提供了平行、快速、高通量、多参数的研究手段和筛选方法。高通量、多参数的研究手段和筛选方法。n 大黄治疗糖尿病大黄治疗糖尿病n全反式维甲酸;三氧化二砷治疗白血病全反式维甲酸;三氧化二砷治疗白血病2)SNPs(single nucleotide polymorphisms)n染色体的某个位点上存在单个碱基的变化如果在人群中的频率超过1%,则认为是单核苷酸多态(SNPs)。SNPs 是近年来出现的第三代遗传标记。另两个是RFLP,MSDNA;用途:1)基因连锁分析,用于基因作图和疾病基因定位;2)人群中寻找SNPs位点;3)检测保守基因中的点突变;4)病例与对照间的相关分析等。nSNPs分析的前提是所研究基因的DNA序列必须是已知的。