1、微生物基因组学微生物基因组学微生物基因组研究概况微生物基因组的特点微生物基因组研究的意义微生物基因组学微生物基因组学微生物基因组研究概况微生物基因组重要纪事年限 事件1994年美国DOE启动MGP1995年Science发表了第一株细菌-流感嗜血杆 菌全基因组1995年发表了集胞藻菌株PCC6803的测序和注释1996年Science发表了第一个完成的古细菌-詹 氏甲烷球菌全基因组序列1996年酵母基因组序列发表1997年大肠杆菌K-12基因组序列发表 截至2011年4月24日,NCBI上记录了1534个细菌基因组, 包括了103个古细菌和1431个真细菌, 其中中国科学家完成了44个 Pub
2、Med检索到的有关基因组学和转录组学的文献数The literature number retrieved in PubMed database using “Genomics” and “Transcriptomics” as keywords年份Year基因组学文章Articles about Genomics基因组学综述Reviews about Genomics转录组学文章Articles about Transcriptomics转录组学综述Reviews about Transcriptomics2000154338320200120725594220022689826187200
3、335709842313200448101238562320056109141788522006690515591054920077295161313355200881191603162592009855115792347520108986148729670研究现况及内容细菌 研究内容 代表菌株病原菌 毒力因子、致病岛、耐药基因、耐药机制以及与寄主的关系等 肺炎链球菌、致病性大肠杆菌、沙门氏菌等极端环境生长的细菌 极端环境下的生存机制,如嗜热菌的热稳定性 詹氏甲烷球菌、热自养甲烷杆菌、甲烷嗜热菌、腾冲嗜热菌等工业和环境有影响的细菌 CO2固定、固氮、硫氧化 和氢代谢等 单细胞蓝细菌、丝状蓝细菌
4、、原绿藻等原核生物基因组的大小原核生物基因组的大小原核生物基因组的编码序列原核生物基因组的编码序列( (CDS/ORF)CDS/ORF)原核生物染色体结构原核生物染色体结构GC GC 含量含量重复序列重复序列DNADNA链组成的非对称性链组成的非对称性微生物基因组的特点微生物基因组的特点微生物基因组的特点类别特征染色体结构多为一条环状闭合双链DNA基因组大小从0.16-13Mb编码序列占基因组总长度的90%,平均为1Kb左右GC含量16.6%-74.9%DNA链组成的非对称分布GCskew、ATskew、基因方向性偏好、密码子使用偏好Circular representation of the
5、 genome of T. tengcongensis MB4原核生物基因组的编码序列原核生物基因组的编码序列 占原核生物基因组总序列的90 基因的平均大小为1kb ORF原核生物基因组的编码序列原核生物基因组的编码序列 不同生物编码序列的比较不同生物编码序列的比较Organism Genome (kb) ORFs ORF size Coding Sequence(%)Buchnera sp 640 583 988 90Aquifex aeolicus 1,551 1,512 956 93Saccharomyces cerevisiae 12,069 6,294 1,092 57 Schizo
6、saccharomyces pombe 14,000 4,820 2,033 70 Caenorhabditis elegans 97,000 19,099 1,311 27 Arabidopsis thaliana 115,428 25,498 460 29Homo sapiens 3,000,000 30,000 1,340 2 原核生物基因组的编码序列原核生物基因组的编码序列 核生物(高温菌)基因组的内含子核生物(高温菌)基因组的内含子Sulfolobus solfataricus P2: 18个tRNA基因含有单个内含子 一个胱氨酸tRNA基因含有2个内含子A.pernix tRNA基
7、因中 发现 14个内含子 Staphylothermus marinus和运动脱硫球菌 23S rRNA基因中也发现内含子 染色体结构大多数原核生物:一条环状闭合双链DNABrucella suis 1330:两条环状闭合双链:两条环状闭合双链DNA 2,107,792 bp (Chr I) 1,207,381 bp (Chr II) Vibrio cholerae: 两条环状闭合双链两条环状闭合双链DNA 2,961,146 bp (Chr I) 1,072,314 bp(Chr II) Borreliaburgdorferi B31: 910,725 bp ( linear Chromos
8、ome) 21 linear and circular plasmidsTreponemapallidum:一条环状闭合双链DNA 1,138,006 bp GC 含量原核生物基因组GC含量为:16.6-74.9 %嗜温菌基因组GC含量与 rRNA、tRNA的GC含量成正比嗜热菌rRNA、tRNA的GC含量与 基因组GC含量不成正比,但与OGT(最适生长温度)成正比tRNA GC含量总是大于rRNA的GC含量嗜温菌基因组嗜温菌基因组G + C content (%)G + C content (%)Organism Genome rRNA tRNA Xfas 52.7 53.1 59.8 Tp
9、al 52.8 53.1 57.2 Mlep 57.8 55.7 61.6 Atum 59.4 54.6 58.4 Smel 62.7 54.5 61.5 Mlot 62.7 56.3 60.5 Mtub 65.6 58.0 62.0 Paer 66.6 53.1 60.1 Drad 67.0 56.5 58.8 Ccre 67.2 55.0 61.2 Hbsp 67.9 58.1 62.4 linear regression 0.88 0.80嗜热菌最适生长温度(嗜热菌最适生长温度(OGTOGT)与与GGC C含量的关系含量的关系OrganismOGT() Genome rRNA tRNA
10、Pabyssi 103 0.45 0.670.70 Pyro 98 0.42 0.63 0.71Aero 95 0.56 0.680.73Mjan 85 0.31 0.61 0.66 Aquae 85 0.43 0.650.68 Aful 83 0.49 0.63 0.68 Ssol 80 0.36 0.62 0.67 Tmar 80 0.46 0.63 0.65Tten 75 0.38 0.590.60 Mthe 65 0.50 0.57 0.62 Tvol 60 0.40 0.53 0.61 Tacid 59 0.46 0.530.61 linear regression 0.01 0.9
11、2 0.90基因组非编码序列的注释基因组非编码序列的注释非编码区的注释 各类重复序列 基因表达的调控序列 信号序列等 DNADNA链组成的非对称性链组成的非对称性 GCGC分布不对称分布不对称 (GC skewGC skew) ATAT分布不对称(分布不对称(AT skewAT skew)前导链含有较多的前导链含有较多的G G(A A) 而后随链含有较多的而后随链含有较多的C C(T T) 计算公式为(计算公式为(nG-nCnG-nC)/ /(nG+nCnG+nC) (nA-nTnA-nT)/ /(nA+nTnA+nT) 累计累计skew skew (cumulative skew)cumul
12、ative skew)用于复制起点和终点的定位用于复制起点和终点的定位GC skew of of T. tengcongensis T. tengcongensis genomegenomeDNA链组成的非对称性(真细菌) 基因方向性偏好基因方向性偏好 基因方向性偏好基因方向性偏好 (gene orientation biasgene orientation bias) 先导链上编码的基因总是多于后随链先导链上编码的基因总是多于后随链 Jean R.Lobry Microbiology Today Vol 26DNA链组成的非对称性 码子使用偏好(码子使用偏好(codon usage bias
13、codon usage bias) 先导链和后随链密码子的不同 在先导链,以G或T开头或结尾的密码子显著地多于后随链,常见的有GTG、GCG和GAG 在后随链以C或A开头或结尾的密码子多于先导链,如CTC、GCC、CCC、ATC和ACC DNA链组成的非对称性 基因密度和密码子使用的差别基因密度和密码子使用的差别 高度表达基因: 核蛋白体蛋白基因,与翻译和转录有关的因子基因,分子伴侣基因和与主要的能量代谢相关的基因 大多编码于前导链通常都有密码子偏好(核蛋白体蛋白基因密码子的第三位多为G )快速生长的细菌(大肠杆菌、霍乱弧菌、枯草芽孢杆菌和流感嗜血杆菌) 主要的糖酵解和三羧酸循环基因为高度表达
14、基因产甲烷菌,与甲烷代谢有关的基因为高度表达基因 高度表达基因高度表达基因: 那些在密码子使用上与一般基因相差很大,与核蛋白体蛋白基因,那些在密码子使用上与一般基因相差很大,与核蛋白体蛋白基因,翻译和转录相关基因,伴侣翻译和转录相关基因,伴侣-降解蛋白基因等在密码子使用上高度相似的基因为高降解蛋白基因等在密码子使用上高度相似的基因为高度表达基因度表达基因。 微生物测序及分析流程图Finishing阶段Finishing阶段Finishing阶段 多重PCR结果,引自Tettelin H.等文章 Finishing阶段短片段文库构建填补二级结构区示意图,摘自Amanda A等文章 Finishi
15、ng阶段 基于转座子技术来完成重复序列区的测序,摘自Scott E等文章 微生物基因组测序策略-高通量测序技术454 长reads 测序Solexa Pair-end测序组合长reads和短reads测序Sanger法finish微生物基因组测序策略副血链球菌FW213基因组基本特征 Genome size(bp)2171616G+C content(%)41.62Average CDS length(bp) 932Protein coding2059Protein with known or predicted fuction 1496(72.7%)Conserved hypothetica
16、l proteins 461(22.4%)Hypothetical proteins 102(4.9%)tRNAs61rRNA operons4副血链球菌FW213基因组基本特征副血链球菌比对结果蛋白质数据库比对最相似基因数分布基因组名称最相似的基因数血链球菌(Streptococcus sanguinis SK36)557肺炎链球菌(Streptococcus pneumoniae) 552戈登链球菌(Streptococcus gordonii str. Challis substr. CH1)233嗜热链球菌(Streptococcus thermophilus)149猪链球菌(Stre
17、ptococcus suis) 68变型链球菌(Streptococcus mutans UA159)42无乳链球菌(Streptococcus agalactiae)31化脓链球菌(Streptococcus pyogenes)21COG分类COG分类图,JKL编码信息加工和储存的蛋白质的基因;DVTMNUO代表细胞加工和信息处理基因;CGEFHIPQ是与代谢相关的基因;RS为功能未知的基因代谢途径代谢途径728691bp 735072bp 精氨酸操纵子示意图,精氨酸脱亚氨酶(精氨酸操纵子示意图,精氨酸脱亚氨酶(arginine deiminase,arcA), , 鸟氨酸氨基甲酰转鸟氨酸氨
18、基甲酰转移酶移酶( (ornithine carbamyltransferase,arcB) ), , 氨甲基酶氨甲基酶( (carbamate kinase,arcC) ), , 逆向运输逆向运输蛋白蛋白 ( (arginine-ornithine antiporter,arcD) ), , 二肽酶二肽酶( (dipeptidase,arcT) )和调控蛋白和调控蛋白( (regulator,arcR) ) 比较基因组分析副血链球菌基因组和血链球菌基因组比对的全部副血链球菌基因组和血链球菌基因组比对的全部MUMMUM点阵图。横坐标,副血链球菌点阵图。横坐标,副血链球菌,2171616bp;
19、2171616bp; 纵坐标,纵坐标, 血链球菌。对角线代表可以对齐区域,斜率血链球菌。对角线代表可以对齐区域,斜率-1-1的对角线的对角线代表大规模的染色体倒位代表大规模的染色体倒位比较基因组分析副血链球菌基因组和其他六株细菌全基因组比对结果图。副血链球菌基因组和其他六株细菌全基因组比对结果图。a,a,和肺炎链球菌和肺炎链球菌CGSP14CGSP14比对的结果;比对的结果;b,b,戈登氏链球菌;戈登氏链球菌;c,c,变异链球菌;变异链球菌;d,d,化脓性链球菌;第化脓性链球菌;第e e,猪链球菌;,猪链球菌;f f,嗜热链球菌,嗜热链球菌 进化分析毒力基因Gene IDGene NameOr
20、thologBacteriumPropertyorf2046gbpCS. mutansorf18 PcsB protein precursorgbpB/sagAS. mutansBinding to glucans orf43purBAdenylosuccinate lyase; endocarditis virulence orf23srtBSortaseorf978srtAsrtAS. pneumoniaeSortase A; colonization , virulence srtAS. gordoniiSortase A; oral adhesion srtAS. mutansSort
21、ase A; oral adhesion, cariogenicity orf1083yncA; acetyltransferaseSortaseorf420Collagen-binding surface protein orf1457Collagenase and related proteasesorf1458Collagenase and related proteasesorf1347pblTStreptococcus mitisVirulence for endocarditis,platelet binding orf1348pblRsloCS.mutansVirulence f
22、or endocarditis,platelet binding orf346fimAS. parasanguinisEndocarditis virulence orf1831cppAcppAS. pneumoniaeC3-degrading proteinase orf1798msrAS. gordoniiPeptide methionine sulfoxide reductase; platelet binding orf571msrAorf1931fap1S. parasanguinisAdhesion to saliva-coated hydroxyapatite orf1283th
23、rBHomoserine kinase; endocarditis virulence (基因组小岛(fwislet1)o or rf fs st ta ar rt te en nd da an nn no ot ta at ti io on nG GC C% %o or rf f3 31 17 73 32 29 94 42 29 9 3 33 30 01 16 69 9 C Co om mE E: :r re es sp po on ns se e r re eg gu ul la at to or r o of f s sa ak ka ac ci in n A A p pr ro od
24、du uc ct ti io on n4 43 3. .5 59 9o or rf f3 31 18 83 33 30 01 18 86 6 3 33 31 14 48 87 7 C Co om mD D: :p pu ut ta at ti iv ve e h hi is st ti id di in ne e k ki in na as se e o of f t th he e c co om mp pe et te en nc ce e r re eg gu ul lo on n3 39 9. .7 71 1o or rf f3 32 20 03 33 31 17 77 79 9 3
25、33 32 24 45 56 6 A AB BC C- -t ty yp pe e m mu ul lt ti id dr ru ug g t tr ra an ns sp po or rt t s sy ys st te em m, , A AT TP Pa as se e c co om mp po on ne en nt t4 41 1. .5 59 9o or rf f3 32 21 13 33 32 24 45 56 6 3 33 33 31 16 60 0 h hy yp po ot th he et ti ic ca al l p pr ro ot te ei in n S SG
26、 GO O_ _0 03 37 77 73 39 9. .4 43 3o or rf f3 32 22 23 33 34 45 52 26 6 3 33 33 35 58 85 5 s su ug ga ar r- -b bi in nd di in ng g t tr ra an ns sc cr ri ip pt ti io on na al l r re eg gu ul la at to or r, , L La ac cI I f fa am mi il ly y 3 38 8. .6 64 4o or rf f3 32 23 33 33 35 54 40 06 6 3 33 34
27、45 54 40 0 P Pr re ed di ic ct te ed d h hy yd dr ro ol la as se es s o of f t th he e H HA AD D s su up pe er rf fa am mi il ly y3 37 7. .4 49 9o or rf f3 32 24 43 33 36 69 97 78 8 3 33 35 59 97 71 1 P Pr re ed di ic ct te ed d m me em mb br ra an ne e p pr ro ot te ei in n4 41 1. .6 67 7o or rf f3
28、 32 25 53 33 37 78 80 02 2 3 33 37 72 29 96 6 P Pr re ed di ic ct te ed d t tr ra an ns sc cr ri ip pt ti io on na al l r re eg gu ul la at to or rs s3 34 4. .5 52 2o or rf f3 32 26 63 33 38 82 23 39 9 3 33 39 92 21 13 3 r re ep pl li ic ca at ti io on n i in ni it ti ia at to or r p pr ro ot te ei
29、in n 3 34 4. .5 56 6o or rf f3 32 27 73 33 39 92 22 28 8 3 33 39 94 41 13 3 h hy yp po ot th he et ti ic ca al l p pr ro ot te ei in n s st tu u1 19 95 54 43 34 4. .4 41 1o or rf f3 32 28 83 33 39 94 41 18 8 3 34 40 05 55 54 4 I In nt te eg gr ra as se e3 34 4. .3 3o or rf f2 21 13 35 5 3 34 40 07 7
30、1 16 6 3 34 40 06 64 41 1 t tR RN NA A- -L Ly ys s基因组岛(fwisland)抗药性二元信号转导系统宏基因组学和宏转录组数据分析流程三三 微生物基因组研究的意义微生物基因组研究的意义基因组研究在医学的应用基因组研究在医学的应用 基因组研究的生物技术应用基因组研究的生物技术应用 微生物的进化微生物的进化 A A 基因组研究在医学的应用基因组研究在医学的应用 1致病相关基因的鉴定致病相关基因的鉴定 2设计特异的实验诊断方法设计特异的实验诊断方法3疫苗的研究疫苗的研究 4新型抗生素的开发新型抗生素的开发 1. 1. 致病相关基因的鉴定致病相关基因的鉴
31、定 通过基因组比较鉴定病原相关基因流感杆菌: 7种内毒素(脂多糖)基因25种新基因 细胞表面定居的粘附分子重复序列1. 1. 致病相关基因的鉴定致病相关基因的鉴定 致病相关基因的预测致病物质多为病原体细胞壁成分、 表面蛋白和一些分泌性蛋白质 PHD预测基因组的跨膜蛋白预测基因组的跨膜蛋白 SIGNALP预测分泌性蛋白质预测分泌性蛋白质 1. 1. 致病相关基因的鉴定致病相关基因的鉴定 致病相关基因的预测(续)功能相同的蛋白质往往相邻并受共同的调控序列调控 operon同一菌种的致病菌株与非致病菌株的基因组进行比较 E. coli K12 MG 1655 4.1 + 0.53 M (528gen
32、es) E. coli O157:H7 EDL 933 4.1 + 1.34 M (1387genes)2. 2. 设计特异的实验诊断方法设计特异的实验诊断方法寻找高度特异的核酸序列寻找高度特异的核酸序列 实验技术 PCR 杂交技术(Microarray,DNA chip) 应用 鉴定病原种类进行临床诊断 病原分型的流行病学研究 预测疾病进展及临床疗效3. 3. 疫苗的研究疫苗的研究通过全基因组序列的同源性比较,寻找致病菌的属特属特异、群特异、种特异、型特异、甚至亚型特异异、群特异、种特异、型特异、甚至亚型特异的抗原的抗原 Pizza等和Tettelin等对血清型B脑膜炎奈瑟菌脑膜炎奈瑟菌近3
33、50种抗原的研究Wizemann等对对肺炎链球菌肺炎链球菌的基因组的抗原性蛋白研究 4. 4. 新型抗生素的开发新型抗生素的开发 药靶的特征:药靶应是病原生物必需的,在进化上是保守的病原生物必需的,在进化上是保守的可作为药靶的微生物基因或蛋白质: 毒力基因、毒力基因、必需基因、菌种专一基因、独特酶类、膜转运必需基因、菌种专一基因、独特酶类、膜转运蛋白等蛋白等 毒力基因作为靶位毒力基因的发现:非致病菌(E.coli K12)与致病菌( E.coli O157, 沙门氏菌,耶尔森氏菌)基因组的比较致病岛(Pathogenicity islands)编码的功能已知蛋白作为药靶必需基因作为药靶寻找必需
34、基因的方法: 比较基因组:在不同进化阶段保守的基因 往往是必需基因 缺失致死或转座子插入 转座子插入PCR寻找流感嗜血杆菌, 肺炎链球菌必需基因 致病菌特殊且必需的蛋白作为靶位 菌种专一基因作为药靶寻找菌种专一基因的方法: 比较基因组方法病原生物基因组中存在但病原生物基因组中存在但 近缘种属中缺少的基因可能是致病关键基因近缘种属中缺少的基因可能是致病关键基因幽门螺杆菌(与大肠杆菌和流感杆菌比较)找到594个特有基因,73个编码种专一蛋白,如丙酮酸:铁氧还蛋白氧化还原酶,可作为靶位独特酶类作为药靶所有细菌独特酶类均可作为靶位: 如: 参与细胞壁合成的酶类 叶酸合成酶类 核酸合成酶类膜转运蛋白作为
35、靶位衣原体和立克次体的ATP/ADP转位酶是致病菌必需,而只有植物叶绿体、线粒体具有类似酶细菌多药运输蛋白(泵)新型抗生素的开发新型抗生素的开发药靶的种类共有药靶共有药靶菌种或某菌种的致病菌株的特异性药靶菌种或某菌种的致病菌株的特异性药靶 某一部位常见致病菌的共同药靶某一部位常见致病菌的共同药靶 新型抗生素的开发新型抗生素的开发Timothy等的研究:肺炎链球菌,流感嗜血杆菌,脑膜炎奈瑟菌肺炎链球菌,流感嗜血杆菌,脑膜炎奈瑟菌 共有基因共有基因32个个 其中其中2个甲硫氨酸亚砜还原酶基因个甲硫氨酸亚砜还原酶基因 疑是毒力决定子疑是毒力决定子 B B 基因组研究的生物技术应用基因组研究的生物技术
36、应用 1生物降解作用生物降解作用2酶工业酶工业3食品生物技术食品生物技术4抗生物质抗生物质生物降解作用Deinococcus radiodurans:抵御放射性物质Thermotoga maritima:降解单体或复合植物 聚合物, 如木聚糖和纤维素Dehalococcoides ethenogenes:降解四氯乙烯Pseudomonas putida:降解多种毒性有机废料, 包括多种芳香族化合物酶工业Thermotoga maritima:耐热:耐热Aquifex aeolicus:耐热:耐热Methanogenium frigidum:耐寒:耐寒Halobacterium:耐盐,降解塑料:
37、耐盐,降解塑料Pseudomonas putida:降解塑料:降解塑料食品生物技术Lactococcus latis: 生产发酵食品,微生物营养添加剂抗生物质Streptomyces coelicolor: 生产抗生素,用于人类,兽医和农业Photorhabdus luminescens: Bacillus thuringiensis Xenorhabdus nematophilus 产生杀昆虫毒素蛋白 转基因抗昆虫植物C C 微生物的进化微生物的进化 基于16S rDNA的系统进化树: Woese等的生物 三域 真细菌域、古生菌域和真核生物域 单个基因的进化并不等同于物种的进化单个基因的进化
38、并不等同于物种的进化 基因的水平转移基因的水平转移 基因的水平转移 的意义研究微生物的进化史研究微生物的进化史研究菌种新功能的来源研究菌种新功能的来源研究微生物的生命过程研究微生物的生命过程预测基因功能预测基因功能基因水平转移的方式转化接合转导鉴定基因水平转移的方法 鉴定基因组区段的组成鉴定基因组区段的组成 比较不同基因的系统发生比较不同基因的系统发生 最大相似性分析最大相似性分析 基因在生物的分布谱基因在生物的分布谱 易被水平转移的基因难被转移的基因:informational genes 进化核心基因易被转移的基因:operational genes 氨酰tRNA合成酶基因 剪切因子 重组
39、酶 DNA聚合酶原核生物转录组学研究原核生物转录组学研究The transcriptomes of prokaryotic have been largely overlooked. It is primary advance in prokaryotic transcriptomics through new sequen-cing technologies in combination with mRNA enrichment and tilling array.原核转录组原核转录组-mRNA enriched methods-mRNA enriched methods原核生物转录组研究内
40、容原核生物转录组研究内容基因注释校正:reads coverage基因表达:RPKM操纵子鉴定:TSS, reads coverage转录起始位点(TSS)鉴定:reads coverage新基因鉴定:没有注释但是表达的区域small RNA分析原核生物转录组研究内容原核生物转录组研究内容原核转录组学研究现状原核转录组学研究现状- -转录单元内部转录单元内部基因表达水平基因表达水平Science 326, 1268 (2009)原核转录组学研究现状原核转录组学研究现状Antisense and RiboswitchAntisense and Riboswitch连接SOLiD RNA接头,逆转
41、录并用RNaseH处理,PCR扩增,胶回收(120-180bp)界定转录单元转录单元在四个不同时期变化纠正基因结构预测错误DEGseq方法鉴定时期特异表达和差异表达基因完善基因组精确注释完善基因组精确注释SOLiD 50nt测序,序列mapping到细菌基因组,分析界定转录起始位点发现新转录本识别UTR区域鉴定不同时期特异表达和差异表达的基鉴定不同时期特异表达和差异表达的基因,寻找潜在的致病基因、毒力基因等因,寻找潜在的致病基因、毒力基因等原核微生物转录单元结构和表达时原核微生物转录单元结构和表达时空性问题以及基因表达调控的复杂空性问题以及基因表达调控的复杂性性不同时期基因表达谱提取细菌Tot
42、al RNARNase处理RNA样品,胶回收(50-100bp)碱性磷酸酶(BAP)去除RNA 5 端单磷酸基团,烟草酸焦磷酸酯(TAP)处理RNA 5 端三磷酸基团,暴露出新5 单磷酸基团去除核糖体RNA连接SOLiD RNA接头,逆转录并用RNaseH处理,PCR扩增,胶回收(120-180bp)SOLiD 50nt测序,序列mapping到细菌基因组上,计算基因平均序列覆盖度RPKM-gene express valuesSingle nucleotide mapping coverageIdentification differentially expressed Gene-IDEG6COG:Clusters of Orthologous Groups COG: gene differential expressionKEGG Pathway单碱基覆盖度单碱基覆盖度vsvs转录单元表达转录单元表达转录水平展示基因组岛结构谢谢