1、生物分子生物分子数数 据据 计算机计算机计计 算算+生物体系和过程中信息生物体系和过程中信息的存贮、传递和表达的存贮、传递和表达细胞、组织、器官的生理、病理细胞、组织、器官的生理、病理药理过程的中各种生物信息药理过程的中各种生物信息信息科学信息科学生生命命科科学学中中的的信信息息科科 学学 生物生物分子数据分子数据深层次深层次生物学知识生物学知识分子生物信息学分子生物信息学Molecular Bioinformatics挖掘挖掘获取获取生物分子信息的获取、存贮、分析和利用生物分子信息的获取、存贮、分析和利用基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据库数
2、据库 DDBJEMBLGenBankSWISS-PROT PDBPIR基因芯片基因芯片蛋白质折叠蛋白质折叠是否未知蛋白序列与已知功能的蛋白质相似是否未知蛋白序列与已知功能的蛋白质相似确定跨膜螺旋、卷曲螺旋和前导序列确定跨膜螺旋、卷曲螺旋和前导序列未知序列是否包含保守序列模体未知序列是否包含保守序列模体查对查对PROSITE数据库库数据库库查对查对BLOCKS和和PRINTS数据库数据库整理所有肯定的结果并核对一致性整理所有肯定的结果并核对一致性预测蛋白质功能预测蛋白质功能蛋白质功能预测流程图蛋白质功能预测流程图(引自引自HPDB蛋白质数据库(蛋白质数据库(http:/ 生物信息学数据库相互关系
3、生物信息学数据库相互关系 n 生物信息学数据库相互关系生物信息学数据库相互关系n常用数据库常用数据库uGenbank数据直接来源数据直接来源 测序工作者提交的序列、测序中心提交的测序工作者提交的序列、测序中心提交的大量大量EST序列、其它测序数据以及与其它数据机序列、其它测序数据以及与其它数据机构协作交换的数据。构协作交换的数据。uGenbank内容内容 所有已知的核酸序列和蛋白质序列,还包所有已知的核酸序列和蛋白质序列,还包括对序列的简要描述、科学命名、物种分类名称、括对序列的简要描述、科学命名、物种分类名称、参考文献、序列特征表等辅助信息。参考文献、序列特征表等辅助信息。uGenbank对
4、数据记录的处理对数据记录的处理 划分为划分为 细菌类、病毒类、灵长类、啮齿类,细菌类、病毒类、灵长类、啮齿类,EST数据、基因组测序数据、大规模基因组序列数据、基因组测序数据、大规模基因组序列数据等数据等16类。类。图图6-4 NCBI-Entrz gene检索界面检索界面图图6-5 NCBI-Entrez cross-database检索界面检索界面Entrez Entrez,The Life Sciences Search Engine BLAST(Basic Local Alignment search Tool)是是 DNA DNA 或氨基酸序列比对分析的重要软件或氨基酸序列比对分析的
5、重要软件 TaxBrowser:Taxonomy browser 分类浏览器Structure:该目录下最重要的资源是分子模型数据库 MMDB 及 Cn3D 生物大分子三维模型查看软件 uEMBL和和GenBank数据库识别标志数据库识别标志uGenBank核酸数据库实例核酸数据库实例 以人畜共患的病源菌鼠伤寒沙门氏菌(以人畜共患的病源菌鼠伤寒沙门氏菌(Salmonella typhimurium)H1相抗原基因相抗原基因H-1-i为例,简要说明为例,简要说明GenBank核核酸数据库的数据格式。酸数据库的数据格式。LOCUS STYFLGH1I 1485 bp DNA linear BCT
6、26-APR-1993DEFINITION Salmonella typhimurium H-1-i gene encoding phase 1 flagellar filament protein(flagellin),complete cds.ACCESSION M11332VERSION M11332.1 GI:153978KEYWORDS flagellin.SOURCE Salmonella typhimurium ORGANISM Salmonella typhimurium Bacteria;Proteobacteria;Gammaproteobacteria;Enterobac
7、teriales;Enterobacteriaceae;Salmonella.REFERENCE 1 (bases 1 to 1485)AUTHORS Joys,T.M.TITLE The covalent structure of the phase-1 flagellar filament protein of Salmonella typhimurium and its comparison with other flagellins JOURNAL J.Biol.Chem.260(29),15758-15761(1985)PUBMED 2999134序列标识序列标识简单描述简单描述序列
8、编号序列编号版本号版本号关键词关键词物种来源物种来源物种分类物种分类引文编号引文编号引文作者引文作者引文标题引文标题引文出处引文出处COMMENT Original source text:S.typhimurium SL877 DNA.Draft entry and clean copy sequence for 1 kindly provided by T.M.Joyce,18-FEB-1986.Individual Salmonella serotypes usually alternate between the production of two antigenic forms of
9、 flagella,termed phase-1 and phase-2,each specified by separate structural genes.Both ends of the flagellin gene act in the regulation of flagellin synthesis.FEATURES Location/Qualifiers source 1.1485 /organism=Salmonella typhimurium /mol_type=genomic DNA /db_xref=taxon:602 CDS 13.1485 /note=phase-1
10、 flagellar filament protein /codon_start=1 /transl_table=11 /protein_id=AAA27072.1 /db_xref=GI:153979评注评注特征表特征表编码区编码区 /translation=MAQVINTNSLSLLTQNNLNKSQSALGTAIERLSSGLRINSAKDDAAGQAIANRFTANIKGLTQASRNANDGISIAQTTEGALNEINNNLQRVRELAVQSANSTNSQSDLDSIQAEITQRLNEIDRVNGQTQFSGVKVLAQDNTLTIQVGANDGETIDIDLKQINSQTLG
11、LDTLNVQQKYKVSDTAATVTGYADTTIALDNSTFKASATGLGGTDEKIDGDLKFDDTTGKYYAKVTVTGGTGKDGYYEVSVDKTNGEVTLAAVTPATVTTATALSGKMYSANPDSDIAKAALTAAGVTGTASVVKMSYTDNNGKTIDGGLAVKVGDDYYSATQDKDGSISIDTTKYTADNGTSKTALNKLGGADGKTEVVTIDGKTYNASKAAGHDFKAEPELAEQAAKTTENPLQKIDAALAQVDTLRSDLGAVQNRFNSAITNLGNTVNNLSSARSRIEDSDYATEVSNMSRAQILQQ
12、AGTSVLAQANQVPQNVLSLLRORIGIN 98 bp upstream of TaqI site.1 aaggaaaaga tcatggcaca agtcattaat acaaacagcc tgtcgctgtt gacccagaat 61 aacctgaaca aatcccagtc cgctctgggc accgctatcg agcgtctgtc ttccggtctg 121 cgtatcaaca gcgcgaaaga cgatgcggca ggtcaggcga ttgctaaccg ttttaccgcg 181 aacatcaaag gtctgactca ggcttcccgt
13、aacgctaacg acggtatctc cattgcgcag 241 accactgaag gcgcgctgaa cgaaatcaac aacaacctgc agcgtgtgcg tgaactggcg 301 gttcagtctg ctaacagcac caactcccag tctgacctcg actccatcca ggctgaaatc蛋白序列蛋白序列基因序列基因序列361 acccagcgtc tgaacgaaat cgaccgtgta aatggccaga ctcagttcag cggcgtgaaa421 gtcctggcgc aggacaacac cctgaccatc caggtt
14、ggtg ccaacgacgg tgaaactatc481 gatatcgatc tgaagcagat caactctcag accctgggtc tggatacgct gaatgtgcaa541 caaaaatata aggtcagcga tacggctgca actgttacag gatatgccga tactacgatt601 gctttagaca atagtacttt taaagcctcg gctactggtc ttggtggtac tgacgagaaa661 attgatggcg atttaaaatt tgatgatacg actggaaaat attacgccaa agttaccg
15、tt721 acggggggaa ctggtaaaga tggctattat gaagtttccg ttgataagac gaacggtgag781 gtgactcttg ctgcggtcac tcccgctaca gtgactactg cgacagcact gagtggaaaa841 atgtacagtg caaatcctga ttctgacata gctaaagccg cattgacagc agcaggtgtt901 accggcacag catctgttgt taagatgtct tatactgata ataacggtaa aactattgat961 ggtggtttag cagttaa
16、ggt aggcgatgat tactattctg caactcaaga taaagatggt1021 tccataagta ttgatactac gaaatacact gcagataacg gtacatccaa aactgcacta1081 aacaaactgg gtggcgcaga cggcaaaacc gaagtcgtta ctatcgacgg taaaacctac1141 aatgccagca aagccgctgg tcatgatttc aaagcagaac cagagctggc ggaacaagcc1201 gctaaaacca ccgaaaaccc gctgcagaaa attga
17、tgctg ctttggcaca ggttgacacg1261 ttacgttctg acctgggtgc ggtacagaac cgtttcaact ccgctattac caacctgggc1321 aacaccgtaa acaacctgtc ttctgcccgt agccgtatcg aagattccga ctacgcgacc1381 gaagtctcca acatgtctcg cgcgcagatt ctgcagcagg ccggtacctc cgttctggcg1441 caggcgaacc aggttccgca aaacgtcctc tctttactgc gttaa/记录结束记录结束
18、图图6-6 Swiss-Prot数据库网站主页数据库网站主页表表6-3 SWISS-PORT 数据库的行识别标志及含义数据库的行识别标志及含义 以鼠伤寒沙门氏菌以鼠伤寒沙门氏菌Salmonella typhimurium H1-i基因编码的鞭毛蛋白基因编码的鞭毛蛋白FLIC_SALTY为例介绍为例介绍SWISS-PORT数数据库的数据格式。据库的数据格式。ID FLIC_SALTY Reviewed;495 AA.AC P06179;P97160;Q02871;Q56088;DT 01-JAN-1988,integrated into UniProtKB/Swiss-Prot.DT 23-JA
19、N-2007,sequence version 4.DT 24-JUL-2007,entry version 69.DE Flagellin(Phase 1-I flagellin).GN Name=fliC;Synonyms=flaF,hag;OrderedLocusNames=STM1959;OS Salmonella typhimurium.OC Bacteria;Proteobacteria;Gammaproteobacteria;Enterobacteriales;Enterobacteriaceae;Salmonella.OX NCBI_TaxID=602;RN 1RP NUCLE
20、OTIDE SEQUENCE GENOMIC DNA.RX MEDLINE=86059460;PubMed=2999134;RA Joys T.M.;RT The covalent structure of the phase-1 flagellar filament protein of Salmonella typhimurium and its comparison with other flagellins.;RL J.Biol.Chem.260:15758-15761(1985).序列标识序列标识 序列序列编号编号登录日期登录日期描述描述基因名称基因名称来源物种来源物种物种分类物种分
21、类物种分类号物种分类号引文序号引文序号引文位置引文位置交叉引用交叉引用引文作者引文作者引文标题引文标题引文出处引文出处 SWISS-PROT 数据库条目实例数据库条目实例RN 9RP NUCLEOTIDE SEQUENCE GENOMIC DNA OF 476-495.RC STRAIN=LT2/ATCC 23564;CC -!-FUNCTION:Flagellin is the subunit protein which polymerizes to form the filaments of bacterial flagella.CC -!-MISCELLANEOUS:Individual
22、 Salmonella serotypes usually alternate between the production of 2 antigenic forms of flagella,termed phase 1 and phase 2,each specified by separate structural genes,fliC and fljB.CC -!-SIMILARITY:Belongs to the bacterial flagellin family.CC -DR EMBL;M11332;AAA27072.1;-;Genomic_DNA.DR EMBL;D13689;B
23、AA02846.1;-;Genomic_DNA.DR EMBL;AE008787;AAL20871.1;-;Genomic_DNA.DR EMBL;X51740;CAA36029.1;-;Genomic_DNA.DR EMBL;J01801;AAA27074.1;-;Genomic_DNA.DR PIR;A24262;A24262.DR PIR;S16121;S16121.DR PDB;1IO1;X-ray;A=54-451.DR PDB;1P95;Model;A=57-451.DR PDB;1UCU;EM;A=1-495.相关内容相关内容评注功能评注功能 其他特性其他特性 相似性相似性交叉引
24、用数据库交叉引用数据库 EMBL核酸序列核酸序列数据库数据库 PIR蛋白序列蛋白序列数据库数据库 PDB蛋白结构蛋白结构数据库数据库PE 1:Evidence at protein level;KW 3D-structure;Complete proteome;Flagellum.FT INIT_MET 1 1 Removed(By similarity).FT CHAIN 2 495 Flagellin.FT /FTId=PRO_0000182578.FT CONFLICT 127 127 S-N(in Ref.1).FT CONFLICT 133 133 N-S(in Ref.1).FT
25、HELIX 3 32FT TURN 37 39FT HELIX 44 98关键词关键词特征表特征表不同来源不同来源数据库的数据库的冲突位点冲突位点二级结构二级结构信息信息SQ SEQUENCE 495 AA;51612 MW;4BD7849FA3B936BA CRC64;MAQVINTNSL SLLTQNNLNK SQSALGTAIE RLSSGLRINS AKDDAAGQAIANRFTANIKG LTQASRNAND GISIAQTTEG ALNEINNNLQ RVRELAVQSA NSTNSQSDLD SIQAEITQRL NEIDRVSGQT QFNGVKVLAQ DNTLTIQVGA
26、NDGETIDIDL KQINSQTLGLDTLNVQQKYK VSDTAATVTG YADTTIALDN STFKASATGL GGTDQKIDGDLKFDDTTGKYYAKVTVTGGT GKDGYYEVSV DKTNGEVTLA GGATSPLTGGLPATATEDVKNVQVANADLTEAKAALTAAG VTGTASVVKM SYTDNNGKTI DGGLAVKVGD DYYSATQNKD GSISINTTKYTADDGTSKTA LNKLGGADGK TEVVSIGGKT YAASKAEGHN FKAQPDLAEA AATTTENPLQKIDAALAQVD TLRSDLGAVQ
27、NRFNSAITNL GNTVNNLTSA RSRIEDSDYA TEVSNMSRAQ ILQQAGTSVL AQANQVPQNV LSLLR/序列标头序列标头蛋白质序列蛋白质序列记录结束记录结束 2.PIR PIR的子数据库:的子数据库:蛋白质序列数据库(蛋白质序列数据库(PIR-PSD)蛋白质分类数据库(蛋白质分类数据库(iProClass)非冗余的蛋白质参考资料数据库(非冗余的蛋白质参考资料数据库(PIR-NREF)PIR数据库按照数据性质和注释层次分四个部分:数据库按照数据性质和注释层次分四个部分:PIR1序列已经验证,注释最为详尽序列已经验证,注释最为详尽;PIR2为尚未确定的冗余序
28、列;为尚未确定的冗余序列;PIR3序列既未检验,也未注释;序列既未检验,也未注释;PIR4序列来自其它渠道,既未验证,也无注释。序列来自其它渠道,既未验证,也无注释。美国国家生物医学研究基金会与国际蛋白质信息中心美国国家生物医学研究基金会与国际蛋白质信息中心(PIR-InternationalPIR-International)共同维护。)共同维护。PIRPIR是第一个蛋白质分类和功能注释数据库是第一个蛋白质分类和功能注释数据库 3.TrEMBL是一个经计算机注释的蛋白质数据库,采用是一个经计算机注释的蛋白质数据库,采用SWISS-PROT数据库格式。数据库格式。主要包含从主要包含从EMBL/
29、Genbank/DDBJ三大核三大核酸数据库中根据编码序列翻译的、尚未集成酸数据库中根据编码序列翻译的、尚未集成到到SWISS-PROT数据库中的蛋白质序列。数据库中的蛋白质序列。TrEMBL为为SWISS-PROT数据库及时提供补数据库及时提供补充。充。TrEMBL网址:网址:http:/www.ebi.ac.uk/trembl/4.UniProt UniProt将将SWISS-PROT、PIR、TrEMBL三个数据库合并。通过文本三个数据库合并。通过文本检索、序列相似检索以及检索、序列相似检索以及UniProt Ftp网站可获得蛋白质序列。网站可获得蛋白质序列。如图如图6-7所示所示 图图
30、6-7 UniProt网站主页网站主页UniProt包含包含UniProtKB、UniRef 和和UniParc 3个部分:个部分:(1)UniProtKB数据库数据库(UniProt Knowledgebase):):蛋白质序列、功能、分类、交叉引用等信息存取中心;蛋白质序列、功能、分类、交叉引用等信息存取中心;(2)UniRef数据库数据库(UniProt Reference Clusters):):为提高检索的速度,将紧密相关的蛋白质序列合并到为提高检索的速度,将紧密相关的蛋白质序列合并到同一条记录中。目前,根据序列相似程度可将同一条记录中。目前,根据序列相似程度可将UniRef数据库分
31、为数据库分为UniRef100、UniRef90和和UniRef50 3个子库个子库(3)UniParc(UniProt Archive):储存大量蛋白质):储存大量蛋白质研究的历史信息。研究的历史信息。利用利用UniProt 可方便的进行蛋白质序列可方便的进行蛋白质序列的交互检索,的交互检索,Salmonella typhimurium H-1项鞭毛蛋白项鞭毛蛋白P06176的的UniProt检索截图如下。检索截图如下。UniProt网址:网址:http:/www.ebi.uniprot.org/index.shtml图图 6-8 核心数据核心数据图图 6-9 核心数据(续)、引用文献与评注
32、核心数据(续)、引用文献与评注图图 6-10 交互检索与关键词交互检索与关键词图图 6-11 特征表与序列信息特征表与序列信息5.GenPept数据库数据库GenPept数据库特点数据库特点 由由Genebank数据库的核酸序列经翻译后产生。数据库的核酸序列经翻译后产生。GenPept数据量大,随核酸数据库的更新而更新,数据量大,随核酸数据库的更新而更新,但未经实验证实,也未有详细注释。但未经实验证实,也未有详细注释。GenPept蛋白质数据库实例蛋白质数据库实例 以鼠伤寒沙门氏菌以鼠伤寒沙门氏菌S.typhimurium H-1-i基因编基因编码的鞭毛蛋白为例进行码的鞭毛蛋白为例进行GenP
33、ept数据库检索数据库检索。GenPept蛋白质数据库实例蛋白质数据库实例LOCUS AAA27072 490 aa linear BCT 26-APR-1993DEFINITION phase-1 flagellar filament protein.ACCESSION AAA27072VERSION AAA27072.1 GI:153979DBSOURCE locus STYFLGH1I accession M11332.1KEYWORDS .SOURCE Salmonella typhimurium ORGANISM Salmonella typhimurium Bacteria;Pro
34、teobacteria;Gammaproteobacteria;Enterobacteriales;Enterobacteriaceae;Salmonella.REFERENCE 1 (residues 1 to 490)AUTHORS Joys,T.M.TITLE The covalent structure of the phase-1 flagellar filament protein of Salmonella typhimurium and its comparison with other flagellins JOURNAL J.Biol.Chem.260(29),15758-
35、15761(1985)PUBMED 2999134COMMENT Draft entry and clean copy sequence for 1 kindly provided by T.M.Joyce,18-FEB-1986.Individual Salmonella serotypes usually alternate between the production of two antigenic forms of flagella,termed phase-1 and phase-2,each specified by separate structural genes.序列标识序
36、列标识简单描述简单描述序列编号序列编号版本号版本号关键词关键词物种来源物种来源物种分类物种分类引文编号引文编号引文作者引文作者引文标题引文标题引文出处引文出处评注评注FEATURES Location/Qualifiers source 1.490 /organism=Salmonella typhimurium /db_xref=taxon:602 Protein 1.490 /name=phase-1 flagellar filament protein Region 1.490 /region_name=PRK08026 /note=flagellin;PRK08026 /db_xref
37、=CDD:76379 Region 29.163 /region_name=Flagellin_N /note=Bacterial flagellin N-terminus.Flagellins polymerise to form bacterial flagella.This family includes flagellins and hook associated protein 3;pfam00669 /db_xref=CDD:64529 Region 191.256 /region_name=Flagellin_D3 /note=Flagellin D3 domain.This d
38、omain is found in the central portion bacterial flagellin FliC.The domain contains a structural motif called a beta-folium fold;pfam08884 /db_xref=CDD:72304特征表特征表 Region 397.468 /region_name=Flagellin_C /db_xref=CDD:64558 CDS 1.490 /coded_by=M11332.1:13.1485 /transl_table=11ORIGIN 1 maqvintnsl slltq
39、nnlnk sqsalgtaie rlssglrins akddaagqai anrftanikg 61 ltqasrnand gisiaqtteg alneinnnlq rvrelavqsa nstnsqsdld siqaeitqrl 121 neidrvngqt qfsgvkvlaq dntltiqvga ndgetididl kqinsqtlgl dtlnvqqkyk 181 vsdtaatvtg yadttialdn stfkasatgl ggtdekidgd lkfddttgky yakvtvtggt 241 gkdgyyevsv dktngevtla avtpatvtta tals
40、gkmysa npdsdiakaa ltaagvtgta 301svvkmsytdn ngktidggla vkvgddyysa tqdkdgsisi dttkytadng tsktalnklg 361 gadgktevvt idgktynask aaghdfkaep elaeqaaktt enplqkidaa laqvdtlrsd 421 lgavqnrfns aitnlgntvn nlssarsrie dsdyatevsn msraqilqqa gtsvlaqanq 481 vpqnvlsllr/蛋白质序列蛋白质序列记录结束记录结束 GenPept的网址是:的网址是:ftp:/ftp.nc
41、ifcrf.gov/pub/genpept/国际上主要的蛋白质序列数据库的种类和特点国际上主要的蛋白质序列数据库的种类和特点(引自引自生物信息学生物信息学,赵国屏等,赵国屏等 编著,科学出版社,编著,科学出版社,2002)(二)蛋白质序列二次数据库(二)蛋白质序列二次数据库 1.PROSITEn PROSITE是蛋白质家族保守区域和功能位点数是蛋白质家族保守区域和功能位点数据库,也是第一个蛋白质序列二次数据库,据库,也是第一个蛋白质序列二次数据库,收录蛋白收录蛋白质家族中同源序列多重比对所确定的保守性区域质家族中同源序列多重比对所确定的保守性区域:如:如酶活性位点、配体结合位点、金属离子结合位
42、点、其酶活性位点、配体结合位点、金属离子结合位点、其它蛋白质结合位点等已知具有重要生物学功能蛋白质它蛋白质结合位点等已知具有重要生物学功能蛋白质位点和序列模式。位点和序列模式。n PROSITE数据库组成数据库组成 包含包含Prosite(数据文件)和(数据文件)和PrositeDoc(说明文(说明文件)两个文件数据库。件)两个文件数据库。PROSITE数据库主页如图数据库主页如图6-12所示。所示。图图6-12 PROSITE数据库主页数据库主页nPROSITE数据库作用数据库作用:可确定一段新蛋白质序列中:可确定一段新蛋白质序列中包含的功能位点以及其归属的蛋白质家族。包含的功能位点以及其归
43、属的蛋白质家族。nPROSITE的网址:的网址:http:/www.expasy.ch/prosite/或或 http:/www.expasy.org/prosite/nPROSITE的中国镜像网址是:的中国镜像网址是:http:/cn.expasy.org/prosite/2.PRINTS PRINTS蛋白质指纹图谱数据库蛋白质指纹图谱数据库将多个保守的将多个保守的序列模式作为识别蛋白质家族的特征序列模式作为识别蛋白质家族的特征,与,与PROSITE数据库的单个序列模式相比,数据库的单个序列模式相比,PRINTS具有更好的识具有更好的识别率。别率。PRINTS 网址:网址:http:/www
44、.bioinf.man.ac.uk/dbbrowser/PRINTS/3.BLOCKSu 序列模块(序列模块(block):):是通过序列比对得到的是通过序列比对得到的若干蛋白质序列中若干蛋白质序列中具有较高相似性的序列片段具有较高相似性的序列片段。u BLOCKS由通过自动检测由通过自动检测PROSITE数据库数据库和和PRINTS蛋白质指纹图谱数据库蛋白质指纹图谱数据库中蛋白质家族高度中蛋白质家族高度保守区域产生的序列模块组成。保守区域产生的序列模块组成。u BLOCKS的网址:的网址:http:/blocks.fhcrc.org/图图6-13 PDB数据库主页数据库主页图图6-14 结构
45、数据库增长曲线截图结构数据库增长曲线截图红色图:总结构数红色图:总结构数 蓝色图:新增结构数蓝色图:新增结构数(引自引自http:/www.rcsb.org/pdb/statistics/contentGrowthChart.do?content=molType-protein&seqid=100)n PDB数据库作用数据库作用 提供序列详细信息、原子坐标、三维结构、提供序列详细信息、原子坐标、三维结构、交叉检索等与结构相关的信息。交叉检索等与结构相关的信息。n PDB数据库实例数据库实例 以鼠伤寒沙门氏菌以鼠伤寒沙门氏菌Salmonella typhimurium H1-i鞭毛蛋白(鞭毛蛋白
46、(P06176)F41片段晶体结构为例,图片段晶体结构为例,图示示PDB数据库格式数据库格式(框(框6-4)和网页格式和网页格式(图(图6-15)。)。n 三维结构的动态展示三维结构的动态展示(如图(如图6-16 所示)。所示)。n PDB 的地址:的地址:http:/www.rcsb.org/pdb/home/home.do框6-4 PDB格式实例HEADER STRUCTURAL PROTEIN 28-DEC-00 1IO1 TITLE CRYSTAL STRUCTURE OF F41 FRAGMENT OF FLAGELLIN COMPND MOL_ID:1;COMPND 2 MOLEC
47、ULE:PHASE 1 FLAGELLIN;SOURCE MOL_ID:1;SOURCE 2 ORGANISM_SCIENTIFIC:SALMONELLA TYPHIMURIUM;KEYWDS BETA-FOLIUM,FLAGELLIN EXPDTA X-RAY DIFFRACTION AUTHOR F.A.SAMATEY,K.IMADA,S.NAGASHIMA,F.VONDERVISZ,T.KUMASAKA,AUTHOR 2 M.YAMAMOTO,K.NAMBA REVDAT 2 15-APR-03 1IO1 1 SOURCE DBREF SEQADV REVDAT 1 04-APR-01
48、1IO1 0 JRNL AUTH F.A.SAMATEY,K.IMADA,S.NAGASHIMA,F.VONDERVISZ,JRNL AUTH 2 T.KUMASAKA,M.YAMAMOTO,K.NAMBA REMARK 1 REMARK 2 REMARK 2 RESOLUTION.2.00 ANGSTROMS.标头标头题目题目化合物名称化合物名称来源来源关键词关键词作者作者发布日期发布日期相关文献相关文献注释注释SEQADV 1IO1 ALA A 426 UNP P06179 GLY 426 CONFLICT SEQRES 1 A 398 PHE THR ALA ASN ILE LYS GL
49、Y LEU THR GLN ALA SER ARG SEQRES 2 A 398 ASN ALA ASN ASP GLY ILE SER ILE ALA GLN THR THR GLU FORMUL 2 HOH *354(H2 O)HELIX 1 1 ILE A 57 ALA A 99 1 43 HELIX 2 2 SER A 104 THR A 129 1 26 SHEET 1 A 2 ASN A 141 GLN A 146 0 SHEET 2 A 2 THR A 154 LEU A 159-1 O ILE A 155 N ILE A 145 CRYST1 51.750 36.440 118
50、.350 90.00 91.15 90.00 P 1 21 1 2 ORIGX1 1.000000 0.000000 0.000000 0.00000 ORIGX2 0.000000 1.000000 0.000000 0.00000 ORIGX3 0.000000 0.000000 1.000000 0.00000 SCALE1 0.019324 0.000000 0.000388 0.00000 SCALE2 0.000000 0.027442 0.000000 0.00000 SCALE3 0.000000 0.000000 0.008451 0.00000 ATOM 1 N ASN A