1、生物信息在临床遗传的运用概要n如何绘制家系图?n如何获得疾病的遗传信息?n如何读测序结果?n如何确定序列改变性质?n如何确定突变与疾病的关系?一、如何绘制家系图?ncyrillicsoftware/Cyrillic 2 特征:1.View up to 9 families in different Windows 2.Cut and paste families or parts of families 3.Toolbar icons,status bar and tooltips guide new users 4.Switch between tree and circular displ
2、ay 5.Maximum of 10,000 individuals per family and 250 markers per chromosome 6.Tools for speed-drawing of new families 7.Space drawings evenlyCyrillic 2 特征(续):8.Color haplotype bars to show inheritance and multiple crossovers 9.Crossovers calculated from phenotype data10.Many new input and output fo
3、rmats 11.Annotation tool:enter text and move to any position and set to any font,size or color 12.Print preview 13.Multiple undo move and undo delete tool 14.Calculate kinship and inbreeding coefficients 15.Automatic recognition of consanguinityIV:1?IV:4I:1I:2II:1II:2II:3II:4II:5II:6II:7III:1III:2II
4、I:3III:4III:5IV:2II:8III:6III:7II:9III:8III:9II:10III:10III:11IV:3一个遗传病家系图n*.FAM 文件只能用cyrillic打开并修改;n建议家系图绘制完成后,同时以图片格式复制到WORD中,保存。二、如何获得疾病的遗传信息?nOMIM 以PKU为例介绍nPubMedn核酸序列数据库 GenBankncbi.nlm.nih.gov/1.OMIM(Online Mendelian Inheritance in Man,联机人类孟德尔遗传)n OMIM是及时且权威的关于人类基因和遗传 性 疾 病 表 型 的 纲 要 性 数 据 库,是
5、Mendelian Inheritance in Man(MIM)(2019年)的不断更新电子版本,由Victor A.McKusick博士等编辑整理。n该数据库从1960年开始收集数据。n OMIM提供了两种检索方式:根据字符串检索,可以关键词对数据库进行查询;根据基因定位检索,可根据疾病或基因所处的染色体位置,如1p21等对数据库进行查询。nFTP上可以下载疾病图,基因图以及全部OMIM数据OMIM条目第一个数字代表的意义1-(100000-)Autosomal dominant(entries created before May 15,1994)2-(200000-)Autosomal
6、 recessive(entries created before May 15,1994)3-(300000-)X-linked loci or phenotypes 4-(400000-)Y-linked loci or phenotypes 5-(500000-)Mitochondrial loci or phenotypes 6-(600000-)Autosomal loci or phenotypes(entries created after May 15,1994)每个条目组成部分包括n标题(包括同义词)n表型,基因产物与基因的描述n疾病缺陷的性质,包括发病机理与病理生理n遗传学
7、,包括定位n疾病的诊断与处理n等位变异体(表型变异体,主要是疾病的分子基础)n文献2.PubMedn是规模最大的生物医学类文献数据库之一,建于70年代初,由美国国家医学图书馆维护;MEDLINE:收录了1966年至今世界70余个 国家的4,600余种生物医学类期刊 n数据来源 Non-MEDLINE:超出MEDLINE范围条目,PMC(PubMed Celtral)n包括引用、摘要和杂志的索引术语,以及直接链接到出版商全文网址PKU 一个数据库记录(entry)一般由两部分组成:原始序列数据和描述这些数据生物学信息的注释(annotation)。注释中包含的信息与相应的序列数据同样重要和有应用
8、价值。3.核酸序列数据库n目前国际上有3个主要的DNA序列数据库GenBank NCBI维护EMBL:European Molecular Biology Laboratory EBI维护 DDBJ:DNA Databank of Japan日本国立遗传 学研究所维护表1.1 三个主要DNA序列数据库网址数据库(Database)网址(Address)GenBank ncbi.nlm.nih.gov/Genbank/GenbankOverview.html EMBL ebi.ac.uk/embl/DDBJ ddbj.nig.ac.jp/n来自于70,000多种生物的核苷酸序列数据库;nGenB
9、ank序列格式与DDBJ相同,EMBL则不同;n序列提交与更改:用户可以向GenBank,EMBL,DDBJ其中任意一个实验室提交序列及提交更改;nGenBank序列提交工具:BankIt(少数序列;基于Web)、Sequin(多、长序列,完整基因组等;独立使用)。GenBank 格式可以分为三个部分:n头部,包含关于整个记录的信息(描述符)n特征表部分,包含了注释这一记录的特性n第三部分,核苷酸序列自身 所有的核苷酸数据库记录(DDBJ/EMBL/GenBank)都在最后一行以/结尾1)头部nLOCUS 行 nDEFINITIONnACCESSIONnVERSION REFERENCEnKE
10、YWORDSnSOURCE ORGANISMAUTHORSTITLEJOURNALMEDLINEPUBMEDREMARK2)特征表特征表它直接表达了记录的生物背景知识n source是唯一一个必须在所有GenBank记录中出现的特征ngenenCDS Coding Sequencenvariationnmisc-featuren3)序列附:FASTA格式nFASTA格式广泛应用于分子生物学软件包中n大于号()表示一个新序列的开始,后面紧跟序列的标记符,另起一行顶头为序列,序列是连续的,无空格等 目前GenBank分为多个分数据库:nr,dbEST,dbSTS,dbGSS和dbHTGS等。(1)
11、nr(non-redudant)是非冗余的核酸数据库,存贮已知的基因全长或部分序列数据,以及完成了的基因组序列。大多序列已具有相应的基因结构分析,如编码区、调控区、重复序列等。(2)dbEST是EST数据库,EST是表达基因中的部分序列,因EST(Expressed Sequence Tags)项目本身的特点,所有EST序列都是一次测序的结果,存在较大的误差。序列较短,多为400bp以下。虽来自于表达基因,但编码情况未知。(3)dbSTS是STS数据库,STS是基因组标记序列数据库,作为基因作图、基因定位的重要工具,STS(Sequence Tagged Site)为基因组DNA序列,且提供染
12、色体定位信息。与EST相同之处是,序列较短且不提供基因功能信息。(4)dbGSS是基因组序列数据库,源于基因组DNA克隆的一次性部分测序得到的序列。它也具有序列较短、有较大的误差,不提供基因功能和定位信息。(5)dbHTGS存贮的是处理未完成阶段的基因组测序数据。基本都是BAC测序的结果。3.PubMedn是规模最大的生物医学类文献数据库之一,建于70年代初,由美国国家医学图书馆维护;MEDLINE:收录了1966年至今世界70余个 国家的4,600余种生物医学类期刊 n数据来源 Non-MEDLINE:超出MEDLINE范围条目,PMC(PubMed Celtral)n包括引用、摘要和杂志的
13、索引术语,以及直接链接到出版商全文网址三、如何读测序结果?DNAStardnastar/web/index.php 是关于DNA和蛋白质结构与功能分析的软件包,与Wisconsin 软件包相比,它带有识别内含子、外显子的程序Genequest,并且能够显示测序的Trace图。nEditSeq Included with all systems,converts sequence formats and allows editingnGeneQuest Discovery and annotation of genesnMegAlign-Alignment of DNA and protein
14、sequencesnProtean Protein Structure predictionnPrimerSelect Primer design and comparison analysisnMapDraw Restriction Site LocatornSeqman Assemble into a contigEditSeqn转化数据格式为DNASTAR所有模块识别的格式n可以导入的数据格式:Text files、FastA files、Genbank flant files、Trace files、GCG files等;n输出的数据格式:FastA files、Genbank fla
15、nt files、GCG files;nDNA序列编辑:大小写转化;查找碱基、ORF;编辑序列特征;提供反向互补和反向序列;翻译;碱基统计n氨基酸序列编辑:大小写转化;查找氨基酸;编辑序列特征;逆翻译氨基酸为DNA;氨基酸统计n新的版本增加有连线Blast和序列搜索功能 EditSeq输出文件格式:*.SEQSeqmann做序列组装(Assembly)、Alignmentn看测序图n按6种阅读框翻译n输入、编辑和输出Phrap Assembliesn过滤掉载体序列、质量低的测序序列 输入文件格式为:输入文件格式为:*.SEQ *.ABI 输出文件格式为:输出文件格式为:*.sqd Ctrl+D
16、四、如何确定序列改变性质?四、如何确定序列改变性质?(SNP or Mutation)dbSNP:ncbi.nlm.nih.gov/SNP/nNCBI维护,启动最早,收集数据最多的公共数据库;n包括SNPs,小的缺失/插入,微卫星变异等;ss编号:所有研究者提交SNP时生成nID rs编号:已有数据比较后,独特的五、如何确定突变与疾病的关系?HGMD(HGMD(H Human uman G Genomeenome M Mutation utation D Database)atabase)n位于英国Cardiff医学遗传学研究所,主要收录人类遗传病的致病基因;n已合并在Celera公司的CDS(Celera Discovery System)中。hgmd.cf.ac.uk/hgmd0.html用Cyrillic绘制家系图,确定遗传方式NCBI的OMIM中查找详细资料若未定位,需做连锁分析,王铮老师介绍 若已定位已克隆,需要分析致病基因GenBank PubMed若已定位未克隆,需要查找候选基因,石立松老师已介绍临床获得可疑遗传病例发现突变位点后,确定突变性质dbSNP与疾病的关系,HGMD,OMIM,小小 结结WEBPAGETHANK YOU!
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。