1、孙宏钰孙宏钰中山大学中山医学院法医学系中山大学中山医学院法医学系法庭科学新技术应用高峰论坛(法庭科学新技术应用高峰论坛(20162016年年1111月月1717日佛山)日佛山)NGS-STR分型分型在个体识别和亲子鉴定中的应用初探在个体识别和亲子鉴定中的应用初探前前 言言Part Il基于基于CE平台的平台的PCR-STR检测是现阶段法医检测是现阶段法医DNA实验室的金实验室的金标准标准lForensic DNA CaseworklDNA DatabaseslMass DisasterslMissing PersonslParentage and Kinship TestinglGenetic
2、 Genealogy & Answering Historical QuestionslAuthenticating Human Cell LineslMonitoring Transplantsll更多更多Loci组合的有限性组合的有限性l长度多态性检测:未充分利用遗传标记信息长度多态性检测:未充分利用遗传标记信息 法医法医STR分型分型中国法庭中国法庭DNA数据库已有数据库已有3877.1(4400)万条万条数据数据已认定比中已认定比中391.9万次万次现场生物物证入库比中率现场生物物证入库比中率35.34%DNA序列分析技术序列分析技术下一代测序(下一代测序(NGS)DNA序列分析技术序
3、列分析技术下一代测序(下一代测序(NGS)Massively parallel sequencing (MPS)DNA序列分析技术序列分析技术下一代测序(下一代测序(NGS)基于基于NGS平台的法医平台的法医STR分型分型长度多态性长度多态性 序列多态性序列多态性材料和方法材料和方法Part II实验材料实验材料l样本:样本:l42个个广东汉族个体血痕样本(广东汉族个体血痕样本(3.0mm血片)血片)l包含包含14个个父母子二代家系父母子二代家系l已采用已采用Goldeye 20A体系进行体系进行19个个STR基因座荧光标记复合扩增和毛细管基因座荧光标记复合扩增和毛细管电泳检测,每个家系都包含
4、电泳检测,每个家系都包含12个个STR突变位点突变位点l阳性对照:阳性对照:l007 (Thermo Fisher)l9947A (Promega)实验方法实验方法lDNA提取:提取:lAutoMate ExpressTM自动化提取系统自动化提取系统lPrepFiler BTA Forensic DNA Extraction KitlQubit3.0定量定量 DNA浓度浓度实验方法实验方法l文库构建:文库构建:l样本文库样本文库构建构建lEarly Access STR Kit (24个个STR基因座)基因座)l11个个CODIS核心位点:核心位点: CSF1PO, D3S1358, D5S8
5、18, D7S820, D8S1179, D13S317, D16S539, D21S11, TH01, TPOX, vWAl5个个CODIS补充核心位点:补充核心位点: D1S1656, D2S1338, D2S441, D10S1248, D19S433l8个非个非CODIS核心位点:核心位点: D14S1434, D1S1677, D2S1776, D4S2408, D5S2500, D6S1043, D6S474, D9S2157l样本文库纯化样本文库纯化l磁珠 Agencourt AMPure XP Reagent (Beckman Coulter)实验方法实验方法l模板制备:模板制
6、备:l文库定量文库定量 lqPCR定量到40-60pMl乳化乳化PCR lIon PGM Hi Q Chef Kit(Thermo Fisher)l阳性珠子的富集阳性珠子的富集Ion Chef实验方法实验方法l测序反应:测序反应:l半导体测序半导体测序lION PGM Hi-Q Sequencing Kit(Thermo Fisher)lIon 318 芯片:1GlIon 316 芯片:100MIon PGM通过检测通过检测pHpH值变化来进行测序,值变化来进行测序,直接将化学信号转换为电信号。直接将化学信号转换为电信号。实验方法实验方法l数据分析:数据分析:lPGM测序数据分析测序数据分析l
7、HID STR Genotyper Plugin v3.1 lBAM 文件用IGV_2.3.72分析lFASTQ文件用STRait Razor v2.6分析lPGM分型数据和分型数据和CE分型数据比较分型数据比较lPGM家系数据分析家系数据分析实验结果和讨论实验结果和讨论Part IIIl分型结果分型结果NGS-STR基因座分型基因座分型所有样本的分型结果总览所有样本的分型结果总览等位基因的核心序列简式等位基因的核心序列简式等位基因及其等位基因及其Stutter峰图峰图l分型结果输出格式分型结果输出格式NGS-STR基因座分型基因座分型l分型结果输出格式分型结果输出格式NGS-STR基因座分型
8、基因座分型PGM检测平台的检测平台的STR基因座分型基因座分型l阳性对照结果阳性对照结果l测序覆盖深度(测序覆盖深度( depth of coverage, DoC)NGS-STR检测的数据质量检测的数据质量PGM检测平台的数据质量检测平台的数据质量Stutter占主峰的峰面积比:占主峰的峰面积比:Stutter出现比率:出现比率:l等位基因的杂合峰高比等位基因的杂合峰高比PGM检测平台的数据质量检测平台的数据质量lCE和和NGS平台的平台的STR分型一致性:分型一致性:l42个样本和个样本和2个阳性对照个阳性对照DNA样本(样本(9947A,007),共),共1232个等位基因个等位基因,分
9、型一致率为,分型一致率为98.13%。l不一致原因分析不一致原因分析l等位基因丢失等位基因丢失lD21S11基因座基因座X.1、X.2、X.3结构结构l多一个重复单位多一个重复单位NGS-STR与与CE-STR的一致性研究的一致性研究l各个基因座的等位基因个数各个基因座的等位基因个数等位基因(等位基因(Isoallele)等位基因(等位基因(Isoallele)lGoldeneye 20A和和Early Access STR Kit重叠基因座共重叠基因座共14个:个:lCSF1PO, D2S1338, D3S1358, D5S818, D6S1043, D7S820, D8S1179, D13
10、S317, D16S539, D19S433, D21S11, TH01, TPOX and vWAl14个三联体个三联体二代二代家系家系:l3个个:母源突变(其中母源突变(其中2个是多步突变)个是多步突变)l3个个:父源突变父源突变l3个:个:突变来源不明突变来源不明l3个个:有突变,但有突变,但未未涵盖在重合的涵盖在重合的14个个基因座基因座中中亲子鉴定亲子鉴定小小 结结Part IVNGS-STR分型的优点分型的优点l检测序列多态性检测序列多态性信息更充分利用,提高多态性;信息更充分利用,提高多态性;l可组合的可组合的STR基因座的个数不受荧光种类限制;基因座的个数不受荧光种类限制;l每个每个STR基因座的扩增片段长度不受荧光组合限制;基因座的扩增片段长度不受荧光组合限制;l对等位基因亲本来源的识别能力;对等位基因亲本来源的识别能力;l对混合样本潜在的检测能力。对混合样本潜在的检测能力。NGS-STR分型尚需解决的问题分型尚需解决的问题l可读序列的评价标准可读序列的评价标准l等位基因的命名标准等位基因的命名标准l与与CE数据的可兼容性数据的可兼容性l群体数据群体数据l结果评判依据和标准结果评判依据和标准l检测时间和成本检测时间和成本