质谱数据定量分析方法课件.ppt

上传人(卖家):三亚风情 文档编号:2957369 上传时间:2022-06-15 格式:PPT 页数:40 大小:3.44MB
下载 相关 举报
质谱数据定量分析方法课件.ppt_第1页
第1页 / 共40页
质谱数据定量分析方法课件.ppt_第2页
第2页 / 共40页
质谱数据定量分析方法课件.ppt_第3页
第3页 / 共40页
质谱数据定量分析方法课件.ppt_第4页
第4页 / 共40页
质谱数据定量分析方法课件.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、蛋白质学组中质谱数据定量分析方法研究谢红卫国防科学技术大学机电工程与自动化学院自动控制系2010.5.151主要内容研究背景(我们对定量问题的认识) 定量数据分析面对的问题 定量数据分析的基本方法 已有定量软件和应用情况研究内容和结果 定量信息提取方法及问题 多批次定量数据的对应及重复实验 差异显著性检验 计算问题和软件开发未来工作2第一部分:研究背景第一部分:研究背景3定量数据分析面对的问题大规模Biomarker 发现-低丰度蛋白质- 信号信号S/NS/N低低+ +鉴定信息少鉴定信息少 重复实验数据综合重复实验数据综合 蛋白质和肽段预分离技术策略的数据综合Biomarker验证-靶标分析-

2、 靶标挑选(MRM)肽段分析效率预测(绝对定量)肽段分析效率预测(绝对定量)生物样本蛋白质表达的随机变化影响 临床诊断-直接寻找差异- 肽段组学,肽段特征矩阵,LC-MSLC-MS策略策略,信号直接对比+有选择鉴定4定量数据分析的基本方法不包括MRM、iTRAQ和SC定量标记定量无标定量5计算问题图谱定量信息提取-同位素峰簇处理肽段定量指标计算-比值计算,XIC处理,母离子误差校正RT对齐-LC-MS策略和LC-MS/MS策略的不同信号归一化-消除系统误差差异显著性检验-考虑信号强度影响6质谱信号与定量无标记:同位素峰无标记:同位素峰标记:配对的同位素峰7图谱定量信息提取方法基本方法 最大值法

3、,平滑积分法,信号求和,构建3D peaks(MaxQuant),函数拟合附加处理 小波去噪,同位素分布约束,信噪比过滤结果形式 标记定量:比值,定量指标 无标定量:定量指标8肽段定量指标计算可选步骤可选步骤去噪处理:小波,平滑滤波XIC峰形拟合:复杂的类高斯函数XIC边界确定:信噪比,连续性,局部最小值母离子匹配误差分布:提高精度?标记定量:标记定量:比值计算,MaxQuant采用了最小二乘拟合法问题:问题:不同试剂标记的肽段XIC平移,差异越大,表现越明显无标记定量:无标记定量:定量指标计算9RT对齐LC-MSLC-MS策略:策略:寻找共同的肽段信号,建立非线性模型LC-MS/MSLC-M

4、S/MS策略:策略:利用共同鉴定肽段的RT建立对齐模型对齐模型:对齐模型:3次样条,局部回归,小波,分段线性,偏移向量等作用:作用:对LC-MS/MS策略,可以弥补鉴定信息的不足,提高MS图谱信号利用率10信号归一化和差异显著性检验信号归一化信号归一化 目的:针对无标记定量,消除不同实验间的系 统误差 基本方法:寻找不变量差异显著性检验差异显著性检验 从肽段到蛋白质的信息综合:平均?筛选? 异方差问题:信号越弱,误差分布越宽11一个例子XICXIC定量信息:TGVIVGEDVHNLFTYAK图谱计数SCXIC面积SA(对数)保留时间RT上样量(ug/ul)1268.5453.6616173.0

5、707.5658.1350220.335.1559.1996300.0345.8957.6437970.003AVG_ISO_DISAVG_ISO_DISSCCHXCorrCnLM(ug/ul)12625.10.623.01432.630.333.07025.580.470.3432.80.400.3324.90.490.03424.30.720.003132.20.340.003鉴定信息数据产生LTQ/FT分析Yeast样品,SEQUEST搜库,Target-decoy过滤(FDR=0.01),取Scan number最小的记录12定量软件Cencus、CRAWDAD、MaxQuant软件在

6、可视化、速度、数据文件格式支持、算法精度和实验策略支持等方面有很大发展空间 13定量软件-Mascot支持的定量类型 多种标记定量, MS/MS图谱定量, emPAI, 重复实验Label free, 选择信号最强的3个肽段p数据处理算法特色 基于m/z和RT的对齐,多种XIC积分方法,多参数鉴定结果过滤,outliers排除,归一化处理(利用均值)p使用方法 在搜库前定义修饰和定量的参数(通过修改XML文件实现),搜库,然后使用Distiller定量 14第二部分:研究内容和结果第二部分:研究内容和结果15定量信息的提取:Label free去噪方法去噪方法不去噪Xcalibur默认小波去噪

7、谱峰定量信息谱峰定量信息最大值平滑积分函数拟合信号加和同位素峰同位素峰单一最高全部XICXIC处理处理小波去噪平滑去噪连续性截断误差分析XICXIC定量定量平滑积分函数拟合信号加和XXX图谱水平图谱水平肽段水平肽段水平X X共3*4*3*4*3=432种计算流程比较原则:比较原则:重复实验的CV值最小目前结论目前结论:(1)不进行去噪处理的信号加和方法最优(2)高信号水平的处理结果CV值都比较小 16定量信息提取:标记定量图谱水平:非线性拟合算法10, 98 , 76 , 54 , 32 , 1,*424221422121iiiiiTKTKTKTKTKTCTKTCTCIiiiiiiiiiiii

8、iii1012iif10102iiiCCf1011102iiiKKf0210122iiiKKf特点特点可定义一般模式,支持自定义标记方法,支持多重标记能够充分利用同位素分布信息能够直接解决谱峰叠加问题17定量信息提取:标记定量肽段水平 实现了多种算法实现了多种算法:XIC面积比, 图谱比值平均,主成分分析, 最小二乘回归采用了异常值排除策略采用了异常值排除策略实现了基于实现了基于XICXIC连续性的截断连续性的截断18 单一同位素峰最高单一同位素峰最高问题:同位素峰分布测量误差61,/61iiIsoDisiIsoDisiExpIsoiExpIsoERRii-1-0.500.511.522.53

9、3.540.20.40.60.811.21.41.61.8DataDensityIso1Iso2Iso3Iso4Iso5Iso6第二同位素峰最高第二同位素峰最高第三同位素峰最高第三同位素峰最高第四同位素峰最高第四同位素峰最高数据:FT_yeast, BPRC,高可信鉴定肽段19问题:从质量预测同位素分布经验公式:从IPI.Human 3.49酶切肽段中统计(胰酶,2个漏切,肽段长度不超过100)!)()(iebxaxfiibxaiiiixbxeaxf000)(5 , 4 , 3 , 2 , 1iaibi1.007 0.00057920.0006321 -0.092120.00056830.02

10、2920.0005526 0.09675 0.000568 Bellew, M., M. Coram, et al., Bioinformatics, 2006. 22 22(15):.20重复实验的数据处理RT对齐和交叉搜索P1P2PnXXMS搜索搜索MS搜索搜索信息的充分利用不可逆不可逆:需要建立2/ ) 1(2nnCn个RT对齐模型可逆可逆:需要建立n-1个模型工作:工作:实现了基于局部回归(采用线性函数)的可逆模型和算法,大大减小了计算量21交叉搜索的效果鉴定次数123456789100200400600800100012001400 10987654321定量次数22重复实验的数据处

11、理-信息融合问题问题:一个肽段,多个定量结果,怎样给出最终结果?方法:方法:信号归一化后,求平均值、中值或者最大值结果:结果:对简单重复来说,分组平均后组间差异更小,例如10次重复,分为两组,求5次平均。数据:FT_yeast, BPRC23标记定量中比值分布-信号强度H/D(3)标记实验中发现,比值的标准差随着XIC中peak number的增大而减小数据:FT,人血浆,BPRC24无标记定量中差异分布分段估计方差25带有参数的分布模型极大似然估计直接优化似然函数初始值的选择决定成败baeeyfiiyiybaeii2)(2),(22niiniiiniiinyfL11221ln)2ln(2)(

12、21),(ln26标记定量软件SILVERC+语言GUI交互操作批量数据处理文件格式支持:XML,Mascot dat和html多线程,图谱、XIC导出,多种输出格式,算法优化27索引文件和速度提升索引文件和数据结构Scan number到MS图谱索引:Hash表图谱中Isotopic peaks定位:二分法查找28无标记定量软件LFQuant重复实验支持定量精度和参数优化速度:1 s可以定量1000个肽段支持pepXML,protXML,mzXML,mzData,mzML蛋白质组装和未鉴定肽段搜索RT对齐、信号归一化p从搜库(SEQUEST)到定量完成的全流程自动化,有GUI界面29LC-M

13、S策略支持软件XICFinder不需要鉴定信息,直接从MS图谱中解析同位素峰簇考虑了XIC截断,同位素峰叠加,母离子误差校正等问题提供了信噪比、同位素分布拟合优度等过滤测试:发现采用严格过滤规则,则鉴定肽段也可能不能定量,说明和LC-MS/MS策略可以相互补充30第三部分:进一步的思考第三部分:进一步的思考31预分离和信号归一化SDS分离蛋白质多条带分布条带切割的不均匀性不同实验之间信号不可比321D-SDS PAGE 和Label free定量蛋白质的多条带分布问题没有提及多条带分布的原因:修饰、误切、可变剪接33信号归一化“局部效应”仅仅考虑了信号强度因素RPLC和ESI过程中的离子抑制效

14、应和Matrix effect:信号的局部归一化寻找RT轴上的校正曲线:不变量34可能方法仪器加性电子噪声的不变性图谱信号统计不变量小波去噪35蛋白质组装与定量Quant:MSID score:MS/MSPCP: sequenceQuant:MSPCP: sequence影响图谱质量,从而影响 ID Score决定碎裂模式,影响 ID score蛋白质肽段RPLC分离过程中肽段之间相互影响色谱流出曲线与肽段混合物有关MS response不仅仅由肽段自身属性决定,还与其它混合在一起的肽段相关肽段检测效率预测问题肽段检测效率预测问题36贝叶斯网络蛋白质肽段肽段肽段酶切模型MS图谱(多张,组成XIC)MS/MS图谱(多张,重复鉴定)母离子误差分布同位素分布匹配XIC形状定量指标序列物理化学属性碎裂模式图谱质量搜库打分重复鉴定次数共享肽段问题:肽段有多个父节点37感谢北京蛋白质组研究中心-贺福初,钱小红,朱云平研究员北京蛋白质组研究中心-刘科辉博士,马洁博士团队主要成员: 博士-张纪阳,刘伟 博士生-孙汉昌,徐长明,张伟,刘辉,唐海 琳,王腾蛟 硕士生-马海滨38谢谢大家!39/10/29

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(质谱数据定量分析方法课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|