1、蛋白质结构分析及三维可视化以镰刀型红细胞贫血症为例正常成人血红蛋白是由两条链和两条链相互结合成的四聚体,链和链分别由141和146个氨基酸顺序连结构成。镰状细胞贫血患者因链第6位氨基酸谷氨酸被缬氨酸所代替,形成了异常的血红蛋白S(hemoglobin S,HbS),取代了正常血红蛋白(HbA),在氧分压下降时HbS分子间相互作用,成为溶解度很低的螺旋形多聚体,使红细胞扭曲成镰状细胞(镰变)。课程工具 PYMOL 下载地址: B 1.Linux 2.win32(扩展名man改msi) 3.win64(扩展名man改msi) 4.mac课程内容 蛋白质结构简介 常见的蛋白质相关数据库 三维结构可视
2、化练习(PYMOL)蛋白质结构与功能预测1. 从氨基酸组成辨识蛋白质 2. 蛋白质二级结构预测 3. 蛋白质的三维结构 考虑氨基酸理化性质时注意的主要因素:侧链基团的大小,和疏水性。常根据氨基酸侧链的疏水性进行分类From wikipedia 蛋白质的生物功能由蛋白质的结构所决定 ,蛋白质结构预测成为了解蛋白质功能的重要途径 蛋白质结构预测分为: 二级结构预测 空间结构预测 二级结构预测 在一定程度上二级结构的预测可以归结为模式识别问题 在二级结构预测方面主要方法有: 立体化学方法 图论方法 统计方法 最邻近决策方法 基于规则的专家系统方法 分子动力学方法 人工神经网络方法 预测准确率超过70
3、%的第一个软件是基于神经网络的PHD系统通过对多种蛋白质结构分析发现各种氨基酸在不同二级结构中出现具有偏好:-螺旋 :具有长侧链的氨基酸如Leu、Met、Gln和Glu-折叠:碳原子处有分支的侧链如Val,Ile,和Phe-Pro在螺旋和折叠中出现都不适宜-Gly也很少出现在螺旋和折叠中-pro和Gly常出现在转角中通过蛋白质的氨基酸序列预测二级结构可以达到70的准确率蛋白质的三维结构 SWISS-MODEL:http:/www.expasy.ch/swissmod/SWISS-MODEL.html CPHmodels:http:/www.cbs.dtu.dk/services/CPHmode
4、ls/蛋白质序列数据库 SWISS-PROT (瑞士日内瓦大学)蛋白质序列数据库 http:/www.Expasy.ch 内容包括序列及功能信息、蛋白识别、蛋白质结构预测及其他功能 NCBI 蛋白质数据库 包括所有蛋白质序列,及其翻译产物序列 http:/www.ncbi.nlm.nih.gov/guide/proteins/ PIR 蛋白质序列信息资源库(美、德) http:/pir.georgetown.edu 蛋白质结构数据库PDB Protein DataBank,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库 http:/www.rcsb.org/pdb/
5、 NCBI STRUCTURE MMDB (Molecular Modelling DataBase),包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库 SCOP (Structural classification of proteins) 英国医学研究会(MRC)剑桥分子生物学实验室开发的蛋白质结构分类数据库。包含描述蛋白质域的家族、超家族、折叠、等级等信息。http:/scop.mrc-lmb.cam.ac.uk/scop http:/www.uniprot.orghttp:/www.expasy.org/proteomicshttp:/pir.georgetown.eduPr
6、otein Data Bank数据库收集了全世界利用核磁共振,X-ray衍射实验,理论模拟出来的蛋白质和DNA的三维立体结构PDB是全球最重要的蛋白质结构资料来源,主要提供的信息有:原子的空间坐标,引用文献,形成的-helix和-sheet的氨基酸序列,二硫键连接模式,与蛋白结合的ligand,参与生化功能的residuehttp:/www.rcsb.org/pdb/home/home.do课堂练习1.以人类的血红蛋白beta亚基为例的pymol展示实验2.从数据库中下载感兴趣的pdb文件观察其蛋白结构模型PymolPymol: python + molecule开源产生高质量三维结构图像Py
7、mol GUIExternal GUIInternal GUIMouse matrixMovie controlsNames panelCommand line获取序列选择序列格式显示2022-6-6复旦大学图书馆文献检索教研室获取FASTA格式序列进入日内瓦大学生物分子学网站www.expasy.org选择同源建模服务器SWISS MODEL同源建模服务器建模自动模式联盟模式项目模式自动模式建模将以上获取的Fasta序列的MHLTPEE MHLTPVE重新建模*Model 预测模型*Templates与相似的已知结构蛋白的列表蛋白质功能预测 例:对正常hemoglobin的序列修改后并预测其功能MVHLTPVEKSAVTALWGKVNVDEVGGEALGRLLVVYPWTQRFFESFGDLSTPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKGTFATLSELHCDKLHVDPENFRLLGNVLVCVLAHHFGKEFTPPVQAAYQKVVAGVANALAHKYH