1、动力学模拟实验动力学模拟实验 一、选题背景:一、选题背景: 材料材料:凝集素样氧化型低密度脂蛋白受体1(LOX-1) sLOX-1是LOX-1的可溶形式,其水平与LOX-1的表达水平相关,在急性冠脉综合症等心血管疾病、高血压、高脂血症心血管疾病、高血压、高脂血症的早期诊断中具有重要价值。 两条链的序列两条链的序列: gi|61680779|pdb|1YPU|A Chain A, Human Oxidized Low Density Lipoprotein Receptor Lox-1 C2 Space GroupRVANCSAPCPQDWIWHGENCYLFSSGSFNWEKSQEKCLSLD
2、AKLLKINSTADLDFIQQAISYSSFPFWMGLSRRNPSYPWLWEDGSPLMPHLFRVRGAVSQTYPSGTCAYIQRGAVYAENCILAAFSICQKKANL gi|61680780|pdb|1YPU|B Chain B, Human Oxidized Low Density Lipoprotein Receptor Lox-1 C2 Space GroupRVANCSAPCPQDWIWHGENCYLFSSGSFNWEKSQEKCLSLDAKLLKINSTADLDFIQQAISYSSFPFWMGLSRRNPSYPWLWEDGSPLMPHLFRVRGAVSQTYPS
3、GTCAYIQRGAVYAENCILAAFSICQKKANL 结构特征结构特征 LOX-1蛋白是分子量为50kDa的型穿膜糖蛋,由273个氨基酸组成,属于清道夫受体家族 。LOX-l蛋白由包含34个残基的N末胞质区域、单个穿膜区域、由82个残基组成的颈部紧接着的由130个残基组成的C型凝集素样配体合区域的C末端胞外部分组成。 二,二,利用利用GROMACS进行深入的结构优化和进行深入的结构优化和短时间动力学模拟短时间动力学模拟 分子模拟是在分子模型的基础上用计算机做实验,“计算机实验”。通过模拟微观粒子的运动来计算宏观性质。 实验准备阶段实验准备阶段:1,Pdb2gmx,选择 Gromacs4
4、3a2 力场,生成 .gro 和 .top文件pdb2gmx -ignh -f 1YPU.pdb -o 1YPU_1.gro -p 1YPU_1.top -water spce-f : 指定你的坐标文件,可以是pdb、gro、tpr等等包含有分子坐标的文件;-o : 输出文件,也就是处理过的分子坐标文件,同样可以是pdb、gro、g96等文件类型;-p :输出拓扑文件。pdb2gmx读入力场文件,根据坐标文件建立分子系统的拓扑;-water :指定使用的水模型,使用pdb2gmx的时候最好加这个参数,不然后面会吃苦头。它会提前在拓扑文件中添加水分子模型文件;-ff :指定力场文件,也可以不用这
5、个参数,再自行选择;-ignh : 舍弃分子文件中的H原子,因为H原子命名规则多,有的力场不认;2,Editconf, 为蛋白质加上1.5nm厚度的水层editconf -bt cubic -f 1YPU.gro -o 1YPU_editconf.gro -d 1.5-f : 指定你的坐标文件。-o : 输出文件,即放进盒子里面的分子系统。-bt : 盒子类型,有正方型,长方形,八面型等等,看个人需要跟癖好啦。-d : 分子离盒子表面的最短距离。这个跟-bt一起使用,基本就足够了;如果蛋白在模拟过程尺寸变化很大,那就用-box。3,Genbox, 选择SPC模式的水溶液,生成溶质+溶液体系的.
6、top和.gro文件genbox -cp 1YPU_editconf.gro -cs spc216.gro -o 1YPU_genbox.gro -p 1YPU.top-cp :带盒子参数的分子坐标文件,也就是editconf的输出文件;-cs :添加的水分子模型,如spc216、spce、tip3p、tip4p等,关于各个模型的区别,请参考scholar google;-o :输出坐标文件,就是添加水分子之后的分子坐标文件,默认是.gro文件,但是也可以输出其他文件格式,如pdb;-p :系统拓扑文件,genbox会往里面写入添加水分子的个数4,Make_ndx,生成一个仅包含蛋白质分子的索
7、引文件protein.ndxmake_ndx -f 1YPU_genbox.gro -o protein.ndx5,Genpr, 在protein.ndx基础上生成一个仅包含Ca原子的索引文件 ca.itpgenrestr -f 1YPU_genbox.gro -n protein.ndx -o ca.itp实验核心阶段实验核心阶段: 每一步都是先用grompp命令,生成运行初始文件.tpr;然后用mdrun命令运行md程序。6,对蛋白质进行分步能量最小化。A,先固定Ca原子,采用steep算法,进行1000步的能量最小化;修改修改.mdp文件。文件。grompp -f em1.mdp -c
8、1YPU_genbox.gro -p 1YPU.top -o 1YPU_grompp.tprgenion -s 1YPU_grompp.tpr -o protein_ion.gro -g ion.log -nname CL- -nn 3为体系添加离子,选择(SOL)。重新编辑.top文件。在“molecules”一栏,添加“CL 3”,然后在SOL数量中减3。重新保存;-s: 指定系统tpr文件。-p: 指定系统拓扑文件,在往系统中添加金属离子时,genion会往拓扑文件最后的分子类型中写入添加的离子数,并修改拓扑文件中系统原子数。-o: 指定输出文件,genion的输出是pdb文件或者gro
9、等结构文件。也就是说你产生这个文件之后,还要再用这个文件产生tpr文件。-np/-nn: 带正/负电金属粒子的数目。-pn/-nn 指定正负金属离子的名字,比如 NA+ 或者 CL- grompp -f em1.mdp -c protein_ion.gro -p 1YPU.top -o 1YPU_grompp_2.tprmdrun -s 1YPU_grompp_2.tpr -o 1YPU_grompp_2_md.trr -c 1YPU_grompp_2_md.gro -e 1YPU_grompp_2_md.edrB,放开所有原子,采用l-bfgs算法,进行3000步的能量最小化。观察能量最小化
10、输出文件mdout.mdp最后部分能量的情况,若能量很高,则继续A/B步骤,直至能量降低。 修改修改.mdp文件。文件。grompp -f em2.mdp -c 1YPU_grompp_2_md.gro -p 1YPU.top -o 1YPU_grompp_B.tprmdrun -v -s 1YPU_grompp_B.tpr -o 1YPU_grompp_B_md.trr -c 1YPU_grompp_B_md.gro -e 1YPU_grompp_B_md.edr7,对体系进行加热,从0度加热到300,设置运行时间为30ps。修改pr.mdp文件。文件。grompp -f pr.mdp -c
11、 1YPU_grompp_B_md.gro -p 1YPU.top -o 1YPU_grompp_hot.tprmdrun -v -s 1YPU_grompp_hot.tpr -o 1YPU_grompp_hot.trr -c 1YPU_grompp_hot.gro -e 1YPU_grompp_hot.edr8, 运行运行100ps的分子动力学的分子动力学模拟。(选用模拟。(选用md选项),选项),dt=0.002 ps,nsteps=50000.修改修改md.mdp文件。文件。 grompp -f md.mdp -c 1YPU_grompp_hot.gro -p 1YPU.top -o 1
12、YPU_grompp_hot_8md.tpr mdrun v -s 1YPU_grompp_hot_8md.tpr-o 1YPU_grompp_hot_8md.trr -c 1YPU_grompp_hot_8md.gro -e 1YPU_grompp_hot_8md.edr结果分析结果分析: 对模拟得到的轨迹文件.trr 或者.xtc文件进行分析。9 , 用g_rms,计算蛋白质Ca原子随时间的RMSD结果,画图rmsd.jpg g_rms -s 1YPU_grompp_hot_8md.tpr -f 1YPU_grompp_hot_8md.trr -o rmsd9.xvg结果构象和目标构象的的
13、偏差统计RMSD计算前首先要把模拟结果构型进行平动和转动,使之与目标构型(一般为初始结构)进行尽量的重合或部分重合,然后计算每个原子与目标构型的坐标的差值!计算每个原子与目标构型的坐标的差值(r_i,c -r_i,r),c,r代表存储构型和目标构型,i代表构型上的某个原子。RMSD就是这些差值的平方的平均,再开方!RMSD是计算在某一时刻的构象与目标构象所有原子偏差的加和,对原子数的平均!每一帧有一个RMSD!因此是衡量体系是否稳定是否稳定的重要依据 。 在0到20ps比较稳定,这个模拟需要延长到完全平衡。图二,root-mean-square deviation,均方根偏差,10,用,用g_
14、rmsf,计算,计算Ca原子的原子的RMSF变化幅度并画图变化幅度并画图 g_rmsf -s 1YPU_grompp_hot_8md.tpr -f 1YPU_grompp_hot_8md.trr -o rmsf10.xvg 图三,均方根涨落(均方根涨落(Root-Mean-Square-Fluctuation)图)图得到每一个原子的结构位置涨落(也就是震动的构象变化)。体系有2条链,总体来说中间部分还是比较稳定的。11,用g_energy计算体系的总能量变化并画图g_energy -s 1YPU_grompp_hot_8md.tpr -f 1YPU_grompp_hot_8md.edr -o
15、energy11.xvg图四,100ps内的总能量变化图总能量在-1.383e+06上下波动,总体看是比较稳定的。 12,用VMD画出最终构象的三维结构图,并与起始构象进行比较。图五,红色为最终构象的三维结构图,蓝色为起始构象的三维结构图通过图中可以看出除了尾部一点变化外其他地方没有明显变化。三、讨论与分析:三、讨论与分析: 本实验选取凝集素样氧化型低密度脂蛋白受体1(LOX-1)蛋白利GROMACS进行深入的结构优化和短时间动力学模拟。通过对体系加水,能量最小化,升温,最后进行分子动力学模拟。对得到的结果进行分析。 本实验分析从RMSD,RMSF,TOTAL ENERGY三个方面进行计算作图观察。通过计算 RMSD 来当作评估蛋白质结构的可信度: 在模拟过程中,分子会不断的发生变化,而对于我们而言,必须等到分子结构在稳定的状态下(fluctuation较小时)再进一步进行分析,这样才比较有意义。所以本实验还需要延长时间到完全平衡。从总能量上看,它在-1.383e+06上下波动,总体看是比较稳定的。用VMD在最终构象的三维结构图与起始构象进行比较,两者除了尾部一点变化外其他地方没有明显变化。