MD基本教程-溶菌酶的水溶液的MD模拟 下载本文

内容发布更新时间 : 2024/10/14 13:21:54星期一 下面是文章的全部内容请认真阅读。

溶菌酶水溶液的简单分子动力学模拟教程

GROMACS是一个使用经典分子动力学理论研究蛋白质动力学的工具[1]。这个软件包遵守GNU协议,因此可以免费从其主页(http://www.gromacs.org)上下载。GROMACS可以在linux、unix和Windows上使用。 第一步 建立拓扑结构

本教程使用鸡蛋清溶菌酶(PDB code:1AK1)作为目标蛋白质。首先需要从RCSB(http://www.rcsb.org/pdb/home/home.do)网站下载其三维结构文件。然后通过诸如SYBYL、Discovery Studio、VMD、Chimera和PyMOL等图形显示软件分析其三维结构。根据模拟的需要去除或保留该文件中的结晶水分子。例如,在研究蛋白质和配基之间的亲和作用时,结合在活性位点附近的水分子就必须保留。但如果利用MD模拟研究蛋白质的构象转换时,蛋白质中的结晶水就可以删除。删除PDB文件中分子可以利用简单的文本编辑软件如vi(Linux)、emacs (Linux/Mac)和Notepad (Windows) 删除这些分子所对应的条目。例如,如果要删除文件中高的结晶水就可以将PDB文件中的所有“HOH”残基删除。切记不要用文字处理软件Word处理该文件。

在运行pdb2gmx程序之前,一定要检查pdb文件中的MISSING条目。这些条目会标注出该晶体结构中缺失哪些原子或残基。这一步是必须做的,因为不完全氨基酸残基或分子都会导致pdb2gmx命令的失败。这些遗失的原子或残基必须利用其他的软件补充完整。但末端的遗失可能不会对动力学模拟的顺利进行造成影响,但有可能会对结果有影响。此外,还要注意pdb2gmx程序并不是万能的,它并不能为所有的分子建立拓扑结构,仅能对一些力场中定义好的分子才有效,例如大部分蛋白质,核酸,还有一些辅因子如NAD、NADH 、ATP和ADP等。此外,一些糖类(海藻糖等)的力场也都定义好,可以从力场文件中获得。因此,如果目标蛋白质含有小分子配基的,在运行该软件之前就需要先用简单的文本编辑软件将配基删除。最后除去结晶水和小分子配基,同时确保所有必需原子存在,此时的PDB文件中只含蛋白质原子,现在可以运行pdb2gmx命令了。

常用pdb2gmx命令的详细参数:

pdb2gmx -f 1AKI.pdb -o 1conf.gro –p conf.top –ignh

此时程序会提示你选择力场(力场的选择类型与你安装的力场密切相关): Select the Force Field:

From '/usr/local/gromacs/share/gromacs/top':

1: AMBER03 force field (Duan et al., J. Comp. Chem. 24, 1999-2012, 2003) 2: AMBER94 force field (Cornell et al., JACS 117, 5179-5197, 1995) 3: AMBER96 force field (Kollman et al., Acc. Chem. Res. 29, 461-469, 1996) 4: AMBER99 force field (Wang et al., J. Comp. Chem. 21, 1049-1074, 2000) 5: AMBER99SB force field (Hornak et al., Proteins 65, 712-725, 2006) 6: AMBER99SB-ILDN force field (Lindorff-Larsen et al., Proteins 78, 1950-58, 2010)

7: AMBERGS force field (Garcia & Sanbonmatsu, PNAS 99, 2782-2787, 2002) 8: CHARMM27 all-atom force field (with CMAP) - version 2.0 9: GROMOS96 43a1 force field

10: GROMOS96 43a2 force field (improved alkane dihedrals) 11: GROMOS96 45a3 force field (Schuler JCC 2001 22 1205) 12: GROMOS96 53a5 force field (JCC 2004 vol 25 pag 1656) 13: GROMOS96 53a6 force field (JCC 2004 vol 25 pag 1656) 14: OPLS-AA/L all-atom force field (2001 aminoacid dihedrals)

15: [DEPRECATED] Encad all-atom force field, using full solvent charges 16: [DEPRECATED] Encad all-atom force field, using scaled-down vacuum charges 17: [DEPRECATED] Gromacs force field (see manual)

18: [DEPRECATED] Gromacs force field with hydrogens for NMR

力场中包含将写进拓扑文件中的所有信息,所以此选择非常重要,应仔细衡量每个力场且选择与你的模拟情况最相符的力场。在此教程中,我们选择全原子的OPLS力场,因此,选择14并回车。

此外,在pdb2gmx软件中还有很多其他操作参数可以选择:如

-ignh:在PDB文件中忽略非极性氢原子,尤其在处理利用核磁共振获得的三维结构时尤其需要利用该参数;

-ter:交互指定N末端和C末端的带电情况;

-inter:交互指定带电氨基酸(精氨酸,赖氨酸,天冬氨酸,谷氨酸和组氨酸)的电荷,指定半胱氨酸的二硫键。

运行pdb2gmx命令会获得GROMACS运行所需要的三个文件力: 1.conf.top 2. posre.itp 3. conf.gro

分子拓扑文件 位置限制文件

分子结构文件

conf.top为分子拓扑文件(后缀名为top)包含所模拟分子的所有信息,例如原子类型、电荷数、键长、键角和二面角等。 posre.itp包含限制重原子位置的信息。

conf.gro为一个GROMACS格式的结构文件,它包含在已定义力场中上所有原子的结构文件(氢原子已经加入其中)。conf.top是整个系统文件的拓扑文件。 下面首先来看看分子的拓扑信息。利用文本编辑器打开conf.top,几行之后你会发现如下句子:#include \,这一行指定了本次MD模拟选用OPLS-AA力场。即,本次MD模拟的所有拓扑参数皆来自于此力场。 第二个重要行是[ molecule type ],在它之后可以看到 ; Name nrexcl Protein_A 3

\是分子的名字,即蛋白质在PDB文件中被标为A链。 大部分内容为蛋白质分子中的原子信息,以下所示: [ atoms ]

; nr type resnr residue atom cgnr charge mass typeB chargeB massB

1 opls_287 1 LYSH N 1 -0.3 14.0067 ; qtot -0.3

2 opls_290 1 LYSH H1 1 0.33 1.008 ; qtot 0.03

3 opls_290 1 LYSH H2 1 0.33 1.008 ; qtot 0.36

4 opls_290 1 LYSH H3 1 0.33 1.008 ; qtot 0.69