版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、amber中生成小分子模板第一步:生成小分子模板蛋白质中各氨基酸残基的力参数是预先存在的,但是很多模拟过程会涉及配体分子,这些有机小分子有很高的多样性,他们的力参数和静电信息不可能预存在库文件中,需要根据需要自己计算生成模板。amber中的antechamber程序就是生成小分子模板的。生成模板要进行量子化学计算,这一步可以由antechamber中附带的mopac完成,也可以由gaussian完成,这里介绍用gaussian计算的过程。建议在计算前用sybyl软件将小分子预先优化,不要用gaussian优化,大基组从头计算进行几何优化花费的计算时间太长。gaussian计算的输入文件可以用a
2、ntechamber程序直接生成,生成后去掉其中关于几何优化的参数即可将小分子优化后的结构存储为mol2各式,上传到工作目录,用antechamber程序生成gaussian输入文件,命令如下:antechamber-i49.mol2-fimol2-o49.in-fogzmat这样可以生成49.in文件,下载到windows环境,运行gaussian计算这个文件,如果发现计算时间过长或者内存不足计算中断,可以修改文件选择小一些的基组。获得输出文件49.out之后将它上传到工作目录,再用antechamber生成模板,命令如下:antechamber-i49.out-figout-o49mod.
3、mol2-fomol2-cresp运行之后就会生成一个新的mol2文件,如果用看图软件打开这个文件会发现,原子的颜色很怪异,这是因为mol2的原子名称不是标准的原子名称,看图软件无法识别。下面一步是检查参数,因为可能会有一些特殊的参数在gaff中不存在需要程序注入,命令如下:parmchk-i49mod.mol2-fmol2-o49mod这样那些特殊的参数就存在49mod这个文件中了第二步:处理蛋白质文件amber自带的leap程序是处理蛋白质文件的,他可以读入PDB各式的蛋白质文件,根据已有的力场模板为蛋白质赋予键参数和静电参数。PDB格式的文件有时会带有氢原子和孤对电子的信息,但是在这种格
4、式下氢原子和孤对电子的命名不是标准命名,力场模板无法识别这种不标准的命名,因此需要将两者的信息删除ATOM121HARGA8212.4128.89134.1281.000.00H在PDB各式里面,氢原子的信息会在第13或者14列出现H字符,可以应用grep命令删除在13或者14列出现H的行命令如下:grep-v'AH'1t4j.pdb>xgrep-v'aH'x>1t4j_noh.pdb除了删除氢和孤对电子,还应该把文件中的结晶水、乙酸等分子删除,这些分子的信息常常集中在文件的尾部,可以直接删除。处理过之后的蛋白质文件,只包括各氨基酸残基和小分子配体的
5、重原子信息,模拟需要的氢原子和水分子将在leap中添加接下来需要进一步整理蛋白质文件,主要关注氨基酸的不同存在形态和小分子的原子名称。半胱氨酸有两种存在形态,有的是两个半胱氨酸通过二硫键相连,有的则是自由的,两种半胱氨酸在力场文件中是用不同的unit来表示的,这相当于是两个完全不同的氨基酸,需要手动更改蛋白质文件中半胱氨酸的名字,桥连的要用CYX,自由的用CYS组氨酸有若干种质子态,和半胱氨酸一样,也需要查阅文献确定这些质子态,并更改残基名称最后需要修改的是配体分子的原子名,这是工作量最大的事情,仔细观察可以发现,一般PDB文件中配体的各个原子名称,和我们上面通过antechamber生成的4
6、9mod.mol2中原子名称并不一致,这会造成leap无法识别这些原子,无法为这些原子赋予力参数和静电参数,因此需要手动更改蛋白质文件中配体分子的原子名称。进行这一步可以同时用看图软件打开49mod.mol2和蛋白质文件,隐藏蛋白质文件中除配体分子以外的所有结构,旋转两个文件,让他们姿态相近,以方便观察,并且在各自均标识原子名称,然后用文字编辑软件打开蛋白质文件,核对看图软件中两个分子对应的原子名称,手动逐一修改。修改原子名称需要极大的耐心和细心,如果发生错误下一步的操作会无法继续。我现在想到的也只有这个笨办法,如果谁还有别的好法子,欢迎告诉我。现在文件的准备工作都已经完成,该开始正式的模拟了
7、第三步:生成拓扑文件和坐标文件用amber进行分子动力学模拟需要坐标和拓扑文件,坐标文件记录了各个质点所座落的坐标,拓扑文件记录了整个体系各质点之间的链接状况、力参数电荷等信息。这两个文件是由leap程序生成的amber中有两个leap程序,一个是纯文字界面的tleap,一个是带有图形界面的Xleap。但是amber的图形界面做得很差,用远程登录使用图形界面不仅麻烦而且慢,所以我比较偏爱使用tleap,两个leap的命令是完全一样的,其实用哪一个都无所谓。启动tleap,在shell里输入命令tleap,leap就启动了,shell里会显示-I:Adding/usr/local/amber8/
8、antechamber-1.23/dat/leap/preptosearchpath.-I:Adding/usr/local/amber8/antechamber-1.23/dat/leap/libtosearchpath.-I:Adding/usr/local/amber8/antechamber-1.23/dat/leap/parmtosearchpath.-I:Adding/usr/local/amber8/antechamber-1.23/dat/leap/cmdtosearchpath.WelcometoLEaP!(noleaprcinsearchpath)>这个是leap的提
9、示符下面要调入库文件。amber是模拟生物分子的好手,主要就是依靠专门为蛋白质多糖核酸量身订做的amber力场,力场的所有参数都存储在库文件里,所以打开leap第一件事便是调入库文件。amber提供了很多种库,这里我们只用到两个库,gaff和02库,输入命令:>sourceleaprc.gaff>sourceleaprc.ff02之后两个库就调入进来了这时可以用list命令看看库里都有什么:这里面罗列的就是库里面的unit,包括20种氨基酸、糖以及核酸还有一些常见离子的参数下面一步是调入配体分子的模板,首先补全参数,输入命令:>loadamberparams49mod然后读入
10、模板文件,输入命令:>MOL=loadmol249mod.mol2其中MOL是unit的名字,要保证这个名字和pdb文件中配体的残基名完全一致,否则系统仍然无法识别pdb文件中的小分子在再输入list命令会发现库里面多了一个unit:那个就是配体分子的模板下面读入pdb文件,输入命令:>comp=loadpdb1t4j_noh.pdb如果输入这个命令之后,屏幕上出现了大量的创建unit或者atom的信息,如下所示,则说明上面一步的pdb文件处理没有做好,还需要重新处理,通常这种情况都发生在配体分子上面,有时则是因为蛋白质中存在特殊残基。CreatingnewUNITforresid
11、ue:FRJsequenee:1Createdanewatomnamed:O36withinresidue:.RCreatedanewatomnamed:S33withinresidue:.RCreatedanewatomnamed:035withinresidue:.RCreatedanewatomnamed:N34withinresidue:.R如果屏幕仅仅显示添加原子,这说明输入的PDB文件中缺失了部分重原子,leap根据模板自动补全了这些缺失的原子,这种情况不会影响进一步的计算Addedmissingheavyatom:.R.AAddedmissingheavyatom:.R.AAdd
12、edmissingheavyatom:.R.AAddedmissingheavyatom:.R.A根据体系的具体情况,还可能要将成对的CYX残基中的二硫键相连,有时候还会链接其他原子,比如将糖基链接在氨基酸残基上,用bond命令可以完成,命令用法如下:>bondcomp.35.SGcomp.179.SG其中comp是刚才读入的分子名称,35和179是残基序号,SG是CYX残基模板中硫原子的名称,用comp.35.SG这样的语法就可以定位一个原子果希望进行考虑溶剂效应的动力学模拟,可能还需要为体系加上水,加水有很多种命令,这里只列举一个:>solvateboxcompTIP3PBOX
13、10.0solvatebox命令是说要加上一个方形的周期水箱,comp指要加水的分子,TIP3PBOX是选择的水模板名称,10.0是水箱子的半径的体系总电荷不为0,为了模拟稳定,需要加入抗衡离子,系统会自动计算体系的静电场分布,在合适的位置加上离子,命令如下:>addionscompNa+0意思是用钠离子把体系总电荷补平,还可以选择其他库里面有的离子。完成这一步之后就可以输出拓扑文件和坐标文件了,但是为了方便起见,在运行最后一步之前要先把leap里加工好的分子单独存成一个库文件,以后可以直接调用这个库文件,免得重复上面的操作:>saveoffcompItaj.off这样就生成了一个
14、off文件在那里,下面输出拓扑文件和坐标文件>saveamberparmcomp1t4j.prmtop1t4j.inpcrdCheckingUnit.Buildingtopology.Buildingatomparameters.Buildingbondparameters.Buildingangleparameters.Buildingpropertorsionparameters.Buildingimpropertorsionparameters.total1impropertorsionappliedBuildingH-Bondparameters.NotMarkingper-re
15、sidueatomchaintypes.Markingper-residueatomchaintypes.(ResidueslackingconnectO/connect1-thesedon'thavechaintypesmarked:restotalaffectedCMET1)(norestraints)>quit现在准备好拓扑文件和坐标文件,接下来就可以开始能量优化和动力学模拟了。如果愿意的话还可以用ambpdb这个命令生成一个pdb文件,直观地看一看生成了什么东西,命令如下:$ambpdb-p1t4j.prmtop<1t4j.inpcrd>kankan.pdb|
16、NewformatPARMfilebeingparsed.|Version=1.000Date=09/08/06Time=16:36:09$可以下载之后用看图软件欣赏,如果加了溶剂盒子的话,看的时候可要小心,会恨吓人的样子。第四步:能量优化用amber进行分子动力学模拟需要坐标和拓扑文件,这在上一步已经完成了,分别生成了1t4j.prmtop和1t4j.inpcrd两个文件,下面一步就是动力学模拟之前的能量优化了。由于我们进行的起始结构来自晶体结构或者同源模建,所以在分子内部存在着一定的张力,能量优化就是在真正的动力学之前,释放这些张力,如果没有这个步骤,在动力学模拟开始之后,整个分子可能会因
17、此散架。能量优化由sander模块完成,运行sander至少需要三个输入文件,分别是分子的拓扑文件,坐标文件以及sander的控制文件。现在分子的拓扑文件和坐标文件已经完成,需要建立输入文件,min_1.inInitialminimisationofourstructures&cntrlimin=1,maxcyc=4000,ncyc=2000,cut=10,ntb=1,ntr=1,restraint_wt=0.5restraintmask=':1-283'/文件首行是说明,说明这项任务的基本情况;&cntrl与/之间的部分是模拟的参数其中imin=1表示任务是能
18、量优化,maxcyc=4000表示能量优化共进行4000步,ncyc=2000表示在整个能量优化的4000步中,前2000步采用最陡下降法,在2000步之后转换为共轭梯度法,如果模拟的时候不希望进行方法的转换,可以再加入另一个关键词NTMIN,如果NTMIN=0则全程使用共轭梯度法,NTMIN=2则全程使用最陡下降法,此外还有=3和=4的选项,分别是xmin法和Imod法,具体情况可以看手册。第二行的cut=1O表示非键相互作用的截断值,单位是埃,ntb=1表示使用周期边界条件,这个选项要和前面生成的拓扑文件坐标文件相匹配,如果前面加溶剂时候用的是盒子水,就设置ntb=1,如果加的是层水,那就
19、应该选择ntb=O;ntr=1表示在能量优化的过程中要约束一些原子,约束的是哪些原子呢?后面有。第三行和第四行都是关于约束原子的信息,restraint_wt=0.5限定了约束的力常数,在这里约束原子就是把原子用一根弹簧拉在固定的位置上,一旦原子偏离固定的位置,系统就会给他施加一个回复力,偏离的越远,回复力越大,回复力就是由这个力常数决定的,单位是Kcal/(mol*A)。restraintmask=':1-283'表示约束的是从1到283号残基,在这个分子中,1-283号残基是蛋白质上的氨基酸残基,从284号开始,就都是水了,所以这个命令的意思就是,约束整个蛋白质,自由地优化
20、溶剂分子。因为溶剂分子是前面的tleap自动给加上的,所以一定要额外多关注一些。下面运行sander来执行这个优化:$sander-O-imin_1.in-p1t4j.prmtop-c1t4j.inpcrd-ref1t4j.inpcrd-r1t4j_min1.rst-o1t4j_min1.out命令中,-0表示覆盖所有同名文件,-imin_1.in表示sander的控制文件是min_1.in,-p1t4j.prmtop表示分子的拓扑文件,-c1t4j.inpcrd表示坐标文件,-ref1t4j.inpcrd是参考坐标文件,只有在控制文件中出现关键词ntr=1的时候才需要给sander指定-ref文件,这是约束原子的参考坐标,-ref1t4j.inpcrd就是说以1t4j.inpcrd中的坐标为准进行约束原子的优化。以上这四个是输入文件。-r1t4j_min1.rst表示经过模拟之后新的原子坐标会输出到1t4j_min1.rst文件中,-o1t4j_min1.out则表示优化过程中的相关信息都会写入到1t4j_min1.out文件中。运行起这个命令之后,等拿到1t4j_min1.rst文件就意味着对溶剂的优化已经差不多了,显然下面还需要对蛋白质本身进行优化,这个优化还要分两步进行,控制文件分别是min_2.in
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- (新教材)2026人教版三年级下册数学 1.2 平移 教学课件
- 2026年收钟表合同(1篇)
- 路侧设备安装施工标准化项目可行性研究报告
- 抛光糖果项目可行性研究报告
- 纳米自清洁玻璃生产经营项目可行性研究报告
- 跆拳道馆项目可行性研究报告
- 2025年上海市会展中心大型展会期间临时便利店运营保障可行性研究报告
- 2026年及未来5年市场数据中国陕西白酒行业市场全景监测及投资策略研究报告
- 高中信息技术信息系统在木雕工艺品制作工艺与生产进度跟踪中的应用课件
- 2025 高中信息技术数据与计算之算法的粒子群优化算法策略课件
- 智能温室大棚建设项目技术标施工组织设计施工方案(技术方案)
- 四川成都历年中考语文古诗欣赏试题汇编(2003-2023)
- 头顶一颗珠对VCI大鼠血脑屏障及紧密连接蛋白的影响及作用机制研究
- 接触网工学习通练习试题
- 锅炉暖风器改造施工方案
- 【英语】五年级英语下册人教pep版Unit-1-My-day-单元测试卷
- 一元线性回归模型说课课件2024年第十届全国中小学实验教学说课活动
- 成都市崇州市2024年小升初必考题数学检测卷含解析
- 精索静脉曲张教学
- 停车位租赁合同可打印模板
- 2022年版初中物理课程标准解读-课件
评论
0/150
提交评论