生物信息学报告4_第1页
生物信息学报告4_第2页
生物信息学报告4_第3页
生物信息学报告4_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

吉林大学国家级生物实验教学示范中心实验报告课程名称:生物信息学 实验题目:同源模建 2012年12月9日姓名:孙瑶 学号:34100425 用户名:name101 专业:2010级生命科学与技术基地二班一、同源模建的意义 蛋白质是生命的物质基础,其功能对于生命活动的正常进行非常重要。 蛋白质的三维结构是其功能发挥的基础。 蛋白质的三维结构由氨基酸序列决定。 三维结构的测定方法:实验方法:准确,但有局限性;X射线晶体衍射方法等;生物信息学方法:从序列到结构,限制条件少;同源模建方法(homology modelling)等。二、同源模建的原理 同源模建方法是根据目标蛋白质序列和相关模板蛋白质结构确定目标蛋白质最可能结构的建模方法。目标蛋白质序列目标蛋白质结构模板蛋白质结构 由模板蛋白质结构共性特点确定定目标蛋白质可能的空间结构。包括键长、键角、肽基和侧链环的共平面性、各个原子的手性、范德华接触距离以及胱氨酸二硫键的键长、键角和二面角等。三、实验过程(以乳酸脱氢酶(lactate dehydrogenase, TvLDH为例)1寻找与TvLDH相关的结构1.1 打开查看TvLDH.ali,TvLDH的序列信息文件文件内容: P1;TvLDHsequence:TvLDH:0.00: 0.00MSEAAHVLITGAAGQIGYILSHWIASGELYGDRQVYLHLLDIPPAMNRLTALTMELEDCAFPHLAGFVATTDPKAAFKDIDCAFLVASMPLKPGQVRADLISSNSVIFKNTGEYLSKWAKPSVKVLVIGNPDNTNCEIAMLHAKNLKPENFSSLSMLDQNRAYYEVASKLGVDVKDVHDIIVWGNHGESMVADLTQATFTKEGKTQKVVDVLDHDYVFDTFFKKIGHRAWDILEHRGFTSAASPTKAAIQHMKAWLFGTAPGEVLSMGIPVPEGNPYGIKPGVVFSFPCNVDKEGKIHVVEGFKVNDWLREKLDFTEKDLFHEKEIALNHLAQGG* 显示了乳酸脱氢酶的序列信息。1.2 pdb_95.pir文件C; Produced by MODELLERP1;1swyAstructureX:1swy: 1 :A: 164 :A:MOL_ID 1; MOLECULE LYSOZYME; CHAIN A; SYNONYM LYSIS PROTEIN, MURAMIDASE,:MOL_ID 1; ORGANISM_SCIENTIFIC BACTERIOPHAGE T4; ORGANISM_COMMON VIRUS; GE: 1.06:-1.00MNIFEMLRIDEGLRLKIYKDTEGYYTIGIGHLLTKSPSLNAAKSELDKAIGRNCNGVITKDEAEKLFNQDVAAAVRGILRNAKLKPVYDSLDAVRECALINMVFQMGETGVAGFTNSLRMLQQKRWDEAAVNLAKSRWYNQTPNRAKRVITTFRTGTWDAYKNL*文件中有大量的相似信息,为不同的蛋白序列,用于下一步的比对工作。1.3 在Modeller 文件夹下面运行build_profile.py脚本$ mod9.11 build_profile.py光标在下一行闪烁几秒钟,然后另起一行停止ls命令查看文件夹下面内容发现多出了如下文件:build_profile.logbuild_profile.alibuild_profile.prfpdb_95.bin(通过序列对比的方法与乳酸脱氢酶相似度大于95%的)$ vi build_profile.prf文件返回符合相似性95%,不一样残基数 Summary of successfully produced models:Filename molpdf DOPE score GA341 score-TvLDH.B99990001.pdb 1564.73584 -38113.57812 1.00000TvLDH.B99990002.pdb 1681.38281 -37947.54688 1.00000TvLDH.B99990003.pdb 1604.21155 -38076.31250 1.00000TvLDH.B99990004.pdb 1653.67175 -38434.94141 1.00000TvLDH.B99990005.pdb 1703.68042 -38011.60938 1.00000Total CPU time seconds : 133.80DOPE score:能量值越小越好,选择TvLDH.B99990004.pdb5.结果评估5.1运行evaluate-model.py脚本$ mod9.11 evaluate-model.py出现:TvLDH.profile文件5.2运行evaluate-template.py脚本$ mod9.11 evaluate-template.py出现:1Bfile文件$ mv 1Bfile 1BdmA.profile(对文件改名)5.3 运行dope.sh脚本$modpy.sh python plot-profiles.py 出现dope-profile.png文件(粉色)四、课堂作业 选用7mdh号蛋白质,在上述流程中4.1处选择第4个文件。得出最后的图像文件。1. 比较TvLDH与所选模板的序列1.1对align2d.py文件修改from modeller import *env = environ()aln = alignment(env)mdl = model(env, file=7mdh, model_segment=(FIRST:A,LAST:A)aln.append_model(mdl, align_codes=7mdhA, atom_files=7mdh.pdb)aln.append(file=TvLDH.ali, align_codes=TvLDH)aln.align2d()aln.write(file=TvLDH-7mdh.ali, alignment_format=PIR)aln.write(file=TvLDH-7mdh.pap, alignment_format=PAP)其中下划线部分为改动后的部分1.2运行align2d.py脚本;$ mod9.11 align2d.py得到: TvLDH-7mdhA.aliTvLDH-7mdh A.pap2构建TvLDH三维结构2.1 修改model-single.py脚本from modeller import *from modeller.automodel import *env = environ()a = automodel(env, alnfile=TvLDH-7mdhA.ali, knowns=7mdhA, sequence=TvLDH, assess_methods=(assess.DOPE, assess.GA341)a.starting_model = 1a.ending_model = 5a.make()其中下划线部分为改动后的部分2.2运行model-single.py脚本;$ mod9.11 model-single.py得到文件:model-single.logTvLDH.B99990001.pdbTvLDH.B99990002.pdbTvLDH.B99990003.pdbTvLDH.B99990004.pdbTvLDH.B99990005.pdbTvLDH.D00000001TvLDH.D00000002TvLDH.D00000003TvLDH.D00000004TvLDH.D00000005TvLDH.V99990001TvLDH.V99990002TvLDH.V99990003TvLDH.V99990004TvLDH.V99990005TvLDH.rsrTvLDH.iniTvLDH.sch3.结果评估3.1.1 evaluate-model.py文件修改from modeller import *from modeller.scripts import complete_pdblog.verbose() # request verbose outputenv = environ()env.libs.topology.read(file=$(LIB)/top_heav.lib) # read topologyenv.libs.parameters.read(file=$(LIB)/par.lib) # read parameters# read model filemdl = complete_pdb(env, TvLDH.B99990004.pdb)# Assess with DOPE:s = selection(mdl) # all atom selections.assess_dope(output=ENERGY_PROFILE NO_REPORT, file=TvLDH.profile, normalize_profile=True, smoothing_window=15)其中下划线部分为改动后的部分3.1.2运行evaluate-model.py脚本$ mod9.11 evaluate-model.py出现:TvLDH.profile文件3.2.1修改evaluate-template.py脚本from modeller import *from modeller.scripts import complete_pdblog.verbose() # request verbose outputenv = environ()env.libs.topology.read(file=$(LIB)/top_heav.lib) # read topologyenv.libs.parameters.read(file=$(LIB)/par.lib) # read parameters# directories for input atom filesenv.io.atom_files_directory = ./:./atom_files# read model filemdl = complete_pdb(env, 7mdh.pdb, model_segment=(FIRST:A, LAST:A)s = selection(mdl)s.assess_dope(output=ENERGY_PROFILE NO_

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论