西 安 交 通 大 学 实 验 报 告 生物信息学.doc_第1页
西 安 交 通 大 学 实 验 报 告 生物信息学.doc_第2页
西 安 交 通 大 学 实 验 报 告 生物信息学.doc_第3页
西 安 交 通 大 学 实 验 报 告 生物信息学.doc_第4页
西 安 交 通 大 学 实 验 报 告 生物信息学.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实验名称 核酸和蛋白质序列数据的使用系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字: 实验目的:了解常用的序列数据库,掌握基本的序列数据信息的查询方法。实验步骤:在序列数据库中查找某条基因序列(insulin人的),通过相关一系列数据库的搜索、比对与结果解释实验结果:1.该基因的功能是?DNA结合、RNA结合、雄激素受体结合、酶结合、蛋白结合、转录激活活性、转录调控区的DNA结合、微管蛋白结合、泛素蛋白与连接酶结合、泛素蛋白连接酶的活性、提高泛素蛋白连接酶的活性、锌离子结合2. 编码的蛋白质序列是怎样的? 10 20 30 40 50 60 MALWMRLLPL LALLALWGPD PAAAFVNQHL CGSHLVEALY LVCGERGFFY TPKTRREAED 70 80 90 100 110 LQVGQVELGG GPGAGSLQPL ALEGSLQKRG IVEQCCTSIC SLYQLENYCN 3. 该蛋白质有没有保守的功能结构域该蛋白质有保守的功能结构域。分别为cd00027(Location:1763 1842 Blast Score: 107) cd00162(Location:23 68 Blast Score: 134) pfam04873(Location:655 978 Blast Score: 1301) pfam12820(Location:344 507 Blast Score: 809)pfam13923(Location:20 65 Blast Score: 135)4. 该蛋白质的功能是怎样的?E3泛素蛋白连接酶,专门介导LYS-6-联泛素链的形成,并通过促胞对DNA损伤的反应,在DNA修复中起着核心的作用;目前还不清楚是否也介导其他类型的泛素链形成。E3泛素蛋白连接酶的活性是其抑癌能必需的。BARD1- BRCA1异源二聚体协调各种不同的细胞通路,如DNA损伤修复,泛素化和转录调控,以维持基因组稳定性。调节中心体微核。从G2到有丝分裂的正常细胞周期进程所必需的。参与转录调控在DNA损伤反应中的P21。为FANCD2靶向DNA损伤位点所需。可以用作转录调控因子。绑定到ACACA和防止其去磷酸化,抑制脂质合成。5. 该蛋白质的三级结构是什么?如果没有的话,和它最相似的同源物的结构是什么样子的?给出示意图。该蛋白有三级结构,如图所示西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实 验 名 称 双序列比对系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字: 实验目的:1、练习使用动态规划算法进行双序列比对;2、理解打分矩阵和参数对;3、双序列比对结果的影响;4、理解动态规划算法的原理。实验步骤及结果:1. RNP1和RNP2是否得到比对? 选择至少三个(差别大的)空位罚分和延伸值来进行比对(1)空位开启 1.0 空位延伸:0.5 结果:比对成功# -gapopen 1.0# -gapextend 0.5# Length: 75# Identity: 38/75 (50.7%)# Similarity: 51/75 (68.0%)# Gaps: 14/75 (18.7%)# Score: 203.5EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFRAIGPINTCRIMRDYK-TGYSY 45 |.|:| | | : :|.:|.|.:|:| | |.|.EMBOSS_001 1 MD-SKTNLIVNYLPQNMTQD-E-FKSLFGSIGDIESCKLVRD-KITGQSL 46EMBOSS_001 46 GYAFVDFTSEM-DSQRAIKVLNG- 67 |.|: |: |:.:|.| EMBOSS_001 47 GYGFVNY-SD-PNDADKAINTLNGL 69(2)空位开启:5.0 空位延伸:0.5 结果:比对成功# -gapopen 5.0# -gapextend 0.5# Length: 69# Identity: 35/69 (50.7%)# Similarity: 47/69 (68.1%)# Gaps: 2/69 ( 2.9%)# Score: 181.0EMBOSS_001 1 -ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAF 49 .|.|:|.|.:|.:|.|.:|:|.|.|.|.|EMBOSS_001 1 MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGF 50EMBOSS_001 50 VDFTSEMDSQRAIKVLNG- 67 |:.|:.:|.| EMBOSS_001 51 VNYSDPNDADKAINTLNGL 69(3)空位开启:1.0 空位延伸:10.0 结果:比对成功# -gapopen 1.0# -gapextend 10.0# Length: 74# Identity: 38/74 (51.4%)# Similarity: 51/74 (68.9%)# Gaps: 12/74 (16.2%)# Score: 203.0EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFRAIGPINTCRIMRDYK-TGYSY 45 |.|:| | | : :|.:|.|.:|:| | |.|.EMBOSS_001 1 MD-SKTNLIVNYLPQNMTQD-E-FKSLFGSIGDIESCKLVRD-KITGQSL 46EMBOSS_001 46 GYAFVDFTSE-MDSQRAIKVLNG- 67 |.|: |: .|:.:|.| EMBOSS_001 47 GYGFVNY-SDPNDADKAINTLNGL 692a. 算法是否找到RNP1和 RNP2的正确比对?如上图b. 当空位开启罚分高时,结果发生什么变化?对比上图(1)和(2)得知空位开启罚分高时,结果得分变低c. 当空位延伸罚分高时,结果发生什么变化?对比(1)和(3)得知空位延伸罚分高时,结果变低,但不明显 d. 为什么k个连续的空位罚分要小于k个间隔的空位罚分?因为空位开启的罚分影响要高于空位延伸罚分,综合2a和b可知,所以k个连续空位罚分要比k个间隔空位罚分低。使用PAM250矩阵重复上述过程。3. 比对结果是否发生变化?(1)# -gapopen 1.0# -gapextend 0.5# Length: 76# Identity: 38/76 (50.0%)# Similarity: 56/76 (73.7%)# Gaps: 16/76 (21.1%)# Score: 213.5EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFR-AIGPINTCRIMRDYK-TGY-S 44 .|:|:| | | : :| :|.|:|:| | | |EMBOSS_001 1 MDSKTNLIVNYLPQNMTQD-E-FKSLF-GSIGDIESCKLVRD-KITG-QS 45EMBOSS_001 45 YGYAFVDFTSEM-DSQRAIKVLNG- 67 .|:|: |: |:|:.| EMBOSS_001 46 LGYGFVNY-SD-PNDADKAINTLNGL 69(2)# -gapopen 5.0# -gapextend 0.5# Length: 70# Identity: 36/70 (51.4%)# Similarity: 55/70 (78.6%)# Gaps: 4/70 ( 5.7%)# Score: 191.0EMBOSS_001 1 -ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYK-TGYSYGYA 48 .|:|:|:.|:.:|.:|.|:|:| | |.|.|:EMBOSS_001 1 MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRD-KITGQSLGYG 49EMBOSS_001 49 FVDFTSEMDSQRAIKVLNG- 67 |:.|:|:.| EMBOSS_001 50 FVNYSDPNDADKAINTLNGL 69(3)# -gapopen 1.0# -gapextend 1.0# Length: 75# Identity: 38/75 (50.7%)# Similarity: 56/75 (74.7%)# Gaps: 14/75 (18.7%)# Score: 213.0EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFR-AIGPINTCRIMRDYK-TGY-S 44 .|:|:| | | : :| :|.|:|:| | | |EMBOSS_001 1 MDSKTNLIVNYLPQNMTQD-E-FKSLF-GSIGDIESCKLVRD-KITG-QS 45EMBOSS_001 45 YGYAFVDFTSE-MDSQRAIKVLNG- 67 .|:|: |: .|:|:.| EMBOSS_001 46 LGYGFVNY-SDPNDADKAINTLNGL 694a. RNP1 和RNP2 是否在局部比对中得到比对?RNP1 和RNP2 在局部比对中比对成功。b. 局部比对的生物学意义是什么?局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义c. 为什么在这种比对中我们选择局部比对而不是全局比对?答:局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。5. 比对结果发生了什么变化?答:从3的图中可以看出,在同一个打分矩阵下,比对结果基本没有差别;在不同的打分矩阵下,比对结果也基本无区别,但得分有所变化。西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实 验 名 称 序列的点阵分析系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字: 实验目的:点阵分析是双序列分析最直观的工具,通过本实验了解点阵分析的原理和方法。教学基本要求:了解和熟悉点阵分析的原理和参数对分析结果的影响,可以对结果进行解读和解释。回答问题:点阵分析的基本原理是什么? 点阵法是双序列比对的基本方法,比对法的基本思想是:将两条待比较的序列分别放在矩阵的两条轴上,从上往下,当对应的行和列的序列字符匹配时,则在矩阵对应的位置作出点标记,逐个比较所有的字符对,最终形成点阵图。两条完全相同的序列在点阵图中表现为一条连续的对角线,相似性很高却又不完全相同的序列,表现为不连续的对角线,中间断掉的部分表示在那些区域字符不匹配。1. 重复序列通过点阵分析可以很容易的发现序列中的重复,果蝇的一个蛋白质(索引号码:P24014)中具有几个重复片段,请通过dotlet分析,找到这些序列重复的片段。如图所示,除了对角线有8条浅色的线,因为对称可知共四条重复片段。从uniprot注释信息确定有四条重复片段。2. 低复杂度区域恶性疟原虫抗原蛋白前体(索引号码:P69192)具有一段低复杂度区域的序列,通过点阵分析找到这个特点丝氨酸重复域是一个黑色的方形,这是一个低复杂度的地区,其中一个或几个残基表现出或多或少完美的周期性的特点。西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实 验 名 称 多序列比对系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字: 实验目的:在序列分析中,多序列比对具有广泛的应用,是许多其他分析的基础和前提,比如进化发生分析、构建位置特异性打分矩阵、找到一致序列等,本实验的目的是熟悉多序列比对相关的操作和编辑方法。1. 使用CLUSTALW 算法,比对一组蛋白质序列,序列的索引号码为:P25454,P25453,P0A7G6,P48295。a. 练习使用EBI CLUSTALWb. 将序列数据拷贝复制到窗口中;c. 采用默认参数进行比对;结果如下图 clustalw算法的基本原理:ClustalW的基本原理是首先做序列的两两比对,根据该两两比对计算两两距离矩阵,然后用NJ或者UPGMA方法构建Binary进化树作为guide tree,最后用progressive的方法根据guide tree逐步添加序列进行比对,一直到所有序列都比对好.2. 在BAliBASE网站查找一组蛋白质:1csy。这些蛋白质的一致性为20-40%,属于BAliBASE参考序列1。Clustalw2muscleT-coffe分别与下图比较,一致得1分,不一致得0分。(1) CLUSTALW2比对得分10分;(2) MUSCLE比对得分13分;(3) T-Coffee比对得分 14分;所以T-coffe结果更好西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实 验 名 称 HIV病毒的进化分析系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字: 实验目的:了解和学习系统发生分析的步骤和基本方法实验步骤:在MEGA5.05中,AlignEdit/Build AlignmentRetrieve sequences from a file,导入上述的.fasta的文件,选择AlignmentAlign By Clustalw或Align By Muscle。选择默认参数进行比对。将结果保存。(为了节约时间,多序列比对的结果我们可以不处理)结果如下图在MEGA主程序中,选择Phylogeny,选择一种构建树的方法,导入上述保存的结果,在参数选择中,“Phylogeny Test”选择“Bootstrap method”,选择500或者1000,其他参数默认。 选择500时建树:对树的解释: NJ法根据修正净差异值先确定节点,再根据各部分到节点的距离构建树。各节点所标的数值为该节点到前一节点的距离。由图可看出,这16条序列是同源序列,具有共同的祖先序列,即SIVmon Cercopithecus Monkeys序列。1. 系统发生分析的步骤? 主要为三步(1)分子序列或特征数据的分析;(2)系统发生树的构造;(3)结果的检验。2. 为什么不直接使用序列的全长,而只是部分序列? 一是由于序列的长度过长,造成比对时的误差较大,同时,由于各序列的长度不同,可能造成比对的失真,同时,比对过长的序

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论