生物序列分析_第1页
生物序列分析_第2页
生物序列分析_第3页
生物序列分析_第4页
生物序列分析_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学实验报告评分大理大学实验报告 课程名称 生物信息学 实验名称 生物序列分析 20152016学年度第 3 学期一、 实验目的掌握这门课程基础。二、实验环境1、硬件配置:Intel(R)Core(TM) i5 4200M CPU2.50HZ 2.50HZ 三、实验内容第一轮1、 世界三大核酸数据库是什么?分别查出主页2、 查询GENBANK数据量、SWISS-PROT数据量和PubMed中“protein”的研究文件3、 用GENSCAN预测AC002390序列的基因/外显子4、 用CpGplot预测AC002390序列的CpG岛第二轮1、 用POLYAH预测AC002390序列的转录终子信号2、 用promoterScan预测AC002390序列的启动子区域3、 用CodonW分析waxy基因所得的RSCU值和个数4、 用ProtParam分析G00016序列理化性质第三轮1、 用ProtScale分析P02699序列疏水性2、 用TMpred分析P51684序列跨膜螺旋区3、 用SignaIP分析P05019序列前导肽4、 用COILS分析GO45_HUMAN卷曲螺旋5、 生物分子网络主要有哪些?其特点?第四轮1、使用BLAST搜索ZEB1基因和ZEB1蛋白质2、使用BLAST搜索ZEB2基因和ZEB2蛋白质3、使用BLAST搜索FN1基因和FN1蛋白质4、使用BLAST搜索CD44基因和CD44蛋白质5、收集蛋白质互作数据库,并且将其基本信息制成一张表格 第五轮1、使用ClustalX软件进行多序列比对,文件为miR-19.fasta2、使用ClustalX软件进行多序列比对,文件为SARS-19.fasta3、使用MEGA软件进行系统进化树分析,分析文件为miR-19.fasta4、使用MEGA软件进行系统进化树分析,分析文件为SARS-19.fasta5、搜集miRNA靶基因数据库,并且将其基本信息制成一张表格四、实验结果与分析第一轮1、世界三大核酸数据库是什么?分别查出主页 图1:EMBL数据库主页图2:DDBJ数据库主页 图3: GenBank数据库主页分析: 图1:欧洲分子生物学实验室EMBL,目的在于促进欧洲国家之间的合作来发展分子生物学的基础研究和改进仪器设备、教育工作等。图2: DDBJ主要向研究者收集DNA序列信息并赋予其数据存取号,信息来源主要是日本的研究机构,亦接受其他国家呈递的序列,数据库通过WWW环球网,匿名FTP,e-mail或Gopher方式为广大研究人员服务。图3:NCBI中的GenBank 是指美国国立生物技术信息中心,基本研究包括四项:建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统;实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究;加速生物技术研究者和医药治疗人员对数据库和软件的使用;全世界范围内的生物技术信息收集的合作努力。2、查询GENBANK数据量、SWISS-PROT数据量和PubMed中“protein”的研究文件 图4:查询GENBANK的数据量及放大图 图5:查询SWISS-PROT数据量结果及放大图 图6:PUBMED中protein的研究文献3、用GENSCAN预测AC002390序列的基因/外显子 图7:GENSCAN的操作界面及放大图 图8:用GENSCAN预测AC002390序列的基因/外显子输出图分析:从上图中可以得知,GENSCAN 可以对序列中的多个基因同时进行识别,且对由序列中识别出的基因按顺序进行编码, P表示分析结果为外显子的可能性,外显子从1.011.12有11个外显子,从532657长度为126。当P0.99时为可能性极高的外显子,预测结果与实际完全吻合;当0.50.99时为中等可能性的外显子,预测结果与实际大多数情况下吻合;当P0.5时为低可能的外显子,预测结果不可靠。4、用CpGplot预测AC002390序列的CpG岛 图9:CpGplot操作界面及放大图 图10:用CpGplot预测AC002390序列的CpG岛输出图分析:从上图可知CGP岛为位于启动子和第一外显子区域,长度超过200bp的为CPG岛。 第二轮1、用POLYAH预测AC002390序列的转录终子信号图11:POLYAH操作界面及放大图图12:用POLYAH预测AC002390序列的转录终子信号输出图分析:从结果图中可以看出,AC002390序列所有可能的50个PloyA位点的位置(Pos)和权重(LDF),列如在52398 碱基处有PloyA信号,权重2.54,值得注意的是真核生物基因组序列本身存在大量的重复序列。 2、用promoterScan预测AC002390序列的启动子区域 图13:promoterScan操作界面及放大图 图14:用promoterScan预测AC002390序列的启动子区域输出图分析:promoterScan以单元的形式列出了所有可能的启动子区域,值得注意的是,因为转录因子长度较短,无论是同源匹配还是模式识别,预测结果的假阳性比例都很高,需要结合外显子/内含子预测以及GpG岛预测的结果进行综合判断。此外,并非所有的基因的上游区域都符合已知启动子结构的模式。3、用CodonW分析waxy基因所得的RSCU值和个数 图15:用CodonW分析waxy基因所得的RSCU值和个数输出图及放大图4、用ProtParam分析G00016序列理化性质 图16:ProtParam操作界面及放大图 图17:用ProtParam分析G00016序列理化性质输出图第三轮1、用ProtScale分析P02699序列疏水性 图18:ProtScale操作界面及放大图 图19:phob. / Kyte & Doolittle标度 图20:标度权值 图21:用ProtScale分析P02699序列疏水性输出图形显示分析:从Protscale 分析p02699序列结果来看,该蛋白存在7个高疏水性区域,分别分布在4060区域、7590区域、125135区域、155170区域、205230区域、255275区域、285295区域;而4个主要的最小分值区域则位于67、147、196、247氨基酸位点附近,这些区域为高亲水性。2、用TMpred分析P51684序列跨膜螺旋区 图22:TMpred操作界面及放大图 图23:7个跨膜螺旋区图24:7个可能的跨膜螺旋区的相关性列表 图25:7个跨膜螺旋区的图形显示结果分析:从结果图23可以看出:286305是从膜外到膜内的跨膜螺旋,315335是从膜内到膜外的跨膜螺旋,351370是从膜外到膜内的跨膜螺旋,397416是从膜内到膜外的跨膜螺旋,443466是从膜外到膜内的跨膜螺旋,483505是从膜内到膜外的跨膜螺旋,530550是从膜外到膜内。总分为12777。3、用SignaIP分析P05019序列前导肽 图26:SignaIP操作界面及放大图 图27:SignaIP分析P05019序列前导肽输出图分析: 从图中可以得出,前导肽是信号肽的一种,性质为带正电的碱性氨基酸,缺失带负电的酸性氨基酸。4、用COILS分析GO45_HUMAN卷曲螺旋 图28:COILS操作界面图 图29:用COILS分析GO45_HUMAN卷曲螺旋输出图5、生物分子网络主要有哪些?其特点?在生物系统中包含很多不同层面和不同组织形式的网络。目前,基因转录调控网络、生物代谢与信号传导网络、蛋白质相互作用网络是最常见的生物分子网络。折叠基因调控网络 所有生物在生长发育和分化过程中,以及在对外部环境的反应中,各种相关基因有条不紊的表达起着至关重要的作用。 基因调控网络包括:基因调控检测、基因转录调控数据库、基因转录调控网络折叠代谢网络 在生物化学领域,代谢通路是指细胞中代谢物质在酶的作用下转化为新的代谢物质过程中所发生的一系列生物化学反应。而代谢网络则是指由代谢反应以及调节这些反应的调控机制所组成的描述细胞内代谢和生理过程的网络。折叠信号传导网络 生物中的信号传导(signal transduction)则是指细胞将一种类型的信号或刺激转换为其他生物信号最终激活细胞反应的过程。同代谢通路一样,信号传导的过程中多个生物分子在酶的作用下按照一定的顺序发生一系列生理化反应,由此得到了信号传导通路。信号传导网络即是指参与信号传导通路的分子和酶以及其间所发生的生化反应所构成的网络。折叠蛋白质互作网络 蛋白质相互作用通常可以分为物理互作和遗传互作。物理互作是指蛋白质间通过空间构象或化学键彼此发生的结合或化学反应,是蛋白质互作的主要研究对象。而遗传互作则是指在特殊环境下,蛋白质或编码基因收到其他蛋白质或基因的影响,常常表现为表型变化之间的相互关系。第四轮1、使用BLAST搜索ZEB1基因和ZEB1蛋白质ZEB1基因:NG_017048.1ZEB1蛋白质:NP_001310583.1 图30:ZEB1基因序列 图31:BLAST搜索ZEB1基因输出图 图32:ZEB1蛋白质序列 图33:BLAST搜索ZEB1蛋白质输出图2、使用BLAST搜索ZEB2基因和ZEB2蛋白质ZEB2基因: NG_016431.1ZEB2蛋白质: JAP00777.1 图34:ZEB2基因序列 图35:BLAST搜索ZEB2基因输出图图36:ZEB2蛋白质序列 图37:BLAST搜索ZEB2蛋白质输出图3、使用BLAST搜索FN1基因和FN1蛋白质FN1基因: NG_012196.1FN1蛋白质:NP_001293061.1 图38:FN1基因序列 图39:BLAST产生的FN1核酸序列输出图 图40:FN1蛋白质序列 图41:BLAST产生的FN1蛋白质序列输出图4、使用BLAST搜索CD44基因和CD44蛋白质CD44基因: NG_008937.1CD44蛋白质: XP_011518791.1 图42:CD44基因序列 图43:BLAST产生的CD44基因序列输出图 图44:CD44蛋白质序列 图45:BLAST产生的CD44蛋白质序列输出图5、收集蛋白质互作数据库,并且将其基本信息制成一张表格 表1:蛋白质互作数据库数据库名称网址说明BINDhttp:/bind.ca/生物分子相互作用数据库InterDom.sg/结构域相互作用数据库HPRD/人类蛋白质参考数据库PDZbase/services/pdz/start包含PDZ结构域的蛋白质相互作用数据库biogrid/蛋白和遗传相互作用数据,主要来自于酵母、线虫、果蝇和人MPPIhttp:/fantom21.gsc.riken.go.jp/PPI/脯乳动物相互作用数据库HPIDhttp:/wilab.inha.ac.kr/hpid/人类蛋白质相互作用数据库STRINGhttp:/string.embl.de/蛋白质相互作用网络数据库DIP/蛋白质相互作用数据数据库IntActhttp:/www.ebi.ac.uk/intact/index.html蛋白质相互作用数据库 第五轮1、使用ClustalX软件进行多序列比对,文件为miR-19.fasta 图46:ClustalX软件进行多序列比对输出图2、使用ClustalX软件进行多序列比对,文件为SARS-19.fasta 图47:ClustalX软件进行多序列比对输出图3、使用MEGA软件进行系统进化树分析,分析文件为miR-19.fasta 图48:MEGA软件DNA结果输出图 图49:MEGA软件进行系统进化树分析DNA查询结果输出图4、使用MEGA软件进行系统进化树分析,分析文件为SARS-19.fasta5、搜集miRNA靶基因数据库,并且将其基本信息制成一张表格 表2:miRNA靶基因数据库数据库名称网址说明miRNAMap.tw/miRNAMap数据库搜集了多个物种的经过试验证明的microRNA和miRNA靶基因,其中包括人类的、小鼠的、大鼠的以及其他多细胞动物的基因组。miRGatorhttp:/genome.ewha.ac.kr/miRGator/miRGator.htmlmiRGator数据库是一个引导对miRNA进行功能阐释的工具。功能分析和表达谱结合靶基因预测,可以对miRNA的生物学功能进行推测。miRWalkhttp:/www.ma.uni-heidelberg.de/apps/zmf/mirwalk/miRWalkis是一个综合性数据库,提供来自人类、小鼠和大鼠的miRNA的预测信息和经过验证的位于其靶基因上的结位点。CoGeMiRhttp:/cogemir.tigem.it/CoGeMiR数据库总结关于在进化过程中microRNA在不同动物中的保守性。该数据库搜集已知的和预测的microRNA关于染色体定位、保守性和表达谱方面的信息。PMRDhttp:/BioI/PMRD/PMRD是一个关于植物microRNA数据库,包括了microRNA序列和它们的靶基因、二级结构、表达谱、基因组搜索等等,并且该数据库尝试着整合大量的关于植物microRNA的数据。miRecords/动物 mirna的靶相互作用的数据库, 包括人工收集实验验证的, 预测的 miRNA的靶目标. 靶标预测工具DIANA-microT, MicroInspector。.miRexhttp:/miracle.igib.res.in/mirex/miRex是一个分析microRNA基因表达的在线资源库,搜集,整理和分析已发表的关于microRNA基因表达的数据,它允许研究者通过数千数据点来分析基因表达和提供micro

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论