




已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学软件及使用概述,刘吉平liujiping,生物信息学的概念:,生物信息学是一门新兴的交叉学科,它将数学和计算机知识应用于生物学,以获取、加工、存储、分类、检索与分析生物大分子的信息,从而理解这些信息的生物学意义。,生物信息学软件主要功能,分析和处理实验数据和公共数据,加快研究进度,缩短科研时间提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验实验数据的自动化管理寻找、预测新基因及其结构、功能蛋白质高级结构及功能预测(三维建模,目前研究的焦点和难点),功能1.分析和处理实验数据和公共数据,加快研究进度,缩短科研时间,核酸:序列同源性比较,分子进化树构建,结构信息分析,包括基元(Motif)、酶切点、重复片断、碱基组成和分布、开放阅读框(ORF),蛋白编码区(CDS)及外显子预测、RNA二级结构预测、DNA片段的拼接;蛋白:序列同源性比较,结构信息分析(包括Motif,限制酶切点,内部重复序列的查找,氨基酸残基组成及其亲水性及疏水性分析),等电点及二级结构预测等等;本地序列与公共序列的联接,成果扩大。,Antheprot5.0DotPlot点阵图,Dotplot点阵图能够揭示多个局部相似性的复杂关系,PeptoolLite-DotPlot点阵图,DNASIS2.5RNA二级结构预测,DNASIS2.5tRNA二级结构预测,RNAStructure3.5RNA二结构预测,Omiga2.0ORFMap,DNAStar之Protean对氨基酸的亲疏水性分析:helicalwheel图,不同颜色代表不同的AA,功能2.提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验,用软件设计PCR引物,测序引物或杂交探针;设计克隆策略,构建载体;做模拟电泳实验,即模拟核酸内切酶或内肽酶对相应的底物分子切割后的电泳行为;蛋白跨膜区域分析,信号肽潜在断裂点预测。,Winplas2.6质粒构建,Atheprot5.0预测蛋白跨膜区域,Antheprot5.0预测信号肽断裂点,功能3.用计算机管理实验室数据及文献资料,实验室结果的储存、管理和申报工作;从网络数据库获得的序列文件(由ENTREZ集成检索系统所得的数据文件可以进入EndNote或者ReferenceManager储存管理)或资料文献的管理;软件:EndNote,ReferenceManager。,ReferenceManager9界面,功能4.用计算机预测新基因及其结构和功能,对CDS(CodingSequence)蛋白编码区的预测准确率已达到90%以上对整个基因结构的预测存在一定难度PWM(位置权重矩阵)算法由物化原理技术开发,侧重于找基因表达系统和核酸相互作用的位点。给信号序列各个位置每种可能出现的核苷酸分配一个分数,将各位置分数相加后得出该序列作为潜在作用位点的分数。,DNASIS2.5对蛋白编码区的预测A.(CodonBias),DNASIS2.5对蛋白编码区的预测B.(RareCodon),DNASIS2.5对蛋白编码区的预测C.(ORFList),DNASTAR之GeneQuest预测CDS,功能5.蛋白质高级结构预测,该项技术算法十分复杂,尚未成熟。PDB及MMDB数据库目前仍然禁止收录软件预测出来的蛋白高级结构模型。X射线晶体学技术和多维核磁共振技术是当前人们认识蛋白高级结构的主要手段,但两种技术都有不足之处。前者要求必需得到高标准的蛋白晶体,后者对分子量大于3万的大蛋白不能测定。因此理论模拟和结构预测显得十分重要。序列与结构关系的根源在于“蛋白质折叠的问题”,这是近期研究关注的焦点。,DNASIS2.5蛋白二级结构预测,目前应用的蛋白质结构预测的算法,同源预测(一级结构决定高级结构)结构与结构相对比(DALI算法)当前最先进的结构预测方法:结构类识别(foldrecognition)先建立一个已知的结构类数据库(foldlibrary),将待测序列“穿过”该数据库构成的坐标,并根据事先确定的物理限制,逐个位置移动(threading,sequence-structurealignment),由一个函数(sequence-structurefitnessalignment)判断序列与结构类的符合程度,找出未知序列在目标结构上的能量最优和构象最稳固的比对位置。对计算机要求很高。,Cn3D2.5显示1EQFA链三维结构,RasMol2.7显示1EQFA链三维结构,二.常见的部分生物学软件功能介绍,PCR引物设计DNA、蛋白质序列同源分析及进化树构建ContigExpress-DNA序列片断拼接DNA模拟电泳重要生物数据库简介,PCR引物设计,引物设计的原则引物要跟模板紧密结合;引物与引物之间不能有稳定的二聚体或发夹结构存在;引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。,如:引物长度(primerlength),产物长度(productlength),序列Tm值(meltingtemperature),G值(internalstability),引物二聚体及发夹结构(duplexformationandhairpin),错误引发位点(falseprimingsite),引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。,引物设计需要考虑的因素,引物设计要点,一般引物的长度为16-23bp,常用的长度为18-21bp,过长或过短都不合适。引物3端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而其它三种碱基的错误引发效率相对小一些。引物的GC含量一般为45-55%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。引物所对应模板序列的Tm值最好在72左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。,引物设计要点,G值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标。一般情况下,在Oligo5.0软件的G值窗口中,引物的G值最好呈正弦曲线形状,即5端和中间部分G值较高,而3端G值相对较低,且不要超过9(G值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。其原理,引物与模板应具有较高的结合能量,这样有利于引物与模板序列的整合,因此5端与中间段的G值应较高,而3端G值影响DNA聚合酶对模板DNA的解链,过高则不利于这一步骤。,引物设计要点,可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,最好没有错误引发位点,如此可以保证不出非目的产物的假带。引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带,且会降低引物浓度从而导致PCR正常反应不能进行。对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。,关于引物的自动搜索和评价分析,推荐使用自动搜索软件:PrimerPremier5.0推荐使用引物评价软件:Oligo5/6,OLIGO5.0PCR引物设计,DNA、蛋白质序列同源分析及进化树构建,相似性与同源性,相似性是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。可进行自身局部比较。如DotPlot(点阵序列比较)同源性指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断。如Alignment(同源性分析),推荐软件,相似性分析PeptoolLite同源性分析VectorNTI6-AlignXContigExpress-DNA序列片断拼接,VectorNTISuit同源比较主窗口,VectorNTISuit同源比较进化树,DNA模拟电泳,TipsDNA模拟电泳具有一定实验预示功能,模拟电泳不能作为实验结果或依据,VectorNTISuit5.5模拟电泳,GeneConstructionKit2.0模拟电泳,重要的生物数据库,三大数据库NCBI(美国)DDBJ(日本)http:/www.ddbj.nig.ac.jpEBI(欧洲)http:/www.ebi.ac.uk/index.html,其他重要数据库,酵母基因组数据库(SGD)酵母蛋白质数据库(YPD)拟南芥数据库(AtDB)医学数据库(OMIM)线虫数据库(ACEDB),网上数据库的运用,IRACE(基因拉长功能)BLAST同源序列检索ENTREZSYSTEM(集成信息检索系统),ENTREZ集成检索示意图,Entrez是由NCBI开发和维护的一个集成检索数据系统,允许对pubmed,核苷酸和蛋白质的序列数据库,三维结构信息和图谱信息进行集成访问。,四.生物信息学主要服务内容,PCR引物、测序引物及杂交探针的设计及评价DNA,蛋白质序列同源分析及进化树构建生物大分子二级结构模拟显示及基本序列分析,有关蛋白质亲疏水性,等电点,抗原性,跨膜蛋白,信号肽等分析以及DotPlot服务质粒载体构建及克隆策略小型数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中考英语试题分类汇编(全国)阅读理解之应用文(原卷版)
- 2025年工业互联网平台网络隔离技术:工业互联网安全防护市场趋势与竞争分析报告
- 2024人教版八年级英语上册Unit 1 Happy Holiday单元素养评估测试卷(含答案解析)
- 2024人教版八年级生物上册全册知识点提纲26天晨读晚默版
- 2021-2025年高考物理试题分类汇编:万有引力与宇宙航行原卷版
- 药店防盗知识培训课件
- 婚庆行业市场现状与趋势
- 中医针灸理疗试题及答案
- 业务培训学习材料准备与归档工具
- 全球化背景下商业秘密国际保护制度的多维审视与协同发展研究
- 环境空气和废气 氯化氢的测定 离子色谱法(征求意见稿)
- 历史有关的书籍
- 2024年度新版中华人民共和国传染病防治法课件
- 精度班组安全标准化汇报
- 2024年国家电网招聘之法学类题库附参考答案【精练】
- 铅锌矿选矿过程中的水污染防治与治理
- 2024上海市奉贤区第八批储备人才及定向选调生招募91人高频考题难、易错点模拟试题(共500题)附带答案详解
- 电线电缆产品生产许可证实施细则样本
- 阴阳学说剖析课件
- 湖南高职单招《综合素质测试》考试题库(含答案)
- 口腔颌面部外伤的处理课件
评论
0/150
提交评论