




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学软件 华南农业大学动物科学学院刘吉平2004 04 26 内容概要 生物信息学软件的主要功能简介分析和处理实验数据和公共数据 加快研究进度 缩短科研时间提示 指导 替代实验操作 利用对实验数据的分析所得的结论设计下一阶段的实验用计算机管理实验数据寻找 预测新基因及预测其结构 功能蛋白高级结构预测 软件在生物信息学研究中的地位和作用PCR引物及寡核苷酸设计软件核酸序列分析软件蛋白质序列分析软件序列比对软件 软件在生物信息学研究中的地位和作用 Bioinformatics ComputationalBiology 算法是core算法是key算法是soul 软件在生物信息学研究中的地位和作用 数学家 实际问题的抽象算法研究 生物学家 实际问题的提出软件应用 软件专家 算法的工具化软件开发 各种序列 DNA Protein 生物信息学处理软件平台 Blast Genscan Blocks 生物学家 计算生物学模型 算法 软件 并行软件 Blast Phrap SW 市场化 各种算法 串行 后基因组学数据 并行 生物信息学软件的分类 按功能分类 1 DNA序列分析软件如 DNACLUB Chromas1 562 蛋白质序列分析软件如 ANTHEPROT3 RNA结构预测软件如 RNAdraw4 引物设计软件如 Oligo PrimerPremier5 基因芯片软件如 ArrayMaker6 序列比对软件如 ClustalX7 亲缘进化树软件如 PHYLIP和PAUP Treeview8 综合软件如 GCG GeneticsComputerGroup 生物信息学软件的分类 按使用方式分类 1 本地分析软件 如Lasergene 可在Windows或MacIntosh微机运行 有单机版和网络版2 在线分析软件 内联网软件 Genemill Geneworld GeneThesaurus 和因特网软件 如BLAST以及CINEMA 按运行平台分类 1 UNIX SGI工作站2 Windows或MacIntosh PC 生物信息学软件的开发 Perl应用 具有生物信息学特色的程序语言 Perl Perl语言的特点 1 对过程 档案和文字有很强的处理能力2 跨平台3 解释执行4 简单易学5 适用于网络程序开发 bioperl 生物信息学软件的开发 其他常用的生物信息学软件开发语言 Java 跨平台C C 代码执行效率高VB 简单易学 生物信息学软件的发展方向 高通量海量数据分析并行处理新算法的提出和应用网络共享解决方案 PCR技术的应用 PCR 研究领域 基因克隆 测序 重组疾病诊断法医鉴定亲子鉴定古生物学研究 PCR引物及寡核苷酸设计 PCR原理 高温变性低温退火适温延伸 PCR引物及寡核苷酸设计 条件 一 估测可能形成的DNA双链的稳定性 基础 算法 邻近热力学25 G kcal mol 例 ACGG和其互补TGCC结合的 G G ACGG G AC G CG G GG 1 3 3 6 3 1 8 0kcal mol PCR引物及寡核苷酸设计 问题 二 引物可能出现的二级结构 基础 1 发夹结构 Hairpin 自身互补2 自身二聚体 Dimer 两个同型引物互补3 交叉二聚体 CrossDimer 两个异型引物间互补 PCR引物及寡核苷酸设计 规则 三 引物设计的一般规则1 引物3 末端限制3 端防止连续三个C或G3 端防止互补 防止出现3 端二聚体 2 引物互补限制尽量避免发夹结构 自身二聚体和交叉二聚体出现在不可避免时 按如下原则处理 防3 端互补 其他区域 G 小 其他区域 G 大 PCR引物及寡核苷酸设计 规则 三 引物设计的一般规则3 引物长度PCR产物长度 500bp引物长度16 18bpPCR产物长度 5kb引物长度 25bpPCR纪录 23bp长度引物扩增出40kb产物引物长度 20bp产物长度 1kb应考虑使用引物设计软件 有效长度 L 2 G C A T L 38 PCR引物及寡核苷酸设计 规则 三 引物设计的一般规则4 引物的唯一性防止错配发生错配 或称假引发 FalsePriming将导致产生非专一产物 错配 PCR引物及寡核苷酸设计 规则 三 引物设计的一般规则5 引物内部稳定性 InternalStability 引物与模板应具有较高的结合能量 这样有利于引物与模板序列的整合 因此5 端与中间段的 G值应较高 而3 端 G值影响DNA聚合酶对模板DNA的解链 过高则不利于这一步骤 引物的 G值最好呈正弦曲线形状 即5 端和中间部分 G值较高 而3 端 G值相对较低 且不要超过9 G值为负值 这里取绝对值 如此则有利于正确引发反应而可防止错误引发 PCR引物及寡核苷酸设计 规则 三 引物设计的一般规则6 解链温度 Tm值 Tm值的几种算法 1 Tm 4 G C 2 A T 2 Tm 4 G C 2 A T 引物长度 14 Tm 64 9 41 G C 16 4 引物长度 14 引物长度 PCR引物及寡核苷酸设计 规则 三 引物设计的一般规则6 解链温度 Tm值 3 精确算法 邻近热力学 PCR引物及寡核苷酸设计 规则 三 引物设计的一般规则7 退火温度 TaOPT PCR引物及寡核苷酸设计 引物设计软件 四 引物设计软件常用的引物设计软件PrimerPremier5Oligo6推荐使用WONDERFUL生物信息学系统1700RMB 售价US 885 售价US 1200 PCR引物及寡核苷酸设计 寡核苷酸设计 用于基因芯片 Southernblot和Northernblot等核酸分子杂交的探针设计是和引物设计并列的一个问题的两个方面常用的探针设计软件 ArrayDesigner国产WONDERFUL生物信息学系统也具备该功能 核酸序列分析 基础概念 1 相位 任意DNA序列有6个相位 核酸序列简单分析 核酸序列分析 基础概念 2 简并碱基的表示方法 核酸序列分析 基础概念 3 密码子表和密码子偏好性 核酸序列分析 限制酶切位点分析 EcoRI识别片段GAATTC G AATT C GAATTC CTTAAG Psp5II识别片段RGGWCCY RG GWC CY R AorGW AorTY CorT 核酸序列分析 限制酶切位点分析 线型序列 环型序列 核酸序列分析 限制酶切位点分析 限制酶数据库REBASE网址 数据库中限制酶信息包括甲基化酶 相应的微生物来源 识别序列位点 裂解位点 甲基化特性 酶的商业来源和参考文献 核酸序列分析 核酸基序位点分析 基序 motif或称 模体 具有特定功能意义的生物序列片段 如 原核生物Pribnow框 10序列 TATAATSextama框 35序列 TTGACA真核生物TATA框TATACAAT框GGCAATCT AT AT CT TATAWAW GGYCAATCT 核酸序列分析 基因识别 1 ORF 开放阅读框 的识别 ORF OpenReadingFrame 在DNA链上 由蛋白质合成的起始密码开始 到终止密码子为止的一个连续编码序列称为一个开放阅读框 ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的先决条件 核酸序列分析 基因识别 1 ORF 开放阅读框 的识别 算法 a 起始密码子和终止密码子所夹区域 300bpb 选择跨度最大的c 六个阅读框都要进行扫描d 起始密码子可随物种不同而更改 核酸序列分析 基因识别 2 TestCode测试编码 利用编码区与非编码区密码子选用频率的差异进行编码区的统计学鉴别方法 由于内含子的进化不受约束 而外显子则受到选择压力 因此内含子的序列要比外显子更随机 TestCode0 95编码序列0 74 TestCode 0 95不能确定是否编码 核酸序列分析 基因识别 3 CpG岛搜索 脊椎动物绝大多数基因的5 端都存在CpG岛CpG岛的判别方法 以每200个碱基为单位扫描DNA序列 如某个片段内胞嘧啶 C 与鸟嘌呤 G 的总和超过4种碱基总和的50 即每10个核苷酸约出现一次双核苷酸序列CG 具有这种特点的序列仅占基因组DNA总量的10 左右 核酸序列分析 核酸序列分析软件 常用的核酸序列分析软件 DNAsis HITACHI DNAmanDNAtoolsDNAstar密码子图表密码子使用工具CpG岛DNA特征序列查找 DNA统计ORF查找器位置碱基频率限制位点概要碱基比例图测试编码翻译http www bio 实践2 进入以下网站 初步学习分析Nosemabombycis在基因数据库里所有序列的DNA统计分析结果 DNA统计http www bio 实践2 进入以下网站 初步学习分析Nosemabombycis在基因数据库里所有序列的DNA统计分析结果 蛋白质序列分析 基础概念 氨基酸残基的简并逻辑表示法 位置分隔符 允许此位置为括号内的任何一个残基 允许此位置为除了括号内所包括的任何一个残基 x代表任何残基 x 3 代表任何3个氨基酸残基 N PT GM x 2 ILVM N P K G H V N T L K G M N L K G H V N T G K H V 蛋白质序列分析 水解酶切点分析 Calpain LV YMR X 2 蛋白质序列分析 蛋白质基序位点分析 蛋白质motif 如蛋白质的磷酸化位点 糖基化位点等 GLYCO HORMONE ALPHA 1C x G C C FY S R A FY P T P 蛋白质motif数据库PROSITEhttp www expasy org prosite 蛋白质序列分析 蛋白质特性分析 对20个氨基酸用物理化学的方法测定相关性质如 疏水性 蛋白质序列分析 蛋白质特性分析 开窗 的概念 蛋白质序列分析 蛋白质特性分析 Window 1 Window 15 GPCR 蛋白质序列分析 蛋白质特性分析 蛋白质序列分析 蛋白质二级结构预测 GORII法预测结果 蛋白质序列分析蛋白质二级结构预测 五种蛋白质二级结构预测结果比较 蛋白质序列分析 蛋白质高级结构预测 蛋白质高级结构预测网址 http www expasy ch swissmod 蛋白质序列分析软件 专门用于蛋白质序列分析的软件较少大多集成在综合软件之中 Wonderful生物信息学系统的蛋白质序列分析功能 1 蛋白质特性分析2 蛋白质二级结构预测3 蛋白质水解酶切位点分析4 蛋白质基序位点分析 DNA 蛋白质序列同源分析及进化树构建 相似性与同源性 相似性是指一种很直接的数量关系 比如部分相同或相似的百分比或其它一些合适的度量 可进行自身局部比较 如DotPlot 点阵序列比较 同源性指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论 属于质的判断 如Alignment 同源性分析 推荐软件 相似性分析PeptoolLite同源性分析VectorNTI6 AlignXContigExpress DNA序列片断拼接 序列联配 比对 Alignment软件 CLUSTALX VectorNTISuit同源比较 进化树 运行在UNIX平台的序列分析软件 GCG GeneticsComputerGroup 中国生物信息学软件 1994军科院吴加
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宅家园艺让生活充满色彩和乐趣
- 中考复习英语重要知识点汇编
- 社交焦虑症状诊断方案
- 家电维修维护标准规定
- 2.2.4 心脏和血管的保护(说课稿)2023-2024学年七年级生物下册同步教学(冀少版河北专版)
- 2.2 设计和新建三维模型教学设计-2025-2026学年高中信息技术人教中图版2019选修5 三维设计与创意-人教中图版2019
- 幼儿园安全教育年度计划制定要点
- 江苏省泗洪县七年级生物下册 5.11.1 地面上的植物说课稿3 (新版)苏科版
- 四年级科学重点知识总览
- 第三节 海洋旅游业说课稿-2025-2026学年高中地理中图版2007选修2海洋地理-中图版2004
- Unit 2 My friends (Period 1) 课件2025-2026学年人教版英语四年级上册
- 2025版酒店租赁经营合作协议模板:2025年度版
- 2025年烟草专卖局公开遴选面试高分策略及模拟题答案
- 一般性生产经营单位安全管理员主要负责人考核试题及答案
- 乳制品行业智能化奶源管理与追溯方案
- 恒瑞医药2023ESG社会责任报告:关注员工成长共建美好家园
- 医院网络信息安全培训
- 2025年处方药与非处方药分类管理培训试题和答案
- 2025至2030电动升降桌行业产业运行态势及投资规划深度研究报告
- 《基本医疗卫生与健康促进法》知识培训
- (2025标准)拆迁保密协议书
评论
0/150
提交评论