




已阅读5页,还剩32页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 2 12 1 郑连友E mail lianyouzh 吉林大学药学院基因工程教研室 生物信息学 2020 2 12 2 生物信息学 第六章 核酸和蛋白质序列分析 第六章 核酸和蛋白质序列分析 2020 2 12 3 生物信息学 第六章 核酸和蛋白质序列分析 第一节 核酸序列分析 三 DNA序列分析基础四 DNA序列分析方法 2020 2 12 4 生物信息学 第六章 核酸和蛋白质序列分析 三 DNA序列分析基础 1 DNA序列分析内容DNA序列分析 基因序列 基因表达调控信息寻找基因牵涉到两个方面的工作 识别与基因相关的特殊序列信息预测基因的编码区域结合两个方面的结果确定基因的位置和结构基因表达调控信息隐藏在基因的上游区域 在组成上具有一定的特征 可以通过序列分析识别这些特征 2020 2 12 5 生物信息学 第六章 核酸和蛋白质序列分析 2 DNA序列功能位点在DNA序列中 除了基因之外 还包含许多其它信息 这些信息大部分与核酸的结构特征相关联 通常决定了DNA与蛋白质或者DNA与RNA的相互作用 存放这些信息的DNA片段称为功能位点 如启动子 Promoter 基因终止序列 Terminatorsequence 剪切位点 Splicesite 等 2020 2 12 6 生物信息学 第六章 核酸和蛋白质序列分析 功能位点 functionalsite 与特定功能相关的位点 是生物分子序列上的一个功能单元 或者是生物分子序列上一个较短的片段 功能位点又称为功能序列 functionalsequence 序列模式 motif 信号 signal 等 核酸序列中的功能位点包括转录因子结合位点 转录剪切位点 翻译起始位点等 在蛋白质序列分析中 常使用序列模式这个名词 蛋白质的序列模式往往与蛋白质结构域或者作用部位有关 2020 2 12 7 生物信息学 第六章 核酸和蛋白质序列分析 DNA序列功能位点示意图 2020 2 12 8 生物信息学 第六章 核酸和蛋白质序列分析 基因组序列中若干个相邻的功能位点组合形成功能区域 functionalregion 功能位点分析的任务 发现功能位点特征 识别功能位点 2020 2 12 9 生物信息学 第六章 核酸和蛋白质序列分析 利用共有序列搜索功能位点共有序列 consensus 又称一致性片段共有序列是关于功能位点特征的描述 它描述了功能位点每个位置上核苷酸进化的保守性例如 NTATN利用共有序列进行功能位点分析牵涉到两个方面的问题 如何构造共有序列如何利用共有序列在给定的核酸序列上搜索寻找功能位点 并计算所找到的功能位点的可靠性 2020 2 12 10 生物信息学 第六章 核酸和蛋白质序列分析 3 基因识别 基因识别是生物信息学领域里的一个重要研究内容基因识别问题 在近几年受到广泛的重视 当人类基因组研究进入一个系统测序阶段时 急需可靠自动的基因组序列翻译解释技术 以处理大量已测定的但未知功能或未经注释的DNA序列 2020 2 12 11 生物信息学 第六章 核酸和蛋白质序列分析 1 原核基因识别特点 长开放阅读框 高基因 简单的基因结构 原核基因组中的GC含量高重点在于识别编码区域 2020 2 12 12 生物信息学 第六章 核酸和蛋白质序列分析 非翻译区域 untranslatedregions UTR 编码区域两端的DNA 有一部分被转录 但是不被翻译 这一部分称为非翻译区域5 UTR 基因上游区域的非翻译区域3 UTR 基因下游区域的非翻译区域 2020 2 12 13 生物信息学 第六章 核酸和蛋白质序列分析 对于任何给定的核酸序列 单链DNA或mRNA 根据密码子的起始位置 可以按照三种方式进行解释 例如 序列ATTCGATCGCAA 1 ATTCGATCGCAA 2 ATTCGATCGCAA 3 ATTCGATCGCAA这三种阅读顺序称为阅读框 readingframes 2020 2 12 14 生物信息学 第六章 核酸和蛋白质序列分析 一个开放阅读框 ORF openreadingframe 是一个没有终止编码的密码子序列 原核基因识别任务的重点是识别开放阅读框 或者说识别长的编码区域 2020 2 12 15 生物信息学 第六章 核酸和蛋白质序列分析 基于基因密码子特性的识别方法辨别编码区域与非编码区域的一种方法是检查终止密码子的出现频率终止密码子出现的期望次数为 每21个 64 3 密码子出现一次终止密码子 2020 2 12 16 生物信息学 第六章 核酸和蛋白质序列分析 基本思想 如果能够找到一个比较长的序列 其相应的密码子序列不含终止密码子 则这段序列可能就是编码区域 基本算法 扫描给定的DNA序列 在三个不同的阅读框中寻找较长的ORF 遇到终止密码子以后 回头寻找起始密码子 这种算法过于简单 不适合于处理短的ORF或者交叠的ORF 2020 2 12 17 生物信息学 第六章 核酸和蛋白质序列分析 真核基因远比原核基因复杂 一方面 真核基因的编码区域是非连续的 编码区域被分割为若干个小片段 另一方面 真核基因具有更加丰富的基因调控信息 这些信息主要分布在基因上游区域 2 真核基因识别问题 2020 2 12 18 生物信息学 第六章 核酸和蛋白质序列分析 真核基因结构示意图 真核基因远比原核基因复杂 一方面 真核基因的编码区域是非连续的 编码区域被分割为若干个小片段 另一方面 真核基因具有更加丰富的基因调控信息 这些信息主要分布在基因上游区域 2020 2 12 19 生物信息学 第六章 核酸和蛋白质序列分析 真核基因识别基本思路找出基因两端的功能区域 转录启动区 终止区在启动区下游位置寻找翻译起始密码子识别转录剪切位点剪切给体位点剪切接受体位点 2020 2 12 20 生物信息学 第六章 核酸和蛋白质序列分析 真核基因识别的主要方法从头算方法 或基于统计的方法 根据蛋白质编码基因的一般性质和特征进行识别 通过统计值区分外显子 内含子及基因间区域 基于同源序列比较的方法利用数据库中现有与基因有关的信息 如EST序列 蛋白质序列 通过同源比较 帮助发现新基因 2020 2 12 21 生物信息学 第六章 核酸和蛋白质序列分析 四 DNA序列分析方法 2020 2 12 22 生物信息学 第六章 核酸和蛋白质序列分析 1 遮蔽重复序列 在进行任何真核生物序列的基因辨识分析之前 最好把散布和简单的重复序列找出来并从序列中除去 虽然这些重复序列可能正好覆盖了由RNA聚合酶 转录的部分区域 它们几乎不会覆盖启动子和外显子编码区 这样 这些重复序列的定位能为其它基因特征的定位提供重要的反面信息 重复序列还常常会搅乱其它分析 特别是在数据库搜索中 2020 2 12 23 生物信息学 第六章 核酸和蛋白质序列分析 所用程序 1 CENSORhttp www girinst org censor 2 Repeatmaskerhttp www repeatmasker org 2020 2 12 24 生物信息学 第六章 核酸和蛋白质序列分析 2 开放阅读框分析 ORF 1 http www expasy org tools dna html 2 http www ncbi nlm nih gov gorf 3 http exon gatech edu GeneMark 2020 2 12 25 生物信息学 第六章 核酸和蛋白质序列分析 3 数据库搜索TBLSTNhttp www ncbi nlm nih gov blast 2020 2 12 26 生物信息学 第六章 核酸和蛋白质序列分析 4 启动子分析 2020 2 12 27 生物信息学 第六章 核酸和蛋白质序列分析 1 启动子查询http www epd isb sib ch 2020 2 12 28 生物信息学 第六章 核酸和蛋白质序列分析 2 启动子分析http thr cit nih gov molbio proscan 2020 2 12 29 生物信息学 第六章 核酸和蛋白质序列分析 5 内含子剪接位点 2020 2 12 30 生物信息学 第六章 核酸和蛋白质序列分析 1 GRAIL http compbio ornl gov Grail 1 3 5 内含子剪接位点 2020 2 12 31 生物信息学 第六章 核酸和蛋白质序列分析 2 SIM4 http pbil univ lyon1 fr sim4 php 2020 2 12 32 生物信息学 第六章 核酸和蛋白质序列分析 6 CpG岛分析 CpG岛 是指哺乳动物基因启动子及其附近大量的CpG位点 CpG表示指C G以磷酸基连接 事实上基因组中60 90 的CpG都被甲基化 未甲基化的CpG成簇地组成CpG岛 位于结构基因启动子的核心序列和转录起始点 有实验证明超甲基化阻遏转录的进行 2020 2 12 33 生物信息学 第六章 核酸和蛋白质序列分析 CpG岛工具用来查找一条DNA序列中CpG岛 使用Gardiner GardenandFrommer 1987 描述的方法 用一个200bp的窗口移过序列 每次移一个碱基对 进行计算 CpG岛定义为Y值大于0 6并且GC含量大于50 的200bp序列区域 只有符合以上标准 才输入结果 CpG岛经常在脊椎动物基因的5 区域发现 因此 这个程序可用来在基因组序列中查找潜在的基因 2020 2 12 34 生物信息学 第六章 核酸和蛋白质序列分析 1 WEBGENE的CpG分析r it cg
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025医疗器械研发与市场推广综合服务合同
- 二零二五版艺术品抵押贷款合同展期及拍卖协议
- 二零二五年全新版车辆赠与合同含车辆年检及环保标准
- 二零二五年度劳务分包合同合同履行风险评估及预警制度
- 2025版高科技厂房施工合同模板
- 二零二五版电子信息产业核心器件采购合同模板
- 2025年中国电力财务有限公司高校毕业生招聘7人(第二批)笔试参考题库附带答案详解
- 2025湖北机场集团下属商旅公司招聘笔试参考题库附带答案详解
- 平邑一模数学试卷
- 2025年南京化工公司校园招聘50人笔试参考题库附带答案详解
- 新学期-启航出发-2025-2026学年初一上学期新生开学第一课主题班会
- 学堂在线 高职实综合英语 章节测试答案
- 2025年秋数学(新)人教版三年级上课件:第1课时 观察物体
- 社区健康服务与管理教案
- 《用户体验要素》以用户为中心的产品设计课件
- 千方百剂操作流程
- DB32T 1553-2017 高速公路工程工程量清单计价规范
- 北师大版数学九年级上册全册同步练习附答案
- 国家赔偿法完整版教学ppt课件全套教程
- 《中华人民共和国职业分类大典》电子版
- 2019修订《城市规划设计计费指导意见》
评论
0/150
提交评论