生物信息学座未删减版PPT课件_第1页
生物信息学座未删减版PPT课件_第2页
生物信息学座未删减版PPT课件_第3页
生物信息学座未删减版PPT课件_第4页
生物信息学座未删减版PPT课件_第5页
已阅读5页,还剩297页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

亚源制帽网站建设 生物信息学在生命科学研究中的应用 初级篇 马飞教授南京师范大学比较基因组与生物信息学实验室 生物信息学的发展历程 一 前基因组时代的生物信息学 二 基因组时代的生物信息学 三 后基因组时代的生物信息学 3 一 前基因组时代的生物信息学 以研究序列比对为标志的现代生物信息学则起源于20世纪70 80年代 这一阶段的主要成就包括核酸和蛋白质序列的初步分析 生物学数据库的建立以及检索工具的开发 例如Dayhoff的替换矩阵 Neelleman和Wunsch的序列比对 sequencealignment 及GenBank 由美国国立生物技术信息中心建立和维护的核酸与蛋白质序列数据库 等大型数据库的建立 形成了生物信息学的雏形 二 基因组时代的生物信息学 以基因组计划的实施为标志的基因组时代 1990年至2001年 是生物信息学成为一个较完整的新兴学科并得到高速发展的时期 这一时期生物信息学确立了自身的研究领域和学科特征 成为生命科学的热点学科和重要前沿领域之一 这一阶段的主要成就包括大分子序列以及表达序列标签 expressedsequencetag EST 数据库的高速发展 BLAST basiclocalalignmentsearchtool 和FASTA fastalignment 等工具软件的研制和相应新算法的提出 基因的寻找与识别 电子克隆 insilicocloning 技术等 大大提高了管理和利用海量数据的能力 专业的抗体顾问 巴傲得 三 后基因组时代的生物信息学 随着人类基因组计划的顺利进行 人类全基因组测序工作已经完成 测序工作的完成并不代表基因组计划的结束 相反标志着 后基因组信息学 的开始 基因组学研究也由结构基因组转向了功能基因组的研究 通过对基因组的分析来了解生物体的功能成为后基因组时代的主要目标 后基因组时代 生物综合论将成为生物学的主流研究方法 人们在网络观点下 在分子相互作用网络水平理解生物学的基本原理 后基因组生物信息学有时也称为功能基因组系统学 功能基因组系统学的出现 是生物信息学领域的一个重大变化 它由主要以整理 储存 分析生物学数据或知识转变为综合多种生物分子及其相互作用的知识来了解生物系统的功能 后基因组时代研究对象的多层次性 后基因组研究对象是多层次的 人们从包括基因组 Genome 转录组 Transcriptome 蛋白质组 Proteome 相互作用组 Interactome 定位组 Localizome 折叠子组 foldome 代谢组 Metabolome 表型组 Phenome 等方面 从组的角度研究各类生物学过程 如果说基因组问题涉及遗传图谱 Geneticmap 限制性图谱 Restrictionmap 和物理图谱 Physicalmap 那么其它的组学涉及功能图谱 Functionalmaps 8 但现在更加合理的看法是基因组只是细胞中分子之间相互作用的整个网络的一部分 基因组只是细胞指令的大仓库 相互作用网络本身才是那个所谓的指令系统 这个系统遵循固有程序引导发育过程 并产生生殖细胞 后基因组生物信息学是以对一系列生物学知识的综合为特征的 是在网络观点下 在分子网络层次上研究和理解生命的基本规律 专业的抗体顾问 巴傲得 功能基因组学发展趋势 功能基因组学发展的一个最新和重要领域是系统生物学 SystemsBiology 系统生物学研究问题有如下三个特点 1 更好整合生物过程不同阶段的分散数据如整合基因组 转录组 蛋白质组和代谢组的数据 得到对生物学过程的总体认识 另外一个方面是为了满足整合数据库的复杂查询 2 对复杂生物过程的更好模拟包括蛋白质折叠和复杂系统建模 如信号 代谢通路和发病机理 3 生物过程动态研究从一个通路的成分到一个通路的动力学 功能基因组系统学 正如前面所述 在相互作用网络背景下阐释 功能 是功能基因组系统学的一个主要特点 另外一个特点是复杂系统的思想 把生物体看作一个复杂系统进行研究 主要有三个特征 1多层次数据整合整合包括基因组 蛋白质组 转录 表达和调控路径等方面数据2系统的复杂性特点具有复杂系统的自组织 自调控和突变等特点3信息学分析采用信息学方法对多种数据进行分析是功能基因组系统学的又一特点 传统生物学关注的是一个一个的通路 而后基因组生物信息学则希望研究各个通路之间的相互作用 构成一个复杂的相互作用网络 从而从更高的层面上理解生命过程 通俗地说 传统生物学看到的是树木 后基因组生物信息学则看到的是森林 专业的抗体顾问 巴傲得 整合多层次数据在网络层面研究细胞内复杂生物过程的基本思想 13 生物信息学系统化概图 专业的抗体顾问 巴傲得 讲座提纲 一 文献检索与管理二 基因与基因结构预测三 序列拼接 引物设计及进化分析四 蛋白质性质与结构分析五 基因注释与功能分类 专业的抗体顾问 巴傲得 一 文献检索与管理 1 文献阅读的重要性2 文献阅读的一些建议3 文献检索4 文献管理 1 为什么要进行文献阅读 1 科研选题的需要科研选题 发现问题 兴趣 选择问题 剥笋 界定问题的过程 凝练核心观点 科研思路如何产生 牛顿说 如果我看得更远一点的话 是因为我站在巨人的肩膀上 在当今所处的BigData时代 每天都有数以万计的文章发表在各种杂志和不同的数据库中 只有大量阅读文献才能真正了解国际上本专业的热点研究领域和最新研究进展情况 只有在阅读大量文献的过程中 不断总结 才能产生自己的idea 才能真正进入这个研究领域 选题的正确与否 最终要通过 文献阅读 及 文献综述 作判断和决断 每一篇学术论文都是一个Story Story写的越精彩看的人越多 引用率就越高 要高度重视学术论文中引言部分的文献综述 对某个领域代表性文献作较全面的综述是学术论文的重要组成部分 通常引言部分能对所研究问题的动态和有关成果作较系统的介绍和评述 要突出直接的相关性 不可遗漏经典文献和重要的近期文献 对他人工作的评述要准确到位 简练 客观 因为要尊重前人成果 引言部分能够反映研究工作的扎实基础 研究问题的重要性 以及高的研究起点 2 凝练研究问题的需要 3 了解相关理论 技术手段和研究方法的需要针对你自己的研究方向 找相近的论文来读 从中了解本研究领域有关理论的进展和突破 理解文献中回答什么问题 又是通过哪些技术手段来证明 有哪些结论 从这些文献中 了解研究思路 逻辑推论 学习和掌握相关的技术方法 专业的抗体顾问 巴傲得 4 避免重复研究的需要通过阅读文献 了解自己研究领域的现状 了解他人已经进行了哪些研究 得到了什么样的结果 有哪些问题的研究可以启发和帮助自己已确定问题的研究 他人的研究与自己的研究有没有重复等 通过文献阅读可及时调整和修订自己的研究方向和范围 这样才能避免无意义的重复和浪费 2 文献阅读的一些建议 总结一下论文的要点 作者究竟想做什么 讨论所提出的问题的重要性 把它放在当前的研究领域里去讨论 或更大的范畴 或整个科学领域 描述论文的细节 一般应该使用论文里的图分析数据 数据都与结论相符吗 每个实验都有必要吗 数据有没有重要性呢 实验所用的方法合适吗 统计方法站得住脚吗 逐步列举论文的优点和缺陷 怎样才能使论文更精彩一点呢 如果是你 会怎样做呢 把这篇论文与其他论文做个比较 它和其他论文比较起来 做得好吗 一样有意义吗 一样可信吗 作者的身分有没有影响你对文章的评价 就论文的主题和实验数据而言 这个杂志是不是发表它的最好的选择 论文写得好吗 数据表达得清楚吗 如果没有其它的数据 给出的数据图是不是足够清晰 容易理解 论文把研究背景都说明白了吗 预料一下研究的下一步工作 最后研究可能会进行到哪里 在讨论的时候 也可以这样想 我的工作 我的论文和它比起来怎样呢 我希望别的作者做的事情我自己做到了吗 专业的抗体顾问 巴傲得 科学研究的一般工作流程 检索相关的研究分析现有的研究结果发现问题提出假说 制订试验方案定义试验步骤试验数据汇总 数据可视化数据验证调整试验重新校验假说 写作研究论文发表研究论文 科学研究活动 反复 重复 动态 以人为中心依赖于各种不同的资源 3 文献检索 专业的抗体顾问 巴傲得 科研工作流程中与信息相关的问题 如何在海量的信息中快速检索到相关的 高质量的信息 如何有效地分析目前的研究进展并确定新的研究方向 如何及时跟踪某研究方向的最新进展 如何有序管理所检索到的大量文献 如何迅速提高论文写作的效率 如何全面了解所发表论文及其期刊的影响力确定投稿方向 WebofKnowledge知识平台网址 WebofKnowledge平台是一种综合型平台 它提供各级学者 研究专业人士通过网上平台上获得信息最容易的一种研究和管理环境 他的来源文章都是各学科高影响力 高质量的论文 其核心内容为国际杂志 会议论文 专利等 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 WebofScience能帮助我们做什么 检索分析管理写作 专业的抗体顾问 巴傲得 WebofScience 引文与引文分析可以提供什么 论文的相互引证揭示科学研究背后的联系与发展 学科上的相关性 理论与方法 借鉴与利用技术与手段 应用与发展横向上的对应性 实验或方法 互相参照与借鉴结果与讨论 比较与应用纵向上的继承性 课题的基础与起源发展与进步 专业的抗体顾问 巴傲得 被引文献检索 CitedReferenceSearch 谁引用这篇论文 引用这篇论文的文献讲了些什么 论文之间的引文连接 反映了科学交流的网络 结构及其随时间的变化 学科间的互动 引文统计作为一种文献计量和科学计量的指标 告诉科研工作者首先应该关注什么 科学研究贵在创新 一篇在严肃的科学期刊上发表的研究论文 必须在某些方面有所创新 否则就没有发表的价值 但是所有的科学研究又都是建立在前人工作的基础之上 在此基础上有所发展 因此又必需对前人工作给以充分的评价 在论文中必需充分回顾与本人结果直接有关的前人工作 然后再恰如其分地介绍自己工作中的创新之处 专业的抗体顾问 巴傲得 1 被引 施引 文献 2 参考文献 3 相关文献 4 创建引文跟踪 5 引证关系图 2004 CitedReferences 1993 1991 1995 1980 2003 TimesCited RelatedRecords 2003 2004 1999 2002 1994 2004 Citing 从一篇高质量的文献出发沿着科学研究的发展道路 CitedReferences越查越旧TimesCited越查越新RelatedRecords越查越深 1998 分析 学科分布 发展趋势 机构 作者等 专业的抗体顾问 巴傲得 引文检索 SCI 的引文检索记录了某作者的某篇论文曾经被哪些人的哪些论文引用过 揭示了作者与作者之间 论文与论文之间的引用与被引用关系 通过引文的关系 将相关的文献按学科发展的逻辑关系有序的组织起来 揭示学术研究之间的内在联系 帮助研究者迅速了解整个学科进展的全貌 为自己的科学决策及具体解决问题提供全面的信息支持 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 被引文献检索的特点 以一篇文章 一个作者 一个期刊 一篇会议文献或者一本书作为检索词 进行被引文献的检索 提供与检索项相关的所有被引参考文献的列表 被引文献检索能够帮助您发现 某篇论文 某部论著 某期刊被引用过多少次 以揭示其影响力 某一理论有没有得到进一步的证实 是否已经应用到了新的领域 某项研究的最新进展极其延伸 某个实验方法是否得到改进 对于某个研究问题后来有没有勘误和修正说明 专业的抗体顾问 巴傲得 如何获得文献呢 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 4 文献管理 管理参考文献 EndNoteOnline模块 专业的抗体顾问 巴傲得 个人注册信息 EndNoteWeb模块 建立基于Web的MyLibrary 组织管理文献资源并应用于论文写作 专业的抗体顾问 巴傲得 EndnoteOnline模块提高写作效率边写作边引用自动生成文中和文后参考文献提供2300多种期刊的参考文献格式 EndnoteWeb边写作边引用 下载插件查找引文添加引文编辑引文格式引文 与MicrosoftWord自动联接 您可一边写作一边引用相应的参考文献 帮助您提高写作效率 文献管理软件Endnote使用心得及简介 科研工作者必备能力获取信息的能力 文献搜索引擎的使用管理信息的能力 文献管理软件的使用分析信息的能力 文献分析软件的使用EndNote由ThomsonReuters公司开发 占有率约为50 使用广泛 中文文献不够友好 与windowsMSofficeword高度兼容 NoteExpress适合中文文献信息管理LaTex适合Linux环境使用 EndNote的主要功能 进行数据库检索文献信息集中管理调整参考文献的插入格式 省去手动编排参考文献格式的麻烦应用杂志的论文模板快捷写作做笔记和管理进行一定的统计分析 文献管理软件Endnote使用心得及简介 EndNote软件使用前的一些基本概念 文献信息 endnote的管理对象 注意并非文献全文本身database 网上存放文献以及信息的数据库Library 本地 endnote 管理文献信息的数据库 一般是一篇论文对应一个LibraryFilter database中存放的文献信息的数据格式到endnote使用的文献信息格式之间的转换器referencetype 参考文献格式 杂志论文 书 会议论文 专利等style 不同杂志的word写作模板 既指正文模板又指参考文献引用模板 安装EndnoteX7后 打开应用程序 界面如下所示 点击菜单栏中的File按钮 在下拉菜单中可以单击New选项 新建一个库文件 或者直接使用安装时默认的库文件即可 Endnote界面简介 快捷工具栏 分组管理 在线搜索窗口 书目编辑与预览窗口 书目信息显示窗口 检索窗口 在我们搜索文献前可以先进行分组 便于我们以后查找文献 分组信息 在MyGroup区任意位置单击右键会出现左图所示对话框 点击creatgroup就可以新建一个分组 分组的名称可以根据自己的需要来定 本地库搜索 在线数据库搜索 本地 在线数据库搜索 文献查询时我们可以根据自己的需要选择不同的库 本地数据库 在线数据库 以在线数据库为例简单介绍文章的检索 数据库的选择 通常我们在pubMed数据库进行检索 当然也可以选择其它的数据库进行检索 可以根据不同的领域进行检索 文献的检索 右击选中的文献 将其加入选中的数据库中 文献入库 增加文献的PDF全文 小贴士 中文文献的导入从互联网上数据库导出txt文件 然后通过格式转换方式导入endnote注意 需要正确的filter 在importoption中设置 否则不能正确导入对于中文期刊的文献信息 主要是通过这种方式导入endnote中间格式为noteexpress或者txtCNKI UTF8万方 UTF8维普 GB2312目前维普等网站已经提供filter 文献的插入 选中要插入的文献 在文章中选中要插入参考文献的位置 点击Endnote中的这个选项即可插入所选参考文献 待参考文献全部插入结束 开始设置参考文献的格式 在此区域设置所需的参考文献格式 其他有用操作 library压缩 方便传递和交流import和exportlibrary 用import进行不同文献管理软件的library格式转换 用export方便发表成果preference中的displayfields是主窗口显示的项目 duplicates是设置文献重复规则reference goto其实就是查找功能group分组 可以按作者 年代 关键词 杂志等对同一个Library中的文献信息分组文献信息的默认项目内容修改 tools changeandmovefieldstools terms实现缩写语排序 利用endnote进行统计分析 单独的endnote可以进行简单的文献分析tools subjectbibliography分析某领域内的牛作者 文章量 关键词等 可以看出研究方向的发展脉络如果安装了Refivz或其他文献信息分析软件 则可以实现datavisualization数据可视化 二 基因结构与调控元件预测 专业的抗体顾问 巴傲得 对目标基因的结构特征以及调控元件进行全面深入的分析 对深刻揭示基因的功能 以及阐明基因突变导致疾病发生的内在机制等都具有重要的理论和实践意义 SNP InDel 选择性剪接 基因融合 DNA甲基化 ChIP Seq 真核生物基因结构示意图 基因结构预测主要包括预测基因组中的基因位点 开放性阅读框架 ORF 翻译起始位点和终止位点 内含子和外显子区域 启动子 剪接位点 选择性剪接模式以及蛋白质编码序列等 1 基因结构预测 专业的抗体顾问 巴傲得 原核生物基因的各种信号位点 如启动子和终止子信号位点 特异性较强且容易识别 因此相应的基因预测方法已经基本成熟 1 原核基因结构预测 Glimmer http ccb jhu edu software glimmer index shtml 原核 FgeneSV FgeneSB Prodigal http compbio ornl gov prodigal server html 原核 专业的抗体顾问 巴傲得 Glimmer http ccb jhu edu software glimmer index shtml Glimmer是应用最为广泛的原核生物基因结构预测软件 准确度高 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 核苷酸序列中蕴涵着丰富的信息 对于真核编码基因序列的分析 主要是围绕如下内容进行 寻找开放读码框 预测基因功能 分析选择性剪接模式 分析基因多态性位点 分析基因表达调控区域 统计序列GC含量 追踪密码子使用偏好性 设计应用于目的基因的酶切位点和引物等熟 2 真核基因结构预测 GENSCAN http genes mit edu GENSCAN html GeneFinder http rulai cshl edu tools genefinder FgeneSH FGENES GeneWise http www ebi ac uk Tools psa genewise 2 1 真核基因结构预测综合性分析工具 专业的抗体顾问 巴傲得 GENSCAN http genes mit edu GENSCAN html 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 增强子 enhancer 是指能强化基因转录起始的一段DNA序列 又叫强化子 enhancer 增强子是通过启动子来增加转录的 它们通过与激活因子相结合以将DNA弯曲使特定启动子朝向起始复合物 有效的增强子可以位于基因的5 端 也可位于基因的3 端 有的还可位于基因的内含子中 增强子的效应很明显 一般能使基因转录频率增加10 200倍 有的甚至可以高达上千倍 例如 人珠蛋白基因的表达水平在巨细胞病毒 cytomegalovirus CMV 增强子作用下可提高600 1000倍 增强子的作用同增强子的取向 5 一3 或3 一5 无关 甚至远离靶基因达几千kb也仍有增强作用 2 2 增强子预测 VISTAEnhancerBrowser http enhancer lbl gov PReMod http genomequebec mcgill ca PReMod PEDB MammalianPromoter EnhancerDataBase http promoter cdb riken jp 遗憾 现在的网址不存在了 PrESSToHuman http enhancer binf ku dk enhancers php dbSUPER adatabaseofsuper enhancersinmouseandhumangenome DENdb DragonEnhancerDataBase http www cbrc kaust edu sa dendb 4DGenome ageneralrepositoryforchromatininteractiondata http 4dgenome research chop edu DEEP Ageneralcomputationalframeworkforpredictingenhancers http cbrc kaust edu sa deep 启动子 Promoter 是位于结构基因5 端上游的DNA序列 能活化RNA聚合酶 使之与模板DNA准确的结合并具有转录起始的特异性 启动子就像 开关 决定基因的活动 启动子本身并不控制基因活动 而是通过与转录因子 transcriptionfactor 结合而控制基因活动的 启动子序列发生突变 则导致基因表达的调节障碍 甚至导致疾病的发生 转录因子 transcriptionfactor 能够结合在某基因上游特异核苷酸序列上的蛋白质 活化后从胞质转位至胞核 通过识别和结合基因启动子区的顺式作用元件 启动和调控基因表达 转录起始位点 Transcriptionstartsite TSS 转录的起点是指与新生RNA链第一个核苷酸相对应的DNA链上的碱基 A或G 称为起始子 initiator 即5 UTR的上游第一个碱基 研究表明通常为由PY2CAPY5构成 一般位于 3 5 提供RNApol 识别 2 3 启动子区域预测 启动子研究的意义 启动子是基因的重要组成部分 启动子就像 开关 决定基因的活动 启动子活性的异常 可能导致基因表达的调节障碍 从而有可能导致疾病的发生 找到组织特异性启动子 为靶向治疗提供可能 找到某些疾病关键基因异常表达与启动子的关系 为基因治疗提供可能 启动子研究的热点 1 启动子结构研究 包括核心启动子区域 正调控区域 幅调控区域及增强子的确定 2 组织特异性启动子筛选及确定 3 转录因子与顺式作用元件相互作用研究 4 启动子甲基化作用研究5 新顺式作用元件发现及功能鉴定 启动子研究的意义与热点 PlantProm PlantPromoterDatabase TFBS http www tfbss org PromoterScan http www bimas cit nih gov molbio proscan JASPAR JASPAR是收集有关转录因子与DNA结合位点模体 motif 的最全面的公开的数据库 该数据库是由哥本哈根大学维护 JASPAR数据库中所包含的数据 都经过严格筛选 有确切的实验依据 通过计算机辅助软件进行整合识别匹配并用生物学手段进行注释 ASPAR CORE根据物种分成5类 即脊椎动物门 Vertebrata 线虫纲 Nematoda 昆虫纲 Insecta 植物界 Plantae 和真菌界 Fungi 以及根据结构归类 用户可以清晰地在主页上找到相应链接 网站还提供了根据序列号 ID 物种等特性进行的搜索 还可以直接浏览数据库的内容 同时 用户通过主页可以下载JASPAR中的数据到自己的电脑上 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 TRANSFAC数据库是关于转录因子 以及它们在基因组上的结合位点和与DNA结合的profiles的数据库 由SITE GENE FACTOR CLASS MATRIX CELLS METHOD和REFERENCE等数据表构成 此外 还有几个与TRANSFAC密切相关的扩展库 PATHODB库收集了可能导致病态的突变的转录因子和结合位点 S MARTDB收集了与染色体结构变化相关的蛋白因子和位点的信息 TRANSPATH库用于描述与转录因子调控相关的信号传递的网络 CYTOMER库表现了人类转录因子在各个器官 细胞类型 生理系统和发育时期的表达状况 TRANSFAC及其相关数据库可以免费下载 也可以通过Web进行检索和查询 TRANSFAC http www gene TRANSFAC http www gene 专业的抗体顾问 巴傲得 EPD http www epd isb sib ch EPD 是真核基因启动子数据库 提供从EMBL中得到的真核基因的启动子序列 目标是帮助实验研究人员 生物信息学研究人员分析真核基因的转录信号 现有1500多个启动子序列数据 按照层次式方式组织数据 关于启动子的描述信息直接摘自科学文献 因而相对独立于EMBL EPD数据库所有的启动子均经过一系列的实验证实 如是否为真核RNA聚合酶 启动子 是否在高等真核生物中有生物学活性 是否与数据库中的其他启动子有同源性等等 EPD与其他的相关数据库也建立了相关链接 如EMBL SWISS PROT TRANSFAC等 在最新版本第76版本中 EPD将收集的启动子分为六大类 植物启动子 线虫启动子 拟南芥启动子 软体动物启动子 棘皮类动物启动子和脊椎动物启动子 共2997个条目 其中脊椎动物中的人类启动子有1871个 约占总数的62 EPD是目前唯一的一个实验证实启动子数据库 所以是各种预测软件的评论手段之一 专业的抗体顾问 巴傲得 TRRD http wwwmgs bionet nsc ru mgs gnw trrd TRRD 转录调控区数据库 TranscriptionRegulatoryRegionsDatabase 是在不断积累的真核生物基因调控区结构 功能特性信息基础上构建的 每一个TRRD的条目里包含特定基因各种结构 功能特性 转录因子结合位点 启动子 增强子 静默子 以及基因表达调控模式等 TRRD包括五个相关的数据表 TRRDGENES 包含所有TRRD库基因的基本信息和调控单元信息 TRRDSITES 包括调控因子结合位点的具体信息 TRRDFACTORS 包括TRRD中与各个位点结合的调控因子的具体信息 TRRDEXP 包括对基因表达模式的具体描述 TRRDBIB 包括所有注释涉及的参考文献 TRRD主页提供了对这几个数据表的检索服务 专业的抗体顾问 巴傲得 1 基因结构预测 MammalianPromoterCAD DataDrivenDesignofRegulatoryDNAforMammals http promotercad org mammal 2 4 转录起始位点 transcriptionfactorstartsite 预测 Promotor区的研究 首先需要拿到需要的序列 因此转录起始位点的确定是很重要的一步 Promoter2 0PredictionServer http www cbs dtu dk services Promoter DBTSSasanintegrativeplatformfortranscriptome epigenomeandgenomesequencevariationdata Nucl AcidsRes 28January2015 43 D1 D87 D91 DBTSS http dbtss hgc jp wasoriginallyconstructedasacollectionofuniquelydeterminedtranscriptionalstartsites TSSs inhumansandsomeotherspeciesin2002 Sincethen ithasbeenregularlyupdatedandinrecentupdatesepigeneticinformationhasalsobeenincorporatedbecausesuchinformationisusefulforcharacterizingthebiologicalrelevanceoftheseTSSs downstreamgenes Inthenewestrelease Release9 wefurtherintegratedpublicandoriginalsinglenucleotidevariation SNV dataintoourdatabase Forouroriginaldata wegeneratedSNVdatafromgenomicanalysesofvariouscancertypes including97lungadenocarcinomasand57lungsmallcellcarcinomasfromJapanesepatientsaswellas26celllinesoflungcancerorigin Inaddition weobtainedpublicallyavailableSNVdatafromothercancertypesandgermlinevariationsintotalof11 322individuals Withtheseupdates userscanexaminetheassociationbetweensequencevariationpatterninclinicallungcancerswithitscorrespondingTSS seq RNA seq ChIP seqandBS seqdata Consequently DBTSSisnolongeramerestoragesiteforTSSinformationbuthasevolvedintoanintegrativeplatformofavarietyofgenomeactivitydata DBTSSDatabase http dbtss hgc jp NeuralNetworkPromoterPrediction http www fruitfly org seq tools promoter html FirstEF first exonandpromoterpredictionprogramforhumanDNA http rulai cshl org tools FirstEF 专业的抗体顾问 巴傲得 theUCSCTableBrowser数据库中也可以获得也些模式生物的TFs TFBSs和TSSs TSSsofmiRNAs也能从miRstartdatabase中获得 CpG岛 CpGisland CpG双核苷酸在人类基因组中的分布很不均一 而在基因组的某些区段 CpG保持或高于正常概率 CpG岛主要位于基因的启动子和第一外显子区域 约有70 以上基因的启动子含有CpG岛 CpG岛一般定义为GC含量大于50 长度超过200bp CpG岛研究的意义 基因启动子区中通常存在 CpG岛 CpG岛不仅是基因的一种标志 而且还参与基因表达的调控和影响染色质的结构 CpG双核苷酸中的C能被甲基化形成5 methylcytosine 在哺乳动物70 80 CpG双核苷酸中的C能被甲基化 启动子区中CpG双核苷酸中的C的甲基化能导致基因沉默 并且启动子区的高甲基化导致抑癌基因失活 造成癌症的发生 目前的研究还揭示启动子区中CpG双核苷酸中的C的甲基化程度与人的年龄也相关 epigeneticclock 2 5 CpG岛预测与研究的意义 EMBOSSCpGplot http www ebi ac uk Tools seqstats emboss cpgplot CpGIslands http www ualberta ca stothard javascript cpg islands html CpGFinder 2 6 ORF预测 开放阅读框 openreadingframe ORF 是结构基因的正常核苷酸序列 从起始密码子到终止密码子的阅读框可编码完整的多肽链 其间不存在使翻译中断的终止密码子 分析步骤 获得尽量长的mRNA序列 分析可能的读框 六种 在线 ORFfinder http www ncbi nlm nih gov gorf gorf html 软件 GENSCAN GenomeScan 基因探索者 Omiga等 选取最可能的一种 看是否符合各种条件 点击此处进行开放阅读框的预测 选择不同的预测结果 从中找到目标结果 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 点击此处进行序列的格式化 2 7 密码子使用预测与意义 研究意义 影响外源基因表达水平的因素很多 而密码子的选择是其中重要的参数之一 基因表达水平与嗜好密码子的使用程度之间存在强的相关性 进行密码子优化 对基因序列进行设计改造 从而达到优化蛋白表达的目的 密码子的使用与蛋白的结构和功能有关 稀有密码子的使用与蛋白质结构域的连接区和规则二级结构单元的连接区有关 翻译速率在连接区会降低 在表达具有不同二级结构的蛋白质时 mRNA各区段的翻译速率有所不同 说明蛋白质折叠方式与mRNA序列之间存在一定的相关性 此外 蛋白质的三级结构与密码子使用概率有密切的关系 通过对密码子的聚类分析 可以将具有不同三级结构蛋白质的编码基因分成不同的类 而具有相似三级结构蛋白的编码基因则大致聚在同一类中 密码子 codon 在随机或者无自然选择的情况下 各个密码子出现频率将大致相等 密码子偏好 各个物种中 编码同一氨基酸的不同同义密码子的频率非常不一致 可能的原因 密码子对应的同功tRNA丰度的不同 Anticodon 密码子偏好的应用及计算 基本假设 在高表达的基因中 密码子的选择 更倾向于使用 优化 的同义密码子推论1 给定一个物种的一些高表达的基因 我们可以估算优化的同义密码子的分布推论2 接着 我们可以对给定的一个未知基因的序列进行密码子分布的分析 预测该基因的表达量 推论3 对于一个表达量很低的基因 我们是否能够通过将少量的密码子改变成优化密码子 从而显著提高基因的表达量 CodonW codonusagedatabase http www kazusa or jp codon 2 8 UTR UntranslatedRegions 预测与意义 研究意义 基因非翻译区主要包括5 UTR和3 UTR 它们通过一些调控因子的结合来对基因的表达进行调控 mRNA分子的5 UTR通过其长度和碱基顺序以及二级结构等来参与基因表达调控 5 UTR包含了保守的茎环结构参与转录后协同调控的生物路径 5 UTR主要参与翻译调节 影响转录后的各个阶段 包括mRNA的稳定 折叠和核糖体的相互作用的 3 UTR含有在mRNA3 端添加多腺苷酸的信号 这个序列在mRNA转运 稳定性和翻译调节中起重要作用 此外 3 UTR还含有miRNA的靶位点 对基因的表达调控具有重要的作用 UTR UntranslatedRegions 即非翻译区 是信使RNA mRNA 分子两端的非编码片段 5 UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子 3 UTR从编码区末端的终止密码子延伸至多聚A尾巴 Poly A 的前端 PACdb PolyACleavageSite 3 UTRDatabase http harlequin jax org pacdb UTRdbandUTRsite acollectionofsequencesandregulatorymotifsoftheuntranslatedregionsofeukaryoticmRNAs http harlequin jax org pacdb 2 9 转录区域调控元件预测 Theexonicsplicingenhancer ESE isaDNAsequencemotifconsistingof6baseswithinanexonthatdirects orenhances accuratesplicingofheterogeneousnuclearRNA hnRNA orpre mRNAintomessengerRNA mRNA Mutationofexonicsplicingenhancermotifsisasignificantcontributortogeneticdisordersandsomecancers SimplepointmutationsinESEscaninhibitaffinityforsplicingfactorsandalteralternativesplicing leadingtoalteredmRNAsequenceandproteintranslation AfieldofgeneticresearchisdedicatedtodeterminingthelocationandsignificanceofESEmotifsinvivo Anexonicsplicingsilencer ESS isashortregion usually4 18nucleotides 1 ofanexonandisacis regulatoryelement Asetof103hexanucleotidesknownasFAS hex3hasbeenshowntobeabundantinESSregions 2 ESSsinhibitorsilencesplicingofthepre mRNAandcontributetoconstitutiveandalternatesplicing Toelicitthesilencingaffect ESSsrecruitproteinsthatwillnegativelyaffectthecoresplicingmachinery ESSshavefourgeneralroles inhibitingexoninclusion inhibitingintronretention regulatingalternative5 splicesiteusage regulatingalternative3 splicesiteusage ISE intronicsplicingenhancerISS intronicsplicingsilencer Theprokaryotic5 UTRcontainsaribosomebindingsite RBS AGGAGGU Incontrast theeukaryotic5 UTRcontainstheKozakconsensussequence ACCAUGG Theeukaryotic5 UTRalsocontainscis actingregulatoryelementscalledupstreamopenreadingframes uORFs andupstreamAUGsandterminationcodons uAUGs whichhaveagreatimpactontheregulationoftranslation the5 UTRhasahighGCcontent secondarystructuresoftenoccurwithinit Hairpinloopsareonesuchsecondarystructurethatcanbelocatedwithinthe5 UTR Thesesecondarystructuresalsoimpacttheregulationoftranslation The3 untranslatedregionplaysacrucialroleingeneexpressionbyinfluencingthelocalization stability export andtranslationefficiencyofanmRNA Itcontainsvarioussequencesthatareinvolvedingeneexpression includingmicroRNAresponseelements MREs AU richelements AREs andthepoly A tail Inaddition thestructuralcharacteristicsofthe3 UTRaswellasitsuseofalternativepolyadenylationplayaroleingeneexpression 专业的抗体顾问 巴傲得 ESEfinder3 0 http rulai cshl edu cgi bin tools ESE3 esefinder cgi process home 专业的抗体顾问 巴傲得 ESS FAS ESS http genes mit edu fas ess RegRNA2 0 anintegratedwebserverforidentifyingfunctionalRNAmotifsandsites http regrna2 mbc nctu edu tw 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 2 10 基因选择性剪接预测 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 2 11 模体寻找与比对 MEMESuiteVersion4 11 2patch1 http meme suite org Motif basedsequenceanalysistools寻找DNA RNA和蛋白质的共有序列可以在启动子区域搜寻TFBS的结合位点可以搜寻蛋白质家族的模体 motif 专业的抗体顾问 巴傲得 专业的抗体顾问 巴傲得 Weblog http weblogo berkeley edu Weblogo基于多序列比对信息 把多序列的保守信息通过图形表示出来 每个logo由一系列碱基 氨基酸 组成 在每一个序列位置上用总高度表示此位置上的序列保守性 用碱基 氨基酸 字母的高度表示出现的频率 3 序列拼接 引物设计及进化分析 DNA序列片断拼接分析mRNA开放阅读框PCR引物设计核酸序列的比对系统发生树的构建 3 1 DNA序列片断拼接 电子基因克隆 获得感兴趣的EST 在EST数据库中找出目标EST的最有效的途径是寻找同源序列 标准 长度 100bp 同源性50 以上 85 以下 然后将检出序列组装为重叠群 contig 以此重叠群为被检序列 重复进行BLAST检索与序列组装 延伸重叠样序列 重复以上过程 直到没有更多的重叠EST检出或者说重叠群序列不能继续延伸 有时可获得全长的基因编码序列 常用的序列拼接软件 DNAMAN Sequencher DNAstar DNAMAN的使用方法 DNAMAN是美国LynnonBiosoft公司开发的高度集成化的分子生物学应用软件 可以用于多重序列比对 PCR引物设计 限制性酶切分析 质粒绘图 蛋白质分析等 几乎囊括了所有日常核酸 蛋白质序列的分析工作 点击此图标进行序列拼接 点击此处开始进行拼接 点击 导出 按钮输出拼接好的序列 Sequencher4 2的使用方法 Sequencher是DNA序列分析的工业标准软件 它可以和所有的自动序列分析仪一同工作 并且因为它的极速Contig组装 很短的学习曲线 用户友好的编辑工具而众所周知 Sequencher主要被用于许多不同的DNA序列分析应用方面 包括基因重组 突变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论