




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
序列特征分析 AnalysisofSequenceCharacteristics 第一节引言 一 基因结构 基因的概念是随着遗传学 分子生物学 生物化学等领域的发展不断完善的 从分子生物学角度来看 基因是负载特定生物遗传信息的DNA分子片段 在一定的条件下能够表达这种遗传信息 产生特定的生理功能 原核生物基因结构 一个完整的原核基因结构是从基因的5 端启动子区域开始 到3 端终止区域结束 基因的转录开始位置由转录起始位点确定 转录过程直至遇到转录终止位点结束 转录的内容包括5 端非翻译区 开放阅读框及3 端非翻译区 基因翻译的准确起止位置由起始密码子和终止密码子决定 翻译的对象即为介于这两者之间的开放阅读框ORF 操纵子模型结构 原核生物大多数基因表达调控是通过操纵子机制实现的 所谓操纵子通常由调节基因 启动子 操纵基因以及2个以上的编码序列 结构基因 在原核生物基因组中成簇串联组成 其中结构基因的表达受到操纵基因的调控 调节基因能产生作用于操纵基因的阻遏物 一种蛋白质 操纵基因靠近它所控制的结构基因 阻遏物与操纵基因的结合能阻止结构基因的转录 5 基因组序列cDNA序列 真核基因的功能分析 蛋白质的一级结构 蛋白质的一级结构决定二级结构蛋白质的二级结构决定三级结构 二 蛋白质结构 蛋白质的二级结构 H表示螺旋E表示折叠B表示 桥G表示3 螺旋I表示 螺旋T表示氢键转角S代表转向 蛋白质分子只有处于它自己特定的空间结构情况下 才能获得它特定的生物活性 空间结构稍有破坏 就很可能会导致蛋白质生物活性的降低甚至丧失 因为它们的特定的结构允许它们结合特定的配体分子 蛋白质空间结构 对DNA序列和蛋白质序列进行序列特征分析 能够使我们从分子层次上了解基因的结构特点 了解与基因表达调控相关的信息 了解DNA序列与蛋白质序列之间的编码 了解蛋白质序列与蛋白质空间结构之间的关系和规律 为进一步研究了解蛋白质功能与蛋白质结构之间的关系提供理论依据 第二节基因结构分析 分析DNA序列 除了进行序列比对之外 更重要的工作是从序列中找到基因及其表达调控信息 寻找基因的工作主要有两个 一是识别与基因相关的特殊序列信号 如启动子 起始密码子 通过信号识别大致确定基因所在的区域 二是预测基因的编码区域 或预测外显子所在的区域 在此基础上 结合两个方面的结果确定基因的位置和结构 11 基因结构分析常用软件 一 开放阅读框ORF OPENREADINGFRAME 开放阅读框指的是从5 端开始翻译起始密码子 ATG 到终止密码子 TTA TAG TGA 的蛋白质编码碱基序列 每个序列都有6个可能的开放阅读框 其中3个开始于第1 2 3个碱基位点并沿着给定序列的5 3 的方向进行延伸 而另外的3个开始于第1 2 3个碱基位点但沿着互补序列的5 3 的方向进行延伸 我们的目的就是从这6个可能的开放阅读框中找出一个正确的开放阅读框 根据这个开放阅读框翻译得到的氨基酸序列才是真正表达的蛋白质产物 真核生物的开放阅读框 编码蛋白的外显子 exon 而且还有内含子 intron 开放阅读框的长度变化范围非常大 GT AG规律 内含子序列5 端的起始两个核苷酸总是GT 并且其3 端的最后两个核苷酸总是AG 即 5 GT AG 3 这个规律有助于真核生物开放阅读框的识别 14 15 一ORF识别 GENSCAN 用GENSCAN预测AC002390序列的基因 外显子 用GENSCAN预测AC002390序列的基因 外显子的位置图 起始外显子 终止外显子 18 二 转录调控序列分析CpG岛 启动子和转录终止信号区域的预测 2 1CpG岛的预测 CpG岛常位于真核生物基因转录起始位点 GC含 50 长度 200bp的一段DNA序列 20 CpG岛的预测 CpGPlot 用CPGPLOT预测AC002390序列的CPG岛的结果 GENSCAN预测结果起始为532bp终止于51783bp 23 2 2启动子区结构 启动子 Promoter 位于结构基因5 端上游 能活化RNA聚合酶 使之与模板DNA结合并具有转录起始的特异性转录起始位点 Transcriptionstartsite TSS PYCAPY 嘧啶 核心启动子元件 Corepromoterelement TATAbox Pribnowbox TATAA 上游启动子元件 Upstreampromoterelement UPE CAATbox GCbox SP1 Otc增强子 Enhancer PyCAPy TATAAT GC区CAAT区 mRNA 1 40 25 110 增强子 上游启动子元件 UPE 核心启动子元件 转录起始位点 24 启动子结合位点分析常用软件 25 启动子预测 PromoterScan 26 用PROMOTERSCAN预测AC002390序列的启动子区域的结果 2 3转录终止信号 转录终止信号是在mRNA序列的3 端终止密码子下游位置上的加尾信号 tailingsignal 前体mRNA3 端多聚腺苷酸化是真核细胞内mRNA转录后处理的三个最主要步骤之一 这三个步骤包括 5 帽子结构的形成 内含子的剪切及3 端的多聚腺苷酸化 因此 前体mRNA3 端多聚腺苷酸化与mRNA稳定性的调节 mRNA的细胞内转运 翻译的起始以及一些其他的细胞机制和疾病机制有着重要关系 真核生物前体MRNA3 端的多聚腺苷酸化包括两个步骤 1 特异性的核苷酸内切酶在PolyA位点处进行断裂 2 腺苷酸聚合酶在断裂位点处添加PolyA尾巴 其主要标志为AATAAA或ATTAAA两种序列 称为多聚腺苷酸信号 polyadenylationsignal 简称PolyA信号序列 也称为转录终止信号 在3 UTR区存在多个潜在PolyA位点 因此对PolyA位点的准确识别 对于预测基因结构 理解mRNA的形成机制及某些疾病的分子机制具有巨大的作用 29 转录终止信号预测 POLYAH 30 GENESCAN预测结果PolyA位点52398bp 用POLYAH预测AC002390序列的转录终止信号的结果 三 密码子偏好性 密码子偏好性 32 1 研究蛋白质结构功能中的作用2 在表达外源基因方面的作用3 在生物信息学研究中的作用 基因密码子偏好性 CodonW 33 34 参数选择 35 CodonW结果界面 36 内含子 外显子剪接位点识别 如何分析核酸序列中的外显子组成 通过对特征序列 GT AG 的分析进行直接的预测基因预测软件 NetGene2 与相应的基因组序列比对 分析比对片段的分布位置 Spidey 37 38 剪接位点识别 NetGene2 http 39 NetGene2输出结果 40 mRNA剪接位点识别 Spidey NCBI开发的在线匹配程序用于mRNA序列同基因组序列比对分析 41 Spidey同源序列的获得 序列比对 通过BLAST进行序列比对 找到可能同源的相似性好的一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大连东软信息学院《工程造价与招投标》2024-2025学年第一学期期末试卷
- 昆明铁道职业技术学院《国际商法导论》2024-2025学年第一学期期末试卷
- 武汉航海职业技术学院《土壤与生物地理学实验》2024-2025学年第一学期期末试卷
- 南开大学滨海学院《排水工程课程设计》2024-2025学年第一学期期末试卷
- 长江艺术工程职业学院《大数据分析》2024-2025学年第一学期期末试卷
- 2025年地理信息系统专业知识点模拟题集
- 男幼师缺失的成因分析
- 西双版纳职业技术学院《客户画像管理》2024-2025学年第一学期期末试卷
- 2025年物业管理案例分析实战中级面试模拟题集萃与解析
- 石家庄经济职业学院《建筑意匠》2024-2025学年第一学期期末试卷
- 公司之间罚款协议书
- T/CECS 10246-2022绿色建材评价智能坐便器
- 2025年中国铂金属制品市场现状分析及前景预测报告
- 2025-2030年中国硅酸钇镥(LYSO)市场深度调查与发展前景预测报告
- TSG 23-2021气瓶安全技术规程
- 2025年渠道管理及维护工技能资格知识考试题与答案
- CCF全国青少年信息学奥林匹克联赛NOIP 2024真题
- 社区健康教育知识讲座
- 监护学徒协议书范本
- JISG3141-2017冷轧钢板及钢带
- 2025届苏锡常镇高三语文一模作文解读及范文:我会洗碗呀
评论
0/150
提交评论