版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
郑连友E-mail:lianyouzh@吉林大学药学院基因工程教研室
生物信息学2/18/20251生物信息学第六章、核酸和蛋白质序列分析第六章、核酸和蛋白质序列分析2/18/20252生物信息学第六章、核酸和蛋白质序列分析第一节、核酸序列分析三、DNA序列分析基础四、DNA序列分析方法2/18/20253生物信息学第六章、核酸和蛋白质序列分析三、DNA序列分析基础1、DNA序列分析内容DNA序列分析
——基因序列
——基因表达调控信息寻找基因牵涉到两个方面的工作:识别与基因相关的特殊序列信息预测基因的编码区域结合两个方面的结果确定基因的位置和结构基因表达调控信息隐藏在基因的上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。2/18/20254生物信息学第六章、核酸和蛋白质序列分析
2、DNA序列功能位点在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DNA与RNA的相互作用。存放这些信息的DNA片段称为功能位点,如启动子(Promoter)、基因终止序列(Terminatorsequence)、剪切位点(Splicesite)等。2/18/20255生物信息学第六章、核酸和蛋白质序列分析功能位点(functionalsite)
-与特定功能相关的位点,是生物分子序列上的一个功能单元,或者是生物分子序列上一个较短的片段。
功能位点又称为功能序列(functionalsequence)、序列模式(motif)、信号(signal)等。
核酸序列中的功能位点包括转录因子结合位点、转录剪切位点、翻译起始位点等。
在蛋白质序列分析中,常使用序列模式这个名词,蛋白质的序列模式往往与蛋白质结构域或者作用部位有关。2/18/20256生物信息学第六章、核酸和蛋白质序列分析DNA序列功能位点示意图2/18/20257生物信息学第六章、核酸和蛋白质序列分析
基因组序列中若干个相邻的功能位点组合形成功能区域(functionalregion)。功能位点分析的任务-发现功能位点特征-识别功能位点2/18/20258生物信息学第六章、核酸和蛋白质序列分析利用共有序列搜索功能位点
共有序列(consensus)又称一致性片段共有序列是关于功能位点特征的描述,它描述了功能位点每个位置上核苷酸进化的保守性例如:NTATN
利用共有序列进行功能位点分析牵涉到两个方面的问题,如何构造共有序列如何利用共有序列在给定的核酸序列上搜索寻找功能位点,并计算所找到的功能位点的可靠性2/18/20259生物信息学第六章、核酸和蛋白质序列分析3、基因识别基因识别是生物信息学领域里的一个重要研究内容基因识别问题,在近几年受到广泛的重视—当人类基因组研究进入一个系统测序阶段时,急需可靠自动的基因组序列翻译解释技术,以处理大量已测定的但未知功能或未经注释的DNA序列2/18/202510生物信息学第六章、核酸和蛋白质序列分析(1)原核基因识别特点:长开放阅读框;高基因;简单的基因结构;原核基因组中的GC含量高重点在于识别编码区域2/18/202511生物信息学第六章、核酸和蛋白质序列分析非翻译区域(untranslatedregions,UTR)
—编码区域两端的DNA,有一部分被转录,但是不被翻译,这一部分称为非翻译区域5’UTR---基因上游区域的非翻译区域3’UTR---基因下游区域的非翻译区域2/18/202512生物信息学第六章、核酸和蛋白质序列分析
对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位置,可以按照三种方式进行解释。例如,序列ATTCGATCGCAA(1)
ATTCGATCGCAA
(2)ATTCGATCGCAA(3)ATTCGATCGCAA
这三种阅读顺序称为阅读框(readingframes)2/18/202513生物信息学第六章、核酸和蛋白质序列分析一个开放阅读框(ORF,openreadingframe)是一个没有终止编码的密码子序列。原核基因识别任务的重点是识别开放阅读框,或者说识别长的编码区域。2/18/202514生物信息学第六章、核酸和蛋白质序列分析基于基因密码子特性的识别方法辨别编码区域与非编码区域的一种方法是检查终止密码子的出现频率终止密码子出现的期望次数为:每21个(
64/3)密码子出现一次终止密码子2/18/202515生物信息学第六章、核酸和蛋白质序列分析基本思想:如果能够找到一个比较长的序列,其相应的密码子序列不含终止密码子,则这段序列可能就是编码区域。基本算法:扫描给定的DNA序列,在三个不同的阅读框中寻找较长的ORF。遇到终止密码子以后,回头寻找起始密码子。这种算法过于简单,不适合于处理短的ORF或者交叠的ORF。2/18/202516生物信息学第六章、核酸和蛋白质序列分析真核基因远比原核基因复杂:一方面,真核基因的编码区域是非连续的,编码区域被分割为若干个小片段。另一方面,真核基因具有更加丰富的基因调控信息,这些信息主要分布在基因上游区域。(2)真核基因识别问题2/18/202517生物信息学第六章、核酸和蛋白质序列分析真核基因结构示意图
真核基因远比原核基因复杂:一方面,真核基因的编码区域是非连续的,编码区域被分割为若干个小片段。另一方面,真核基因具有更加丰富的基因调控信息,这些信息主要分布在基因上游区域。2/18/202518生物信息学第六章、核酸和蛋白质序列分析真核基因识别基本思路
找出基因两端的功能区域:
转录启动区;终止区在启动区下游位置寻找翻译起始密码子识别转录剪切位点剪切给体位点剪切接受体位点2/18/202519生物信息学第六章、核酸和蛋白质序列分析真核基因识别的主要方法从头算方法(或基于统计的方法)根据蛋白质编码基因的一般性质和特征进行识别,通过统计值区分外显子、内含子及基因间区域。基于同源序列比较的方法利用数据库中现有与基因有关的信息(如EST序列、蛋白质序列),通过同源比较,帮助发现新基因。2/18/202520生物信息学第六章、核酸和蛋白质序列分析四、DNA序列分析方法一个基本的DNA序列分析方案发现重复元素数据库搜索分析功能位点序列组成统计分析综合分析2/18/202521生物信息学第六章、核酸和蛋白质序列分析1、遮蔽重复序列
在进行任何真核生物序列的基因辨识分析之前,最好把散布和简单的重复序列找出来并从序列中除去。虽然这些重复序列可能正好覆盖了由RNA聚合酶Ⅱ转录的部分区域,它们几乎不会覆盖启动子和外显子编码区。这样,这些重复序列的定位能为其它基因特征的定位提供重要的反面信息。重复序列还常常会搅乱其它分析,特别是在数据库搜索中。2/18/202522生物信息学第六章、核酸和蛋白质序列分析所用程序(1)CENSORhttp:///censor/(2)Repeatmasker
http:///2/18/202523生物信息学第六章、核酸和蛋白质序列分析2、开放阅读框分析(ORF)(1)/tools/dna.html(2)http:///gorf/(3)http:///GeneMark/2/18/202524生物信息学第六章、核酸和蛋白质序列分析3、数据库搜索TBLSTNhttp:///blast2/18/202525生物信息学第六章、核酸和蛋白质序列分析4、启动子分析2/18/202526生物信息学第六章、核酸和蛋白质序列分析(1)、启动子查询http://www.epd.isb-sib.ch/2/18/202527生物信息学第六章、核酸和蛋白质序列分析(2)、启动子分析http:///molbio/proscan/2/18/202528生物信息学第六章、核酸和蛋白质序列分析5、内含子剪接位点2/18/202529生物信息学第六章、核酸和蛋白质序列分析(1)GRAIL:/Grail-1.3/5、内含子剪接位点2/18/202530生物信息学第六章、核酸和蛋白质序列分析(2)SIM4:http://pbil.univ-lyon1.fr/sim4.php2/18/202531生物信息学第六章、核酸和蛋白质序列分析6、CpG岛分析
CpG岛,是指哺乳动物基因启动子及其附近大量的CpG位点(CpG表示指C、G以磷酸基连接)。
事实上基因组中60%~90%的CpG
都被甲基化,未甲基化的CpG
成簇地组成CpG
岛,位于结构基因启动子的核心序列和转录起始点。有实验证明超甲基化阻遏转录的进行。2/18/202532生物信息学第六章、核酸和蛋白质序列分析
CpG岛工具用来查找一条DNA序列中CpG岛,使用Gardiner-GardenandFrommer(1987)描述的方法。用一个200bp的窗口移过序列,每次移一个碱基对,进行计算。CpG岛定义为Y值大于0.6并且GC含量大于50%的200bp序列区域。只有符合以上标准,才输入结果。CpG岛经常在脊椎动物基因的5'区域发现,因此,这个程序可用来在基因组序列中查找潜在的基因。
2/18/202533生物信息学第六章、核酸和蛋白质序列分析(1)WEBGENE的CpG分析r.it/cgi-bin/wwwcpg.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数字化转型下D公司保险业务系统运维项目质量管理的多维剖析与策略构建
- 数字化转型下A银行南宁分行中小企业信贷风险管理创新与实践
- 数字化赋能:高中电磁学演示实验教学革新与实践探索
- 数字化赋能:某省产品质量监督管理系统的创新设计与实践
- 数字化赋能:四川省金玉融资担保有限公司人事管理系统的深度设计与高效实现
- 2025年教师资格之幼儿保教知识与能力练习题库含答案
- 数字化浪潮下:广东省梅州市初中班主任QQ学生管理模式的探索与革新
- 数字化浪潮下区域性中小商业银行经营绩效提升路径探究
- 数字化浪潮下PJ电信农村移动业务市场的营销策略:洞察与突破
- Axure网站与App原型设计(全彩慕课版)(AxureRP10)- 教案 第7-12章 用Axure链接动作制作交互效果-产品经理的职能
- GB/T 25085.5-2026道路车辆汽车电缆第5部分:交流600 V或直流900 V和交流1 000 V或直流1 500 V单芯铜导体电缆的尺寸和要求
- 2026黑龙江省住房和城乡建设厅直属事业单位招聘14人笔试备考试题及答案解析
- 2026年矿山生态修复与矿区治理(新标准陆续实施)
- 2026年安徽工商职业学院单招综合素质考试题库及答案详解(名校卷)
- 2026年山西经贸职业学院单招职业适应性考试题库带答案详解(巩固)
- 2026年安徽城市管理职业学院单招职业适应性测试题库附参考答案详解(突破训练)
- 足疗店内部管理相关规定制度
- 北中医毕业论文
- 穴位贴敷治疗呼吸系统疾病
- (2023-2025)重庆市中考历史高频考点分析及2026备考建议
- 课程与教学论知到智慧树期末考试答案题库2025年浙江师范大学
评论
0/150
提交评论