付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1生物信息学的应用俳句之神芭蕉桑1,序列比对(SequenceAlignment)序列比对的基本问题是比较两个或两个以上符号序列的类似性或不类似性.从生物学的初志来看,这一问题包括了下面几个意义:从互相重叠的序列片断中重构DNA的完好序列.在各种试验条件下从探测(probedata)中决定物理和基因图存贮,遍历和比较库中的DNA序列比较两个或多个序列的类似性在库中搜索相关序列和子序列寻找核苷(nucleotides)的连续产生形式找出蛋白质和DNA序列中的信息成分序列比对考虑了DNA序列的生物学特性,如序列部分发生的插入,删除(前两种简称为indel)和替代,序列的目的函数获得序列之间突变集最小间隔加权和或最大类似性和,对齐的方法包含全局对齐,部分对齐,代沟处分等.两个序列比对常采取动态规划算法,这种算法在序列长度较小时适用,然而对于海量基因序列(如人的DNA序列高达109bp),这一方法就不太适用,以至采取算法复杂性为线性的也难以奏效.因而,启发式方法的引入势在必定,有名的BALST和FASTA算法及相应的改良方法均是从此前提出发的.2,蛋白质构造比对和预测基本问题是比较两个或两个以上蛋白质分子空间构造的类似性或不类似性.蛋白质的构造与功能是亲密相关的,一般以为,具有类似功能的蛋白质构造一般类似.蛋白质是由氨基构成的长链,长度从50到1000~3000AA(AminoAcids),蛋白质具有多种功能,如酶,物质的存贮和运输,信号传递,抗体等等.氨基的序列内在的决定了蛋白质的3维构造.一般以为,蛋白质有四级不同的构造.研究蛋白质构造和预测的理由是:医上能够理解生物的功能,寻找dockingdrugs的目的,农业上获得更好的农作物的基因工程,上有利用酶的.直接对蛋白质构造进行比对的原因是由于蛋白质的3维构造比其一级构造在进化中更稳定的保留,同时也包括了较AA序列更多的信息.蛋白质3维构造研究的前提假设是内在的氨基序列与3维构造一一对应(不一定全真),物理上可用最小能量来解释.从观察和总结已经知道构造的蛋白质构造规律出发来预测未知蛋白质的构造.同源建模(homologymodeling)和指认(Threading)方法属于这一范畴.同源建模用于寻找具有高度类似性的蛋白质构造(跨越30%氨基一样),后者则用于比较进化族中不同的蛋白质构造.然而,蛋白构造预测研究现在状况还远远不能知足实际需要.3,基因辨别,非编区分析研究.基因辨别的基本问题是给定基因组序列后,正确辨别基因的范围和在基因组序列中的精到准确位置.非编区由内含子构成(introns),一般在构成蛋白质后被丢弃,但从实验中,假如去除非编区,又不能完成基因的复制.显然,DNA序列作为一种遗传语言,既包括在编区,又隐含在非编序列中.分析非编区DNA序列当前没有一般性的指点方法.在人类基因组中,并非所有的序列均被编,即是某种蛋白质的模板,已完成编部分仅占人类基因总序列的3~5%,显然,手工的搜索如此大的基因序列是难以想象的.侦测密区的方法包含测量密区密子(codon)的频率,一阶和二阶马尔可夫链,ORF(OpenReadingFrames),启动子(promoter)辨别,HMM(HiddenMarkovModel)和GENSCAN,SpliceAlignment等等.4,分子进化和比较基因组学分子进化是利用不同物种中同一基因序列的异同来研究生物的进化,构建进化树.既能够用DNA序列可以以用其编的氨基序列来做,以至于可通过相关蛋白质的构造比对来研究分子进化,其前提假定是类似种族在基因上具有类似性.通过比较能够在基因组层面上发现哪些是不同种族同的,哪些是不同的.早期研究方法常采取外在的因素,如大小,肤色,肢体的数量等等作为进化的根据.近年来较多形式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化.在匹配不同种族的基因时,一般须处理三种情况:Orthologous:不同种族,一样功能的基因;Paralogous:一样种族,不同功能的基因;Xenologs:有机体间采取其他方式传递的基因,如被病毒注入的基因.这一领域常采取的方法是构造进化树,通过基于特征(即DNA序列或蛋白质中的氨基的碱基的特置)和基于间隔(对齐的分数)的方法和一些传统的聚类方法(如UPGMA)来实现.5,序列重叠(Contigs)装配根据现行的测序技术,每次反应只能测出500或更多一些碱基对的序列,如人类基因的测量就采取了短(shortgun)方法,这就要求把大量的较短的序列全体构成了重叠(Contigs).逐步把它们拼接起来构成序列更长的重叠,直至得到完好序列的经过称为重叠装配.从算法条理来看,序列的重叠是一个NP-完全问题.6,遗传密的起源通常对遗传密的研究以为,密子与氨基之间的关系是生物进化历史上一次偶尔的而造成的,并被固定在现代生物的共同祖先里,一直延续至今.不同于这种"冻结"理论,有人曾分别提出过选择优化,化学和历史等三种学说来解释遗传密.随着各种生物基因组测序任务的完成,为研究遗传密的起源和检验上述理论的真伪了新的素材.7,基于构造的设计人类基因工程的目的之一是要了解人体内约10万种蛋白质的构造,功能,互相作用以及与各种人类疾病之间的关系,寻求各种和预防方法,包含.基于生物大分子构造及小分子构造的设计是生物信息学中的极为主要的研究领域.为了抑制某些酶或蛋白质的活性,在已经知道其蛋白质3级构造的基础上,能够利用分子对齐算法,在计算机上设计抑制剂分子,作为候选.这一领域目的是发现新的基因,有着宏大的经济效益.8.生物系统的建模和随着大规模实验技术的发展和累积,从全局和系统水平研究和分析生物学系统,揭示其发展规律已经成为后基因组时代的另外一个研究热门-系统生物学。当前来看,其研究内容包含生物系统的模仿〔CurrOpinRheumatol,2007,463-70〕,系统稳定性分析〔NonlinearDynamicsPsycholLifeSci,2007,413-33〕,系统鲁棒性分析〔ErnstScheringResFoundWorkshop,2007,69-88〕等方面。以SBML〔Bioinformatics,2007,1297-8〕为代表的建模语言在迅速发展之中,以布尔网络〔PLoSComputBiol,2007,e163〕、微分方程〔MolBiolCell,2004,3841-62〕、随机经过〔NeuralComput,2007,3262-92〕、离散动态系统等〔Bioinformatics,2007,336-43〕方法在系统分析中已经得到应用。许多模型的建立借鉴了电路和其它物理系统建模的方法,许多研究试图从信息流、熵和能量流等宏观分析思想来解决系统的复杂性问题〔AnalQuantCytolHistol,2007,296-308〕。当然,建立生物系统的理论模型还需要很长时间的努力,如今实验观测固然在海量增长,但是生物系统的模型辨识所需要的远远跨越了当前的产出能力。例如,对于时间序列的芯片,采样点的数量还不足以使用传统的时间序列建模方法,宏大的实验代价是当前系统建模重要困难。系统描绘叙述和建模方法也需要创始性的发展。9.生物信息学技术方法的研究生物信息学不仅仅仅是生物学知识的简单整理和、数学、物理学、信息科学等学科知识的简单应用。海量和复杂的背景导致机器学习、统计分析和系统描绘叙述等方法需要在生物信息学所面临的背景之中迅速发展。宏大的计算量、复杂的噪声形式、海量的时变给传统的统计分析带来了宏大的困难,需要像非参数统计〔BMCBioinformatics,2007,339〕、聚类分析〔QualLifeRes,2007,1655-63〕等愈加灵敏的分析技术。高维的分析需要偏最小二乘〔partialleastsquares,PLS〕等特征空间的压缩技术。在计算机算法的开发中,需要充足考虑算法的时间和空间复杂度,使用并行计算、网格计算等技术来拓展算法的可实现性。10,生物图像没有血缘关系的人,为什么长得那么像呢?外貌是像点构成的,像点愈重合两人长得愈像,那两个没有血缘关系的人像点为什么重合?有什么生物学基础?基因是不是类似?我不知道,希望解答。11,其他如基因表达谱分析,代谢网络分析;基因芯片设计和蛋白质组学分析等,逐步成为生物信息学中新兴的主要研究领
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 计划部作业流程规范制度
- 危化品管理制度及规范
- 医疗经营制度管理规范
- 完善鉴定技术规范制度
- 卫生监督协管制度规范
- 进一步规范听课评课制度
- 如何规范宠物寄养制度
- 康复训练技术规范制度
- 城市轨道交通行车调度员安全生产意识强化考核试卷含答案
- 2026年浙江凤栖湖文化发展有限公司及下属子公司招聘工作人员备考题库参考答案详解
- 2025年湖南省公务员录用考试《行测》试题及答案解析
- 厦门市人教版八年级上册期末生物期末试卷
- 2026中国钢研钢研纳克校园招聘备考考试题库附答案解析
- 减速机知识培训资料课件
- 冷库消防安全培训课件
- 普陀区一模高三数学试卷
- 光热储能电站发电项目项目管理各阶段主要任务
- 2026年中考语文复习:非连续性文本阅读 中考真题练习题汇编(含答案解析)
- 医疗工作者榜样学习心得体会
- 部队安全驾驶课件
- 医保基金安全使用警示教育
评论
0/150
提交评论