




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
生物信息学在人类基因组计划中 的应用 作者:佚名来源:生命经纬2005-4-8 16:03:00 生物信息学是当前生物学领域的研究热点,预计在未来的若干年它将变得越来越重要、 越来越引起人们的重视。 近期任务 由于未来几年蛋白质和核酸的测序数据将以指数方式增加,近期生物信息学将在以下 几方面迅速发展: 大规模基因组测序中的信息分析 大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。目 前,从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列 间隙,到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的软件 和数据库的。特别是拼接和填补序列间隙更需要把实验设讨和信息分析时刻联系在一 起拼接与组装中的难点是处理重复序列,这在含有约30重复序列的人类基因组中显得 尤其突出。 新基因和新 SNPs(单核苷酸多态性)的发现与鉴定 人类基因组的工作草图即将完成,因此发现新基因就成了当务之急。使用基因组信息 学的方法通过超大规模计算是发现新基因的重要手段,可以说大部分新基因是靠理论方法 预测出来的。比如啤酒酵母完整基因组(约1300万 bp)所包含的6千多个基因,大约60 是通过信息分析得到的。 当人类基因找到之后,自然要解决的问题是:不同人种间基因有什么差别;正常人和 病人基因又有什么差别。 ”这就是通常所说的 SNPs(单核苷酸多态性) 。构建 SNPs 及其相 关数据库是基因组研究走向应用的重要步骤。1998年国际已开展了以 EST 为主发现新 Spps 的研究。在我国开展中华民族 SNPs 研究也是至关重要的。 完整基因组的比较研究 现在,生物信息学家不仅有大量的序列和基因而且有越来越多的完整基因组。有了这 些资料人们就能对若干重大生物学问题进行分析,比如:研究生命是从哪里起源的?生命 是如何进化的?遗传密码是如何起源的?估计最小独立生活的生物至少需要多少基因,这 些基因是如何使它们活起来的?比如,鼠和人的基因组大小相似,都含有约三十亿碱基对, 基因的数目也类似。可是鼠和人差异确如此之大,这是为什么?同样,有的科学家估计不 同人种间基因组的差别仅为01;人猿间差别约为 I。但他们表型间的差异十分显著。 因此其表型差异不仅应从基因、DNA 序列找原因,也应考虑到整个研究组、考虑染色体组 织上的差异。总之,这些例子说明由完整基因组研究所导致的比较基因组学必将为基因组 研究开辟新的领域。 大规模基因功能表达谱的分析 随着人类基因组测序逐渐接。近完成、一些学者就提出如下的问题:即使我们已经获 得了人的完整基因图谱,那我们对人的生命活动能说明到什么程度呢?于是他们提出了一 系列由上述数据所不能说明的问题,例如:基因表达的产物是否出现与何时出现;基因表 达产物的浓度是多少;是否存在翻译后的修饰过程,若存在是如何修饰的;基因敲出 (knock-out)或基因过度表达的影响是什么;多基因的表现型如何,等。概括这些问题, 其实质应该是:我们虽然知道了基因,知道了核酸序列,但我们不知道它们是如何发挥功 能的,或者说它们是如何按照特定的时间、空间进行基因表达的,表达量有多少。 为了得到基因表达的功能谱,国际上在核酸和蛋白质两个层次上都发展了新技术。这 就是在核酸层次上的 DNA 芯片技术和在蛋白质层次上的二维凝胶电泳和测序质谱技术, 也称蛋白质组技术。 生物大分子的结构模拟与药物设计 随着人类基因组计划的执行,估计几年之内就可找到人类的8万到10万个基因,也就是 发现它们的一级序列。然而要了解他们的功能、要找到这些蛋白质功能的分子基础,必须 进一步知道它们的三维结构。与此同时,要设计药物也需要了解相应的蛋白质受体的三维 结构。这是摆在科学家面前的紧迫任务。 远期任务 生物信息学的远期任务是读懂人类基因组,发现人类遗传语言的根本规律。从而阐 u 若干生物学中的重大自然哲学问题,像生命的起源与进化等。这一研究的关键和核心是了 解非编码区。 非编码区信息结构分析 近年来完整基因组的研究表明,在细菌这样的微生物中非编码区只占整个基因组序列 的10到 20。而高等生物和人的基因组中非编码区都占到基因组序列的绝大部分。从生 物进化的观点看来,随着生物体功能的完善和复杂化非编码区序列明显增加的趋势表明: 这部分序列必定具有重要的生物功能。普遍的认识是,它们与基因在四维时空的表达调控 有关。因此寻找这些区域的编码特征以及信息调节与表达规律是未来相当长时间内的热点 课题。 对人类基因组来说,迄今为止,人们真正掌握规律的只有 DNA 上的编码蛋白质的区 域(基因) ,很多资料说 u 这部分序列只占基因组的3到5,也就是说,人类基因组中多 达 95到97是非编码区。如何深人了解这些非编码区序列的功能是当前科学家们面临的 一个真正的挑战。 遗传密码起源和生物进化的研究 自 1859年 Darwin 的物种起源发表以来,进化论成为对人类自然科学和自然哲学发展 的最重大贡献之一。进化论研究的核心是描述生物进化的历史(系统进化树)和探索进化 过程的机制。自本世纪中叶以来,随着分子生物学的不断发展,进化论的研究也进入了分 子水平。当前分子进化的研究已是进化论研究的重要手段,并建立了一套依赖于核酸、蛋 白质序列信息的理论方法。近年来,随着序列数据的大量增加,对序列差异和进化关系的 争论也越来越激烈。不少的研究结果并不支持分子钟的假设。因为基于某一种分子序列所 重构出的进化树,只能反映这种序列的系统发育关系,并不一定能代表物种之间真正的进 化关系,即可能存在着基因树与物种树之间的差异。同时,对垂直进化和水平演化之间关 系的讨论正逐渐引起人们的重视。当前的资料给了我们。一个更为复杂也更为丰满的进化 模式,它启示我们要彻底了解进化的规律必须使用整个基因组的信息。相应地必须发展新 的理论方法。 总之,当前是生物信息学研究的一个有活力的新时代。不少科学家还说它是 人类基因组研究的收获时代,它不仅将赋予人们各种基础研究的重要成果,也会带来巨大 的经济效益和社会效益。在未来的几年中 DNA 序列数据将以意想不到的速度增长,这是 一个难得的机会,我国应尽早利用这些数据就可能走在国际科学界的最前沿。 论文关键词生物信息学 生命科学 论文摘要生物信息学是80年代以来新兴的一门边缘学科,信息在其中具有广阔 的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生 物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的 分析。 一、生物信息学的产生 21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如 大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些 模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因 组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定 律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生 物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信 息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息 学。 二、生物信息学研究内容 (一)序列比对 比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基 础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包 BALST 和 FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。 有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman 算法是解决 局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又 十分有效的算法。 (二)结构比对 比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。 (三)蛋白质结构预测 从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出 发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要 是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指 认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远 不能满足实际需要。 (四)计算机辅助基因识别 给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重 要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重 要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果 好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和 终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。 (五)非编码区分析和 DNA 语言研究 在人类基因组中,编码部分进展总序列的35%,其它通常称为“垃圾”DNA,其 实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区 DNA 序列需要 大胆的想象和崭新的研究思路和方法。DNA 序列作为一种遗传语言,不仅体现在编码序列 之中,而且隐含在非编码序列之中。 三、生物信息学的新技术 (一)Lipshutz(Affymetrix,Santa clara,CA,USA) 描述了一种利用 DNA 探针阵列进行基因组研究的方法,其原理是通过更有效有作图、 表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用 于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列 可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行 DNA 杂交 分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen, Branford, CT, USA)介绍 了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统 GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗 余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技 术在基因的表达、生物学功能以及疾病的基础研究中的应用。 (二)基因的功能分析 Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类 基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、 管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红 系发生的功能分析的原型系统 E-poDB,它包括了用于集成数据资源的 Kleisli 系统和建立 internet 或 intranet 上视觉化工具的 bioWidget 图形用户界面。EpoDB 有可能指导实验人员 发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药 物靶,EpoDB 提供了这样一个机会,这可能是它最令人激动的地方。 Babbitt(University of California,San Francisco,CA,USA)讨论了通过数据库搜索来识别远 缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑 造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中 得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关 系较不显著的序列 是重要的。Babbit 证明了通过使用 BLAST 检索,可以在数据库搜索所 得的低得分区识别远缘关系(distant relationship) 。Levitt(Stanford univeersity,Palo Alto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功 能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每 18 个月翻一番。 为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(ab initio folding)方法是 两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segment matching)来完成的,计算机程弃 SegMod 就是基于同源模建方法的。 (三)新的数据工具 Letovsky(Johns hopkins University,Baltimore,MD,USA)介绍了 GDB 数据库,它由每条人 类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点 (STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论 其类型(type)和来源(source) ,或者是否它们正好包含用以批定感兴趣的区域的标志 (markers) ,能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统 (common coordinate system)来排列这些图谱。数据库还提供了一张高分辨率的和与其他 图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱 的标准图谱的分配。 Candlin(PE applied Biosystems,Foster City,CA,USA)介绍了一种新的存储直接来自 ABPrism dNA 测序仪的数据的关系数据库系统 BioLIMS。该系统可以与其它测序仪的数 据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放 的、可扩展的生物信息学平台。 参考文献: 1Lim HA,Batt tR.TIBTECH,1998;16(3):104. 2Williams n.Science,1997;277(5328):902. 计算机技术和人类基因组计划的发展,应运而生了一门新兴的学科生物信息学,该学 科包含了两个交叉领域的工作:用于建立现代生物学所需信息系统框架(支持生物学的信 息管理系统、分析工具和通讯网络)的研究开发工作,即传统意义上的生物信息学 (bioinformatics) ;旨在理解基本生物学问题的基于计算的研究工作,即计算生物学 (computational biology) 。生物信息学和基因组研究(Bioinformatics and Genome Research)系列会议于 1990 年开始举办,1997 年 6 月 1112 日在美国加州旧金山举办了第 六届国际生物信息学和基因组研究年会,年会的主要议题包括正在出现的新技术、基因的 功能分析、新的数据工具和制药先导的基因和蛋白质发现1。现将有关内容简介如下: 一、正在出现的技术 Klingler(Lncyte pharmaceuticals,PaloAlto,CA,USA)强调基因组学正推动制药业进入信息 时代。随着不断增加的序列、表达和作图数据的产生,描述和开发这些数据的信息工具变 得对实现基因组研究的任务至关重要。他谈到了 Incyte pharmaceuticals 对大规模基因组数 据和生物信息学的贡献。 Lipshutz(Affymetrix,Santa clara,CA,USA)描述了一种利用 DNA 探针阵列进行基因组研 究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基 因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这 种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后 这些阵列就可以直接用于并行 DNA 杂交分析,以获得序列、表达和基因分型信息。 Milosavljevic(CuraGen, Branford, CT, USA)介绍了一种新的基于专用定量表达分析方法的基 因表达检测系统,以及一种发现基因的系统 GeneScape。为了有效地抽样表达,特意制作 片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研 究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基 础研究中的应用。 二、基因的功能分析 Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类 基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分 析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系 统红系发生的功能分析的原型系统 E-poDB,它包括了用于集成数据资源的 Kleisli 系统和 建立 internet 或 intranet 上视觉化工具的 bioWidget 图形用户界面。EpoDB 有可能指导实验 人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新 的药物靶,EpoDB 提供了这样一个机会,这可能是它最令人激动的地方。 Sali(Rockefeller university,New York,NY,USA)讨论了同源蛋白质结构模建。比较蛋白质 模建(comparative protein modeling)也称为同源模建(homology modeling) ,即利用实验 确定的蛋白质结构为模式(模型)来预测另一种具有相似氨基酸序列的蛋白质(靶)的构 象。此方法现在已经具有了足够的精确性,并且被认为效果良好,因为蛋白质序列的一个 微小变化通常仅仅导致其三维结构的细微改变。 Babbitt(University of California,San Francisco,CA,USA)讨论了通过数据库搜索来识别远 缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑 造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中 得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关 系较不显著的序列 是重要的。Babbit 证明了通过使用 BLAST 检索,可以在数据库搜索所 得的低得分区识别远缘关系(distant relationship) 。Levitt(Stanford univeersity,Palo Alto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功 能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每 18 个月翻一番。 为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(ab initio folding)方法是 两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segment matching)来完成的,计算机程弃 SegMod 就是基于同源模建方法的。 三、新的数据工具 Letovsky(Johns hopkins University,Baltimore,MD,USA)介绍了 GDB 数据库,它由每条人 类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点 (STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论 其类型(type)和来源(source) ,或者是否它们正好包含用以批定感兴趣的区域的标志 (markers) ,能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统 (common coordinate system)来排列这些图谱。数据库还提供了一张高分辨率的和与其他 图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱 的标准图谱的分配。 Markowitz(Lawrence berkeley Laboratory,Berkeley,CA,USA)讨论了分布式数据库与局部 管理的关系,以及用基于工具的方法开发分子生物学数据库(MDBs)的问题。许多方案 当前正在促进搜索多种不同来源 MDBs 的数据,包括建立数据仓库;这要求对各种 MDBs 的组合有一种全局观,并从成员 MDBs 中装填数据入中心数据库。这些方案的主要问题是 开发整体视图(global views) ,构建巨大的数据仓库并使集成的数据库与不断发展中的成 员 MDBs 同步化的复杂性。Markowitz 还讨论了对象协议模型(object protocol model,OPM) , 并介绍了支持以下用途的工具:建立用于文本文件或者关系 MDBs 的 OPM 视图;将 MDBs 作成一个数据库目录,提供 MDB 名称、定位、主题、获取信息和 MDB 间链接等信 息;说明、处理和解释多数据库查询。Karp(SRI international,Menlo Park,CA,USA)解释了 Ocelot,一种能满足管理生物学信息需求的面向对象知识陈述系统(一种面向对象系统的人 工智能版) 。Ocelot 支持略图展开(schema evolution)并采用一种新的最优化并行控制机制 (同时进行多项访问数据的过程) ,其略图驱动图形编辑器提供了交互式浏览和编辑功能, 其注释系统支持数据库开发者之间的结构通讯。 Riley(Marine biological Laboratory,Woods Hole,MA,USA)在讨论大肠杆菌蛋白质的功能 同时,特别提到了 GPEC 数据库,它包括了由实验确定的所有 E.coli 基因的功能的信息。 该数据库中最大比例的蛋白质是酶,其次则为转运和调控蛋白。 Candlin(PE applied Biosystems,Foster City,CA,USA)介绍了一种新的存储直接来自 ABPrism dNA 测序仪的数据的关系数据库系统 BioLIMS。该系统可以与其它测序仪的数 据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放 的、可扩展的生物信息学平台。 Glynais(NetGenics,Cleveland,OH,USA)认为生物信息学中最关键的问题之一是软件工具 和数据库缺乏灵活性。但是,软件技术的发展已得到了其它领域如金融业和制造业的发展 经验的借鉴,可以使来自不同软件商的运行于各种硬件系统的软件共同工作。这种系统的 国际标准是 CORBA,一种由 250 多个主要软件和硬件公司共同合作开发的软件体系。联 合使 用 CORBA 和 Java 可以开发各种通过一个公用用户界面访问任何种类的数据或软件 工具的网络应用软件,也包括生物信息学应用软件。Overton 不同意 Glynias 的这种想法, 他强调说 CORBA 仅对软件集成有用,不兼容的数据库软件可能是计算生物 学所面临的最困难问题,一些制药公司和数据库仓库最近资助了一项用 OCRBA 链接不同 的数据库的计划2,3。 四、制药先导的发现 Burgess(Sturctural bioinformatics,San Diego,CA,USA)讨论了填补基因组学和药物设计之 间鸿沟的蛋白质结构中的计算问题。在缺乏主要疾病基因或药物靶的精确描述数据的情况 下,药物设计者们不得不采用大规模表达蛋白质筛选方法;而结构生物信息学则采用一种 更为实用有效的计算方法直接从序列数据中确定靶蛋白质的活性位点的精细结构特征,它 利用一种集成专家系统从现实的或虚拟的化学文库中进行迅速的计算筛选,可以达到一个 很大的规模。 Elliston(Gene logic,Columbia,MD,USA)讨论了治疗药物开发中发现新的分子靶的过程, 着重讨论了基因发现方法。他认为,随着日益临近的人类基因组测序的完成,几乎全部基 因的特征将在序列水平得到揭示。但是,对基因的认识将有赖于更多的信息而不仅仅是序 列,需要考虑的第一类信息是转录表达水平信息,而 Gene logic 公司的 GeneExpress 就是 一个由 mRNA 表达谱、转录因子位点、新基因和表达序列标签组成的数据库。 Liebman(Vysis,Downess grove,IL,USA)介绍了 Vysis 公司开发的计算和实验方法,这些 主法不仅用于管理序列数据,而且被用于以下用途:分析临床数据库和自然突变数据库; 开发新的算法以建立功能同源性(区别于序列同源性)模拟生物学通路以进行风险评估; 药物设计的靶评估;联系复杂的通路特性以便识别副作用;开发疾病发展的定性模型并解 释临床后果。 随着发现的新基因的日益增多,这个问题显得格外重要:基因的功能是什么? Escobedo(Chiron technologies,Emeryville,CA,USA)提出了这个问题的一种方法:将分泌蛋白 质的基因的功能克隆与筛选这些克隆(可能的药物靶)结合起来。在这种方法中,在微粒 体 cDNA 文库池中进行体外翻译避免了劳动密集的克隆、表达和纯化步聚,对文库池中的 翻译产物在细胞水平进行筛选,测试其在细胞增殖和分化中的作用。例如,在用这种方法 识别的 111 个克隆中,56 个属于已知的分泌蛋白质,25 个为膜相关蛋白,另外 30 个功能 未知,可能是新的蛋白质。一种相似的方法在转移到小鼠模型系统中的基因传导载体中构 建分泌蛋白质的 cDNA 文库来克隆特定的功能基因。 Ffuchs(Glaxo wellcome ,Research Triangle Park,NC,USA)讨论了生物信息学更为广义的 影响:它不仅影响到新药物靶基的发现,还对改善药物开发的临床前期和临床期的现状极 具重要性。众所周知,涉汲数以千计病人的临床试验(可能是药物开发最为花钱的部分) 的设计不论多么仔细,也不能为正确的药物选择正确的病人。而在基因组水平划分病人群 体的方法可以大大改善发现新药的效率。Fuchs 介绍了一种将病人的基因型和表型标志结 合起来以改善临床前期和临床期药物开发过程的系统 Genetic information System.他强调将 遗传学和生物信息学数据同化学、生物化学、药理学和医学数据连接起来的集成信息管理 和分析方法是极其重要的。 Green (Human Genome Sciences,Rockville,MD,USA)介绍了他的测序工作中采用的数据 管理工具。基于 EST 的测序方法所面临的挑战是,在对几百个 cDNA 克降重复测序之后, 产生的数据堆积如山。由于大多数人类基因都是用这种方法发现并在么有数据库中分类编 排的,面临的识别开放读框、重叠序列的重叠图谱、组织特异表达和低丰度 mRNA 基因的 任务是令人生畏的。Human genome Scien
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 柑橘种植园农业信息化技术应用考核试卷
- 营林机械在林业灾害应急响应中的应用考核试卷
- 矿山信息化管理系统与数据安全考核试卷
- 宠物友好医院宠物友好医疗服务提升措施考核试卷
- 纱线染色牢度提升技术考核试卷
- 《三年级下册古诗鉴赏课件语文》
- 2019-2025年二级建造师之二建公路工程实务题库附答案(典型题)
- 2025年初级银行从业资格之初级公司信贷综合检测试卷A卷含答案
- 2025年文字、语音、图象识别设备项目建议书
- 猜测图片的课件
- 科研助理笔试题库及答案
- 2024年中华医学会招聘考试真题
- 2025年-山东省建筑安全员A证考试题库附答案
- 《全消光锦纶6切片制备工艺流程分析9200字(论文)》
- 收费室考核细则
- 2024年纪检监察综合业务知识考试题库含答案【培优】
- 医院物业管理服务合同-范本
- 综合执法考试试题及答案
- 药物临床试验质量管理规范解读
- 艾滋病、梅毒、丙肝预防知识
- 天津外研版英语七年级上册单词表
评论
0/150
提交评论