




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 / 13生物信息学新进展计算机技术和人类基因组计划的发展,应运而生了一门新兴的学科生物信息学,该学科包含了两个交叉领域的工作:用于建立现代生物学所需信息系统框架的研究开发工作,即传统意义上的生物信息学;旨在理解基本生物学问题的基于计算的研究工作,即计算生物学。生物信息学和基因组研究系列会议于 1990 年开始举办,1997年 6 月 1112 日在美国加州旧金山举办了第六届国际生物信息学和基因组研究年会,年会的主要议题包括正在出现的新技术、基因的功能分析、新的数据工具和制药先导的基因和蛋白质发现1。现将有关内容简介如下: 一、正在出现的技术 Klingler(Lncyte pharmaceuticals,PaloAlto,CA,USA)强调基因组学正推动制药业进入信息时代。随着不断增加的序列、表达和作图2 / 13数据的产生,描述和开发这些数据的信息工具变得对实现基因组研究的任务至关重要。他谈到了 Incyte pharmaceuticals 对大规模基因组数据和生物信息学的贡献。Lipshutz(Affymetrix,Santa clara,CA,USA)描述了一种利用 DNA 探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行 DNA 杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen, Branford, CT, USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统 GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。 3 / 13二、基因的功能分析 Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统 E-poDB,它包括了用于集成数据资源的 Kleisli 系统和建立 internet 或 intranet 上视觉化工具的 bioWidget 图形用户界面。EpoDB 有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB 提供了这样一个机会,这可能是它最令人激动的地方。 Sali(Rockefeller university,New York,NY,USA)讨论了同源蛋白质结构模建。比较蛋白质模建也称为同源模建,即利用实验确定的蛋白质结构为模式来预测另一种具有相似氨基酸序列的蛋白质的构象。此方法现在已经具有了足够的精确性,并且被认为效果良好,因为蛋白质序4 / 13列的一个微小变化通常仅仅导致其三维结构的细微改变。 Babbitt(University of California,San Francisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低但生物学关系显著的序列与得分高而生物学关系较不显著的序列 是重要的。Babbit 证明了通过使用 BLAST 检索,可以在数据库搜索所得的低得分区识别远缘关系。Levitt(Stanford univeersity,Palo Alto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每 18 个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配来完成的,计算机程弃SegMod 就是基于同源模建方法的。 5 / 13三、新的数据工具 Letovsky(Johns hopkins University,Baltimore,MD,USA)介绍了 GDB 数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型和来源,或者是否它们正好包含用以批定感兴趣的区域的标志,能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。 Markowitz(Lawrence berkeley Laboratory,Berkeley,CA,USA)讨论了分布式数据库与局部管理的关系,以及用基于工具的方法开发分子生物学数据库的问题。许多方案当前正在促进搜索多种不同来源 MDBs的数据,包括建立数据仓库;这要求对各种 MDBs 的组合有一种全局观,并从成员 MDBs 中装填数据入中心数据库。这6 / 13些方案的主要问题是开发整体视图,构建巨大的数据仓库并使集成的数据库与不断发展中的成员 MDBs 同步化的复杂性。Markowitz 还讨论了对象协议模型,并介绍了支持以下用途的工具:建立用于文件或者关系 MDBs 的 OPM 视图;将MDBs 作成一个数据库目录,提供 MDB 名称、定位、主题、获取信息和 MDB 间链接等信息;说明、处理和解释多数据库查询。Karp(SRI international,Menlo Park,CA,USA)解释了 Ocelot,一种能满足管理生物学信息需求的面向对象知识陈述系统。Ocelot 支持略图展开并采用一种新的最优化并行控制机制,其略图驱动图形编辑器提供了交互式浏览和编辑功能,其注释系统支持数据库开发者之间的结构通讯。 Riley(Marine biological Laboratory,Woods Hole,MA,USA)在讨论大肠杆菌蛋白质的功能同时,特别提到了 GPEC 数据库,它包括了由实验确定的所有基因的功能的信息。该数据库中最大比例的蛋白质是酶,其次则为转运和调控蛋白。 Candlin(PE applied Biosystems,Foster 7 / 13City,CA,USA)介绍了一种新的存储直接来自 ABPrism dNA测序仪的数据的关系数据库系统 BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。 Glynais(NetGenics,Cleveland,OH,USA)认为生物信息学中最关键的问题之一是软件工具和数据库缺乏灵活性。但是,软件技术的发展已得到了其它领域如金融业和制造业的发展经验的借鉴,可以使来自不同软件商的运行于各种硬件系统的软件共同工作。这种系统的国际标准是CORBA,一种由 250 多个主要软件和硬件公司共同合作开发的软件体系。联合使 用 CORBA 和 Java 可以开发各种通过一个公用用户界面访问任何种类的数据或软件工具的网络应用软件,也包括生物信息学应用软件。Overton 不同意Glynias 的这种想法,他强调说 CORBA 仅对软件集成有用,不兼容的数据库软件可能是计算生物学所面临的最困难问题,一些制药公司和数据库仓库最近资助了一项用 OCRBA链接不同的数据库的计划2,3。 8 / 13四、制药先导的发现 Burgess(Sturctural bioinformatics,San Diego,CA,USA)讨论了填补基因组学和药物设计之间鸿沟的蛋白质结构中的计算问题。在缺乏主要疾病基因或药物靶的精确描述数据的情况下,药物设计者们不得不采用大规模表达蛋白质筛选方法;而结构生物信息学则采用一种更为实用有效的计算方法直接从序列数据中确定靶蛋白质的活性位点的精细结构特征,它利用一种集成专家系统从现实的或虚拟的化学文库中进行迅速的计算筛选,可以达到一个很大的规模。 Elliston(Gene logic,Columbia,MD,USA)讨论了治疗药物开发中发现新的分子靶的过程,着重讨论了基因发现方法。他认为,随着日益临近的人类基因组测序的完成,几乎全部基因的特征将在序列水平得到揭示。但是,对基因的认识将有赖于更多的信息而不仅仅是序列,需要考虑的第一类信息是转录表达水平信息,而 Gene logic 公司的9 / 13GeneExpress 就是一个由 mRNA 表达谱、转录因子位点、新基因和表达序列标签组成的数据库。 Liebman(Vysis,Downess grove,IL,USA)介绍了Vysis 公司开发的计算和实验方法,这些主法不仅用于管理序列数据,而且被用于以下用途:分析临床数据库和自然突变数据库;开发新的算法以建立功能同源性模拟生物学通路以进行风险评估;药物设计的靶评估;联系复杂的通路特性以便识别副作用;开发疾病发展的定性模型并解释临床后果。 随着发现的新基因的日益增多,这个问题显得格外重要:基因的功能是什么?Escobedo(Chiron technologies,Emeryville,CA,USA)提出了这个问题的一种方法:将分泌蛋白质的基因的功能克隆与筛选这些克隆结合起来。在这种方法中,在微粒体 cDNA 文库池中进行体外翻译避免了劳动密集的克隆、表达和纯化步聚,对文库池中的翻译产物在细胞水平进行筛选,测试其在细胞增殖和分化中的作用。例如,在用这种方法识别的 111 个克隆中,56 个属于已知的分泌蛋白质,25 个为膜相关蛋白,另外 3010 / 13个功能未知,可能是新的蛋白质。一种相似的方法在转移到小鼠模型系统中的基因传导载体中构建分泌蛋白质的cDNA 文库来克隆特定的功能基因。 Ffuchs(Glaxo wellcome ,Research Triangle Park,NC,USA)讨论了生物信息学更为广义的影响:它不仅影响到新药物靶基的发现,还对改善药物开发的临床前期和临床期的现状极具重要性。众所周知,涉汲数以千计病人的临床试验的设计不论多么仔细,也不能为正确的药物选择正确的病人。而在基因组水平划分病人群体的方法可以大大改善发现新药的效率。Fuchs 介绍了一种将病人的基因型和表型标志结合起来以改善临床前期和临床期药物开发过程的系统 Genetic information System.他强调将遗传学和生物信息学数据同化学、生物化学、药理学和医学数据连接起来的集成信息管理和分析方法是极其重要的。 Green (Human Genome Sciences,Rockville,MD,USA)介绍了他的测序工作中采用的数据管理工具。基于 EST 的测序方法所面临的挑战是,在对几百个 cDNA 克降重复测序之后,产生的数据堆积如山。11 / 13由于大多数人类基因都是用这种方法发现并在么有数据库中分类编排的,面临的识别开放读框、重叠序列的重叠图谱、组织特异表达和低丰度 mRNA 基因的任务是令人生畏的。Human genome Sciences 公司开发了一些可用户化数据库工具,在同一个数据库中可包括以下功能:WWW 上访问和检索数据,序列拼接,临视潜在药 物靶基因的研究进展等。这些能够管理多项任务从注释基因序列到成功开发基因产物进入药物发现的流程的软件工具,极其可望从一种基于基因组知识的药物发现方法中得到新的药物靶。 Summer-Smith(Base4 bioinformatics,Mississauga,Ontario,Canada)描述了一种相关的策略。药物发现阶段中所要求的软件工具的任务是多样化的,要能注释基因,并阐明它的生理和病理功能及其商业潜质。对这样多种来源的信息的集成与分析,在派生的、项目取向的数据库中可以很好完成。由于项目贯穿于发现到开发全过程,其间又不断加入背景的成员,PSD在项目的管理与发展中成为一种关键性的资源。 按照 Smith(Boston university,Boston,MA,USA)的12 / 13观点2,我们并不需要更快捷的计算机或更多的计算机科学家,而是需要更的生物学家和生物化学家来解释序列的功能。这对有些软件或硬件专家来说是个打击,但生物学系统的复杂性是令人生畏的,并且对基因功能的认识可能需要生物学方法和计算方法的结合。探索基因的功能很可能要花费生物学家们数十年的时间,本次会议表明没有任何单一的方法可以得出一个答案;但是,将计算生物学同大规模筛先结合起来识别一种化学靶物是一种产生化学工具来探索基因功能的方法,这些化学工具接下来就可以用作理解基因功能的“探针” 。这种方法在 Butt(Gene Transcription Technologies, Philadelphia, PA, USA)的描述中,既是一种检查基因功能的简单方法,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 17236:2025 EN Leather - Physical and mechanical tests - Determination of extension set
- 资产配置中的信用风险管理技术与策略应用考核试卷
- 汽车制造产能调整策略考核试卷
- 船舶改装项目施工过程中的质量保障措施优化考核试卷
- 藤编家具行业人才培养与技术创新体系建设战略考核试卷
- 运动服装的智能纤维技术与发展趋势考核试卷
- 电机在电力市场运营中的应用考核试卷
- 连续搬运设备环境适应性设计方法研究进展考核试卷
- 艺术家作品的艺术风格演变与文化传承考核试卷
- 电气工程项目管理与协调考核试卷
- 安全管理职业健康体系适用法律法规要求清单(2023年7月版)
- 农业政策与法规复习题
- MOOC 农学概论-福建农林大学 中国大学慕课答案
- 模拟法庭剧本(五篇)
- 美军浮空器雷达系统现状浅析
- 我的家乡陕西省安康市
- 八角茴香油教学课件
- 教学机房规划方案
- 国家文化安全教育课件
- 可行性研究报告编制服务投标方案
- 山东省汽车维修工时定额(T-SDAMTIA 0001-2023)
评论
0/150
提交评论