



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
迎接 21 世纪生命科学的新时代基因组与蛋白组计划时代湖南医科大学分子生物学研究中心研究生 (长沙 410078)谭文斌朱定尔专业导师当全世界人类基因组计划在近年取得迅速和突出的进展 ,即将来临的 21 世纪将带领人类基因组计划进入一个后基因组时代 、蛋白组计划 、生物信息学的新时代 ,所有这些将构成 21 世纪生命科学研究的核心前沿和主流 。同样 ,生物信息学的成果将高度地拓展生命科学新的研究领域和加速其研究的进程 。多种多样数以千万计的生命模式 (如生物大分子结构功能的模式) 的数字化 ,将是加快生命科学信息化步入一个崭新的水平和时代的必由之路 。关键词 :人类基因组计划 后基因组时代 蛋白组计划 生物信息学21 世 纪 是 生 命 科 学 、信 息 科 学 的 世纪 ,也必将是生命科学与信息科学融合交 汇发展的世纪 。以系统论的眼光来看 , 21 世纪的生命科学将由人类基因组计划和后 基因组时代 、蛋白组计划 、生物信息学 、生命科学模式数字化等部分组成 。本文将就21 世纪生命科学在这几方面的发展趋势 作一简要描述 。一 、人类基因组计划和后基因组时代人类基因组是指合成有功能的人体各 类细胞中蛋白质及/ 或多肽链和 RNA 所必需的全部 DNA 顺序和结构 。也即包含人类的 24 条染色体 ( 22 条常染色体和 X 、Y两条性染色体) 上全部 DNA 所携带的遗传 信息的总和 ,其总长度约为 3 109 bp ,估约含 810 万个基因 。人类基因组计划 ( Hu2man Geno me Project , H GP) 旨 在 阐 明 人 类 基因组的全部序列 ,从整体上破译人类遗 传信息 ,使人类第一次在分子水平上全面 地认识自我 。主要包括四项任务 : ( 1) 遗传 图谱的建立 ; (2) 物理图谱的建立 ; (3) DNA顺序测定 ; ( 4) 基因的 识 别 。美 国 于 1990年正式启动 H GP , 15 年时间内提供 30 亿 美元的资助 。现预计整个基因组测序工作将于 2005 年之前完成 。1当基因数据库逐渐地被填充时 , 下一 步便是 要 研 究 这 些 基 因 到 底 有 怎 样 的 功 能 , 这 就 是 后 基 因 组 时 代 ( Po st geno me Era) 2 的到来 。810 万个基因的功能研 究比 H GP 更为复杂和艰巨 ,必将成为下个 世纪生命科学研究的主战场 。其主要任务 有 :11 研究组织器官特异 性 的 基 因 表 达 : 迄今发展起来的基因表达系列分析法 ( Se2 rial Analysis of Gene Exp ressio n , SA GE) 和 微排列分析法 ( Microarray assay) 可同时对 上千种基因的表达进行研究 。预计这两种 方法将 成 为 今 后 研 究 基 因 表 达 的 主 要 手段 。2 ,321 基因表达与调控研究 。基因表达除组织特异性外 ,还有发育阶段特异性等方面精确调控 。近来的研究表明 , 基因 的表达调控不能简单地认为是几个反式作用因子 和 顺 式 作 用 元 件 间 有 序 地 相 互 作方法 ,创立新的方法 , 在现有研究基础上 ,从而认识生命的本质 遗传信息的传递利用数学 、统计学 、信息学的研究成就 , 对基因表达调控的可能模式在理论上进行预 测 。31 基因组 95 %左右的“废弃”DNA 信 息的运作规律尚未有突破性认识 , 这些非编码区 DNA 是否为调控序列或为有其它 作用的序列 ? 又是如何发挥其功能的 ? 这 些问题与基因的表达调控有部分的重叠 , 期待着科学家去研究 。41 基因诊断 、基因 治疗和基因工程产品开发将展现出广阔的应用前景 ,将引发临床诊断和治疗以及医 药工业的变革 。人类基因组计划和后基因组时代研究 任务是异常复杂和艰巨的 ,以人类基因组 计划为例 ,如果每个实验室克隆一个新的基因 ,欲完成人类整个基因组的克隆则需8 10 万个实验室 ; 再加上各个实验室间 条件 、人员素质不一以及实验室之间的重 复竞争等不利因素对完成克隆整个人类基 因组显然不知要到何年何月 。然而 , 我们若将人类 8 10 万个基因视为一个整体 , 从整体水平上去考察基因的存在 、基因的 结构与功能 、基因之间的相互关系 ,即用系 统论的方法进行研究 ,对整个计划系统的 组织实施 ,也可能迎刃而解 。因此 ,人类基因组计划的实施是系统论方法在生命科学 中的典型运用 。同时也说明了当代科学研 究模式从以往的自由 、盲目 、独立 、小规模 走向社 会 化 、整 体 化 、系 统 化 、大 规 模 化 。 我们期望着这一哲学的方法能在后基因组时代和 蛋 白 组 计 划 研 究 中 发 挥 更 大 的 作或基因的本质 ; 随着人们对核酸的研究越来越深刻和全面 ,人们认识到单纯孤立的 核酸研究已不能完全解决生命现象的本质 问题 ,只有同时结合对核酸和蛋白质的研究 ;并且只有在研究核酸的基础上才能在 本质上对蛋白质进行认识 。于是生物化学 家和分 子 生 物 学 家 经 历 了 从 蛋 白 质 核 酸 ,最终又回到蛋白质和核酸结合的研究 历程 。随着人类基因组计划的完成和后基因组时代的到来 , 一个新的研究领域 蛋白组 ( Proteo me) 的研究随之提出了 。如 果我们将人体整个蛋白质称为蛋白组 , 那么蛋白质组无疑是一个极为复杂的群体 。阐明蛋白质的结构和功能是揭示生命奥秘的另一关键所在 。然而 , 我们现在对蛋白质的 研 究 困 难 重 重 , 还 缺 乏 有 效 的 方 法 。当 Pat rickoFarrell 发明了 双 向 凝 胶 电 泳( t wo dimensio nal gel elect rop ho resis , 2D gel elect rop ho resis) 后 ,人们曾为之鼓舞 。但到 了 80 年代中期 ,人们发现这种方法有两个 弱点 : (1) 难以重复 ,以致不同实验室间无 法比较 ; (2) 很难从蛋白质图片斑点中获得 信息 。近 来 新 的 质 谱 测 定 法 ( mass spec2 t ro met ry ,M S) 诞生后 ,两种基本技术 : 激光 脱吸附质谱测定法 (laser deso rp tio n M S) 以 及电喷雾质谱测定法 ( elect ro sp ray M S) 分 别得已发展 ,人们开始叩开了大规模 、自动 化蛋白质图片斑点识别之门 , 但这种方法 仍有待于进一步的改进和发展 。4蛋白质空间结构预测是蛋白组计划的们推测地球上存在的蛋白质有 1040 之多 ,从 50 年代第一个蛋白质 肌球蛋白的 空间结构被测定至今已有 40 年历史 ,但总 计被测定的蛋白质结构只有 6 000 余个 。 因此 ,要想用实验的方法测定所有蛋白质的空间结构是不可能的事情 。解决这一问 题的有效途径似乎只有从理论上发展预测 蛋白质结构的新方法 。这些方法的基本思 维是将基于知识的方法与计量化学 、统计 物理学 、信息学的方法相结合起来 ,从理论上预测蛋白质的空间结构 。5 一旦这些方 法取得成功 ,蛋白质折叠这一分子生物学 难题将有望获得解决 ,同时也为分子生物 学研究提供新的思路 。三 、生物信息学从哲 学 高 度 而 言 , 21 世 纪 是 生 命 科 学 、信息科学的世纪 ,也必将是生命科学与 信息科学融合交汇发展的世纪 。两者的融 合交汇便诞生出一门崭新的学科 生物 信息学 。因此生物信息学是基于生物学与 数学 、物理学 、化学以及计算机科学等诸多 学科交叉发展而成 ,是随着基因组测序数 据迅猛增加而逐渐兴起 。其核心是基因组 信息 学 , 它 包 含 着 基 因 组 信 息 的 获 取 、处 理 、存储 、分配和解释 。6 迄今 ,国际上四个 大的生物信息中心即美国国家生物技术信 息中心 ( N CB I) 和基因组序列数据库 ( GS2DB) 、欧洲分子生物学实验室 ( EMBL ) 和日 本 DNA 数据库 (DDBJ ) 已建立和维持了源 自数百种生物的 cDNA 和基因组 DNA 序列的大型数据库 。基因组相关数据库及计 算机网络技术的高速发达 ,使世界各国的 科学家 均 能 及 时 得 到 所 需 要 的 数 据 与 资 料 。7 生物信息学的发展 ,极大地促进了分 子生物学的研究 ,开拓了一些新的研究领域 ,诞生了一些新的研究方法 ,例如对齐比 较研究法 、分子进化论 、蛋白质空间结构预 测 、DNA 大规模序列分析 等 。又 例 如 , 为 了解决双向电泳凝胶上的蛋白质斑点识别的难题 , Genevas Ro n Appel 发 明 了 一 种叫 Melanie 的软件包以对凝胶图像进行 比较 。在 此 基 础 上 , 生 物 信 息 学 家 Amo s Bairoch 和 Appel 随后发展了一种蛋白质专 业分 析 系 统 ( t he Expert Protein AnalysisSystem , Ex PA Sy) ,该系统将 Geneva 2D gel数据库与 SW ISS - PRO T 蛋白质序列数据库联网 ,再与其它的数据与软件工具联网 。每月 这 套 系 统 能 从 WWW ( wo rld wideweb) 收到 300 000 份分析 2D gel 蛋白斑点 的请求 ,同时也帮助研究者从蛋白质序列预测其功能 ,从而开始了大规模 、自动化蛋白质的分析 。4由于生物信息学的发展和人类基因组 计划的完成 ,人们对现在医学的认识将有彻底的改变 今后人们去看医生时 , 很 可能是带着存有自己遗传密码的光盘 , 请 医生帮 助 从 中 找 到 最 佳 的 诊 断 和 治 疗 方 案 。四 、生命科学模式数字化科学要数字化 ,生命科学亦是如此 ,建 立数学模型来描述生命现象的本质和规律 将是分子生物学今后发展的方向之一 。我 们姑且看看生命现象中的数学 : 首先看看 DNA ,它由 A 、T 、G、C 四种碱基构成 ,不正 是数学中的四进制吗 ? 若以 A 、T 、G、C 配 对的方式 A - T 、G - C 而言 , 就是计算机 中采用的二进制了 ,再看看蛋白质和多肽 , 由 20 种氨基酸构成 ,其一级结构无非是 1 至 20 进制中的任何一种 ,在此基础上再加 以组 合 , 便 构 成 蛋 白 质 的 庞 大 家 族 ; 在 DNA 的复制 、转录及蛋白质的合成中都体 现了数学运算的规则 。又如蛋白质活化与失活过程中的磷酸化 、去磷酸化 、乙酰化 、去乙酰化等修饰方式无不体现了二进制 。再加上 DNA 双螺旋结构和肽键平面简洁的数学模型 。由此可见 , 生命活动的本质 规则体现了最简单的数学法则 , 这也就是 生命科学数字化的基础 。参考文献基因的表达与调控和蛋白质结构与功能 :1 . 陈 竺. 人类基因组 , 合作大舞台. 第 3 版. 中国科学报 ,1998 年 1 月 7 日 ,第 1192 期2 . Rachel Nowak . Entering t he Po st geno me Era . Sci2ence ,1995 ,270 :3683 . Victo r E. Velculescu et al . Serial Analysis of GeneExp ressio n . Science ,1995 ,270 :4844 . Pat ricia Kahn . Fro m Geno me to Proteno me : Loo k2ing at a cells Proteins. Science ,1995 ,270 :3695 . 刘振坤 ,王志新. 蛋白质结构预测 : 生命科学的前 沿课题. 第 2 版. 中国科学报 ,1998 年 1 月 5 日第1191 期6 . 杨永田. 生物信息学处在重大科学发现前夜. 第 3版. 中国科学报 ,1998 年 1 月 7 日 ,第 1192 期7 . 朱定尔. 生命科学的进展与生物信息网络. 医学 图书馆通讯 ,1996 ,5 ( 4) :2Meeting the 21st Century Open A Ne w Era of Lif e Science Tan Wenbin , The Center of Molecular Biology Re2 search , HuNan Medical U niversit y ,Changsha ,410078Abstract :As t he rapid and o ut standing p rogress of Hu2 man Geno me Project ( H GP) in recent few years over t he wo rld ,t he co ming of 21st cent ury will bring t he H GP en2 tering a new stage of po st geno me and/ o r p roteo me p roject s as well as Biological Info r matics , all of which will be t he co re f ro nt s and fo r m a main st ream of t he research of life Science in 21st cent ury. Wit h a similar sense ,t he advance of Biological Info r matics will induce t he develop ment of many new research fields and enhance t he p rogress of Life Science at a high way. By digitizatio n of vario us and t ho usands life mo dels ,such as t he mo dels of st ruct ure of f unctio n of large bio molecules ,may p rovide a key ro ute to advance t he Info r2 matics of Life Science stepping into a renewal level and a new ear .Key Words :Human Geno me Project Po st geno me eraProteo me p roject Biologi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 扩句课件教学课件
- 2025年化工仪表考试题目及答案
- 慢性胃炎护理课件
- 2025年江西道法中考试卷及答案
- 情节曲折的课件
- 深圳中考模考试卷及答案
- 数学教学论考试题及答案
- 情商培养独立自律的课件
- 树脂中控考试试题及答案
- 食品制作考试题目及答案
- 宠物展会策划方案
- 高等教育心理学知识点总结(张积家)华南师范大学
- 矿物绝缘电缆电缆头终端头制作安装和施工方法及矿物绝缘电缆线路敷设工艺标准
- 【道法广角】成语故事会:立木为信
- 病历书写基本规范课件
- XX学校“十抓十提升”高质量发展提升方案
- 曼昆《经济学原理》第七版课后答案
- 人体解剖生理学 课件 1绪论
- LB/T 070-2017温泉旅游泉质等级划分
- GB/T 7909-2017造纸木片
- GB/T 7383-2007非离子表面活性剂羟值的测定
评论
0/150
提交评论