已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
遗传 HE R E D I T A S B e i j i n g 2 0 6 4 1 一4 7 1 9 9 8 W蕊 巨 人类基因组的物理图谱与大规模D N A测序 于军 中国科学院遗传研究所人类基因组中心 北京 1 0 0 1 0 1 P h y s i c a l Ma p p i n g a n d L a k g e s c a l e S e q u e n c i n g o f t h e H u m a n G e n o m e YU J u n Hu ma n Ge n o me C e n t e r I n s t i t u t e o f G e n e t i c s C h i n e s e A c a d m y S c i e n c e s B e i j i n g 1 0 0 1 0 1 1历史的回顾 物理图谱的制作是与分子克隆技术分不开的 限制性 内切酶的发现 导致 了第 一个物理图谱 的完成 S V 4 0 D a n n a与 N a t h a n s 1 9 7 1 新克隆技术 尤其是 Y A C Y e a s t A r t if ic i a l C h r o m o s o m e 和 B A C B a c t e r i a l A r t if i c ia l C h r o m o s o m e 的发明 使物理图谱的 制作向前大大地迈进了一 步 它们的克隆片段长度使 S T S S e q u e n c e T a g g e d S i t e O ls o n 等 1 9 8 9 成为 有力的物 理图 谱路标 而 保证7图 谓的 联贯性 大肠杆菌 酵母 和C e l e g a n s 等物理图 谱的完成则标志着制作技术的 成熟 有了 精确的 物理图 谱 测序就变得常规化了 第一个生命基因 组 P h iX 1 7 4 顶 序的测定是 1 9 7 7 年在英国的S a n g e r 试验室完成的 而S a n g e r 的酶法 测序以 其速度与准确性很快取代了 Ma x a m和 Gi l b e r t 的化学法 大规模测序的开始是以荧光自动分析仪的发明开始的 H u n k a p il le r 等 1 9 9 1 它不仅效率高而且测序的质量也比手工操作高得多 由于D N A多聚酶的不断 修饰 和荧 光底物的不断更新 在很长的一段时间里 荧光测序法会保持主导地位 毛细管电泳也有可能在不久的将来取代 现在的平板电泳 现在的难点之一 是由于受到毛细管的空间和电泳介质的限制使读序的长度不够 一般停留在 3 0 0 b y 到4 5 0 b y 左右 而平板电 泳则高 达 6 0 0 b y 到9 0 0 b p 左右 除了 基本技术和仪器外 测序的 策略也很重要 散弹测序法 S h o tg u n S e q u e n c in g 是策略的代表作之一 它主要依赖于计算机技术将单一读序自动组装起来 而减少人工操作 人类基因组物理图谱的初期完成主要有两个标志 全基因组和各染色体物理图谱 全基因组物理图谱是由法 国 D a n ie l C o h e n领导的 C E P H C e n t r e d E t u d e d u P o ly m o r p h is m e H u m a i n 和美国 E r ic L a n d e r 领导的 Wh i t e h e a d基因组中心分别完成的 由于他们制作物理图谱是为遗传图谱打基础 分辨率较低 仅在 0 5 到 1 Mb左右 单个染色体物理图谱的分辨率则高得多 一般要求在 l O O K b 左右 完成最早的单个染色体是 Y和 2 1 号 质量最高的数 X和 7 号染色体 分辨 率其实有两个重要的参数二有顺序路标 O r d e r e d Ma r k e r s 的平均距离和 总路标的平均距离 比 如 美 国 N I H的 E r i c G r e e n 小组制作的 7 号染色体物理图谱中 S T S间的平均距离是 7 9 Kb 但是这些路标只有百分 之九一 是有明确顺序的 所以其真正分辨率只有平均 8 8 K b B o u f f a r d 等 1 9 9 7 再如 E r ic L a n d e 领导的 M I T 小组 H u d s o n 等 1 9 9 5 的 图谱只 有 1 7 0 K b 的分辨率 而有顺序路标的 平均距离则只 有 1 Mb o D N A大规模顺序测定是在低精度遗传图谱与物理图谱宣告完 成后 酵母和 C e le g a n s 测序工作显示不容质 疑的 成功希望时开始的 O l s o n 1 9 9 5 英国S a n g e r 中心的J o h n S u ls t o n 和美国圣 路易斯 华盛顿大学的R o b e r t W a te r s t o n 是这个 领域的先驱 不容忽略的 是这些物理图谱的 关键作用 它 们为测序提供了 基本原料 没有这样 的 基本原料 测序的速度就会受到限制 遗传 H E R E D I T A S B e ij in g 1 9 9 8 2 0卷 2制作物理图谱的基本要素与原理 2 1物理图谱制作的基本要素 2 1 1路标 L a n d ma r k 路标是用来标位的工具 对于物理图谱来讲有 S T S O l s o n 等 1 9 8 9 和限制性内切 酶位点 对于遗传图 谱来讲 有 R F L P R e s t r i c t io n F r a g m e n t L e n g t h P o l y m o r p h is m m i c r o s a t e l li te s 和S N P S in g le N u c le o t id e P o l y m o r p h is m s 2 1 2单位 U n i t 单位的 概念比较复杂一些 限制性内 切酶的酶切片段是限制性内 切酶物理图谱的 基本单位 S T S 则由它相对整个基因组的专一性而自成单位 基因组的每一个碱基是物理图谱的终极单位 2 1 3顺序 O r d e r 由于物理图谱与遗传图谱都是一维空间的 顺序的测定就成了制作图谱的终极目的 顺序 是路标间的相对位置 这个相对位置具有绝对的专一性 2 1 4可复制的 D N A片段 C l o n a b le F r a g m e n t s 目 前 可复制的的D N A片 段有辐射杂交株 R a d i a t io n H y b r id Y A C Y e a s t A r t if ic ia l C h r o m o s o m e B A C B a c t e r ia l A r t i f ic i a l C h r o m o s o m e P 1 C o s m id F o s m i d 以 及其它细菌复制系统 2 2物理图谱制作的基本原理 一个完整的物理图谱应该有路标的顺序 距离标尺和可复制的克隆 比如 在 R H图谱中 S T S 是路标 R H细胞可以复制 但距离是个未知数 它只能作为低分辨物理图谱 其主要用途是保持 S T S在长距离上的顺 序和其与遗传图谱的关系 因为它的分辨能力与遗传图谱的分辨率相近 限制性内切酶制图似乎是理想的候选 在一般条件下其分辨率可在 2 0 0 到5 0 0 b y 左右 2 2 1物理图谱的本质是路标和克隆的顺序物理图谱与克隆 DN A指纹的差异在于物理图谱中的路标具有一 定的顺序 图 1 揭示了图谱与 DNA指纹的这种关系 1 DN A指纹 没有顺序 2 可能的排序 3 重叠定顺序 共有6种可能 可写作 图 1物理图谱的本质是克隆和DNA片段的顺序排列 以一个D N A克隆的指纹产生4 个 片段为 例 1 一个克隆的信息无法确定任何片段的 顺序 2 而三个 重叠的克隆就可以确定两个片段的顺序 3 可用简单的方式表达出来 这里的短竖线表示两边片段顺序未知 2 2 2低分辨率物理图谱是高分辨率物理图谱的基石物理图请的制作是纵 向整合 S T S确定了YA C克隆的 顺序 Y A C又将 S T S 连接在一起 然而 Y A C不能用来直接测序 还要进一步分解成限制性内切酶图谱 B A C 的普遍应用已基本取代了Y A C R H细胞株也可以用来作类似的S T S 容量图谱 4 2 共有 4 种 1 0 刀 k b 5 0 2 0 0 8 6期于军 人类基因组的物理图谱与大规模 D N A测序 2 2 3物理图谱的连续性单一克隆或重叠克隆都不是图谱 重叠克隆的延续可以制成图谱克隆末端的数量 决定 了 可排 D NA片段的数量 见图 2 连续性是由文库的容量和覆盖率所决定的并与制库的技术和方法息息 相关 物理图谱的连续性是大规模测序的基本保障 也是资金消耗预算的基本出发点 在没有达到连续性要求时 价格是无法预测的 因为合拢这些间隙的耗资很难预测 物理图谱的间隙有时可以用末端延伸 Wa l k i n g 来合 拢 有时并不容易 例如 当缺失的间隙很大 尤其是遇到无法克隆的片段时 延伸的可能性就更小了 此类间 隙一般在 5 0 0 Kb 到 l Mb左右才有可能遇到一个 目前在 G e n b a n k中超过 5 0 0 K b的 D N A片段只有几个 图 2 物理图谱中DN A片段的顺序是由克隆末端的数量决定的 克隆 A决定了片段 1 和 8的位置 克隆 B决定了片段2和9的位置 依此类推 理论上讲 每一个片段的排序需要至少有一个末端 克隆的覆盖率是一个重的因素 2 3制作物理图谱的纵向整合 制作物理图谱的精髓是它的纵 向整合 人类基因组共有 4 6 条染色体 2 2 对常染色体 外加 X Y两个性染 色体这些染色体就成了基因图谱的必然单位 又因为DN A的基本结构单位是碱基 那磨单个碱基就成了物理 图谱的最小单位 所谓的纵向整合 是指从染色体到碱基的依赖关系 每个有顺序的碱基都相对地在染色体上占 一个位置 也就是说 物理图谱的最终形式是碱基在染色体上的相对顺序 那磨 怎样把染色体分解成可测定顺序的形式呢 分子克隆是 目前的唯一手段 染色体片段可以克隆 D N A片段也可以克隆 下面列举的是不同水平的克隆方法 2 3 1放射杂交株 R a d i a t i o n Hy b r i d R H 这一 技术是在体细胞杂交株 Go s s 与 H a r r i s 1 9 7 5 的基础上发展起来的 其基本原理是利用 X 一 光照射人细胞株使染 色体断 裂 再转移到中国仓鼠 体细胞株中 C o x 等 1 9 9 0 这些经过筛选和扩增的 细胞株可以用来定位S T S 和用 统计学方法计算它们的间距 2 3 2酵母人T 染色体 Y e a s t A r t if ic ia l C h r o m o s o m e Y A C Y A C是 O ls o n 实验室发展出来分子克隆技术 B u r k e 等 1 9 8 7 它是利用酵母染色体 的结构和酵母复制系统来复制 DN A大分子 它可以用来克隆 2 0 0到 2 0 0 0 K b 的 D NA片段 2 3 3 细菌人T染色体 B a c t e r ia l A r t i f ic ia l C h r o m o s o m e B A C 细菌人工染色体是利用 F 质粒的单拷贝 控制 系 统来 设 计的 它可以 运载 1 0 0 到3 0 0 K b 基因 组 D N A S h z u y a 等 1 9 9 2 2 3 4 C o s m id 与 F o s m i d C o s m id 用途很广 基于其组装的效率 可用来制备文库和再克隆大的D N A片 段 尽管不如 L a mb d a 和 F o s m i d稳定 但拷贝数量很高 易于 D NA制备F o s m i d 用途不广 因为它是单拷 贝 载体 较 C o s mi d 稳定 主要用于难克隆的DNA 2 3 5 L a m b d a 噬菌体和质粒它们只能用于克隆 2 0 K b以下的小片段 L a m b d a的特点是它对所克隆片段的 大小不敏感 而质粒则很敏感 小片段会有选择地先克隆进去 4 3 4 4遗传 H E R E D I T A S B e ij in g 1 9 9 8 2 0 卷 3制作物理图谱的基本方法 3 1 S T S 一 容积制图 S T S c o n t e n t Ma p p in g S T S 的 概念是由Ma y n a r d V O ls o n 等根据物理图谱的制作需要提出来的 O ls o n 等 1 9 8 9 这一 概念的提 出使低分辨率物 理图谱的制作产生了新的飞跃 之所以 称为飞跃是因为这一 概念是基于当时刚刚发明的P C R技 术 老旧的杂交方法用于人类基因组有很多不便 比如 重复序列 多基因家族 假基因等都给杂交法带来困 难错误率与数据量都走向极限 相反 P C R可用以区别单个碱基的差异 需时短 见效快 S T S 一 容积制图的原理很简单 与筑路的打桩划线一样 Y A C在这里是作为线 S T S则作为桩 每一个桩都 是一个唯一的路标 不同的是 这里的路不是从一个端点开始的 是多点生长 另外 D NA的线性特点决定了 这条路只是一维空间的 S T S 一 容积制图的主要步骤如下 1 Y A C克隆的 排列 与Y A C D N A组合 P o o li n g 一 般是采 用 孔板 三 维组合 2 制作 S T S S T S 有许多来源 E S T 已知遗传标记 随机测序 Y A C末端测序等 3 S T S 确定一般采用 P C R方法 4 A图通常使用的软件是由 P h il G r e e n 小组的 C L Ma g n e s s 等人编写的 S E G MA P 参见 h t t p w w w g e n o m e w a s h i n g t o n e d u U W G C t o o ls s e g m a p h t m S E G MA P根 据 S T S的分析 数据 将 Y A C c o n ti g 组装在一 起 又 根据Y A C的长度估计S T S 间的距离 1 9 9 7 年 E r ic G r e e n 小组的第七号染色体物理图谱和D a v id S c h l e s in g e r 小组的X染色体物理图 谱分别以低 于 1 0 0 K b 的分辨率完成 B o u f f a r d 等 1 9 9 7 N a g a r a j a 等 1 9 9 7 笔者与同 事曾著文为此欢呼并 评估物理图 谱制 作的现状 Y u a n d Wo n g 1 9 9 7 这两个小组都是以 制备Y A C文库为出发点 在 O ls o n 的指导下 不断完善 S T S 图 谱制作的理论和试验技术 锲而不 舍而取得成功的 3 2限制性内切酶制图 3 2 1限制性 内切酶制图的基本步骤及范例限制性内切酶制图是最经典的物理图谱制作方法之一 一个克隆 可以 被酶切成不同长度的片 段 也就是所谓的 指纹 F i n g e r p r i n t 但是指纹并不 是图谱 因为它没有顺序 限 制性内切酶制图主要有以下几个步骤 制备克隆 DNA 克隆的 DN A指纹分析主要是酶切 电泳分离 杂交标记或图象处理 克隆的排列和 DN A 片 段的排序一 般由计算机处理 填空隙 包括分离新克隆及 P C R 验证等 三个 有代表性的方法 是 c o l i 酵母和 C e l e g a n s 的 物理图 谱 E c o l i 的 物理图谱 4 6 M b K o h a r a 等 1 9 8 7 是由日 本科学家完成的 它们的基本方法是用不完全酶 切法 和放射性标记杂交 和一般的不完全酶切法一样 他们用标记的载体作为探针来识别不同的DNA片段 此法在 技术上不是很好掌握 也很难规模化 酵母 S a c c h a r o m y c e s 1 2 M b 的物理图谱是由Ma y n a r d O ls o n 实验室制作的 O ls o n 等 1 9 8 6 主要的 策略是用随机取样和限制性内切酶完全酶切指纹法 用克隆间的重叠来排出克隆和酶切片段的顺序 图谱所用的 克隆是以噬菌体为主 这个项 目的成功在于物理化学 数学 分子生物学 计算机等学科及其技术的有机结合 比如 O l s o n 实验室所用的缓冲液是高盐缓冲液而不是一般的T B E或 T A E 克隆和 D NA片段的组装都是用自己设计的软件 由于软件的复杂性 这个方法的推广有一定的难度 这个 方法的特点是技术简单 不用标记 因为实验的重复性非常好 完全酶解法可以规模化 这个项目的成功为酵母 的完整测序铺下了基石 使酵母成为第一个完成全测序的真核生物 C e l e g a n s 5 0 M b 的物理图谱也是一个很好的 例子 C o u l s o n 等 1 9 8 6 它的 制作虽然也是用完全酶切 但 也用了末端标记 这个项 目主要是用 C o s m i d 由于其多拷贝的特点 克隆的稳定性较差 物理图谱完成是有 6 0 0 余个C o n t ig s 后来 Y A C克隆被用来将这些C o n t i g s 连接起来 这个 制作方法较简单 只收集一部分D N A片段 的数据 用公有的片 段识别重叠 S a n g e r 中 心还完成用来组装图 谱的 软件 F P C T h e S a n g e r C e n te r U K C 6期于军 人类基因组的物理图谱与大规模 DN A测序4 5 e l e g a n s 物理图谱的制作成功是其成为第二个被完整测序的真核生物 3 2 2多酶完全切法 Mu lt i p le c o m p le te d ig e s t MC D 多酶完全切法是在单酶法的基础上发展出来的 Wo n g 和 1 9 9 7 它的特点是准确 自动化分析 可规模化 这个方法主要依赖于琼脂电泳分离的可重 复性 图象分析的自动化和图谱组装的自动化 这种方法既可 以用来制作完整基因组的图谱 也可以用来制作单个 Y A C或 B A C克隆的物理图谱 其基本步骤如下二 1 组建 C o s m i d 文库 2 随机取样 制作 D N A指纹 一 般要有 1 0 v 1 5 x 的筱盖率 3 3 识别载体片段 4 图谱组装 3 3其它制图方法 除了限制性内 切酶法外 杂交法也经常用到 例如 利用重复序列作探针的杂交法 S t a ll in g 等 1 9 9 0 其优 点是简便 但误差较高 仅使用于样品数量较少的情况 不完全酶解法也有一定的用途 但实验不容易掌握 尤 其是在 DN A片段较多时 近年来 由于物理技术的 介人 许多 新颖的 物理制图方 法涌现出 来 如D a v id S c h w a r t z N e w Y o r k U n i v e r s 卜 t y 鼓吹的光学制图 O p t ic a l Ma p p i n g 染色体显微切割 Mic r o d is s e c t io n 等 这些技术都会找到 应用的角 度 它们的缺点是得不到相应的克隆 而克隆是分子生物学的基本原料 4 DN A顺序的测定 4 1 D N A顺序的测定的基本策略 分而治之 DN A顺序的测定基本上是采用分而治之的法 目前 可用来测序的 D NA有 B A C C o s mi d F o s m i d 噬 菌体和质粒 细菌和小基因组 小于 I O Mb 也可直接用散弹法测序 随着技术的不断改进 科学家会向新的长 度挑战的 大规模测序的两个前沿基本上都采用散弹法 无论是逐个克隆测序还是全基因组测序 其主要的限制 是组装 如果重复顺序和人为间隙不来捣乱的话 人类基因组也许可用散弹法直接测序 然而 多染色体基因组 的测 序仍然采 用逐个克隆各个击破 单分 子基因 组的 测序则可用全 基因组散弹法 4 2 D N A顺序的测定的质量和准确性 D N A测序的准确性是基于D N A多态性的特点而 定的 因为基因多态性是在千分之一左右 一般公认测序 错 误要在万 分之一以下 一 超过前者十 倍犷D N A测序的质量是由 初级数 据所决 定的 4 3 D N A III 序的组装 D NA顺序的组装是一项技术性很强的工作 目 前应用最广的软件是 P h i l Gr e e n 实验室发展的一套完整的系 统P h r e d P h r a 沪 毛 o n s e d E w i n g 蔑 1 9 9 8 E w i n g 与G r e e n 1 9 9 8 G o r d o n 等 1 9 9 8 其 基本 步骤 如 下 1 找道 L a n e T r a c k i n g 一 找到电泳道并V II I 泳道的空间 2 信号分离 L a n e P r o f ili n g 分离碱基的 四种不同信号 3 信号分析 T r a c e P r o c e s s i n g 估计信号的强弱和基线 纠正信号的交叉 4 碱基识别 B a s e c a l li n g 按顺序破译碱基 5 错误率的 估计 E r r o r P r o b a b il it ie s 根据信号峰的I司 距 识别与未识别 碱 基 比 率 及 信 号峰 分 辨率 等 来 估 计 错 误 P h r a p 组装 器 和C o n s e d 校对 器 的 基 本功 能 是 根据P h r e d 的 结果 从 头 组 装 散 弹 法 产生 的 不 同 的 短 顺 序 显示组装结果和质量 整合人工校对结兔 T I G R T h e I n s t it u t e o f G e n o m e R e s e a r c h 在组装他们细菌基因组的顺序时 主 要是用 P E A B I P e r k in E l m e r A p p l ie d B io s y s te m s 的 组装软件 A U T O A S S E MB L E R和他 们自己的组装软件T I G R A S S E MB L E R和 T I GR E DI T OR 4 4测 序数据的管理 D a t a Ma n a g e m e n t 和处理 D a t a P r o c e s s i n g 大规模测 序所产生的数据量之大是难以 形容的 一 般说来 一个测序中 心至少有三分之一的人力来管理 和处 理这些数据 由于人力和财力的集中 各个中心倾向于设计自己的软件系统 而且在易于使用上下了很多功夫 遗传 H E R E D I T A S B e ij in g 1 9 9 82 0卷 5 DNA测序的规模化与工业化 5 1 D N A测序规模化的技术前提 D NA侧序无疑已经进人规模化阶段 从样品的制备到侧序电泳都进人半 自动化状态 毛细管电泳仪也有希 望在近期进人市场 目前测序的成本有降低到十至二十美分的可能 这一成本的降低使很多较大的基因组也可以 排到测序的时间表中 目 前 广范应用的两个测序策略是全基因 组散弹法和 逐克隆测定法 虽然有人提出用散弹法测 序人类基因组 We b e r 与 My e r s 1 9 9 7 但由于人类基因组中高比率的重复序列的存在 尤其是 L I NE 2 到 7 K b长 克隆文 库有无可避免的间隙和基因的多态性等基本原因 散弹的组装几乎是不可能的 G r e e n 1 9 9 7 其中 主要是 受 读序长度所限 无法 跨过L I N E 然而 小基因组 1 到5 Mb 的 散弹测序还是非常成功的 逐克隆测定法的限制是物理图谱的制作 这方面技术的发展和自动化程度都有待于进一步的发展 实际上 随着物理和遗传图谱的不断完善 E S T c D N A B A C末端顺序等的 不断 积累 散弹法也会吸引人们去冒 险 5 2 D N A测序规模化的现状 人类基因组测序进人冲刺阶段 目前 世界上大规模测序 中心已有十几个之多 测序量都逐年在成倍增长 生物产业界也在不断地推动这个前沿 模式生物的测序如火如茶 C e l e g a 二的测序即 将完成 小鼠 基因组的测序正在酝酿之中 河 豚鱼 斑马 鱼 也有可能排到日程上 如果价格降低 技术不断改进 灵长类 哺乳类动物也可开始测序 微生物的测序如洪闸打开 目前 有近百种微生物或致病菌已经或将要被完全测序 几乎所有的 D NA侧序 中心都承担一定比例的小基因组测序工作 很多制药公司也有相当的投人 病原菌顺序的测定会为新抗菌素的发 现和设计提供非常有利的条件 商品植物和家养动物基因组的工作已经初步展开 人类已积累了一万年以上丰富的驯化野生动植物的经验 人类的生活无时无刻不依赖于自然界和家养的动植物 优良动植物品种的培养和筛选有赖于遗传学提供科学 快 速的 方法和技术 水稻的遗传工 程已 在中国展开 玉米 小麦 大豆 棉花等粮食经济作物的研究也应展开 动 物类 如猪 牛 羊 鸡等是食物蛋白的主要来源 也应予以不断改良 传统的杂交方法 新的转基因方法都应 予以重视 DNA测序的工业化也将促使新项目的展开 价格的低廉 市场的开拓 可使一些以前无法想象的项 目成为现实 目前的测序单上除 了人以外还有小鼠 大鼠 黑猩猩 斑马鱼 河豚鱼 将来还会加上猪 羊 牛 马 狗 猫等等 植物也会有一个更长的清单 其实 对于高等动物来讲 除了有选择的新物种外 基因组的全测序必要性并不大 组建相应的高度的物理 和遗传图谱就足够了 测序的能力应放在全长 c D NA和基因调控区上 尤其是近亲繁殖系的实验动物 功夫应 下在找出定量性状和有关基因 5 3 D N A测序规模化的趋势和技术关健 DN A测序规模化的基本趋势之一是技术的并进 除了测序技术外 P C R技术 DN A顺序分析 DNA制 备 文库组建 数据分析等都平行地发展 自动化也相应地紧跟在后 很明显 机器要运转 样品要不断供应 数据要及时处理 根据半导体工业和计算机工业的经验 微型化自然地成为未来的技术 目前 生物硅片 微量 液体反应器等都在飞速发展之中 在不久的将来都会变成现实 基因 组研究正在 成为实足的 技术密集型工业 DN A测序规模化的第一关键是数据的分析和处理 随着技术的不断改进 数据的积累将不成问题 尤其是 原始数据 例如 目前的测序能力完全可以开始全基因组散弹测序 但没有人敢预言能够将其组装起来 很多数 据处理技术还没有达到应有水平 很多问题要与生物学家协作解决 上百万的 E S T的数据就已使很多分子生物 学家忙得不亦乐乎 了 要把这些 E S T按组织来源 按细胞的富集量 可能的功能等分门别类使其易于应用 有 很多工作要做 DN A测序规模化的另外一个特点是工作的完整性或彻底性 全基因组测序 全 E S T测序 全长 c D NA侧 4 6 6 期于W 人类基因组的物理图谱与大规模 DN A测序4 7 序 全基因组扫描等等 新技术 新系统的设计都要从这里着眼 要从完整性着眼 不难想象 在未来的二十一世纪里 从事基因组研究的科学家们需要的第一硬件就是计算机 一端连在数据 库 一端连在工业化管理和运作的 理想实验室 脖子上挂着电话和同行设计实验 讨论结果 口述文章 实验 室里不是摆满仪器和试剂 而是一套完整的健身器 虽然要作的工作还很多 比如基因功能的研究 基因产物一 一酶和蛋白水平的研究等 这个日子的到来不会是很久远的 就现在的进展来看 因为基因组研究的高度工业化 水平 很难相信这些工作在十年或二十年后还会在一般的实验室里完成 可以相信 随着工艺的不断更新 新技术 的不断出现 D NA测序的规模化和工业化是不可避免的 参考文献 1 B o u f f a r d G G I d o l J R B r a d e n V V e t a l A p h y s i c a l ma p o f h u ma n c h r o mo s o me 7 a n i n t e g r a t e d YAC c o n t i g ma p wi t h a v e r a g e S T S s p a c i n g o f 7 9 k b Ge n o me R e s 1 9 9 7 7 6 7 3 一6 9 2 2 B u r k e D T C a r l e G F O l s o n M V C l o n i n g o f l a r g e e x o g e n o u s D N A i n t o y e a s t b y m e a n s o f a r t i f i c i a l c h r o mo s o me v e c t o r s S c i e n c e 1 9 8 7 2 4 4 1 3 4 8 1 3 5 1 3 C o u l s o n A S u l s t o n J B r e n n e r S K a r n J T o w a r d a p h y s i c a l m a p o f t h e g e n o m e o f t h e n e m a t o d e C a e n o r h a b d i t i s e l e g a n s P r o c Na t l Ac a d S c i US A 1 9 8 6 8 3 7 8 2 1 一7 8 2 5 4 Da n n a K Na t h a n s D S p e c i f i c c l e a v a g e o f s i mi a n v i r u s 4 0 DNA b y r e s t r i c t i o n e n d o n u c l e a s e o f He mo p h i l u s i n f l u e n z a e P r o c Na t l Ac a d S c i US A 1 9 7 1 6 8 2 9 1 3 一2 9 1 7 5 E w i n g B L a d e a n a H We n d l M C Gr e e n P B a s e 一 c a l l i n g o f a u t o ma t e d s e q u e n c e r t r a c e s u s i n g P h r e d 1 Ac c u r a c y a s s e s s me n t Ge n o me Re s 1 9 8 8 8 1 7 5 一1 8 5 6 E w i n g B Gr e e n P B a s e 一 c a l l i n g o f a u t o ma t e d s e q u e n c e r t r a c e s u s i n g P h r e d 1 1 E r r o r p r o b a b i l i t i e s Ge n o me Re s 1 9 9 8 8 1 8 6 1 9 4 7 Go r d o n D Ab a j i a n C Gr e e n P C o n s e d a g r a p h i c a l t o o l f o r s e q u e n c e f i n i s h i n g Ge n o me Re s 1 9 9 8 8 1 95 202 8 Gr e e n P Ag a i n s t a wh o l e g e n o me s h o t g u n Ge n o me Re s 1 9 9 7 7 4 1 0 一4 1 7 9 Hu d s o n T J S t e i n L D Ge r e t y D S e t a l S c i e n c e 1 9 9 5 2 5 8 6 0 一6 6 1 0 Hu n k a p i l l e r T Ka i s e r R J Ko o p B F Ho o d L S c i e n c e 1 9 9 1 2 5 4 5 9 一6 7 1 1 Ko h a r a Y Ak i y a ma K I s o n o K Th e p h y s i c a l ma p o f t h e wh o l e E c o l i c h r o mo s o me a p p l i c a t i o n o f a n e w s t r a t e g y f o r r a p i d a n a l y s i s a n d s o r t i n g o f a l a r g e g e n o mi c l i b r a r y Ce l l 1 9 8 7 5 0 4 9 5 一5 0 8 1 2 Ma x a m A M Gi l b e r t W A n e w me t h o d o f s e q u e n c i n g DNA P r o c Na t l Ac a d S c i US A 1 9 7 7 7 4 5 60一 5 64 1 3 Ol s o n M V Du t c h i k J E Gr a h a m M Y B r o d u e r G M e t a l 1 9 8 6 R a n d o m一 c l o n e s t r a t e g y f o r r e s t r i c t i o n ma p p i n g i n y e a s t P r o c Na i l Ac a d S c i US A 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届安徽省合肥三十五中化学高三第一学期期中学业水平测试试题含解析
- 2026届浙江省镇海市镇海中学高三上化学期中调研模拟试题含解析
- 评选最美面试题及答案
- 诺基亚面试题及答案
- 宁夏电信面试题及答案
- 某团面试题及答案
- 2025年建筑工程施工合同示范文本
- 四川省成都市双流区棠湖中学2026届化学高一上期中联考试题含解析
- 《2025建筑项目融资合同》
- 盲人餐厅面试题及答案
- 南农《土壤学》课件
- 车库进出口坡道施工方案
- 货架安全知识培训资料课件
- 文化创意产业园区工业厂房租赁与设计服务协议
- 制造业2025年质量审核指标评估方案
- (2025秋新修订)人教版二年级数学上册全册教案(教学设计)
- 2025年北京客运考试应用能力试题及答案详解大全
- 《无人机飞行控制技术》全套教学课件
- 适岗评价管理办法
- 二年级上册数学应用题100道含完整答案【名师系列】
- 东台辅警招聘考试真题2025含答案
评论
0/150
提交评论