




已阅读5页,还剩55页未读, 继续免费阅读
(生物医学工程专业论文)寡核苷酸合成优化方法研究及其应用系统实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
寡核普酸合成优化方法研究及其应用系统实现 a b s t r a c t t h e s i s t i t l e : r e s e a r c h o n t h e o p t i m i z a t i o n m e t h o d o f o l i g o n u c l e o t i d e s y n t h e s i s a n d i t s i m p l e m e n t a t i o n ma s t e r n a me : z h a n g y u j i s u p e r v i s o r n a me : l u z u h o n g ( 2 ) 建立相应的数据库, 进行数据分析,并分析此计划可能带来的人种, 伦理及社会问题: ( 3 ) 对一些动物的 遗传组成进行研究, 包括大肠杆菌, 果蝇, 和小白鼠 等。 在各国科学家的努力下, 2 0 0 0 年6 月人类基因组测序工作顺利完成, 我们 获得了人类基因组的全部序列, 这意味着人类基因组的研究开始进入下一个重 要时期功能基因组研究即后基因组时代, 对生物数据进行信息提取和数据 分析。 如何分析这些数据, 从中获得生物结构、功能的相关信息是基因组研究 取得成果的决定性步骤,也是生物信息学研究的主要内容。 1 . 2 生物信息学 生 物信息学 5 l ( b i o i n f o r m a t ic s ) 是8 0 年代末随着基因 组侧序数据迅猛 增加而逐渐兴起的一门新兴学科领域。它综合运用生物学、数学、物理学、 信 息科学以 及计算机科学等诸多学科的 理论方法, 主要进行生物分子信息的组织 和分析, 包含对生物信息的获取、 处理、 存储、分发、分析和解释等ce l 东南大学硕士学位论文 生物信息学的内容极其丰富, 其定义也各有不同, 大致可分为 广义和狭义 两种。广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、 储存、 分配、 分析和解释。 这一定义包括了两层含义, 一是对海量数据的收集、 整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好 这些数据。 具体地说, 生物信息学是把基因组 d n a 序列信息分析作为源头, 找 到基因组序列中代表蛋白 质和 r n a基因的编码区, i ;同时,阐明基因组中大 量存在的非编码区的信息实质,破译隐藏在 d n a 序列中的 遗传语言规律:在 此基础上, 归纳、 整理与基因组遗传信息释放及其调控相关的转录谱和蛋白 质 谱的数据,从而认识代谢、 发育、分 化、 进化的规律司 。 生物信息学的核心是基因组信息学, 包括基因组信息的获取、 处理、 存储、 分配和解释。 基因组信息学的关键是“ 读懂” 基因组的核昔酸顺序,即全部基因 在染色体上的确切位置以及各d n a片段的功能:同时在发现了新基因信息之 后进行蛋白 质空间结构模拟和预测, 然后依据特定蛋白 质的功能 进行药物设计 9 .了 解基因 表达的调控机理也是生物信息学的重要内 容, 根据生物分子在基 因调控中的 作用, 描述人类疾病的诊断、治疗侧内 在规律. 总的来说,近期生物信息学将在以下几方面迅速发展:大规模基因组测序 中的信息分析: 新基因和新s n p s ( 单核昔酸多态性) 的发现与鉴定: 完整的比 较基因组研究;大规模基因功能表达谱的分析; 生物大分子的结构模拟与药物 设计d u . 而其长远任务是非编码区 信息结构分 析和 遗传密 码 起源与生物进化的 研究。 读值人类基因组,发现人类遗传语言的根本规律, 从而阐明若干生物学 中的重大自 然哲学问题,像生命的起源与进化等。 , . 3 基因芯片 基因 芯片t 1+ . 15 1 ( g e n e c h i p ) , 又 名d n a微阵列, 系 指 采用微电 子芯片 光刻技术和在位合成化学技术, 或者利用其它方法将大量特定的核昔酸探针有 序地固化在玻璃或者硅等材料的基底上, 并与标记的样品分子进行杂交, 通过 检测每个探针分子的杂交信号强度进而获得样品分子的数t和序列信息。 基因 芯片是在分子生物学、计算机科学、 微电子学、 物理学等学科交叉的背景下孕 寡核普酸合成优化方法研究及其应用系统实现 育产生, 融合了 生物技术与微电 子芯片技术【 16 1 , 近几年该技术在国际上迅猛发 展,潜力巨大。 1 . 3 . 1 基因芯片的概念 生物芯片【 17 1 这一名词是8 0年代初提出来的,最初主要是指分子电子器 件。美国海军实验室研究员c a r t e r等一批科学家试图把有机功能分子或生物 活性分子进行组装, 构建微功能单元,实现信息的获取、贮存、处理和传输等 功能, 研制仿生信息处理系统和生物计算机。 在此基础上产生了“ 分子电 子学” 这一研究方向。 一些重要的 进展如分子开关、 分子贮存器、 分子导线和分子神 经元等分子器件, 以及基于d n a或蛋白 质等分子计算的实验模型已经引起科学 界的关注。 9 0年代以 来,另一类“ 生物芯片”引 起了 人们极大的关注。这类 “ 生物芯片”实际上是一种微型多参数生物传感器。它通过在一微小的基片表 面固定大量的分子识别探针,或构建微分析单元和系统,实现对化合物、蛋白 质、核酸、细胞或其它生物组分准确、快速、大信息量的筛选或检测. 基因芯片 ( g e n e c h i p ), 又称d n a微探针阵列 ( m i c r o a r r a y ),是一种最 重要的生物芯片。 它在面 积不大的 基片表面有序的固定大量的基因探针 g e n e c h i p ) , 通过与被检测的核酸序列互补匹配, 进行序列测定。 芯片上每一个特 定位置的核昔酸序列都是已 知的, 杂交后根据各点产生的荧光信号强弱, 利用 激光共聚焦扫描和电荷祸合器件 ( c c d )成像等方法对杂交结果进行检测,从 而实现样品的分析。 基因芯片能够在同一时间内 分析大量的基因, 实现生物基 因信息的大规模检测。 1 . 3 . 2 基因芯片的特点 基因芯片自 诞生以来就因其诸多优点而备受科学界的关注, 与以往的生物 学方法相比,它具有以 下特点( 18 ( 1 ) 采用了平面微细加工技术,可实现大批量生产: 东南大学硕士学位论文 ( 2 ) 可组装大量的 ( 1 0 - 1 0 )基因探针,信息量大,效率高; ( 3 )与微机械技术 ( m e m s )相结合,可把生物样品的预处理、基因物质的提取、 扩增以及杂交后的信息检测集成为芯片实验室, 制备成微型、全自 动化、无污 染、可用于微量试样检测的高密度集成的智能化生物芯片。 1 . 3 . 3 基因芯片的制备及检测 基因芯片根据其制备方法可以 分为两 种类型 19 1 ( l ) 原位合成法制备寡核昔酸芯片 原位合成主要为光引导聚合 ( l i g h t - d i e c t e d s y n t h e s i s ) 技术, 它为光蚀刻技 术( p h o to l it h o g r a p h y ) 与 固 相 合 成 及 计 算 机 技 术以 及 分 子 生 物 学 等多 学 科 相 互 渗透的产物. 它不仅可用于寡聚核昔酸的合成, 也可用于合成寡肚分子。 半导 体技术中曾使用光蚀刻技术在半导体硅片上制作微型电 子线路。 固相合成技术 是当前多肚、 核酸人工合成中普遍使用的方法, 技术已经非常成熟并已自 动化 q。 两者的结合为合成高密度核酸探针及短肤序列提供了一条快捷的途径。 美 国a ff y m e t r ix公司 生产的高 密度 基因 芯 片就是 借鉴光引导 聚合技术, 在 l c m 2 左右的玻片上原位合成寡聚核普酸探针序列。 ( 2 ) 点样法制备基因芯片 此种方法是将预先合成好的探针、 c d n a克隆通过精密的机械装置吸入加 样器中,然后将样品点加于基片上从而制得d n a阵列。此方法根据点样时针 头是否与芯片接触而分为直接打印 法和喷墨法两种: 前者针头与芯片接触, 后 者通过驱动装置定量的将样品喷于芯片上。 基因芯片与靶基因探针杂交及荧光检测(2 1 1 是在样品把基因扩增过程中将 带荧光素分子标记的单核昔酸随即掺入其序列中, 当其与芯片上固定的探针发 生特异性杂交而结合在芯片的不同位点上。 荧光素分子受特定波长的激发光的 照射而发射出特定波长的荧光。 完全杂交则信号较强, 不完全杂交则信号较弱, 不杂交则无信号。 通过扫描和检测,结合芯片上各点的设计和分布信息, 可确 定目 标序列相应基因的表达情况、突变和多态性的存在,还可以进行遗传图谱 寡核普酸合成优化方法研究及其应用系统实现 和物理图谱的制作。 为减少实验误差, 在标本中加入标记的表达较为恒定的看 家基因的。 d n a作为内 对照; 或者将不同来源的c d n a用不同颜色的荧光素标 记 位探针22 1 , 并将两组探针等比 例混合后与芯片杂交。 分别扫描不同的荧光并 将结果综合后加以 分析, 判断感兴趣组织或细胞中的基因差异表达情况。由于 荧光标记具有实时、多色、足够的分辨率等诸多优点且对人体无放射性污染, 已基本取代了同位素标记. 基因芯片把大量已知序列探针集成在同一张芯片上, 经过标记的若干目 标 核酸序列于芯片特定位点上的探针杂交。 检测杂交探针的位置, 便可根据碱基 互补匹配的原理确定靶基因的序列, 然后利用杂交图像便可对生物细胞或组织 中大量的基因信息进行分析。 . 3 . 4 基因芯片的应用 基因芯片因其快速、准确、并行的分析大量基因信息的特点在诸多领域得 到 广 泛 应 用 【, “ : . 一、基因表达水平的检测 随着测序工作的顺利完成, 人类基因组计划进入后基因组时代, 鉴定基因 功能成为基因组研究的重点。由于基因表达 m r n a的水平反映了特定基因在 特定环境、特定细胞类型、生长阶段及状态下的功能信息,因此发展能对大量 m r n a提供监测的实验工具很有实际意义。 基因芯片在这方面有着自己独到之 处,它能直接对 m r n a的种类及丰富度进行检测,因而它也成为研究基因表 达的有力工具。 目 前,人们已 经对多种生物包括拟南芥 ( a r a b i d o p s i s t h a l i a n a ) .酵母 ( s a c c h a r o m y c e s c e r e v i s i a e ) 及人类基因组的表达情况进行了 研究,并用基因 芯片进行基因表达水平检测, 该技术可以自 动、 快速的 检测出 成千上万个基因 的表达情况。 二、基因诊断 生物医学研究发现, 人类大部分疾病的发病机制根本上都与基因有关, 如 癌症、 遗传病等。 从正常人的基因组中分离出d n a 与d n a 芯片杂交就可以 得出 东南大学硕士学位论文 标准图谱。 从病人的基因组中分离出d n a 与d n a 芯片杂交就可以得出病变图谱。 通过比较、分析这两种图谱,就可以得出病变的d n a 信息。这种基因芯片诊断 技术以其快速、高效、敏感、经济、平行化、自动化等特点,将成为一项现代 化诊断新技术。例如 a f f y m e t r i x公司,把 p 5 3 基因全长序列和已知突变的探 针集成在芯片上,制成p 5 3 基因芯片,将在癌症早期诊断中发挥作用。又如, h e l l e r 等构建了9 6 个基因的c d n a 微阵, 于检测分析风湿性关节炎 ( r a ) 相关 的基因,以探讨d n a 芯片在感染性疾病诊断方面的应用。 现在, 肝炎病毒检测 诊断芯片、 结核杆菌耐药性检测芯片、多种恶性肿瘤相关病毒基因芯片等一系 列诊断芯片逐步开始进入市场。 基因诊断是基因芯片中最具有商业化价值的应 用。 三、杂交测序 杂交测序 ( s b h )是基因芯片技术最早的用途之一,即在芯片阵列上排布 有不同序列的寡核昔酸探针, 利用固定探针与样品进行分子杂交产生的杂交图 谱而排列出待测样品的序列。 m a r k c h e e 等用含1 3 5 0 0 0 个寡核昔酸探针的阵列 测定了全长为1 6 . 6 k b 的人线粒体基因组序列, 准确率达9 9 % e h a c i a 等用含有 4 8 0 0 0 个寡核昔酸的高密度微阵列分析了 黑猩猩和人b r c a 1 基因序列差异, 结 果发现在外显子1 1 约3 . 4 k 6 长度范围内的核酸序列同 源性在9 8 . 2 % 到8 3 . 5 % 之 间, 提示了二者在进化上的高度相似性。 据未经证实的 报道, 去年有一种不成 熟的生物芯片在1 5 分钟内完成了1 . 6 万个碱基对的测定, 9 6 个这样的生物芯 片的平行工作,就相当于每天1 . 4 7 亿个碱基对的分析能力。 四、基因突变和多态性检测 随着遗传病和癌症相关基因发现数量的增加, 变异与多态性分析越来越重 要。 利用高密度探针阵列克大规模检测具有特征性的较长序列相关的突变与多 态性。如果已 经知道了易发生突变的核酸序列区段,用d n a 芯片进行再测序, 可以成功地鉴定完全错配和单个碱基错配。 而用等位基因特异的寡核昔酸探针 ( a s 氏 ) 进行示差杂交,则是基因多态性分析最有效, 应用最广的方法。 五、基因发现 基因芯片技术再发现未知基因及分析各个基因在不同时空表达方面是一 项十分有用的技术。待测的目 标d n a密度高,样品用量极少,结合基因芯片 寡核昔酸合成优化方法研究及其应用系统实现 检测自 动化程度高的优点,可以方便的大量筛选未知基因, 从而大大提高发现 未知基因的速度。h e l l e r 等应用 d n a芯片对风湿性关节炎病变细胞与正常细 胞间基因表达的差异进行了研究,发现了一些与炎症相关的新基因。随着人类 基因组计划测序工作的完成, 通过基因芯片用来发现新基因越来越成为完成后 基因组计划的重要手段。 . 3 . 5 基因芯片的发展趋势及其存在的问题 始于 9 0年代初的基因芯片研究己形成迅速发展的势头,对科学技术产生 巨 大的影响。美国 财富杂志对这一技术非常看好,载文指出:在 2 0世纪 科技史上有两件事影响深远, 一是微电子芯片, 它改变了 我们的经济和文化生 活,并已 进入了每一个家庭; 另一件事就是生物芯片, 它将改变生命科学的研 究方式, 革新医 学诊断 和治 疗, 极大 地提高人口 素质和健康水平二 刀 。 随 着 人类基因组计划的顺利进行, 基因芯片不仅促进了 基因组学从理论研究发展为 实用基因组学, 而且很有可能在2 1 世纪将人类带入基因工业的新时代。 现在, 世界各国的公司、 研究机构都在积极地进行研究、申 请专利、 开发新产品, 争 相登陆市场。 较早涉足该领域的美、 德、 英、日 等国已 经开发出大童有竞争性 的基因芯片产品,取得了令人瞩目 的成就。 在这样的国际形势下, 我国政府对 基因芯片的研制也显示出与日 俱增的关注和重视, 投资力度亦随之增加,以争 取我国早日 在芯片研究领域占有一席之地。 目 前基因芯片技术的研究主要有两方面的问题: 一是基因芯片的研制一直 处于试验阶段, 至今尚未形成比较成熟的制备技术, 其中一个主要原因就是芯 片检测目 标寡核昔酸序列合成过程的可靠性难以得到保证, 从而导致了芯片检 测的不确定性。因此, 探针制备技术的成熟是芯片制作以 及提高芯片检测可靠 性的一个关键问题。 另外一个是芯片技术所涉及的大量信息分析, 即生物信息 学的研究。 尽管芯片技术已 经有了极大的发展, 但对芯片的数据管理及结果分 析等这些生物信息学的内容病没有引起足够的重视, 只是简单认为只要人工处 理一下原始数据就可以轻松得到我们想要的生物信息, 这样无疑将导致大量有 意义的生物信息的湮没和浪费。 特别是对于高密度基因芯片, 这方面的问 题尤 东南大学硕士学位论文 其突出, 生物信息学在其中起着举足轻重的作用。 下面本文对基于基因芯片的 生物信息学内容作简要介绍。 1 . 4 基于基因芯片的生物信息学研究内容 生物信息学作为分析处理生物分子信息、 揭示生物分子信息内涵的一种技 术, 在基因 芯片的 研究 和应用过程中 起 着重要 作用划 。 与基因 芯片 相关的生 物 信息学问 题主要包括三方面的内 容, , : ( 1 ) 芯片设计:通过核酸数据库查询和分析序列,确定基因芯片所要检测 的目 标对象, 然后根据芯片设计的具体功能要求, 采用特定的方法进行探针的 设计与芯片的布局,并进行芯片优化。 ( 2 ) 芯片分析:实现杂交荧光图像的处理分析,提取杂交信号,并结合探 针信息得到检测目 标的分子生物信息。 数据挖掘:通过对基因芯片涉及的各种信息流 ( 包括探针信息、样品 信息、 芯片分析的结果等) 进行关系分析, 发现隐藏在数据后的新的生物学知 识或者深层次的生物学规律。 图 1显示了基因芯片相关的生物信息学研究内容以 及相关的信息处理流 程。 1 . 4 . 1 芯片待检测序列的确定 基因 芯片探 针的 选取主 要运用 序列比 较” 3 ( s e q u e n c e a l i g n m e n t ) 的 方法。 序列比 较也是生物信息学中最基本、最重要的操作,大致分为两种:两 两比 对和多重比 对z . d i 。 我们常用的是前者, 将两个长度相近的来自 同 一个字 母表的序列, 通过字符的插入、 字符的删除和字符替换等基本操作,发现序列 之间的相似之处,找出序列的差异,是生物数据分析中最基本的处理方法。比 较常 寡核普酸合成优化方法研究及其应用系统实现 图1生物芯片信息处理流程 用的应用是: ( 1 ) 假设有两个序列,要求判断是否有一个序列的前缀与另一个序列的后 缀相似, 如相似, 则分别取出前缀和后缀。 该方法应用于大规模d n a 测序中序 列片断的组装。 ( 2 ) 假设有两个序列,要详细分析两个之间的相似性,判断是否有两个非 常相似的子序列。该方法用于分析保守序列。 序列比较可以分为全局比较和局部比较:全局比较是比较两个完整的序 列, 儿局部比 较是找出最大相似的子序列。 进行芯片设计时, 我们主要是对多 条同 源的目 标序列运用两两对比 排列的动态规划算法, 提取同源序列的高度保 守区域, 并将其作为这些同源序列的特征序列, 根据这些区域设计相关疾病的 基因芯片;同样, 我们也可以对基本算法对进行改进,提取同源序列的突变活 跃区域, 取互补序列则可以设计对应的检测疾病亚型的芯片。以 肝炎检测芯片 为例,由于人群所处地理位置以 及其他因素的影响, 不同人种的治病乙肝病毒 的基因组序列并不完全相同, 这些序列之间存在着碱基插入、缺失、替换等导 致的细微差别, 利用序列的局部比 较算法可以找出这些同源序列的最大相似子 序列,提取其高度保守区域,并将其作为目 标序列进行探针设计,对应的检测 芯片预警p c r 处理的人体血样进行杂交, 即可判断血样中是否携带有乙肝病毒。 我们还可以运用两两对比排列的算法抽取这些同 源序列的突变活跃区域, 因为 不同亚型的病毒在这类区域有着最明显的差别, 由此设计的芯片可以 对乙肝病 毒亚型进行鉴别。 我们在进行芯片设计, 尤其是目 前实验室常用的底密度寡核昔酸检测型芯 东南大学硕士学位论文 片设计时, 都要运用序列比较算法对输入序列进行预处理, 提取其中若干段她 一行较高的子序列作为探针设计的原序列, 并由此生成探针阵列, 这样不仅可 以节约芯片的探针数目, 也增加了杂交检测的目 的性, 大大提高芯片检测的效 率。 1 . 4 . 2 基因芯片的设计 基因芯片的设计是基于芯片的生物信息学问题中 最重要的一个环节3s洲 。 芯片的设计主要包括两个方面, 即 探针的设计和探针在芯片上的布局。 前者是 指如何选择芯片上的探针, 后者指如何将探针排布在芯片上。 总的来说, 整个 设计过程实质上是一个信息处理的过程, 即将一维的序列在芯片上形成对应的 探针阵列, 每个探针都由一定长度的寡核昔酸序列构成,实现了由一维序列向 三维构型的转化,其特点是:( 1 ) 信息高度集成,适合基因芯片高密度的存储 特性; ( 2 ) 信息存储时保留了 一定的数据冗余,显著提高了芯片检测的准确性、 可靠性及容错性; ( 3 ) 转化后的信息有序规整, 能够很好的与原有信息相对应, 同时原有信息的完整性也得以保持。 1 . 4 . 3 基因芯片检测结果分析 芯片检测结果的分析是通过杂交图谱, 4 上每个信号点的荧光强度及其探 针序列来推断样品的遗传信息。由 于样品与探针完全杂交的双链分子, 具有较 高的热力学稳定性, 产生的荧光信号最强, 不完全杂交的双链分子的热力学稳 定性低,荧光信号弱,不能杂交的位点则检测不到荧光信号或者只检测到芯片 上原有的荧光信号. 根据荧光信号的强弱, 遵循碱基配对的原则, 并根据探针 阵列的原有信息,就可以 进行芯片检测结果的分析, , 阁 。 由于芯片分析的对象并非一个简单的数据, 它受基因芯片其它技术如芯片 设计、芯片制备工艺、杂交过程等的影响,因此在实际研究中,必须考虑到芯 片图像特点以 及杂交温度、 探针等因素, 设计合适的方法, 提高分析的准确度。 寡核昔酸合成优化方法研究及其应用系统实现 1 . 4 . 4基因芯片的数据管理、挖掘 一 基于基因芯 片的 数据库3 4 ) 由于基因芯片的高度集成性, 每一次芯片试验都要产生巨大的信息量,以 平均每片 5 0 0 0 个点,每个实验设4 个水平,每个水平重复计算 3 次,则一次 完整的实验将产生6 万个数据。如此大量的数据如何进行存储、分析, 是芯片 设计以 及分析中面临的一个重要问 题。 为了定位和跟踪实验相关数据( 克隆子, 探针或者阵列等) ,计算机系统在整个实验过程中都必须存储大量的数据。此 外,由于各实验室所用的基因芯片和样品及实验条件不同,实验数据缺乏统一 标准, 造成不同实验室之间的数据交流和数据分析的困难。因此, 建立基于基 因 芯 片 的 杂 交 数 据 分 析 、 处 理 以 及 数 据 管 理 的 一 种 共 同 的 数 据 格 式 成 为 目 煎 人 们关心的热点. 国际上相关领域的专家正在建立一种共同的数据格式14 0 , 把不 同实验室获得的基因芯片分析结果集中到一个数据库中, 可供研究者进行评 估、比 较和再分析e4 11 . 一些公司和研究机构正在发展基因芯片软件工具, 用于 构建和管理基因表达信息的数据库, 和发展进行数据比较的工具。目 前世界上 主要的芯片数据库有:美国基因组研究中心 ( n c g r )的g e n e x ,欧洲生物信息 研究所 ( e b i )的a r r a y e x p r e s s ,美国生物技术信息国 家中心 ( n c b i ) 的g e o ( g e n e e x p r e s s i o n o m n i b u s ) , m i t 的c h i p d b , h a r v a r d 的e x p r e s s d b ,宾州 大学的e p o d b ,加州大学s a n f r a n c i s c o 分校的a m a d 等。 二、数据集成和交叉索引 近年来大童生物学实验的数据积累, 形成了当前数以百计的生物信息数据 库。 它们各自 按一定的目的收集和整理生物学实验数据, 并提供相关的数据查 询、 数据处理的 服务。国际上最著名的是生物分子的三大核心数据库一- -p d b 生物大分子结构数据库1. z 1 , s wi s s - p o r t蛋白 质序列数据库和 g e n b a n k核酸 序列数据库。 基因组的 信息是相互关联的, 这些公共数据库或分析工具提供给 生物学者的是集成的、 相互联系的信息。 合理的解释实验监测数据依赖于实验 数据与其它相关数据库的集成。基因芯片数据库如果能够象 g e n b a n k一样与 m e d l i n e , e n t r e z 等其它数 据库、 分析工具 集成 在一起, 将 会成为 更有价值的 生物资源。 东南人学硕士学位论文 虽然,当今大量的序列、结构数据库微生物芯片数据库的建立了一个较好 模式,但是基因芯片的数据仍有其特有的性质, 这些性质给建立一个通用的、 有效的、可以 和别的数据库交换数据的数据库带来很大的麻烦, 必须发展新的 数据库模式。目前建立新的模式主要面临以下两个问题:( 1 ) 基因芯片数据或 基因表达数据在数据库中的存储形式; ( 2 ) 基因芯片数据的标准化及归一化问 题。前者目 前还没有一致公认的解决方案, 每个实验室内 部有自己各自 的存储 方式; 而对后者一般是利用多色荧光标记的方法, 用一个标准样品作为参照物, 通过这种方法得到高精度的相对杂交水平,以此实现表达数据的归一化。 三、基于基因芯片的数据挖掘 生物信息学是通过利用和开发多种数理工具对数据中现有的大量基因序 列信息进行分析,从这些序列信中挖掘出生物体的生长、发育、 遗传和进化以 及生物体疾病的分子机制,基因芯片为生物信息学的研究提供了强有力的工 具,同时他也是分析和验证生物信息学假设的有效实验手段. 基于芯片的数据挖掘目 标主要有以下几个方面: ( 1 ) 发现d n a 序列的进化 信息: ( 2 )寻找基因之间的协同关系;( 3 ) 探索基因表达时空规律; ( 4 ) 获取 与疾病相关的信息。 在大规模基因表达的数据挖掘方面有两种主要方式:假设检验和知识发 现。 常用到的数据挖掘方法主要有: 统计分析、 聚类分析、 连锁分析、 决策树、 自 组织映射、神经网络、 遗传算法等1 3 , 川 。 1 . 5 本文的研究目标和内容 基因芯片相关技术包括:基因芯片设计、 基因芯片制备、靶基因的制备杂 交和检测、 检测结果分析等。其中,芯片制备是整个过程的核心, 其基本方法 主要有两种: 原位合成法i . 3 和合成点样法3 .目 前, 大部分基因芯片采用的是 点样法,即是通过点样的针头将不同的探针样品分配到固体芯片表面。因此, 发展对于大量不同寡核昔酸探针的低成本合成技术是大幅度降低基因芯片成 本的关键。 本文的研究目 标就是结合实验室基因芯片的研制, 并根据本实验室开发出 寡核普酸合成优化方法研究及其应用系统实现 的新型多探针并行合成装置, 对探针合成过程进行优化处理,开发出商业化的 基因芯片原位合成优化系统,实现对探针合成过程的优化及自 动、可靠控制。 本文的结构安排如下: 第一章: 概要介绍基因组计划、生物信息学、 基因芯片以及本文研究的基 因芯片原位合成优化系统,并对课题的总体设计方案进行了阐述。 第二章: 介绍目 前寡核普酸合成的常见方法及本实验室提出的多探针并行 合成装置原理。 第三章:介绍聚类分析等相关统计分析理论方法,提出整体优化算法。 第四章: 介绍根据合成优化算法开发的原位合成优化系统, 详细介绍了基 因芯片原位合成优化系统 g o s 1 . 0的开发, 包括需求分析、设计思想、用户说 明等。 第五章:总结本文工作,并提出展望。 东南大学硕士学位论文 参考文献 1 .s t i p p d . g e n e c h i p b r e a k t h r o u g h . f o r t u n e , 1 9 9 7 , ma r c h 3 1 : 4 4 - 5 3 . 2 .孙啸. 生物信息学教材东南大学吴健雄实验室,1 9 9 9 3 .世纪之交的新科学:生物信息学,生物技术通报,第3 期,1 9 9 9 4 . d a v i d b e n t o n . b i o in f o r m a t i c s -p r in c i p l e s a n d p o t e n t i a l o f a n e w mu l t i d i s c ip l in a r y t o o l . t i b t e c h , a u g u s t 1 9 9 6 5 . s y l v i a j . s . b i o i n f o r m a t i c s i n t h e i n f o r ma t i o n a g e . s c i e n c e , v o 1 . 2 8 7 n o . 5 4 5 6 , f e b r u a ry 2 0 0 0 6 . j a m i s o n d c . o p e n b i o i n f o r m a t i c s . b i o i n f o r m a t i c s ,2 0 0 3 , a p r i l , 1 9 ( 6 ) :6 7 9 - 8 0 7 . t y e r s m, ma n n m. f r o m g e n o m i c s t o p r o t e o m i c s . n a t u r e , 2 0 0 3 , ma r c h 1 3 , 4 2 2 ( 6 9 2 8 ) : 1 9 3 - 7 8 .陈润生. 生物信息学. 生物物理学报, 第1 5 卷第1 期,1 9 9 9 年3 月 9 . f a u m a n e b , h o p k i n s a l , g r o o m c r . s t r u c t u r a l b i o i n f o r m a t i c s i n d r u g d i s c o v e ry . me t h o d s b i o c h e m a n a l ,2 0 0 3 ( 4 4 ) :4 7 7 - 9 7 1 0 . 卢凯.基因治疗学与基因诊断学. 东南大学出版社,1 9 9 4 1 1 . 李衍达, 孙之荣等译. 生物信息学: 基因和蛋白质分析的实用指南. 清 华大学出 版社. 2 0 0 0 1 2 . 马立人,蒋中华. 生物芯片北学工业出版社,2 0 0 0 1 3 . 冯永强 ,阎小君,苏成芝. 基因芯片技术第四军医大学全军基因诊断 研究所,1 9 9 9 1 4 . t h e c h i p c h a l l e n g e , n a t u re g e n e t i c s , v o l . 2 1 , j a n u a ry 1 9 9 9 1 5 . h a r d i m a n gmi c r o a r r a y t e c h n o l o g i e s 2 0 0 3 一 a n o v e r v i e w , p h a r m a c o g e n o m i c s 2 0 0 3 ,4 ( 3 ) : 2 5 1 - 2 5 6 1 6 . 东南大学. 制备化合物微震列芯片的新方法及由该方法制备的化合物微 阵列芯片” ,中国专利申请号:c n 9 8 1 1 1 2 2 o x ,国际专利申请号: p ct / cn9 9 / 0 0 0 1 3 1 7 . c h u a ms , s a r w a l m m. mi c r o a r r a y : n e w t o o l s f o r t r a n s p l a n t a t i o n r e s e a r c h , p e d i a t r i c n e p h r o lo g y . 2 0 0 3 , 1 8 ( 4 ) : 3 1 9 - 2 7 寡核普酸合成优化方法研究及其应用系统实现 1 8 . 陆祖宏,何农跃,赵雨杰,孙啸. 基因芯片的研究与应用. 生物医学 电子学高级教程( 王保华,罗立民主编) ,2 0 0 0 . 东南大学出版社, 2 3 5 - 2 5 6 1 9 ,肖 鹏峰, 何农跃, 陆祖宏. 分子印章法d n a 芯片的合成1 .p d ms 印章的 固定与收缩研究, 东南大学学报自 然科学版, 2 0 0 1 ( 2 ) :6 - 1 0 2 0 .沈同. 生物化学. 高等教育出版社,1 9 9 0 2 1 . f r e e m a n wm, r o b e r t s o n d j , v r a n a k e . f u n d a me n t a l s o f d n a h y b r i d i z a t i o n a r r a y s f o r g e n e e x p r e s s io n a n a l y s i s . b i o t e c h n i q u e s , 2 0 0 0 , 2 9 ( 5 ) : 1 0 4 2 - 1 0 5 5 2 2 . h a c i a j , e d g e m o n k , s u n b , e t a l . t w o c o l o r h y b r i d i z a t i o n a n a l y s i s u s i n g h i g h d e n s i t y o l i g o n u c l e o t i d e a r r a y s a n d e n e r g y t r a n s f e r d y e s . n u c l e i c a c i d s r e s . , 1 9 9 8 ( 2 6 ) : 4 2 4 9 - 4 2 5 8 2 3 . 陆祖宏.生物芯片的 研究、发展和应用生物电子学报,1 9 9 8 2 4 . g a a s t e r l a n d t , b e k i r a n o v s . ma k i n g t h e m o s t o f m i c r o a r r a y d a t a . n a t g e n e t , 2 0 0 0 , 2 4 ( 3 ) : 2 0 4 - 2 0 6 2 5 . b ro w n p o , b o t s t e i n d . e x p l o r i n g t h e n e w w o r d o f t h e g e n o m e w i t h d n a m i c ro a r r a y s . n a t u r e g e n e t i c s s u p p l e m e n t , 1 9 9 9 ( 2 1 ) :3 3 - 3 7 2 6 . 孙开来.d n a芯片的发展和意义. 国外医学遗传学分册,1 9 9 8 , 2 1 ( 6 ) : 3 5 - 3 8 2 7 . l a n d e r e s . a r r a y o f h o p e . n a t u re g e n e t i c s s u p p l e m e n t , 1 9 9 9 ( 2 1 ):3 - 4 2 8 . k a l o c s a i p , s h a m s s . u s e o f b i o i n f o r m a t i c s i n a r r a y s . me t h o d s mo l b i o l , 2 0 0 1: 2 2 3 - 2 3 6 孙啸, ( 1 7 0 ) 王哗,何农跃, 赵雨杰,陆祖宏. 生物信息学在基因芯片中的应 用. 生物物理学报.2 0 0 1 , 1 7 ( 1 ) :2 7 - 3 4 b a s s e tt j d e , e i s e n mb , b o g u s h i ms . g e n e e x p r e s s io n i n f o r m a t i c s 一 i t s a l l i n y o u r m i n e . n a t u r e g e n e t i c s s u p p l e m e n t , 1 9 9 9 ( 2 1 ) :5 1 - 5 5 ma rt i n d r u m m o n d , j o h n s t a m p e r . d n a p r o b e , a c o m p u t e r p rog r a m w h i c h g e n e r a t e s o l i g o n u c l e o t i d e p r o b e s fr o m p ro t e i n a l i g n m e n t s . n u c l e i c a c i d r e s e a r c h , 1 9 9 9 ( 2 7 ) : 3 9 4 3 - 3 9 4 6 a l t s c h u l s e , g i s h w l o c a l a l i g n m e n t s t a t i s t i c s . me t h o d s e n z y m o l . , 1 9 9 6 , : 90 21 : ,二2 内j内、 东南大学硕士学位论文 3 3 口. 41、j 气jfj 3 6 3 7. 3 8 . 3 9. 4 0 . 2 6 6 : 4 6 0 - 4 8 0 a l t s c h u l s f . a p r o t e i n a l i g n m e n t s c o r i n g s y s t e m s e n s i t i v e a t a l l e v o l u t i o n a r y d i s t a n c e s . j m o l e v o l . , 1 9 9 3 , 3 6 ( 3 ) : 2 9 0 - 3 0 0 a l t s c h u l s f , l i p m a n d j . t r e e s , s t a r s , a n d m u l t i p l e a l i g n m e n t . j . t h e o r e t i c a l b i o l . , 1 9 8 9 , 1 3 8 : 2 9 7 - 3 0 9 孙啸,王哗一种高密度基因芯片设计的新方法. 东南大学学报,1 9 9 9 孙啸, 顾万君, 何农跃,陆祖宏. 高密度基因芯片探针布局方法. 生物技 术, 2 0 0 1 , 1 1 ( 5 ) : 2 8 - 3 1 b u r k e h b . d i s c o v e r i n g p a t t e rn s i n m i c r o a r r a y d a t a . mo l d i a g n , 2 0 0 0 , 5 ( 4 ) : 3 4 9 - 3 5 7 c h e u n g v q mo r l e y m, a g u i l a r ee t a l . ma k in g a n d re a d i n g m i c r o a r r a y s n a t u r e g e n e t i c s , 1 9 9 9 ( 2 1 ): 1 5 - 1 9 s h e r l o c k g ., b a l l c a . mi c r o a r r a y d a t a b a s e s : s t o r a g e a n d r e t r i e v a l o f mi c r o a r r a y d a t a . me t h o d s mo l b i o l ,2 0 0 3 , 2 2 4 :2 3 5 - 4 8 h a y e s a . t h e s e c o n d i n t e rn a t i o n a l m e e t in g o n mi c r o a r r a y d a t a s t a n d a r d s , a n n o t a t i o n s , o n t o l o g i e s a n d d a t a b a s e s . y e a s t , 2 0 0 0 , 1 7 ( 3 ) :2 3 8 - 4 0 o l g a e , e t a l . d a t a m a n a g e m e n t a n d a n a l y s i s f o r g e n e e x p r e s s i o n a r r a y s . n a t u r e g e n e t i c s , 1 9 9 8 , 2 0 ( 9 ) : 5 6 - 6 0 b e r l e y s k , b o n a n n o j b . s t r u c t u r a l g e n o m i c s . me t h o d s b i o c h e m a n a l , 2 0 0 3 , 4 4 : 5 9 1 - 6 1 2 黄振华,昊诚一模式识别原理. 浙江大学出版社,1 9 9 1 李书波,李晓斌.运筹学教程冲国建筑工业出版社,1 9 9 8 ,且2 4443.44. 寡核普酸合成优化方法研究及其应用系统实现 第二章 寡核昔酸合成理论及方法研究 寡核普酸合成技术是分子生物学的重要技术之一,即是将核昔酸单体连接 并使其具有天然的d n a 分子的全部生物学活性和特定的排列顺序。 化学合成的 寡核昔酸可作为引物、探针、接头、基因合成子等,这些都是我们进行各种分 子生物学实验的基础。它是基因芯片探针制备的主要方法之一。目前,我们主 要使用d n a自 动合成仪来制备寡核昔酸。 现有的各种d n a 合成仪由于种种原因, 合成成本居高不下。 我们在基因芯片分子印章法原位合成和p c r 芯片杂交条件 控制和芯片的检测等方面进行了大量的研究工作, 并针对实验过程中探针合成 的效率低、 成本高、 耗时长等缺点, 以及在微珠载体上和微珠上合成不同的d n a 探针等问题提出一种快速合成寡核昔酸探针的新思路, 并据此设计出一种新的 多探针并行合成装置。 2 . 1 寡核昔酸的化学合成原理 核酸分子的基本骨架是相邻核昔酸之间的3 一 5 磷酸二醋键,一个矛 盾便是核昔酸是一个多官能基团的分子, 且人工化学合成核酸分子必定是一个 多步连续的反应,因此要求反应过程中副反应尽可能的少,否则目的产物的产 率以及纯化的难度会使合成失败。 所以
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 地产保险考试题及答案
- 济南护理事业编考试题库及答案
- 中专护理实操考试题库及答案
- 张家界护理职称考试题库及答案
- 袋鼠科学考试题及答案
- 农牧合作社土地用途监管与使用协议
- 六年级写景作文南京玄武湖800字(7篇)
- 划拨土地买卖协议
- 秋日思念的深情抒情类作文15篇范文
- 技术支持流程标准话流程工具技术响应及时版
- 2025年网络信息安全技术岗位专业知识试卷及答案解析
- 2025新款餐饮兼职合同模板
- 网络安全知识宣传科普主题班会课件
- 多家俱乐部转让合同范本
- 人工智能应用基础 课件 3.1AI办公
- 第二课 现代媒体艺术的类型和特点教学设计-2025-2026学年高中美术人美版2019选择性必修6 现代媒体艺术-人美版2019
- 2025年财政部高层次财会人才选拔考试综合试题及答案
- DL∕T28112024变电站二次系统通信报文规范
- 2025年“好年华 聚福州”(福州大学场)福州地铁高校毕业生招聘模拟试卷带答案详解
- 地球的外衣大气层课件
- 2025年时事政治考试100题(附答案)
评论
0/150
提交评论