已阅读5页,还剩120页未读, 继续免费阅读
(计算机应用技术专业论文)基于DNA微阵列基因表达谱数据的癌症检测研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博i 学伊沧文 摘要 癌症治疗面临的重大挑战是如何针对病原上各自独特的癌症类型制定具体的 治疗方法,以达到最大疗效的同时降低药物的副作用。因此,癌症检测或癌症分 类成为癌症治疗的中心环节。一直以来,癌症检测主要基于肿瘤的形态表观,但 这种检测方式有很大的局限性,因为具有相似组织病理学表观的肿瘤可能表现出 很不相同的临床发展过程,或者对同种治疗呈现出不同反应。近年来,d n a 微阵 列技术的发展产生了海量的基因表达谱数据,为寻找基因之间表达调控的复杂关 系网络,研究功能基因组和癌症检测提供依据。目前,利用基因表达谱进行癌 症检测成为癌症研究的重点之一。但是基因表达谱数据具有高维性,高噪声, 高冗余,数据分布不均衡等特点,对基因数据分析方法提出了更高要求,对基 于d n a 微阵列基因表达谱的癌症检测带来了挑战。 本论文从基因表达谱数据的分析着手,以挖掘基因表达模式和癌症检测研究 为主要目标,研究癌症检测中基因表达数据的预处理、特征基因的选取、癌症组 基因表达模式的分析以及建立合适的基因诊断模型的问题。本文的主要工作归纳 如下: 第一,针对基因表达数据的特点,提出一种基于c m s t 聚类方法的分步的特 征基因选择方法,然后,在分步的特征基因选择方法中引入“g a ps t a t i s t i c ”理 论,以确定特征基因数目,提出一种自适应的特征基因的选择方法,弥补目前的 特征基因选择算法中缺乏较好的基因数目预置机制的不足。 第二,利用主分量分析方法( p c a ) 和独立分量分析方法( i c a ) 挖掘基因 表达谱中隐含的基因表达模式,揭示癌症中基因的调控机制,通过抽样来选取特 征基因子集以减少噪声对p c a f 和i c a p 的影响,并且根据基因子集中隐含模式的 相似性来重构基因表达,提出一种基于隐含变量模型的癌症检测算法。 第三,利用癌症组基因表达存在的局部特征相关性的生物病理特点,提 出d n a 微阵列基因表达谱中癌症组关联空间的概念,抽取不同癌症组基于关联空 间的基因特征模式,研究与癌症组相关联的基因表达模式在癌症组中的表达以及 调控,并提出适合癌症组相关联的基因表达模式的癌症预测算法,有效缓解基因 数据集中“维数灾难”的问题。 第四,由于不同的特征选择方法采用不同的搜索机制和评价策略,挑选出的 特征基因偏向癌症特征的不同方面,因此不同方法选择的特征基因明显不同,导 致分类器的识别结果不稳定。针对癌症组基因数据和基因组数据构建一组具有互 补性分类器,提出一种组合分类算法提高癌症分类算法的泛化性能。 萆十儆辨别苹嘲发迓谱数掘, 勺穗痹抢测研究 第五,从基因之间的协同表达来分析基因数据,研究具有可解释的基因表达 模式。在显现模式的提取中增加虚拟样本以挖掘具有更高辨识能力的显现模式, 并在候选分割点选择策略中通过高斯分布来模拟分割点的分布,提高分割点选择 的可靠性,然后提出两种基于显现模式的癌症检测算法。 关键词:d n a 微阵列;基因表达谱;癌症检测;特征基因;基因调控;基因表 达模式 1 l 博f 学伊论文 a b s t r a c t t h eg r e a tc h a l l e n g ei nc a n c e rt r e a t m e n ti sh o wt od i r e c ts p e c i f i ct r e a t m e n tt op a r t i c u l a rt u m o u l i no r d e rt oa c h i e v et h eb e r e rt h e r a p ye f f e c tw h i l et h el o w e rt o x i c i t y s ot h e c a n c e rd e t e c t i o no rc a n c e rc l a s s i f i c a t i o nb e c o m e so n ek e yp o i n tf o rc a n c e rt h e r a p y f o ra l o n gt i m e ,t h ec l a s s i f i c a t i o nl i e so nt h es a m p l em o r p h o l o g y , w h i c hi sn o t e f f i c i e n ti nm a n y c a s e s b e c a u s et u m o u r si nd i f f e r e n ts t a g e sm a y p r e s e n ts i m i l a rp a t h o m o r p h i s ma n dt u m o u e sw i t hs i m i l a rp a t h o m o r p h i s mm a yr e a c td i f f e r e n t l yt ov a r i o u st h e r a p i e s n o wc a n c e r d e t e c t i o nu s i n gg e n ee x p r e s s i o nd a t ai sa ni m p o r t a n ta s p e c ti nc a n c e rr e s e a r c h r e c e n t l y , w i t ht h ed e v e l o p m e n to fm i c r o a r r a yt e c h n o l o g ym a s s i v eo fg e n ee x p r e s s i o nd a t ai sp r o d u c e d , w h i c hi sh e l pf o re x p l o r i n gc o m p l i c a t e dg e n e t i cr e g u l a t i n gn e t w o r k , i n v e s t i g a t i n g f u n c t i o n a lg e n o m ea n ds t u d y i n go nc a n c e rd e t e c t i o n h o w e v e r , t h e r ea r ec h a r a c t e r si ng e n e e x p r e s s i o nd a t a , s u c ha sh i g hd i m e n s i o n a l i t y , h u g en o i s e ,h u g er e d u n d a n c ya n dn o n e q u i l i b r i u md i s t r i b u t i o n , w h i c hi m p o s e sc h a l l e n g e sf o rd e v e l o p m e n to f t h ea s s o c i a t e dd a t am i n i n g t e c h n i q u e sa n dc a n c e rd e t e c t i o n i nt h i sd i s s e r t a t i o n , w ee m p h a s i z eo na n a l y s i so fg e n ee x p r e s s i o nd a t a o u rm a j o r g o a l sa x ef o rg e n ee x p r e s s i o nm o d em i n i n ga n dc a n c e rd e t e c t i o n w ee x p l o r et h eg e n e e x p r e s s i o nd a t ap r e - p r o c e s s i n g ,t h ef e a t u r eg e n es e l e c t i o n , a n a l y s i so fg e n ee x p r e s s i o n m o d e lt oc a n c e ra n db u i l d i n gt h ec a n c e rd e t e c t i o nm o d e l t h em a i nc o n t r i b u t i o n so ft h i s d i s s e r t a t i o na l es u m m a r i z e da f t ;b e l o w : f i r s t l y , t h ec h a r a c t e r so fg e n ee x p r e s s i o np r o f i l ea r ea n a l y z e da n d ac m s t c l u s t e r i n g b a s e dm u l t i s t e pg e n es e l e c t i o ns c h e m ei sp r o p o s e d ,t h e n ”g a ps t a t i s t i c i si n t r o d u c e d i n t ot h i sf e a t u r eg e n es e l e c t i o nt od e t e r m i n et h en u m b e ro ff e a t u r eg e n e s ,s ow ed e v e l o p as e l f - a d a p t i v eg e n es e l e c t i o nm e t h o d , w h i c hm a k e sag r e a ti m p r o v e m e n tc o m p a r e dt ot h e m e c h a n i s mo fs e t t i n gt h en u m b e ro ff e a t u r eg e n e sa r b i t r a r i l y s e c o n d l y , p c aa n di c a i sa p p l i e dt oa n a l y z et h eg e n ee x p r e s s i o nd a t aa n di n v e s t i g a t e t h eu n d e r l y i n gr e g u l a t i n gf a c t o ra n dg e n er e g u l a t i n gn e t w o r k i n gi nc a n c e r s a m p l i n gi s u s e dt op r o d u c et h eg e n es u b s e t s ,a n di nt h ep c a pa n di c a po f s u b s e t st h en o n i n f o r m a t i v e f e a t u r e sa r er e d u c e d , t h e nt h eg e n ee x p r e s s i o nm o d e sa r er e c o n s t r u c t e da n dah i d d e ng e n e e x p r e s s i o nm o d e lb a s e dc a n c e rd e t e c t i o ni sp r e s e n t e d t h i r d l y , t h eb i o l o g i c a ll o c a l i t yo fg e n ee x p r e s s i o nt ot h ec a n c e ri se x p l o r e d , a n da c o n c e p to f r e l a t i v es p a c e t oac a n c e ri sp r o p o s e d , t h e nt h ec a n c e r o g e n i cg e n em o d eb a s e d o nr e l a t i v es p a c ei se x t r a c t e d , a n dt h er e g u l a t i o nw i t l lc a n c e r o g e n i cg e n em o d ei sd i s c u s s e d 1 1 1 棼卡微弦硎革田表达谱数搦的瘸瘁捡测研究 t h e nac a n c e rd e t e c t i o na l g o r i t h mw i t hr e l a t i v eg e n ee x p r e s s i o nm o d ei sp r o p o s e d ,i n w h i c ht h ep r o b l e mo f c u r s eo f d i m e n s i o n a l i t y i sr e l i v e d f o u r t h l y , w h e n d i f f e r e n tf e a t u r es e l e c t i o n sa r eu s e d ,a st h er e s e a r c h i n gm e c h a n i s ma n d e v a l u a t i o ns t r a t e g ya r ed i f f e r e n tt h ed i s t i n c tf e a t u r eg e n e s ,w h i c ht e n dt od i f f e r e n ta s p e c t s o f c a n c e r , a l es e l e c t e d t h ec l a s s i f i c a t i o nr e s u r su s i n g t h e s ec l a s s i f i e r sw i t hd i s t i n c tg e n e s v a r i e dal o t s oa g r o u p o fc o m p l e m e n t a lg e n ec l a s s i f i e r sa r ec o n s t r u c t e d ,a n dae n s e m b l e c a n c e rc l a s s i f i c a t i o na l g o r i t h mi sp r o p o s e d f i f t h l y , t h eg e n ec o e x p r e s s i o na n de x p l a i n a b l ee m e r g i n gp a t t e r na r ee x p l o r e d t h e v i r t u a ls a m p l e si sa d d e dt ot oi m p r o v ed i s t i n g u i s h m e n to fe m e r g i n gp a t t e r n ,a n di nt h e s t r a t e g yo fc h o o s i n gc u tp o i n tt h ed i s t r i b u t i o no fc u tp o i n ti sa s s u m e dt ob et h eg a u s s i a n d i s t r i b u t i o nf o ri m p r o v i n gt h er e l i a b i l i t yo fe m e r g i n gp a t t e r na n dt w oe m e r g i n gp a t t e m b a s e dc a n c e rd e t e c t i o n sa l ep r e s e n t e d k e y w o r d s :d n am i e r o a r r a y ;g e n ee x p r e s s i o np r o f i l e ;c a n c e rd e t e c t i o n ;f e a t u r e g e n e ;g e n er e g u l a t i o n ;g e n ee x p r e s s i o nm o d e i v 图1 1d n a 微阵列技术及应用 图1 2 基因表达谱数据 插图索引 图2 1 双向层次聚类图 图2 2 自组织映射 图2 3g s 法 圈3 1 自组织树算法 图3 2 0 s c m s t 在b u d d i n g y e a s t d a t a s e t 上的实验结果 图3 3 0 s c m s t 在y e a s t f u n c t i o n a l g e n o m e 上的实验结果 图3 4o s c m s t 在a l i z a d e h 上的实验结果 图4 1 癌症组织中基因表达的混合模型 图4 2 癌症组织中基因表达的解混模型 图4 3 基于i c a 隐含变量的基因表达模型 图4 4 在y e a s t 中七类基因的平均表达谱 图4 5 在y e a s t 中i c a e 模型的基因表达模式i c a p 图4 6 在y e a s t 中的基因表达模式e i c a p 图4 7 在y e a s t 中p c a e 模型的基因表达模式p c a p 图4 8 在y e a s t 中的基因表达模式e p c a p 图5 1 样本在i 维,i i 维和i i i 维空间下的分布情况比较 图5 2 癌症模式p 和q 中致癌因子的局部相关性 图5 3l e u k e m i ad a t a s e t 中平均正确率随d 的变化情况 图5 4 c o l o n d a t a s e t 中平均正确率随d 的变化情况 图5 5a l l 和a m l 在g a l l 下的分布 图5 6 a l l 和a m l 在g a m l 下的分布 图5 7 t c t 和n c t 在t 下的分布 图5 8t c t 和n c t 在 ,凹下的分布 图6 1 基因特征选择和分类器组合 图6 2 癌症识别中的全局分量模型 图6 3 癌症识别中的癌症组分量模型 图6 4c c m 的癌症组分量和g c m 的全局分量 图6 5 基于组合g c m 和c c m 的癌症识别 图6 6 基于组合g c m 和c c m 的解决方案 图6 7 独立测试实验结果 图6 8l o o c v 交叉测试实验结果 图6 9f f c v 交叉测试实验结果 图7 1 分割点的分类性能比较1 0 4 v 四加n ” 铝锣钾舛舛鲐” 鼹鼹:2的卯锯钞田 记弭踮盯盯 萆十徽斛列萆田表选谱数瓤的稚疼传测研完 附表索引 表3 1b u d d i n g y e a s t d a t a s e t 表3 2 y e a s t f u n c t i o n a l g e n o m e 表3 3 a l i z a d e h s d a t a s e t 表3 4 在b u d d i n g y e a s t d a t a s e t 数据集上的基因聚类结果比较 表3 5 在b u d d i n g y e a s t d a t a s e t 上的聚类结果 表3 6 在y e a s t f u n c t i o n a l g e n o m e 上的聚类结果 表3 7 经不同基因预处理后的癌症识别结果( a ) 表3 8 经不同基因预处理后的癌症识别结果( b ) 表3 9 分类结果比较 表4 1l o o c v 测试实验结果( s v m ) 表4 2l o o c v 测试实验结果( k n n ) 表5 1l e u k e m i ad a t a s e t 中l o o c v 的实验结果比较 表5 2 c o l o n d a t a s e t 中l o o c v 的实验结果比较 5 6 5 6 6 7 6 8 表6 1 基因表达谱数据集8 2 表6 2 噪声基因过滤8 3 表6 3 混乱矩阵8 3 表6 4 独立测试实验结果8 4 表6 5l o o c v 测试实验结果8 6 表6 6 f f c v 测试实验结果8 6 表7 1 离散方法分离出的前2 5 个特征基因及分割点 表7 2 基于m - 估计的离散方法分离出的前2 5 个特征基因及分割点 表7 3 显现模式中的三个特征基因在分割点的类别信息熵 表7 4 增强显现模式中的三个特征基因在分割点的类别信息熵 表7 5 测试集样本在基因表达规则上的分布情况 表7 6 测试集样本在增强基因表达规则上的分布情况 表7 7a l l 样本中增长率最大的前2 5 个e p i s 表7 8a m l 样本中增长率最大的前2 5 个e p i s 表7 9 试验结果比较 表7 1 0 a l l 中增长率最大的前2 0 个e p a s 表7 1 1a m l 中增长率最大的前2 0 个e p a s 表7 1 2 试验结果比较 孙n弘孙弘拍诣 鳄卯卯粥:兮 湖南大学 学位论文原创性声明 本人郑重声明:此处所呈交的论文基于d n a 微阵列基因表达谱数 据的癌症检测研究,是本人在导师的指导下独立进行研究所取得的成 果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人 或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人 和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后 果由本人承担。 作者躲知词 日期矽。7 年,f 月- 乒日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同 意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许 论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段 保存和汇编本学位论文。 本学位论文属于 1 、保密口,在年解密后试用本授权书。 2 、不保密囱。 ( 请在以上相应方框内打“”) 日期p 0 7 年九月 争日 醐。1 q 一7 日 司弋 苁并 孙铳套鸯 者师恻副 第1 章绪论 在多年的癌症( 疾病) 研究中,科学家和医学工作者们认识到,癌症并不只 是某一种疾病,在它的背后,隐藏着形形色色,变化多端的种类,存在着几百种 这样的癌症。它们为什么一直难以攻克呢? 其主要的原因是由于每一种癌症都有 自己的特点,一种药物并不能对各个不同组织的癌症都能产生疗效,有些能抑制 住肿瘤细胞,但有些却毫无作用,甚至在病症上相同的癌症,也无法用一种药物 达到治疗的目的。随着人类生命科学的发展,人们对于基因这一有关人类生长、 发育、衰老、遗传的最重要和最本质的因素,有了新的认识,并逐渐开始将基因 引入对疾病的诊断、治疗、药物研制、药物筛选等方面。因此,基因诊断、基因 治疗,药物基因组图等应运而生。通过基因进行疾病诊治是对传统诊治方法提出 的巨大挑战,成为人们关注的焦点。 2 0 世纪9 0 年代初开始实施的人类基因组计划( h u m a ng e n o m ep r o j e c t ,h g p ) 与2 0 世纪4 0 年代制定的曼哈顿原子弹计划( m a n h a t t a np r o j e c t ) 以及6 0 年代制定的 阿波罗登月计划( a p o l l op r o j e c t ) 并称为美国的三大国家计划。人类基因组计划 是由美国科学家于1 9 8 5 年率先提出”“,旨在阐明人类基因组3 0 亿个碱基对( b a s e p a i t s ) 的序列,发现所有人类基因,并搞清其在染色体( c h r o m o s o m e ) 上的位 置,破译人类全部遗传信息,让人类第一次在分子水平上全面地认识自我,该计 划1 9 9 0 年正式启动。英、日、德、法随后相继加入该计划,值得关注的是1 9 9 9 年 中科院基因组中心代表中国正式加入该计划,承担了1 人类基因组的测序任 务。2 0 0 1 年2 月,人类基因组草图宣布完成“。随着以测序为主的结构基因组计 划( s t r u c t u r a lg e n o m i c sp r o j e c t ) 的完成,生命科学研究的重点也逐渐的转变为以 对基因功能研究为主的功能基因组计划( f u n c t i o n a lg e n o m i c sp r o j e c t ) 。功能基 因组计划的主要任务之一是寻找调控疾病的相关基因,研究与疾病相关基因功 能,进行基因功能鉴定,研究通过基因表达实现疾病诊断和基因治疗。在“九 五”“十五”期间,功能基因组计划研究已被列为国家高科技计划8 6 3 和9 7 3 重大 专项。 一项类似于计算机芯片技术的新兴生物高技术一d n a 微阵列( m i c r o a r r a y ) 技术,或称为生物芯片( b i o c h i p ) 、d n a 芯片( d n ac h i p ) 、基因芯片( g e n e c h i p ) “”,随着人类基因组研究的进展应运而生。自从1 9 9 1 年a f f y m e t r i x 公司 的f o a o r 博士等人”提出基因芯片的概念后,已有多种不同功用的基因芯片问世, 并在生命科学研究中开始发挥重要作用。近年来d n a 微阵列技术”1 得到了迅猛 发展,产生了大量基因序列和基因表达水平数据。如何利用d n a 微阵列技术研究 辈十儆矿砷k 四五让啦数批7 兜弼矿拎删职了: 基因的功能、基因的调控,以及在疾病中的基因变异和基因表达。因此,研究者 提出了后基因组计划、蛋白组计划、疾病基因组计划以破泽人类基因这部天书。 生物体发育、分化、生长相代谢的过程,始终足遗传信息从储有到表达、加 工及传递的过程;实质上,主要是基因中m r n a ( c d n a ) 信息的传递过程。而 生物体的遗传、变异和进化问题则主要体现在遗传信息的复制、重组、变异和选 择。d n a 微阵列利用成千上万密集排列的基因探针,通过己知碱基顺序的d n a 片 段,并结合碱基互补的原则检测细胞基因m r n a ( c d n a ) 表达水平。不同个体 基因变异、不同组织、不同时间、不同生命状态等基因表达的分析是基因组计 划、蛋白组计划和疾病基因组计划中最重要的一个环节。d n a 微阵列基因表达数 据在疾病诊断、基因治疗、药物筛选、给药个性化、新基因发现、d n a 计算机研 究等领域发挥重要的作用。 d n a 微阵列具有高速度、高通量、集约化的特点,所以我们可以通过微阵列 一次性对大量序列进行检测和基因分析,获取高维的基因表达数据”。”1 。通过基 因表达数据研究人员能够在基因组层次上研究任何种类细胞在任何时间、任何给 定条件下的基因表达模式,可以帮助我们深入研究和了解生物过程的本质。通过 分析基因表达数据,我们可以了解疾病在基因级别的发病机理、疾病的诊断、基 因级别的药物研制以及基因治疗。当前的肿瘤检测和分类技术高度依赖于病理学 工作者对癌症组织的主观判断,而基于微阵列技术,即使一些组织没有显著变 化,利用基因表达数据也可以对之做出早期诊断”。如何利用基因表达数据揭示 基因在影响和调控癌症组织产生的变异? 如何利用基因表达数据有效地识别癌症 组织,并为人类最终战胜各种病魔提供有效武器? 然而,基于微阵列数据的分析 方法和基于微阵列数据的癌症检测的发展才刚刚起步,解决上述问题具有巨大的 挑战“。 1 1d n a 微阵列技术简介 d n a 微阵列技术是融微电子学、生物学、物理学、化学、计算机科学于一体 的高度交叉的新兴技术。d n a 微阵列技术已被公认将会给2 1 世纪的生命科学和医 学研究带来一场革命,并因此成为学术界和工艺界研究的一个热点。美国总统克 林顿在1 9 9 8 年1 月的国情咨文演讲中指出:“在未来的1 2 年内,基因芯片将为我 们一生中的疾病预防指点迷津”。另外,美国商界权威刊物f o r t u n e 对其重大意义 作了如下阐述:“微处理器在本世纪使我们的经济结构发生了根本改变,给人类 带来了巨大的财富,改变了我们的生活方式。然而,生物芯片给人类带来的影响 可能会更大,它可能从根本上改变我们的医学行为和生活质量,从而改变世界的 面貌“。由于生物芯片技术领域的飞速发展,美国科学促进协会于1 9 9 8 年底将 生物芯片评为1 9 9 8 年的十大科技突破之一“。 基因芯片就是利用点样技术、现代探针固相原位合成技术、照相平板印刷技 术等微电子技术在有限的空间内,将成千上万种基因的d n a 片段有组织的点在固 相片基上作为可寻址识别的基因探针。在微阵列实验中,所有的r n a 被反转录成 带有放射性同位素或荧光标记的e d n a 。然后,c d n a 与由基因片段组成的、固相 片基上的大型d n a 文库杂交。最后,采用荧光或其他成像技术测定上千个基因在 各种不同实验条件下的表达,以检测不同组织或不同细胞的基因表达情况,为疾 病诊断和基因治疗提供大量的遗传变化信息”1 ,如图1 1 所示。按照芯片的制作原 理,基因芯片可以分为很多类,但目前真正成熟的,且广泛应用的有使用原位合 成和合成点样技术的微阵列( m i c r o a r r a y ) 。 图1 1d n a 微阵列技术及应用 1 1 1d n a 微阵列的制备技术 d n a 微阵列的实质是高度集成的寡核苷酸阵列,制造基因芯片首先要解决的 技术是如何在芯片片基上定位合成高密度的核酸探针。目前,基因芯片的制备技 术主要有以下几种: 茸十做阱硎革罚女达讲数批叼彬癌盼例碳完 1 1 1 1 原位合成法 原位合成( h as i r es y n t h e s i s ) 是指直接在芯片上用四种核苷酸合成所需探针 的基因芯片制备技术。原位合成方法可以制作高密度基因芯片,但是,需要的技 术设备复杂,成本较高并且合成的效率较低。主要包括: 1 原位光刻 美国a f f y m e t r i x 公司结合了半导体工业的光刻技术$ 1 d n a 合成技术制造发展 的一项高密度核酸阵列的基因芯片制备技术。它利用光保护基团修饰芯片片基表 面碱基单体的活性羟基,通过设计特定的光刻掩膜和不断地更换曝光区域,直接 在片基上合成所需高密度寡核昔酸阵列,探针数目在合成循环中呈指数增长。 2 原位喷印合成 原位喷印合成原理与喷墨打印类似,不过芯片喷印头和墨盒有多个,墨盒中 装的是四种碱基等液体而不是碳粉;采用的化学原理与传统的d n a 固相合成一 致,因此不需要特殊制备的化学试剂。 3 分子印章多次压印 根据所需微阵列,设计有凹凸的微印章,然后根据预先设计在制备的各级印 章上涂上对应的单核苷酸;按照设计的顺序将不同的微印章逐个依次压印在同一 基片上,得至u 2 5 6 2 5 6 阵列的高密度基因芯片。 1 1 1 2 合成点样法 合成点样法( o f f - c h i pd n as y n t h e s i s ) 是指将合成好的探针、c d n a 或基因 组d n a 通过特定的高速点样机器人直接点在芯片片基上。制作基因芯片的密度 低,需要的设备简单,成本较低,适用于多数实验室制作基因芯片。目前, 除a f f y m e t r i x 等研究和生产基因芯片的少数大公司使用原位合成法外,其他中小 型公司和实验室研究中普遍采用合成点样法。 1 微型机械点样法 该技术是由s h a l o n 和b r o w n 于1 9 9 5 年发展起来的一类芯片制备技术,而后由 美国s y n t e n i 公司开发出商品仪器。该方法通过毛细作用使用点样针将生化物质转 移到固体基底表面( 点样针与基底表面接触) ,每一轮结束后,清洗点样针进行 下一轮操作,而且机器人控制系统可使其实现自动化生产。 2 化学喷射法 将合成好的寡核苷酸探针定点喷射到芯片片基上来制作d n a 芯片。该技术 f l j i n c y t ep h a r m a c e u t i c a l s 和p r o t o g e n e 公司等发展。该方法通过应用与压电接口相连 的微型喷嘴将生化物质喷向基底,通过电流控制使样品体积得到精确控制。 1 1 2d n a 微阵列技术的主要特点 d n a 微阵列技术将成千上万的核酸探针固定于芯片片基上与标记的样品分子 进行杂交,通过检测每个探针分子的杂交信号强度获取样品分子中的基因表达水 平。相对于传统的基因检测技术,d n a 微阵列技术的具有以下特点:技术操作简 单、自动化程度高、检测基因数量大、检测效率高、应用范围广、成本相对低。 1 2d n a 微阵列技术的应用 d n a 微阵列技术将生命科学研究中许多不连续的分析过程,如样本制备、生 化反应和定性、定量检测等,集中到指甲盖大小的芯片上,使基因分析过程全自 动化,被称为“芯片实验室”( l a b o n - ac h i p ) 。该技术成千上万倍提高基因分 析效率的同时,大大减少了样品和试剂,并且实验结果更具全面性、直观性和 可重复性。因此,d n a 微阵列技术广泛地应用于分子生物学及医学研究的各个方 面。 1 2 1 基因组测序 d n a 微阵列的思想是在基因测序的早期提出的,由于传统的基因测序方法难 以解决人类基因组计划如此繁重的工作,因此d n a 微阵列早期主要用来研究基因 组结构。d n a 微阵列技术可在一次实验中利用探针与待测样本分子进行大量杂交 反应,并分析杂交反应产生的杂交图谱而排列出待测样品的序列。h a c i a 在n a t u r e g e n e t i c s 上对用寡核苷酸微阵列进行基因重复测序和基因突变分析进行了较为详 细的叙述川。 1 2 2 基因表达分析 基因表达( g e n ee x p r e s s i o n ) 是指储存遗传信息的基因经过一系列步骤表现 出其生物功能的整个过程。典型的基因表达是基因经过转录、翻译,产生有生物 活性的蛋白质的过程。d n a 微阵列已被用来测定菌类、植物、动物和人类样品中 的基因表达水平。 斯坦福大学的s c h e n a 于1 9 9 5 年首先使用d n a 微阵列研究拟南芥( a r a b i d o p s i s t h a l i a n a ) 基因表达,通过芯片杂交分析拟南芥根与叶两种组织中基因的差异表 达嘲。 d e r i s i 等“”应用酿酒酵母( s a c c h a r o m v c e sc e r e v i s i a e ) e d n a 基因芯片研究孢 子在有丝分裂状态下基因转录和表达水平的差异。斯坦福大学的b r o w n 研究小组 应用合成点样法制备酿酒酵母c d n a 微阵列,获得酵母在不同细胞周期状态以及 职十徽阱列菲习衷地诰戡荆均癣痒_ 陀测研究 在热休克冷休克处理后其2 4 7 3 个基因的表达谱,较直观地反应了不同条件和状态 下基因转录调控水平,为寻找基因调控的机理提供了一条有效的途径。 t a n a k a 等“”利用基因芯片技术检测了1 5 0 0 只小鼠妊娠中期子宫及胚胎发育过 程中基因的表达情况,从而了解到哺乳类动物胚胎发育过程中基因表达的动态变 化。 g o l u b 等”分析了人类白血病的6 8 1 7 个基因表达谱,利用基因表达水平的差 异将7 2 个白血病样本分成a m l 和a l l 两组,并取得了较好的准确性。b u l l 等”1 用 包含前列腺癌、损害前身和正常组织的e d n a 微阵列研究前列腺癌中基因表达。 标记从前列腺电切术( t u r p ) 或前列腺根治术得到的肿瘤样品的e d n a ,分析其 表达,揭示了许多上调转录和基因过表达 1 2 3 发现新基因 微阵列技术是一项发现新基因及分析各个基因在不同时空表达方面 十分有用的技术,它具有样品用量极少,自动化程度高等优点,便于大 量筛选新基因。h e l e r 等”1 利用e d n a 芯片比较了炎证性疾病类风湿关节炎 和肠炎组织中基因表达的不同,并导致进一步发现了炎症相关基因i l 3 ,g r o - a 等。b u a t e s 等“”鉴定了由激活因子( s 2 8 4 6 3 ) 诱导表达的一系列基 因。s c h e n a 等用包含1 0 5 6 个c d n a 的芯片与热休克作用和佛波酯处理的t 细胞 的c d n a 杂交,发现了4 个新基因。目前,人类基因数据库中有4 0 0 0 0 0 个基因表 达序列标签( e x p r e s s e ds e q u e n c et a g ,e s t ) 。成千上万的e s t s 微阵列为人类基 因表达研究提供强有力的分析工具,加速人类基因组的功能分析。 1 2 4 在疾病诊断中的应用 疾病的发生和发展实际是多种疾病相关基因表达失常或许多疾病抑制基因失 活所致。利用基因微阵列技术,可以找到与该疾病相关的基因,实现对该疾病快 速、简便、高效的诊断。人类恶性肿瘤的6 0 与人类尸5 3 抑癌基因的突变有关, 对癌症样本的基因突变和异常表达进行检测可以作为诊断的重要指标。 k a u r a n i e m i 等利用e d n a 芯片技术和n o r t h e r n 杂交技术检测了b r c a l 乳腺癌 患者m y b 基因m r n a 的表达情况,发现在b r c a l 突变型中m y b 基因表达较常 见”。o k u s t s u 等从7 6 例急性细胞白血病( a m l ) 患者获得2 3 0 4 0 个基因构成的肿 瘤细胞基因表达谱,结果a m l 患者有6 3 个基因过表达,3 7 2 个基因的表达受到 抑制,这些基因可能调控与a m l 发病分子机制有关的关键因子,也成为a m l 药 物治疗的潜在靶基因。同时通过比较a m l 患者对化疗敏感者与对化疗不敏感 患者的基因表达情况发现有2 8 个基因的表达水平不同,基于此基础建立一个 个体抗肿瘤药物的敏感系统,预示化疗最终走向个性化治疗的目标”。k a n 等 把人食管癌细胞系和人食管组织点在c d n a 微阵列上,把k y a z 和o e 3 3 ( 腺癌) 从k y s e 系( 鳞状细胞癌) 中区分出来,识别了在k y a z 和o e 3 3 中特征性表达 的基因”“。l o s s o s 等在一项独立研究中发现,根据i g 基因超突变的有无,可将 弥漫性大b 细胞淋巴瘤( d i f u s el a r g eb c e l ll y m p h o m a ,d l b c l ) 分为两个亚 型。b r o w n 等运用d n a 微阵列技术对脆x 综合症( f r a g i l e - xs y n d r o m e ,f r ax ) 的分子生物学机制及早期诊断进行了研究”“。 d n a 微阵列技术为临床疾病的诊断提供了一种全新的概念,它不仅使实验检 测的高通量、高自动化,微量化得以实现,并且在临床上对使某些疑难疾病的准 确诊断成为可能。 1 2 5 在药物研究中的应用 基因芯片技术在新药开发、药物靶标的发现,多靶位药物筛选、药物作用 的分子机理研究、药物疗效及副作用等方面具有明显优势,还可以将药物的生 物效应和基因变化密切相联系,从而为药物的研究和开发注入了新的生机和活 力。k u m a r - s i n h a 等利用d n a 芯片筛选发现脂酸合酶( f a s ) 基因及其相应的信 号通路与乳腺癌的发生相关,提示该通路可能被用来作为治疗或药物筛选的新靶 标”1 。r o g e r s 等通过d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 花类药材说课稿2025学年中职专业课-天然药物学基础-药剂-医药卫生大类
- 2026年浦发员工合同(1篇)
- 高中心理教育教案2025生涯决策指导说课稿
- 小学春季“防过敏”主题班会说课稿
- 企业资料备份容灾方案
- 2026年环保行业垃圾分类智能系统报告及未来五至十年环保科技报告
- 农产品防腐防潮方案
- CIGB-552-TFA-生命科学试剂-MCE
- 发胶定型检验报告
- 变频器输出谐波及效率检测报告
- 2026广西梧州苍海投资集团有限责任公司招聘总会计师1人笔试模拟试题及答案解析
- 2024-2025学年四川省成都市石室联中教育集团八年级(下)期中数学试卷
- 小学科学教学中的跨学科融合创新实践研究教学研究课题报告
- 《AQ3067-2026化工和危险化学品重大生产安全事故隐患判定准则》解读
- 2026 年山东春考英语提分技巧全解
- 2026广东东莞市康复实验学校招聘18人备考题库及答案详解(各地真题)
- 2026届湖北黄冈中学等十一校高三下学期第二次联考物理试卷(含答案)
- YDT 5102-2024 通信线路工程技术规范
- GB/T 33610.1-2019纺织品消臭性能的测定第1部分:通则
- 统编版小学语文小升初专项训练 汉语拼音选择题
- 沙漠掘金(经典版)-沙漠掘金攻略
评论
0/150
提交评论