




已阅读5页,还剩76页未读, 继续免费阅读
(动物遗传育种与繁殖专业论文)cdna微阵列数据的非转化分析方法.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国农业大学博士学位论文摘要 摘要 c 1 ) n a 微阵列技术已经广泛应用于生物学与医学研究,成为生物学试验中的一种重要试验手 段,与其相应的数据处理方法和检测差异表达基因的统计方法也在快速地完善。但c d n a 微阵列 数据中包含有许多的变异,在用于著异表达基因检测和其他统计分析前,必须将这些“噪音”剔 除。背景校正、转换和数据标准化已经广泛地应用于c d n a 微阵列数据分析中。目前,通用的数 据处理方法是对数比转换法。在数据转换之后,通过标准化过程将不同信道的荧光信号校正剑同 一水平。但正如h u b e r 等所指出的那样,它本身还存在着些有待解决的缺陷,如在所检测的样 品当中,其一些基因会出现弱表达,或是不表达。在这种情况下,经过背景校止后,这些基因的 观测值可能会是负值。然而对于比值或是对数转换,负值是没有意义的;以及假设样品中,只有 - - d 部分的基因发生了差异表达,同时发生差异表达的基囚的上下调的比例要对称。这些缺陷会 造成“噪音”效应估计有偏,从而影响了检测结果的可靠性。 本研究首先根据r o c k e 和d u r b i n 提出的微阵列数据分析方法,提出一种基丁方著比判别 式的1 f 转换方法,并结合试验中的各种影响因子对试验“噪音”的剔除效率进行了模拟研究,结 果表明:( 1 ) 背景参数估计值西略微偏高,但相对偏差较低,可以很好地校止背景影响。 ( 2 ) 比例冈子随机误的期望估计值e i p 9j 基本上是无偏的,同时其相对偏差( r d ) 值均低于0 5 。 ( 3 ) 比例因子屈在差异表达基困比例较小的情况下,受差异表达基冈上f 调比例的影响不大。 这种方法克服了对数比转换的部分缺陷,但由f 其对于试验的殴计要求和基因结构的要求而造成 适用性的降低。同时研究发现,对于差异表达基因比例较高( 如3 0 ) ,且上卜调比例不平衡的 微阵列数据,难以有效剔除试验中的“噪音”,因而其适用范围就受到了限制。 根据研究中所发现的问题,改进了标准化公式和判别式( 为简便起见,这里称之为“非转换 方法”) 。利用一个t 统计量作为判别式,使标准化参数参数估计中得到准确地剔除潜在差异表 达基囡,从f 面提高了标准化参数估计的准确性和精确性。通过模拟研究比较了非转换方法与 对数比法在多种条件下剔除c d n a 微阵列试验“噪音”功效和对检测差异表达基因的效率的影 响,结果证明:这种非转换方法克服了对数比法的缺陷,可以更有效地剔除试验“噪音”, 同时在检测差异表达基因的效率方面,非转换方法比常规的对数比法具有更好的稳健性和更高的 检测功效,基因检出率和准确性大大提高,同时将错检率控制在预定水平之下( 5 ) 。特别是当 尊异表达基因比例较高( 3 0 ) ,且上下调比例不平衡时,依然保持了其稳健性和有效性。本研 究还利用a p oa i 试验的芯片数据进行了效率验证,结果表明:相对于传统的对数转换方法,非转 换方法能检测山更多的差异表达基冈。 总的来看,非转换方法处理e d n a 微阵列数据是行之有效的,并且克服了对数比法中存在的 缺陷。因而可作为e d n a 微阵列数据的主要方法之一。 关键词:c 1 ) n a 芯片对数转换方差比非转换方法标准化 中国农业大学博士学位论文摘要 a b s t r a c t m i c r o a r r a yt e c h n o l o g yh a sb e e nw i d e l yu s e dt os t u d yg e n ee x p r e s s i o ni nb i o l o g i c a la n dm e d i c a l r e s e a r c h e d n am i c m a r r a y sh a v eb e e ns t a n d a r de q u i p m e n t si nb i o l o g yl a b o r a t o r i e s m e t h o d sf o r i d e n t i f y i n gd i f f e r e n t i a l l ye x p r e s s e dg e n e sa r es t i l le v o l v i n g i ne d n am i c r o a r r a ye x p e r i m e n t s , f l u o r e s c e n ti n t e n s i t i e sa r es u b j e c tt on u m e r o u ss o u r c e so f v a r i a t i o n t h e s ev a r i a t i o n sh a v et ob er e m o v e d s ot h a tt h er e a ld i f f e r e n c ei ng e n ee x p r e s s i o ni nt h ed i f f e r e n tk i n d so fc e l l so rt i s s u e sc a nb ed e t e c t e d t h e c u r r e n t l yw i d e l yu s e dm e t h o di n v o l v e sb a c k g r o u n dc o r r e c t i o n ,l o g - t r a n s f o r m a t i o n a n d n o r m a l i z a t i o no ft h em e a s u r e di n t e n s i t i e s t h em o s t p o p u l a r d a t at r a n s f o r m a t i o ni s l o g r a t i o t r a n s f o r m a t i o n ,i e 1 0 9 - t r a n s f o r m a t i o no f t h er a t i oo f t h eb a c k g r o u n d c o r r e c t e di n t e n s i t yo f o n em r n a s a m p l et ot h a to ft h eo t h e rs a m p l e ,n o r m a l i z a t i o nc a l i b r a t e st h es i g n a l sf r o md i f f e r e n tc h a n n e l sa n d a r r a y s t oa c o m p a r a b l es c a l e 、a l t h o u g ht h el o g r a t i ot r a n s f o r m a t i o na p p r o a c h ( r e f e r r e dt o a st h e l o g - r a t i oa p p r o a c h ”h e r e a f t e r ) h a sb e e nw i d e l yu s e di nc d n am i c r o a r r a yd a t aa n a l y s i s t i th a ss o m e p r o b l e m s , a sp o i n to u tb yh u b e re ta 1 :i f ag e n ei se x p r e s s e dw e a k l yo rn o ta ta l l ,i tm a yh a p p e nb y c h a n c et h a tt h eb a c k g r o t m d c o r r e c t e df o r e g r o u n di n t e n s i t i e sb e c o m en e g a t i v e h o w e v e r t n o n p o s i t i v e v a l u e sd on o tm a k es e n s ef o re i t h e r r a t i o so tl o g t r a n s f o r m a t i o n a n dn o r m a l i z a t i o nr e q u i r e sa a s s u m p t i o nt h a to n l yar e l a t i v e l ys m a l lp r o p o r t i o no ft h eg e n e sa r ed i f f e r e n t i a l l ye x p r e s s e di nt h et w o m r n as a m p l e s ,a n dt h a tt h e r ei ss y m m e t r yi nt h ee x p r e s s i o no ft h eu p - r e g u l a t e d d o w n - r e g u l a t e d g e n e s i f t h e s ea s s u m p t i o n sd on o th o l d ,w h i c hh a p p e n si nm a n yc a s e s ,t h ee s t i m a t e so f t h e “n o i s e e f f e c t sw i l lb eb i a s e d w ep r o p o s e dan o r m a l i z a t i o nm e t h o du s i n gav a r i a n c er a t i od i s c r i m i n a n ta c c o r d i n gt ot h em e t h o d p r o p o s e db yr o c k ea n dd u r b i n t h ef a c t o r so fi n f l u e n c i n gn o r m a l i z a t i o nw e r es i m u l a t e di nt h i ss t u d y t h er e s u l t ss h o w e dt h a t ( 1 ) 西w a sa l w a y so v e r e s t i m a t e d , b u tr e l a t i v ed e v i a t i o nw a sa tal o wl e v e l t h a tm e a n sb a c k g r o u n di n f l u e n c ec a nb ec o r r e c t e de f f e c t i v e l y ( 2 ) e ( 一) i se s t i m a t e dm o r ea c c u r a t e , a n dr e l m i v ed e v i a t i o nw a su n d e ro 5 ( 3 ) t h o s ed i f f e r e n t i a l l ye x p r e s s e dg e n e sh a dl i t t l ei n f l u e n c eo n t h ee s t i m a t i o no f 屈w h e no n l yar e l a t i v e l ys m a l lp r o p o r t i o no ft h eg e n e sa r ed i f f e r e n t i a l l ye x p r e s s e d i nt h et w om r n as a m p l e s t h i sn o r m a l i z a t i o nm e t h o dc a np a r t l ys o l v et h ep r o b l e m sw i t ht h el o g - r a t i o t r a n s f o r m a t i o n b u ti t sa p p l i c a t i o nw a sl i m i t e db e c a u s eo f t h er e q u i r e m e n ti nt h ee x p e r i m e n td e s i g na n d g e n ec o m p o n e n t s m e a n w h i l ew ef o u n dw h e nt h ep r o p o r t i o no f t h ed i f f e r e n t i a l l ye x p r e s s e dg e n e si nt h e t w om r n as a m p l e si sr e l a t i v eh i g i ( e g 3 0 ) a n dt h e r ei sn o ts y m m e t r yi n t h ee x p r e s s i o no ft h e u p d o w n - r e g u l a t e dg e n e s , i ti sh a r dt oe l i m i n a t et h e “n o i s e e f f e c t i v e l y i nv i e w o f t h ep r o b l e m s ,w em o d i f i e dt h en o r m a l i z a t i o nf o r m u l aa n dt h ed i s c r i m i n a n t ( f o rs i m p l i c i t y , c a l li tt h e “n o n t r a n s f o r m a t i o na p p r o a c h ”) w et a k eu s eo fat - s t a t i s t i ca sa d i s c r i m i n a n tt h a tc a n e l i m i n a t et h ep o t e n t i a l d i f f e r e n t i a l l ye x p r e s s e dg e n e ss ot h a t i tc a ni m p r o v et h ev e r a c i t yo ft h e p a r a m e t e r se s t i m a t i o n t h er e s u l t ss h o w e dt h a tt h i sa p p r o a c hw a sf e a s i b l ea n dp e r f o n l l e db e t t e rt h a nt h e c u r r e t rp o p u l a rl o g - r a t i oa p p r o a c hi na l lc a s e si n v e s t i g a t e d 。t h a tm e a n st h a in o n t r a n s f o r m a t i o n a p p r o a c hs o l v e dt h ep m b l e m sw i t hl o g - r a t i oa p p r o a c h i tc a ne l i m i n a t e n o i s e ”i n t h ee x p e r i m e n t s ,a n d l l 中国农业大学博士学位论文摘要 c a ni d e n t i f ym o r eg e n e st h a nl o g - t r a n s f o r m a t i o nm e t h o dw i t hl o wl e v e lo ff a l s ed i s c o v e r yr a t e s p e c i a l l y ,w h e nt h ep r o p o r t i o no ft h ed i f f e r e n t i a l l ye x p r e s s e dg e n e si nt h et w om r n as a m p l e si s r e l a t i v eh i 曲( e g 3 0 ) a n dt h e r ei sn o ts y m m e t r yi nt h ee x p r e s s i o no f t h eu p d o w n - r e g u l a t e dg e n e s ,i t s t i l lw o r k sw e l l r e a lc d n am i c r o a r r a yd a t ai nt h ea p oa l e x p e r i m e n tw e r ea n a l y z e dt o l e s tt h e f e a s i b i l i t ya n de f f i c i e n c yo ft h i sa p p r o a c hf o rd e t e c t i n gd i f f e r e n t i a l l ye x p r e s s e dg e n e s t h er e s u l t s s h o w e dt h a to u ra p p r o a c hw o r k e dw e l la n dc a r i d e n t i f ym o r eg e n e st h a nl o g t r a n s f o r m a t i o nm e t h o d t h e r e f o r e ,i tc o u l db ea l la l t e r n a t i v em e t h o df o ra n a l y z i n ge d n am i c r o a r r a yd a t a k e vw o r d s :c d n am i c r o a r r a y ,l o g r a t i o ,v a r i a n c er a t i o ,n o n 4 r a n s f o r m a t i o n ,n o r m a l i z a t i o n 1 1 1 中国农业大学博士学位论文 褒目录 表目录 表2 一l 模型( 2 - 1 ) 参数所服从的分布 表2 - 2 试验因素参数表一 表2 3 差异表达基怯l 卜下调比例平衡时参数估计值的r d 值与b i a s 值 3 7 表2 4 差异表达基因上调比例0 ,3 时参数估计值的r d 值与b i a s 值3 9 表3 - 1 影响标准化参数估计的凼子组合 4 8 表3 - 2 影响差异表达基因检测的潜在因子的参数组合4 9 表3 - 3 芯片内探针( 基因) 熏复数对标准化参数估计值的b i a s 和r d 的影响 5 0 表3 - 4 芯片数对标准化参数估计值的b i a s 和r d 的影响 5 l 表3 - 5 样品池容量对标准化参数估计值的b i a s 和r d 的影响5 1 表3 - 6 背景变异对标准化参数估计值的b i a s 和r d 的影l 啕一5 2 表3 7 差异表达基因上下调比例不甲衡对标准化参数估计值的b i a s 和r d 的影响 一一5 3 表4 - 1 对数转换方法与非转换方法检测结果比较 6 2 表4 - 25 个e s t 在g e n b a n k 中的比对结果6 2 中闰农业大学博士学位论文 圈目录 图目录 留1 1 比值法示意图( 1 ) ( 引自s o r i n ,2 0 0 2 ) 图1 2 比值法示意图( 2 ) ( 引自s o r i n ,2 0 0 2 ) 一1 3 幽1 - 3 特异比值法示意图( 引自s o r i n ,2 0 0 2 ) 1 4 图2 - 1 模拟5 0 0 个基因的原始数据、对数转换后的均值与标准差示意图3 4 图2 - 2b a r t o s i e w i c z 等( 2 0 0 0 ) 微阵列原始数据、对数转换后的均值与标准差示意图3 5 图2 - 3 ,芯片内重复对参数估计值m s e 的影响 3 6 斟2 - 4 样品池容量对参数估计值m s e 的影响,3 8 图2 - 5 差异表达基因中上下调比例对参数估计值m s e 的影响3 9 目3 - 1 芯片内探针( 基凼) 重复数对捡测效力的影响5 4 图3 - 2 芯片数对检测效力的影响5 5 翻3 - 3 芯片数对特异性差异表选基因检测效力的影响 5 5 图3 - 4 芯片数对检测效力的影响 5 6 图3 - 5 背景变异对检测效力的影响5 7 图3 - 6 差异表达基因e 下调比例不平衡对检测效力的影响,5 7 图3 7 错检率5 8 i v 独创性声明 y7 7 3 6 4 8 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得中国农业大学或其它教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示了谢意。 研究生签名: 猥钰刚 时间:刀 年莎月m 日 , 关于论文使用授权的说明 本人完全了解中国农业大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件和磁盘,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复 制手段保存、汇编学位论文。同意中国农业大学可以用不同方式在不同媒体上发表、 传播学位论文的全部或部分内容。 ( 保密的学位论文在解密后应遵守此协议1 研究生签名 导师签名 碾铴刚 孕 时间:沙旷年月勿同 时间:渺年,月刃日 中国农业大学博上学位论文第一章文献综述 1 1 生物芯片 第一章文献综述 生物芯片技术是一项综合性的高新技术,它涉及生物、化学、医学、精密加工、光学、微电 子技术、信息等领域,是一个学科交叉性很强的研究项目。经过近十多年的不懈努力,生物芯片 技术已开始从不成熟逐步走向成熟,并给生命科学研究的许多领域带来冲击甚至是革命。对于生 物芯片而言。微阵列芯片才只是其中一种检测芯片,与其并级的还有其他多种具有不同功能的芯 片。生物芯片技术带来的重大意义和深远影响将是不可估量的。 目前生物芯片技术已应用于分子生物学、疾病的预防、诊断和治疗、新药开发、生物武器的 研制、司法鉴定、环境污染监测和食品卫生监督等诸多领域,已成为各国学术界和上业界所瞩目 利研究的一个热点。生物芯片的概念源自丁计算机苍片,狭义的生物芯片即微阵列芯片,主要包 括e d n a 微阵列、寡核苷酸微阵列、蛋向质微阵列和小分子化合物微阵列。分析的基本单位是在 一定尺寸的基片( 如硅片、玻璃、塑料等) 表面以点阵方式固定的一系列可寻址的识别分子,点 阵中每一个点都可以视为一个传感器的探头。芯片表面吲定的分子在定的条什f 与被检测物进 行反应,其结果利用化学荧光法、酶标法、同位素法或电化学法显像。再利用扫描仪等仪器记录, 最后通过专门的计算机软件进行分析。广义的生物芯片是指能对生物成分或生物分子进行快速并 行处理和分析的厘米见方的固体薄型器件,其主要种类有微阵列芯片、过滤分离芯片、介电电泳 分离芯片、生化反应芯片和毛细管电泳芯片等。生物芯片在农业和林业中有广阔的应用天地。通 过平行检测基因的表返谱进行功能分析,有助于研究者更蚶地了解动植物生长和发育的基本机 理。 i 2 微阵列芯片的作用 i 2 1d n a 序列测定 人类基因组计划的实臆促进了高效、自动化的测序方法的发展。芯片技术中杂交测序 ( s e q u e n c i n g b yh y b r i d i z a i o n ,s 明) 技术及邻堆杂交( c o n t i g u o u s s t a c k i n gh y b r i d i z a t i o n , c s i i ) 技术都是新的高效快速测序方法( w a r a f f 等,1 9 9 7 ;s o u t h e r n 等,1 9 9 6 :d u b i l e y 等,1 9 9 7 ) 。 州含6 5 5 3 6 个8 聚寡核苷酸的微阵列,采抖j s b h 技术,可测定2 0 0 b p 长d n a 序列,采用6 71 0 8 8 6 4 个 1 3 聚寡核营酸的微阵列,可对数千个碱基长的d n a 测序。8 1 3 1 1 技术的效率随着微阵列中寡核苷酸 数量与长度的增加而提高,但微阵列中寡核苷酸数量与长度的增加则提高了微阵列的复杂性,降 低了杂交准确性。c s h 技术弥补了s b h 技术存在的弊端,c s h 技术的应崩增加了微阵列中寡核营 酸的有效长度,加强了序列准确性,可进行较长的d n a 测序。计算机模拟论证了8 聚寡核苗酸微 阵列与5 聚寡核苷酸邻堆杂交,相当丁1 3 聚寡核苜酸微阵列的作用,可测定数千个核苷酸长的 d n a 序列。利用基因芯片测序的准确率达9 9 以上。p e a s e 等( 1 9 9 4 ) 首先将八聚体寡核苷酸所有可 能的序列, 按只著一个碱基的顺序固定在片基上预先设定的位置,样品经扩增并标记后与微阵 列上所有序列进行杂交,产生的杂交图谱中,完全互补的两链产生的杂交信号比错配两链强5 中国农业大学博士学位论文第一章文献综述 3 5 倍,根据产生杂交信号的寡核苷酸序列重叠情况推导并重建原样品的核酸序列。 1 2 2 突变与多态性检测 在同一物种不同种群和个体之间,有着多种不同的基困型,而这种不同,往往与个体的不同 性状和多种遗传性疾病有着密切的关系。通过对大量具有不同性状的个体的基因型进行比较,就 可以得出基因与性状的关系。但是由于大多数性状和遗传性疾病是由多个基因同时决定的,冈此 分析起来就十分困难,然而基冈芯片技术恰恰解决了这一问题,利用其可以同时反映数干甚至更 多个基因的特性,就可以分折基因组中不同基网与性状或疾病的关系( w i n z e l e r 等,1 9 9 8 :h a c i a 等,1 9 9 8 ;b r o d y 等,1 9 9 6 ;l i v a c h e 等,1 9 9 8 ) 。w e i d o n g 所在的研究小组( 2 0 0 3 ) 报道了一种分 析人线粒体t r n a 单核苷酸多态性的方法,他们采用一种称为“x n ao ng o l dc h i p ”的技术平台, 把一系列各含有一个碱基突变的等位基冈特异性探针固定于芯片上,分别与荧光标记的参考核酸 及样本扩增产物杂交,通过分析杂交信号进行s n p 的检测。基冈多态性是指在d n a 的相同位点上 有部分个体的碱基序列不同,即同一位点的碱基种类具有多态性,对它的检测可以研究个体差异, 遗传病诊断等。用类似突变的检测方法,设计针对具有多态性的基因的探针并同定到芯片上就可 检测未知样品的多态性变异。s a i k i 等( 1 9 8 9 ) 较早地借助紫外交联把少量寡核苷酸探针固定到 尼龙滤膜上,分析h l a d q ad n a 的多态性和地中海b 2 贫血症突变。l i p s h u t z 等( 1 9 9 5 ) 采用原位 合成法构建与目的片段错配和匹配的探针阵列,分析了高度多态性的h i v 2 1 基因组中逆转录酶和 蛋白酶基因的突变情况,以指导a i d s 的治疗。w i n z e e r 等( 1 9 9 8 ) 把来自酵母$ 9 6 和i y j m 8 9 菌株的 总基因组d n a 与原位合成的寡核苷酸探针阵列杂交,共确认了7 1 4 个坝等位标记,井用该标记同 时进行1 个多重药物抗性基因座位及4 个其他座位的高分辨率作图,这表明:一个物种的两个隔离 种群中等位基因突变可用基于微阵列杂交的方法进行直接高效的扫描作图,无需等位基因特异 的p c r ,也无需知道变异的特性。这是首次利用芯片对酸母全基因组进行一气呵成的遗传作图。 d r m a n a c 等( 1 9 9 8 ) 把未知d n a 或靶序列点样到片基上形成阵列,与标记的寡核苷酸探针杂交,近 千次重复的随机实验分析了1 2 个同源和异源p 5 3 # f 显子5 8 的l l l k b 序列的碱基替换、插入和缺 火,精确度达1 0 0 。h e c i a 等( 1 9 9 8 ) 用包含9 0 0 0 0 个k 2 5 核苷酸的原位合成探针阵列,筛查a t m 基 闪的9 1 l7 k b 编码区所有可能的杂合菌系突变,发现了5 个新的会导致a t m 蛋白氨基酸序列变异的突 变,这表明d n a 芯片在分析具有复杂结构的大基因突变方面很有价值。 i 2 3 基因表达检测 与基因组不同,转录是高度动态的,由于应答环境变化或者正常的细胞活动而发生快速剧烈 的变化。要了解基因的功能,就应了解基冈何时何处表达,表达程度如何,因为这是了解其所表 达的蛋向质的活动及生物学功能的关键( z i a u d d i n 等,2 0 0 1 ;s e o 等,2 0 0 0 ) 。在细胞中有大量 若隐若现地表达的基因和参与各种生命活动的蛋白质,过去研究者能够观察一个或几个基冈的 表达,却无法看到所有基因全貌( s e r v i c e ,1 9 9 8 ) 。目前研究著异基因表达( d i f f e r e n t i a lg e n e e x p r e s s i o n ,d g e ) 的方法主要有表达序列标签( e s t s ) 测序、差减克隆( s u b l r a c t i v ec l o n i n g ) 、差 异显示( d i f f e r e n t i a ld i s p l a y ) 、基i 灭| 表达系列分析( s e r i a la n a l y s i so fg e n ee x p r e s s i o n ,s a g e ) 。而 2 中国农业人学博士学位论文第一章文献综述 c d n a 微阵列杂交技术可监测人量m r n a 的转录,直接快速地检测出极其微量的m r n a ,且易于同时 监测成千上万的基因,是研究基冈功能的煎要手段之一。通过表达谱的分析可以发现新的基因, 研究顺反式调节元件和转录因子,研究基因在染色体上的分布规律( p a u l 等,2 0 0 2 ) ,可以预测 人类疾病( g o l u b 等,1 9 9 9 ) ,基因袭达谱可以作为指纹图谱象d n a 指纹图谱样被用于分类, 及相关性鉴定( a l i z a d e h 等,2 0 0 0 ) ,女u s c h e n a 等( 1 9 9 6 ) 首次利用c d n a 微阵列定量测定了模 式植物拟南芥3 4 5 个基因的表达水平。用芯片还可检测细胞在外界刺激、代谢条件改变时的基因 表达差异及不同来源的细胞基因表达的差异等。c l o u d 等( 2 0 0 0 ) 利用激光捕捉显微切割技术( l a s e r c a p t u r e m i c r o d i s s e c t i o n ,l c m ) ,联合蛋白质芯片研究了正常人、结肠癌病人、癌转移病人结肠组 织蛋f 1 的表达情况,发现了不同的表达图谱。t a r u i 等( 2 0 0 3 ) 用d n a 芯片分析了烧伤病人淋巴细 胞中细胞因子基因的表达情况,发现i f nyr i ,i l 2 1 r 1 ,2 2 r a , 2 2 r h ,2 2 ry , 2 6 r a , , 1 1 2 7 r 降低,i f n 2y 、i l 2 1a 、2 1 3 、和2 1 5 表达升高,从而为烧伤病人的治疗提供依据。s o n g 等( 2 0 0 3 ) 绘制了早幼粒细胞性白血病h l 2 6 0 细胞向单核细胞或者粒细胞分化过程中一些肿瘤相 关基冈的表达谱。 1 2 4 样品分离与分子扩增 样品分离与分子扩增是通过结构微阵列芯片进行的,可用微加工的显微通道进行毛细管电 泳或电层析,使核酸或蛋白质按片段或分子量大小分开。y a o 等( 1 9 9 9 ) 构建毛细管电泳芯片,并 首次在芯片上进行了蛋白质s d s 2 毛细管凝胶电泳,结合荧光标记及激光诱导的荧光检测技术,成 功地进行了6 种蛋白质混合物的分离,这是把生物芯片用于蛋白分离研究的重要一步。另外可 用蚀刻在芯片上的微反应体系进行核酸的p c r 扩增,m a r t i n 等( 1 9 9 8 ) 的p c r 芯片中,样品可 在不同温度的恒温区间内流动,经2 0 个循环,扩增了淋病奈瑟球卤1 7 6 b p 的d n a ,与常规p c r 相 比,具有扩增速度快,样品消耗量少等优点i ,在这些芯片上流动的包含生物样品的微流体称为 显微微射流,通过它可完成许多连续的生化反应,从而用丁制各生物样品并使核酸分子扩增或 杂交,或进行电泳或层析等。随着集成度的提高,单块芯片就可作为一个缩微实验室,多块芯 片可升行构建“芯片生化工厂”。 1 2 5 生物分子间作用的研究 传统的酵母双杂交系统研究蛋白质间作用有很多局限,如未正确折霍的蛋白质不易检测,不 能控制蛋白质的翻译后修饰,易产生假阴性等。日本研制了一种基于表面等离子体共振( s p r ) 的 生物芯片,用于研究与蛋白质结合的特异d n a 序列。他们把转录因子n te r f 2 的d n a 结合结构 域固定于芯片上,用大量的随机寡核苷酸与之反应,由此筛选结合的特异d n a 分子。组蛋白的甲 基化等影响体内许多基因的活性,美国加州火学的研究人员( 2 0 0 3 ) 把染色质免疫沉淀和d n a 微阵 列技术联台起来,设计了一种研究组蛋白修饰的快速方法,可以在全基因组水平研究组蛋白的修 饰活动以及各种不同的修饰之间的关系。 1 2 6 疾病的诊断与治疗及其它应用 中国农业大学博十学位论文 第一章文献综述 人类的疾病与遗传基因密切相关,基因芯片可以对遗传信息进行快速准确的分析,因此它在 疾病的分子诊断中的优势是不言而喻的,是l 临床上一种新的、强有力的分子r 具( k o z a l 等,1 9 9 6 ) 。 将已知细菌、病毒等病原微生物的部分核酸序列,设计相应的引物及探针,用杂交的方法检测, 或者直接检测是否有目的p c r 产物,可以用来诊断感染性疾病。许多遗传病,如血友病、地中海 贫血、苯丙酮尿症等,都已发现相应的基因异常,肿瘤的发生发展也往往涉及许多基因异常,例 如慢性粒细胞性白血病会检测到融合基因b c r 2 a b l ,急性早幼粒性白血病可检测到融合基因 p m l 2 r a r a 等,可以同时检测人量基因异常的芯片技术势必大力推动临床疾病的诊断。g r u b o r ( 2 0 0 4 ) 介绍了一种单克隆抗体芯片,采用d i t h i o b i ss u c c i n i m i d y lp r o p i o n a t e ( d s p ) 作为蛋白的连结臂,把 单抗同定于芯片上,可以同时检测d n ac a r c i n o g e na d d u e t s 。 基冈微阵列还可以用于个体化医疗( h a c i a 等,1 9 9 9 ;s y v a n e n 等,1 9 9 9 ;y n i s s o n 等,2 0 0 0 ) , 寡核苷酸阵列基网芯片技术已经被应用于感染性疾病、肿瘤和药物代谢等方面的研究。用于新药 的发现,用于毒物学的研究( e m i l e 等,1 9 9 9 ) ,用于进化研究等。 1 3c d n a 微阵列分析流程及方法 本文将着重论述以e d n a 微阵列数据的分析过程和方法。c d n a 微阵列检测与分析是将基囚芯片 上的探针与荧光标记的目标d n a 或r n a 杂交后进行荧光激发扫描检测荧光信号形成杂交图象,随 后通过数据转换和标准化处理,再通过统计分析和多重假设检验检测差异表达基囚,以阐述其生 物学意义分析。 1 3 1 图像处理 图像的处理和分析是微阵列试验中的一个重要组成部分,它会对后续的分析,如聚类分析、 检测差异表达基因等数据分析,产生很大的影响。在微阵列试验中,利用芯片扫描仪可以获得杂 交芯片的扫描幽像,并获得红、绿荧光强度观测值。获得的荧光强度反映了样品与芯片上的探针 ( 基因) 的杂交水平。试验中所观测到的荧光强度值被转换成1 6 比特的图像,并用相应的象素作为 原始数据。 微阵列图像扫描过程一般可以分为3 个阶段: ( i ) 定位和观测范同划定( a d d r e s s i n g ) 。首先定位芯片上各杂交位点的位置,以确定其坐标。 这一过程的自动化提高了分析的速度和准确性,实现了微阵列数据分析的高通量化。 ( 2 ) 信号界定( s e g m e n t a t i o n ) 。本过程是要实现象素的分配,以区别被观测位点的前景荧光 强度和背景荧光强度。 ( 3 ) 荧光强度提取( i n t e n s i t ye x t r a c t i o n ) 。本过程分别计算芯片上每一个位点的红色和绿色前 景荧光强度、背景荧光强度等。 另外一个与图像处理有关的过程是芯片数据的可视化。经过图像处理会得剑红、绿两张图 像,它们将被存为两张1 6 比特的图像。随后这两张图像通过平方根转换,会被分别压缩为8 比 特的图像。这样是为了将这两张图像合成一张1 6 比特的图像( 其数据范围相对应为:2 5 6 6 5 5 3 5 ) ,通过这张图像可以对试验结果有一个比较直观的印象。 4 中国农业大学博上学位论文 第一章文献综述 如r 将介绍目前使用较多的图像分析方法,其中将重点说明定位、范嗣划定和背景校正。 1 3 1 1 定位和观测范围划定 准确地定位芯片上的杂交位点,需要一系列位置参数以确定它们的准确位置。为了提高数 据观测值的准确性,就要确保定位和范围划定的可靠性。在定位过程中,如果进行人1 干预, 可以提高定位的准确性。但是,这样会大大迟滞图像处理过程。如果可以最小程度的减小人r 干预,同时能够最人提高处理效率,将是最理想的结果。这种定位过程在微阵列文献中一般称 之为“定格”( g r i d d i n g ) 。目前通用的图像处理软什都提供手动和自动两种定格模式,但是结果 之间会有很大的差异。 1 3 1 2 信号的界定 在图像的信号界定中,会把图像削分成儿个区域,母个区域代表不同的意义( s o i l l e 1 9 9 9 ) 。 在微阵列试验中,信号的界定将会给位点的前景和背景分配相应的象素。在每一个位点上,计 算荧光强度以测度样品中的基因转录水平。任何信号界定方法都要产生位点框( s p o t m a s k ) ,其 含盖了该位点的前景象素。微阵列图像处理的信号的界定方法一般有四种类型:固定范围界定 法( f i x e dc i r c l es e g m e n t a t i o n ) 、可调范围界定法( a d a p t i v ec i r c l es e g m e n t a t i o n ) 、可调形状界定法 ( a d a p t i v es h a p es e g m e n t a t i o n ) 、柱状图界定法( h i s t o g r a ms e g m e n t a t i o n ) 。 ( 1 ) 固定范围界定法 嘲定范围界定法是利用一个固定的圆形界定图像上的每一个位点。这种方法简单易行,当 所有位点的性状都呈现规则的圆形,则这种方法可以达到理想的效果。这种方法首先使f e j 在 e i s e n ( 1 9 9 9 ) 编写的s a n a 缸p 扫描软件上。由于在微阵列上位点不会完全规范。冈而这种同定 范嗣大小与性状的方法,可能会受到一定的限制。理论上,如果背景对于前景观测值的影响是 加性的,则背景的效应会较为准确地估计,只要通过调整范围的大小以适应位点的人小,保证 位点完全被包含在界定的范围之内。也就是说,只要范围足够的人,就可以准确地估计到背景 的效应大小,从而得到准确的前景荧光强度的估计值。同时还可以限制一些不规则的“噪音”, 诸如芯片上的杂质,划痕等的影响。 ( 2 ) 可凋范围界定法 与固定范围界定法不同之处在于:每一个位点的范围是单独估计,以得到每一个位点的适 台范围。a x o n 扫描仪中的g e n e p i x 就利用了这种算法。这些软件允许使用者逐点调整测定范围 的大小。然而在芯片中包含有成千上万的位点,显然这样处理位点必将是十分耗时的。可调范 围界定法用于标准的商业芯片上是行之有效的,在这些芯片上点的性状比较一致。而在1 f 商业 芯片中,点性状的整齐度可能会降低,出现椭圆形或是圆环状( e i s e n 等,1 9 9 9 ) 。如此,用圆 形界定不规则的位点将会影响参数的估计以及随后的数据分析。非圆形点很可能是由于点样过 程中点样针造成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年产科妇科危重病例处理模拟考试答案及解析
- 2025年中医心理医学中医药心理干预抑郁症考核试卷答案及解析
- 2025年内分泌科学科甲状腺功能亢进患者的药物治疗考试答案及解析
- 2025年儿科营养不良病例分析考察答案及解析
- 2025年产科护理技能操作模拟考试答案及解析
- 2025年妇产科产后护理常见问题答案及解析
- 2025年整形美容整形美容手术知识测试试卷答案及解析
- 2025年呼吸内科呼吸机操作演练模拟试题答案及解析
- 2025年精神病学干预措施考核答案及解析
- 2025年眼科角膜损伤处理方案答案及解析
- 幼儿园大班数学《小熊种玉米》课件
- 公交车广告承包合同5篇
- 2025年秋新北师大版数学3年级上册全册同步教案
- 公共营养师考试题库(附答案)四级真题及答案
- 广东省深圳市福田区2024-2025学年八年级上学期语文期中考试试卷(含答案)
- SAP QM质量管理模块配置详解(S4系统)
- 机械制图选择题试题库及答案
- 医院安全警示教育
- 2025届名校名师模拟卷(九)语文试题(PDF版含答案)
- 技术部工作汇报与未来规划
- 学员游泳培训合同协议
评论
0/150
提交评论