(高分子化学与物理专业论文)生物高分子中信息学分析新方法研究.pdf_第1页
(高分子化学与物理专业论文)生物高分子中信息学分析新方法研究.pdf_第2页
(高分子化学与物理专业论文)生物高分子中信息学分析新方法研究.pdf_第3页
(高分子化学与物理专业论文)生物高分子中信息学分析新方法研究.pdf_第4页
(高分子化学与物理专业论文)生物高分子中信息学分析新方法研究.pdf_第5页
已阅读5页,还剩99页未读 继续免费阅读

(高分子化学与物理专业论文)生物高分子中信息学分析新方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博士学位论文生物高分子中信息学分析新方法研究 摘要 一、研究背景及意义 随着人类基因组计划( h u m a ng e n o m ep r o j e c t ( i i g p ) ) 的完成。关于生命科 学的研究进入了后基因时代,迄今,已经产生了海量的数据,数据的积累必将 产生重大的发现。如何从这些数据中最大限度地获取有用信息并缩短整个研究 的进程是科学家面临的重要课题,随之兴起的与d n a 有关的复杂体系的信息学 要求研究者能够利用信息学的手段获取、分析和挖掘数据结果,尽管已有相当 多的重大发现,但是距离最终解析所有的关于生命的奥秘仍有很长的路程,需 要研究者开拓新的思路、发现新的分析方法和工具。 本文主要针对生物高分子体系( d n a 和蛋白质等) ,运用生物信息学和化学计 量学( 主成分分析、人工神经网络、多元统计方法、傅立叶分析、小波分析) 的 方法,做了以下研究:l ,基因预测新方法研究:2 ,目标分子与d n a 的相互作 用研究;3 ,复杂生物、化学体系频率分析新方法研究,其中包括:( 1 ) 复杂分 析化学体系重叠信号的解析研究;( 2 ) 基于小波变换的核酸序列的频率特征和进 化研究;( 3 ) 膜蛋白跨膜区域的预测研究:4 ,隐马尔可夫模型对核酸序列的识 别研究。 二、研究内容及结果 1 基因预测新方法研究 提出了一种综合的基因预测方法,首先计算序列的四个的特征:三周期特 性、d 值、g c 含量和n e wz _ c u r v e :利用这四个特征图谱,初步确定编码区的数 目和位置:然后用序列搜索的方法准确确定基因的结构。其中n e wz _ c u r v e 特 征是基于z 提出的一种新的特征,通过该特征,可以初步确定编码区的_curve 数目和位胃。对5 个已知的基因的预测结果显示,本文提出的方法具有可行性。 2 目标分子与d n a 的相互作用研究 目标分了与d n a 相互作用的研究在了解药物作用机理、分予歧i r 和药物筛 选等方面有鼋要意义。目前主要以实验方法研究两者的作用机理( 包括作用常数 和作用模式) ,较难从分子结构水平发现影响相互作用的因素,而且对于批量的 未知化合物与d n a 的相互作用无法进行预测。 本文以目标分子与d n a 相互作用的实验数据和目标分子的结构量化数据为 i 【 博士学位论文生物高分子中信息学分析新方法研究 基础,应用模式识别技术、多元回归和人:i :神经网络方法讨论了显著影响相互 作用的因素,建立了两个预测作用常数的模型和一个预测作用模式的模型。初 次量化的分子结构参数有2 4 种,经过筛选发现其中的1 2 种对相互作用有显著 的影响。所建立的模型对作用模式和常数的预测有较好的准确性。这些研究为 抗癌药物的分子设计和筛选可提供有价值的信息。 3 复杂生物、化学体系频率分析新方法研究 ( 1 ) 复杂分析化学体系重叠信号的解析研究 为了估计重叠信号中单峰( 组分) 的数目和位置,本文基于连续小波变换 ( ( c w t ) ) 提出了一种新的重叠峰定位方法连续小波变换极大值谱( m a x i m u m s p e c t r u mo fc o b t i n u o u sw a v e l e tt r a n s f o r m ( m s c w t ) ) ,在m s c w t 中,峰的位 置和数目与原信号包含的单峰的位置和数目一致。在该方法中,c w t 的计算是在 一定的尺度范围内进行的( 不同于单尺度变换) 。为了获得合适的变换尺度范围, 提出了一个新的判据,如果c d i l a t i o n 代表中心尺度,则合适的范围是 c d i l a t i o n 一6 2 ,c d i l a t i o n + l 1 。通过m s c w t 检测到峰的位置和数目后,拟 合方法被用于还原各单峰信号。本文对模拟信号、高效液相色谱( h p l c ) 、紫外 信号( u v ) 、差示脉冲伏安( d p v ) 信号分别做了分析,结果表明本文的重叠信号解 析技术有很高的准确度,适合处理不同类型的重叠信号。 ( 2 ) 基于小波变换的核酸序列的频率特征和进化研究 提出了两种新的频率分析技术小波频率谱( w f s ) 和小波变换f o u r i e r 频 率谱( w t f s ) ,并将其成功地应用于核酸序列的频率分析之中。结果表明:w f s 和w t f s 能准确地检测核酸编码区序列的三周期性,即在0 3 3 3 h z 处有信号蜂。 与f o u r i e r 频率谱相比,w f s 没有噪音干扰,而且可以自由变换区间观察信号频 率:而”f s 除了具有w f s 的优点外,其谱图呈线状,非常有利于频率的分析。 利用w f s 和w t f s ,再结合基因的其它特征,有望开发具有自识别的基因发现工 具。 w f s 除了可以研究核酸序列的频率特点以外,还可以作为序列的频域表示。 基于w f s 表示,本文对11 个核酸序列( 引起急性严重呼吸系统窘迫症的冠状病 毒( s a r sc o v ) ) 做了进化分析,结果表明尽管它们非常相似,但是还是存在差异, 暗示它们具有不同的变异方式。这种基f 序列频域表示的进化分析是一+ 种新的 分析思路。 ( 3 ) 膜蛋白跨膜区域的预测研究 博士学位论文 生物高分子中信息学分析新方法研究 如何从少数已知结构的膜蛋白预测大量未知结构的膜蛋白是蛋白质结构预 测的主要内容之。本文利用m s c w t 对8 种s a r sc o v 膜蛋白的跨膜区域做了预 测,其结果与t m p r e d ( s w i s s ) 软件、单尺度连续小波变换的结果进行了比较, 发现本文所述的方法有较高的准确性。而且可以为进一步研究跨膜片段的折叠 提供参考。 4 隐马尔可夫模型( h m m ) 对核酸序列的识别研究 建立了一个用于识别d n a ( 或r n a ) 序列中多个特殊序列的隐马尔可夫模型, 该模型通过训练可以识别任一序列中是否存在与训练序y l j i h c a 的序列。文中以 预测连续出现的c g 丰富区和t a 丰富区为例,提出了一种可操作的识别过程。 实验结果显示该h m m 可以成功识别序列中是否含有期待的序列。通过设定具有 不同特征的训练序列,模型可推广用于任何特征序列的识别。 三、创新点 本论文的创新点如下: ( 1 ) 基于z c u r v e 曲线,衍生出r 核酸序列的一种新的特征曲线n e w zc u r v e ( n z c ) ,依据该曲线中出现的单峰或靠得很近的组峰的数目和位置可以 预测编码区的数目和大概位置,这在文献中未见报道。另一个创新点是本文提 出了一种综合多特征的基因识别方法,对已知的基因预测的结果显示,该方法 具有较好的准确性,而且操作简单。 ( 2 ) 在目标分子与d n a 相互作用的研究中,提出了从目标分子结构量化参数 出发,结合实验数据预测目标分子与d n a 相互作用的模式和常数的新方法,该 方法提出的两个预测作用常数和预测作用模式的模型能对批量未知分子与d n a 的作用情况进行预测,这对分子设计和筛选具有重要意义。 ( 3 ) 在处理复杂化学体系重叠信号的研究中,提出了一种基于连续小波变换 的新的波谱方法连续小波变换极大值谱( m s c w t ) ,该谱能准确定位重叠信 号中各单组分峰的数目和位置,为进一步用拟合方法解析原始重叠信号提供了 峰实的依据。 ( 4 ) 基于连续小波变换,提出了一种新的频率分析波谱小波频率谱,并 将其应j 】于核酸序列( 以s a r s o v 为例) 的频率分析和核酸序列的频域表示。利 用核酸序列的频域表示研究了11 种s a r s o v 的系统进化,这种苯于序列频域 表示的进化研究思路在其它文献中未见报道。 博士学位论文生物高分子中信息学分析新方法研究 ( 5 ) 开发了小波变换f o u r i e r 频率谱( w t f s ) ,并将其应用于蛋白质编码区三 周期性的检测。w t f s 继承了小波变换的多尺度分析( 可以自由变换频率范围) 和 f o u r i e r 变换的高分辨的特点,其谱图呈线状,易于观察,抗噪能力强。 ( 6 ) 用连续小波变换极大值谱处理膜蛋白的疏水序列,不但可以较好地确定 跨膜区域的位置,而且可以推测跨膜区域内蛋白的可能的折叠方式。 关键词:生物高分子;与d n a 作用;基因预测;重叠信号;小波变换 博十学位论文生物高分子中信息学分析新方法研究 a b s t r a c t i b a c k g r o u n da n dm e a n in g w i t ht h ea c c o m p l i s h m e n to fh u m a ng e n o m ep r o j e c t ( i i g p ) ,1 i f es c i e n c e i sc o m i n gi n t op o s tg e n o m ee r a u pt on o w ,m i l l i o n so fd a t ah a sb e e n g e n e r a t e d ,w h i c hm a yl e a dt ot h ei m p o r t a n td i s c o v e r y h o wt oo b t a i nt h e u s e f u li n f o r m a t i o nf r o mt h e s ed a t ai st h em o s ti m p o r t a n tp r o b l e mf a c i n g r e s e a r c h e r s ,a n dt h ei n f o r m a t i e sa b o u tt h ec o m p l e xs y s t e m sa s s o c i a t e d w i t hd n ar e q u i r er e s e a r c h e r sa n a l y z e o b t a i na n dm i n et h ev a l u a b l e i n f o r m a t i o nf r o md a t aw i t ha 1 1k i n d so fi n f o r m a t i c sm e t h o d s a l t h o u g h m a n ye f f o r t sh a v eb e e nd o n e ,a n dm a n yd i s c o v e r i e sh a v eb e e nf o u n d ,t h e r e i ss t i l lal o n gw a yt og ob e f o r er e s o l v i n ga l l t h em y s t e r i e s ,w h i c h r e q u i r e sr e s e a r c h e rd e v e l o pn e wm e t h o d sa n dt o o l s 。 a i m i n ga tb i o l o g yp o l y m e rs y s t e m ( s u c ha sd n aa n dp r o t e i n ) ,u s i n g b i o i n f o r m a t i c sa n dc h e m o m e t r i c s ( p r i n c i p a lc o m p o n e n t sa n a l y s i s ( p c a ) , a r t i f i c a ln e u r a ln e t ( a n n ) ,m u l t i a n a l y s i s ,f o u r i e ra n a l y s i sa n dw a v e l e t a n a l y s i s ) ,t h ef o il o w i n gw o r k sh a v e b e e nd o n e :i n e wm e t h o d so f g e n e f i n d i n g :2 s t u d i e so fi n t e r a c t i o nb e t w e e nd n a a n dt a r g e tm o l e c u l e ;3 n e w m e t h o d so ff r e q u e n c ya n a l y s i sf o rc o m p l e xc h e m i s t r ya n db i d o g ys y s t e r n : t h i sp a r ti n c l u d e dt h ef o l l o w i n gs t u d i e s :( 1 ) r e s o l v i n go v e r l a p p e d s i g n a l so fc o m p i c a t e dc h e m i s t r ys y s t e m ;( 2 ) n e wf r e q u e n c ya n a l y s i s m e t h o da n dp h y l o g e n e t i es t u d i e so fn u c l e i ca c i ds e q u e n c e sb a s e do n w a v e l e tt r a n s f o r m ,( 3 ) p r e d i c t i o no ft r a n s m e m b r a n ep r o t e i nb a s e do n m a x i m u ms p e c t r u mo fc o n t i n u o u sw a v e l e tt r a n s f o r m :4 r e c o g n i t i o nf o r n u c l e i ea c i ds e q u e n c e sw i t hh i d d e nm a r k o vm o d e l c o n t e n t sa n dr e s ult s 1 n e wm e t h o do fg e n ef i n d i n g a ni n t e g r a t e dm e t h o do fg e n ef i n d l u gw a sp r o p o s e d ,f i r s t ,c o m p u t e f o u rc h a r a c t e r i s t i c s :t h r e ep e r i o d i c it y ,dv a l u e ,g cc o n t e n ta n dn e w i i i zc u r v e ;t h e nd e d u c et h ep o s s i b l ep r o t e i nc o d i n gr e g i o n su s i n gt h ef o u r c h a r a c t e r i s t i e s :a tl a s t ,e s t a b l i s ht h ep r e c i s i o ng e n e s t r u c t u r e n e w zc u r v ei sn e wc h a r a c t e r i s t i cd e r i v e df r o mz _ c u r v e ,b yw h i c ht h e p o s s i b l er e g i o na n dn u m b e r o fc o d i n gr e g i o nc a nb ee s t i m a t e d t h e d r e d i c t i o 兀sf o rf i v eg e n e s i n d i c a t e dt h a tt h ep r o p o s e dm e t h o dw a s f e a s i b l ea n dr e l i a b l e 2 s t u d i e so fi n t e r a c t i o nb e t w e e nt a r g e tm o l e c u l ea n dd n a i n t e r a c t i o nb e t w e e nt a r g e t m o l e c u l ea n dd n ah a st h ei m p o r t a n t s i g n i f i c a n c eo nu n d e r s t a n d i n gt h ed r u gf u n c t i o n ,d e s i g n i n gm o l e c u l ea n d f i l t e r i n gd r u g s t h ep r e s e n ts t u d i e sa i m e dt of i n di n t e r a c t i o nm e c h a n i s m w i t he x p e r i m e n t a lt e c h n i q u e s b u t ,w i t he x p e r i m e n t a lm e t h o d s ,i ti s d i f f i c u l ti nf i n d i n gt h es t r u c t u r ef a c t o r st h a ta f f e c tt h ei n t e r a c t i o n , a n df o rb a t c h e so ft a r g e tm o l e c u l e ,t h ei n t e r a c t i o n i n f o r m a t i o n i s d i f f i c u l tt op r e d i c t i nt h i ss t u d y ,b a s e do ne x p e r i m e n t a ld a t aa n dq u a n t i f i e ds t r u c t u r e d a t a ,p c aa n da n nw e r ea p p l i e dt os t u d yt h ei n t e r a c t i o n t h ei n f l u e n c e f a c t o r sw e r et e s t e d t w om o d e l so fp r e d i c t i n gi n t e r a c t i o nc o n s t a n ta n d o n em o d e lo fp r e d i c t i n gi n t e r a c t i o nm o d ew e r ee s t a b l i s h e d a m o n g2 4 q u a n t i f i e dp a r a m e t e r s ,i tw a sf o u n dt h a tt h e r ew e r e1 2p a r a m e t e r st h a t a f f e c t e dt h ei n t e r a c t i o nm a r k e d l y t h ep r o p o s e dm o d e i sh a dt h eg o o d a c c u r a c yi np r e d i c t i n gc o n s t a n ta n dm o d e t h e s es t u d i e sc o u l dp r o v i d e m u c hv a l u a b l ei n f o r m a t i o ni nf i l t e r i n gd r u g sa n dd e s i g n i n gm o l e c u l a r 3 n e wf r e q u e n c ya n a l y s i sf o rc o m p l e xc h e m i s t r ya n db i o l o g y s y s t e m ( 1 ) r e s o l v i n go v e r l a p p e ds i g n a lso fc o m p l i c a t e dc h e m i s t r ys y s t e m i no r d e rt oe s t i m a t en u m b e ro fp e a k sa n df i n di n d i v i d u a lp e a k s p o s it i o n si no v e r l a p p e ds i g n a l s ,an e wm e t h o dc a ll e dm a x m u ms p e c t r u m o fc o n t i n u o u sw a v e l e tt r a n s f o r m ( m s c w r ) w a sd e v e l o p e db ye x t r a c t i n gt h e m a x i m u mc o e f f i c i e n t so fc o n ti n u o u sw a v e l e tt r a n s f o r m ( c w t ) p e a k 堕:! 堂生堡苎 兰望壶坌主笪:垦= ! 三坌堡堑查鎏婴塞 p o s i t i o ni nm s c w tw a st h es s l l l ea st h a ti no r i g i n a ls i g n a l i nt h i sp r o c e s s , c w tw a sp e r f o r m e dn o to nas i n g l ed i l a t i o nb u to n a na p p r e c i a t i o nd i l a t i o n r a n g e t oo b t a i ns u c har a n g e ,an e wc r i t e r i o n w a si n t r o d u c e dt oc h o o s e ac e n t e rd i l a t i o n ,w h i c hw a su s e dt of o r mt h ed i a t i o nr a n g e i fc d i l a t i o n d e n o t e dt h e c e n t e rd i l a t i o n ,t h e p r o p e r d i l a t i o n r a n g e w a s c d i l a t i o n 一6 - + 2 ,c d i l a t i o n + l 1 m e x i c a nh a tf u n c t i o nw a sa sa n a l y t i c a l w a v e l e t u t i l i z i n gt h ei n f o r m a t i o no fp e a kn u m b e ra n dp o s i t i o nd e t e c t e d b ym s c w t ,af it t i n gr o u t ew a sp e r f o r m e dt or e c o v e rt h eo r i g i n a ls i g n a l o n es i m u l a t e da n df o u r t r u e o v e r l a p p e ds i g n a l s , i n c l u d i n gh i g h p e r f o r m a n c el i q u i dc h r o m a t o g r a p h y ( h p l c ) ,u l t r a v i o l e t v i s i b l e ( u v ) s p e c t r u ma n dd i f f e r e n t i a lp u l s ev o l t a m m e t r y ( d p v ) ,w e r ep r o c e s s e d ,t h e r e s u l t si n d i c a t e dt h a tm s c w tc o u l dd e t e c to v e r l a p p e dp e a kn u m b e ra n d p o s i t i o n ,a n dt h ec u r v ef i t t i n gb a s e do ni n f o r m a t i o no f1 s c w th a dh i g h e r a c c u r a c y t h ep r o p o s e dm e t h o dw a sa ne f f i c i e n to n ei nr e s o l v i n gd i f f e r e n t t y p e so fo v e r l a p p e ds i g n a l s ( 2 ) f r e q u e n c ya n a l y s i sa n dp h y l o g e n e t i cs t u d i e s b a s e do nw a v e l e t t r a n s f o r i d t w on e wt o o l s ,w a v e l e tf r e q u e n c ys p e c t r u m ( w f s ) a n dw a v e l e tt r a n s f o r m f o u r i e rs p e c t r u m ( w t f s ) ,w e r ep r o p o s e df o ra n a l y z i n gt h ef r e q u e n c yo f n u c l e i ea c i ds e q u e n c e t h er e s u l t si n d i c a t e dw f sa n dw t f sh a dt h ea b i l i t y o fd e t e c t i n gt h r e ep e r i o d i c i t yo fp r o t e i nc o d i n gs e q u e n c e ,i e ,t h e r e w a sas i g n a la t0 3 3 3 h z c o m p a r e dw it hf o u r i e rs p e c t r u m ,w f sw a sf r e e o fn o i s ea n di tc o u l dc h a n g ef r e q u e n c yr a n g ef r e e l yt ov i e wi n f o r m a t i o n b e s i d e sa d v a n t a g e so fw f s ,w t f sp r e s e n t e df r e q u e n c yi n f o r m a t i o na sl i n e f o r m ,w h i c hm a d ef r e q u e n c yp e a k se a s yt od e t e c t u s i n gt h er e s u l t so f w f sa n dw t f sa n do t h e rg e n ec h a r a c t e r is t i c s ,ag o o dg e n ef i n d i n gt o o l c o u l db ed e v e l o p e d w f sc o n l da l s ob eu s e dt or e p r e s e n tr u c l e i ca c i ds e q u e n c einf r e q u e n c y d o m a i n b a s e ds u c hr e p r e s e n t a t i o n ,p h y l o g e n e t i cs t u d i e so fi1 i s o l a t e s s e q u e n c eo fs a r s c o vw e r ep e r f o r m e da n dt h er e s u l t si n d i c a t e dt h a tt h e y h a dc l u s t e r i n gi n c l i n a t i o ni ng r n u pa n dl o c a t e dd i f f e r e n tb r a n c h e s ,w h i c h 博士学位论文 生物高分j :中信息学分析新方法研究 s u g g e s t e dt h a tt h e yh a dd i f f e r e n tm u t a t i o nw a y s ( 3 ) p r e d i c t i o no ft r a n s m e m b r a n ep r o t e i nb a s e do nm s c w t m s c w tw a sp r o p o s e dt op r e d ic tt h et r a n s m e m b r a n es e g m e n to fm e m b r a n e p r o t e i n s e i g h ts a r s c o ym e m b r a n ep r o t e i n sw e r ep r o c e s s e d :t h er e s u l t s w e r ec o m p a r e dw i t ht h es o f t w a r e ( t m p r e d ) a n ds i n g l es c a l ec w t i tw a s f o u n dt h a tt h ep r o p o s e dm e t h o dh a dh i g ha c c u r a c y ,a n di t sr e s u l t sc o u l d p r o v i d eh e l pi ns t u d y i n gt h ef o l d i n gw a yo ft r a n s m e b r a n es e g m e n t 4 r e c o g n i l i o nf o rn u d e i ca c i ds e q u e n c e sw i t hh i d d e nm a r k o v m o d e l i nt h i sp a p e r ,ah i d d e nm a r k o vm o d e lw a se s t a b l i s h e dt or e c o g n i t i o n s p e c i a ls e g m e n t so fd n ao fr n a a no p e r a b l ep r o c e s sw a sd e s i g n e dt o d e t e c tg ca n dt ar i c hr e g i o n t h er e s u l t si n d i c a t e dt h a tt h em o d e lw a s s u c c e s s f u l t h em o d e lc o u l db ee x t e n d e dt or e c o g n i l i o no fo t h e rs p e c i a l s e q u e n c e s i in n o v a t i 0 1 3 t h en o v e l t i e so ft h i sp a p e ra r ef o l l o w i n g : 1 b a s eo nzc u r v e ,n e wzc u r v ew a sd e r i r e d w h i c hc o u l db eu s e dt o “n dt h en u m b e ro fp r o t e l nc o d i n gr e g i o n sa n dp o s s i b l el o c a l i o n t h en e w z c u r v ea n dit sp r o p e r t yh a v en o tb e e nr e p o r t e di nr e f e r e n c e s t h eo t h e r n o v e l t yi st h a tan e wi d e ao fi n t e g r a t i n gm u l t i c h a r a c t e r i s t i c sw a su s e d t of i n dg e n e 。w h i c hc a na c h i e v e dh i g h e rp r e d i c t i o na c c u r a c y 2 f o rt h es t u d i e so fi n t e r a c t i o nb e t w e e nd n aa n dm o l e c u l e ,t h i sp a p e r p r o p o s e dan e wi d e ao fc o m b i n i n ge x p e r i m e n t a ld a t aa n ds t r u c t u r ed a t a t of i n dt h ei n f l u e n e ef a c t o r sa n dp r e d i c ti n t e r a c t i o nc o n s t a n ta n dm o d e b yc h e m o m e t r i c sm e t h o d s t h i ss t u d yc o u l dp r o v i d ev a l u a b l ei n f o r m a li o n f o rf i l t e r i n gd r u g sa n dd e s i g n i n gm o l e c u l a r 3 an e w s p e c t r u mc a l l e dm a x i m u ms p e c t r u m0 fc e n t i n u o u sw a v e l e t t r a n s f o r m ( m s c w t ) w a sd e v e l o p e dt oi d e n t if yt h ee a c hs i n g l ep e a ko f o v e r l a p p e ds i g n a l s w h i c hp r o v i d e dh a r dp r o o ff o rf i t t i n gm e t h o d s 博士学位论文生物高分子中信息学分析新方法研究 4 w a v e l e tf r e q u e n c ys p e c t r u m ( w f s ) w a sd e r i v e df r o mc w ta n da p p l i e d i nf r e q u e n c ya n a l y s i sa n dr e p r e s e n t a t i o no fn u c l e i ca c i ds e q u e n c e s t h e p h y l o g e n e t i cs t u d yb a s e do nw f sr e p r e s e n t a t i o nh a sn o tb e e nr e p o r t e di n r e f e r e n c e 5 an o wm e t h o dc a l l e dw a v e l e tt r a n s f o r mf o u r i e rs p e c t r u m ( w t f s ) w a s d e v e l o p e dt oa n a l y z et h r e ep e r i o d i c i t yo fc o d i n gr e g i o n ,t h ea d v a n t a g e w a sw t f sc o u l df r e e l yc h a n g ef r e q u e n c yr e g i o na n di tp r e s e n t e dd a t aa s 1 i n ef o r m ,w h i c hm a d ei th a v eh i g h e rr e s o l u t i o n 6 i np r o c e s s i n gm e m b r a n ep r o t e i n s ,m s c w tc o u l dp r o v i d en o to n l yt h e i n f o r m a t i o no ft h et r a n s m e m b r a n es e g m e n t sb u ta l s ot h e i rf o l d i n g i n f o r m a ti o n 。 k e y w o r d s :b i o l o g yp o l y m e r :i n t e r a c t i o nw i t hd n a ;g e n ep r e d i c t i o n o v e r l a p p e ds i g n a l :w a v e l e tt r a n s f o r m 博十学位论文 生物高分子中信息学分析新方法研究 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了文中特别加以标注和致 谢的地方外,论文中不包括其他人已经发表或撰写过的研究成 果,也不包含为获得西北师范大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献 均已在论文中作了明确的说明并表示了谢意。 签名 等 h 期:竺吖 关于论文使用授权的说明 本人完全了解西北师范大学有关保留、使用学位论文的规 定,即:学校有权保留送交论文的复印件,允许论文被查阅和借 阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印 或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 魏咎铆签名 日期:翌! :查 博e 学位论文 生物高分子中信息学分析新方法研究 p a r t i 生物高分子信息分析研究概述 摘要:本文对部分复杂化学、生物高分了信息分析的研究现状做了概括性地介绍, 这些复杂体系包括:基因预测、目标分子与d n a 的相互作用研究、复杂体系重叠 信号的解析、核酸序列的频率特征和进化研究、膜蛋白跨膜区域预测研究等。 关键词:基因、相瓦作用、预测、研究现状 进入2 1 世纪,随着生命科学、环境科学、新材料的发展,使得化学、生物学 的研究进入了一个崭新的发展时期。研究体系由简单无生命、无机体系转向复杂的 生命体系和环境体系;研究水平向单细胞、单分子水平渗透;分析研究对象越来越 多地选择了d n a 、蛋白质、乎性药物和环境毒物等牛命活性物质,即化学、生物学 的研究越来越转向了复杂的生物、化学体系。研究方法较多地联用各种分析技术, 并注意应用信息学方法对分析结果和波谱结构进行处理和解析。 同时,随着人类基因组计划( h g p ) 的完成,牛物学的研究进入后基因时代,已 经产生丁海量的数据( d n a 和蛋白质的测序数据、化合物与d n a 相互作用的数据等) , 如何从这些数据中最大限度地挖掘有价值的信息,破解生命之迷是当前的重大课题 ( 基因组学和蛋白组学) ,而信息学的方法在这些领域有非常广泛的用途,如随即兴 起的化学信息学和生物信息学( b i o i n f o r m a t i c s ) 就是以数学、计算机科学和信息学 等方法为基础的解决化学、生物学问题的新型学科 1 。 本文试图将信息学的新方法应用到复杂的生物高分了体系的研究中,这些生物 高分子体系主要是指生命物质核酸和蛋白质,另外还包括一些复杂的分析化学体 系。 本文针对复杂的生物高分了体系,主要以信号处理技术( 小波变换、f o u r i e r 变换) 、统计学方法( 丰成分分析) 、模式识别技术( 人工神经网络、聚类) 等为工具, 研究了如下的内容:i ,基因预测新方法研究;2 ,目标分子与d n a 的相互作用研究; 3 ,复杂分析化学体系解析新方法研究;4 ;核酸序列的频率特征和进化研究;5 , 膜蛋白的跨膜区域预测研究;6 ,特异序列的识别和相似序列的比较研究。 现对上述研究内容的现状分别综述如下。 博,j 学位论文 生物高分子,f - 信息学分析新方法研究 一、基因预测新方法研究 在所有与基因有关的研究中,基因预测或识别( g e n ef i n d i n g 、g e n e i d e n t i f i e a t i o n或者g e n e p r e d i c t i o n ) 一直是科学家关注的焦点 之一,因为这是最终破解牛命之迷的必 然要求。基凶预测实质是在准确预测外 显了( e x o n ) 的基础上 2 - 2 5 3 ,给出整个 基因的结构( f i g + 1 和f i g 2 ) 。目前广 泛应用的基因预测方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论