(应用数学专业论文)基于level+set方法的分子场特征分析.pdf_第1页
(应用数学专业论文)基于level+set方法的分子场特征分析.pdf_第2页
(应用数学专业论文)基于level+set方法的分子场特征分析.pdf_第3页
(应用数学专业论文)基于level+set方法的分子场特征分析.pdf_第4页
(应用数学专业论文)基于level+set方法的分子场特征分析.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 在这篇文章中,我们构造了一种l e v e l s e t 模型对生物大分子的分子场进行特 征提取和分析。对于3 维大分子的分子场上的体数据,我们定义了一个新颖的跟 踪几何活动轮廓线的变分方程,这个方程包含两部分:外部能量和内部能量。 外部能量用来控制活动轮廓线的移动,而内部能量则作为l e v e ls e t 函数的惩罚 项,以避免该模型在迭代过程中周期性地重新初始化。我们不断改变方程中相 关的参数,分析在整个演化过程中这些参数对最后结果的影响。与传统的l e v e l s e t 方法相比,我们的方法在分子场上进行特征提取更加精确和有效。 采用上述模型,我们对静态和动态的分子场数据进行分析。对于静态分子 场,选取能量跃变区域来揭示分子场特征,同时构造体特征函数来分析l e v e l s e t 曲面的拓扑特征区域和整体分子场的能量分布特点。对于动态分子场,我们 考察同一蛋白质分子在不同运动状态下的数据,例如观察h i v - 1 蛋白酶间接受 水分子作用改变构象、形成中间通道的整个过程。与此同时,对不同的运动状 态,计算分子场多属性l e v e ls e t 曲面,根据属性的相似程度,寻找分子运动过 程中l e v e ls e t 曲面显著变化的关键时刻。通过上述特征分析方法,结合多种面 以及体可视化绘制技术,本文成功地揭示了蛋白质分子场的重要特征。 初步实验表明,本文的方法计算出来的特征与已有生物学结论一致, 如h i v - 1 蛋白酶内部的水分子排除通道,d p s 蛋白质与铁离子结合的空腔区域, 以及h i v - 1 蛋白酶在水溶液中进行s m d 模拟时的生物活性变化等。生物学家认 为这些结果可能对今后研究h i v - 1 蛋白酶的亲水、疏水性有重要的价值,并可作 为“蛋白质蛋白质”相互作用或“蛋白质一配体”相互作用中首要参考的活性位点, 具有非常巨大的研究意义。 关键词:分子场,特征分析,l e v e ls e t 方法,变分方程,结构及生物学属 性,h i v - 1 蛋白酶,d p s 蛋白质 a b s t r a c t a b s t r a c t i nt h i sp a p e r , w ee x p l o i tal e v e ls e tm e t h o dt oe x t r a c ta n da n a l y z et h ef e a t u r e o fm a c r o m o l e c u l a rf i e l d f o rt h e3 dv o l u m ed a t ao ft h ef i e l d ,w ep r o p o s ean o v e l v a r i a t i o n a lf o r m u l a t i o nf o rg e o m e t r i ca c t i v ec o n t o u r , w h i c hi sc o m p o s e do fa l le x t e r n a l e n e r g yt od r i v et h ea c t i v ec o n t o u r s m o t i o n ,a n da ni n t e r n a le n e r g yw h i c hp e n a l i z e s t h el e v e ls e tf u n c t i o na d a p t i v e l yt oa v o i dp e r i o d i c a l l yr e - i n i t i a l i z i n g w ea d j u s tt h e p a r a m e t e r so fe a c hc o m p o n e n ta n di n v e s t i g a t et h e i ri n f l u e n c ei nt h ew h o l ep r o c e s s a c c o r d i n gt ot h ec o m p a r i s o nw i t ht h et r a d i t i o n a lf r a m e w o r k s ,o u ra p p r o a c hi ss h o w n t ob em o r ea c c u r a t ea n de f f i c i e n to nt h ef e a t u r ee x t r a c t i o n b a s e do nt h el e v e ls e tm e t h o dc o n s t r u c t e di nt h ef i r s tp a r t ,w eg i v eaf u r t h e r a n a l y s i sf o rt h es t a t i ca n dd y n a m i cm o l e c u l a rf i e l dd a t a f o rt h es t a t i cm o l e c u l a rf i e l d , w ec h o o s et h er e g i o nw h e r et h ee n e r g yh a st h eq u a n t u m l e a pa n da n a l y z et h em o l e c u l a r f i e l d t h e n ,w ec o n s t r u c tt h ev o l u m ef e a t u r ef u n c t i o nt oe x t r a c tt h et o p o l o g i c a lr e g i o n a n dg e tt h ee n e r g yd i s t r i b u t i o no ft h ew h o l em o l e c u l a rf i e l d f o rt h ed y n a m i cm o l e c u l a r f i e l d ,w ec o n s i d e rt h es a m ep r o t e i ni nt h ed i f f e r e n ts t a t e s ,l i k eo b s e r v i n gt h ep r o c e s s i nc h a n g i n gt h ec o n f o r m a t i o na n df o r m i n gt h em i d d l et u n n e l a tt h em e a nt i m e ,w e c a l c u l a t et h em u l t i a t t r i b u t e so ft h e s es t a t e sa n dt r yt of i n dt h ec r u c i a lt i m ed u r i n gt h e m o v e m e n to ft h em o l e c u l a r a c c o r d i n gt ot h es u r f a c ea n dv o l u m er e n d e r i n gt e c h n i q u e s , w er e v e a lt h es i g n i f i c a n tf e a t u r eo ft h em a c r o m o l e c u l a rf i e l d p r e l i m i n a r yr e s u l t ss h o wt h a t ,w es u c c e s s f u l l yf i n dt h ee s c a p er o u t eo fw a t e r m o l e c u l e sh i d d e ni nt h eh i v - 1p r o t e a s e ,t h ei n t e r n a lc a v i t yo ft h ed p sp r o t e i nf o rt h e i r o na t o m se n t r ya n dd e p o s i t i o na n db i o l o g i c a la c t i v i t yo fh i v - 1p r o t e a s ew h e np r o - c e s s i n gs m d s i m u l a t i o ni nt h ea q u e o u ss o l u t i o n b o t h o ft h e s er e s u l t sa r ei na c c o r d a n c e w i t ht h ee x p e r i m e n t a lr e s u l t sg i v e nb yc h e m i s t sa n db i o l o g i s t s b i o l o g i s t sb e l i e v et h a t t h e s er e s u l t sm a yb eu s e f u lt os t u d yt h eh y d r o p h i l i ca n dh y d r o p h o b i co fh i v - ip r o t e a s e i nt h ef u t u r e ,a n dt h e s ea c t i v ec i t e sc a nb ec o n s i d e r e da st h em o s ti m p o r t a n tr e g i o n si n t h ep r o t e i n - p r o t e i ni n t e r a c t i o na n dp r o t e i n - l i g a n di n t e r a c t i o n k e yw o r d s : m o l e c u l a rf i e l d ,f e a t u r ea n a l y s i s ,l e v e ls e tm e t h o d ,v a r i a t i o n a lf o r m u - l a t i o n ,s t r u c t u r a la n db i o l o g i c a lp r o p e r t i e s ,h i v - 1p r o t e a s e ,d p sp r o t e i n 一一 浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得逝望盘堂或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文作者签名:a 哆枯、签字日期:矽弼年6 月7 日 学位论文版权使用授权书 本学位论文作者完全了解澎婆盘鲎有权保留并向国家有关部门或机 构送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权逝姿盘鲎 可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影 印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 签字日期: 删年月7 e t签字日期:删年易 月夕 日 第一章绪论 1 1 研究背景 第一章绪论 蛋白质是生命活动的物质基础,蛋白质分子的运动与构象在生命活动中扮 演着极为重要的角色,其中蛋白质分子的空间结构与功能的关系更是人们关注 的焦点【l ,2 】。而蛋白质分子都是生物大分子,生物大分子的结构与功能的关 系是分子生物学的基石。如果没有d n a 双螺旋结构的发现,就没有遗传传达传 递的中心法则,也就没有今天的分子生物学。结构分子生物学已由对单个分子 进入对复合物乃至多亚基、多分子复合体结构研究。同时,过去难以开展的对 分子水平上的生命运动的研究也随着研究的深入和技术手段的发展而逐渐变为 热点。蛋白质研究已从生物大分子静态( 时间统计) 的结构分析开始进入动态 ( 时间分辨) 的结构分析及动力学分析。第十三届国际生物物理大会的2 5 个专 题讨论会中有一半以上涉及蛋白质的结构与功能,而“结构与功能”又强调“动力 学( d y n a m i c s ) ”,即动态的结构或结构的运动与蛋白质分子功能的关系,以及对 大分子相互作用的贡献。因此,研究蛋白质的结构与功能,特别是动态的结构 或结构的运动与蛋白质分子功能的关系,具有非常巨大的意义。 迄今为止,已经发展了多种实验和理论的计算方法来测量或预测蛋白质结 构,并取得了一些成功,如基于一维的氨基酸序列、采用统计模型分析生物结 构和功能【3 】;或针对分子三维结构几何和拓扑性质进行分析【4 ,5 】。但从本质上 讲,这些方法都忽略了蛋白质分子在原子尺度上重要的化学属性,也没有考虑 到分子时刻处于运动状态中。因此,目前对由一定氨基酸序列的多肽链折叠形 成特定空间构象的蛋白质机制仍缺乏深入了解。 在三维数据场的语境下,特征是指数据场数据中蕴涵的某类特殊的信息、 用户感兴趣的区域或能区别不同数据场的标识。对蛋白质大分子而言,内部结 构的显著拓扑特征区域可能构成重要的活性位点,如d p s 蛋白质内部的与铁离 子相互作用的空腔和h i v - 1 蛋白酶分子狭长的水分子排除通道。这些特征区域 在“蛋白质配体”及“蛋白质蛋白质”相互作用过程中起着至关重要的作用。由于 蛋白质分子结构巨大且复杂,怎样有力地刻画分子整体活性状态、有效地抽取 结构特征、分析并预测蛋白质的功能属性,是当前研究信息科学如何服务于生 命科学的重要课题之一。 第一章绪论 从分子物理学的角度看,以力场能为基础来研究蛋白质之间的相互作用将 有助于揭示其结构和功能的关系。蛋白质的功能源于它的活性,而蛋白质的活 性表现在蛋白质分子的相互作用过程中,并常常导致蛋白质局部结构的改变。 为此,我们基于分子力学和分子动力学理论,构建原子尺度上的分子势能场。 其主要思想是将蛋白质分子内部的化学键力、氢键力、库仑力、范德华力等相 互作用表示为三维空间中一系列规则采样点的集合。这样,对蛋白质分子活性 位点和功能区域的寻找就可以转化为对表征蛋白质空间分子场的特征分析研 究,进而找到揭示蛋白质结构和功能关系的突破口。 图形学技术的快速发展使得我们可以在分子水平上研究和了解生命物质。 分子场是分布在三维空间中的一个连续的场,可视化方法对我们理解分子场的 结构和特征非常有帮助。本文将讨论如何利用图形学的技术来研究和分析分子 场的特征。 1 2 研究方法 三维数据场的特征抽取一直是研究的热点,科学家们也已提出了许多的 方法。分割技术通过将体数据按某种规则分割成若干块且连通的区域,从体 数据中得到有意义的3 维结构。该技术在科学计算可视化、医学图像处理等 领域已经取得广泛的应用。在这个基础上,发展了一些较常用的几何和拓扑 分析工具,如h o d g k i n 指数【6 】、c a r b o 指数【7 】、c o n t o u rt r e e 8 、m o r s e s m a l e 复 形【9 ,1 0 等。 数据场等值面的拓扑变化反映出数据分布的空间走向,而这种拓扑改变可 以由求解数据场的c r i t i c a lp o i n t s 来定位。拓扑方法已经在数据场分析中被证明 是简化数据的一种非常有效的方法。它既可以监控拓扑的变化i 1 1 。1 2 ,又可 以清楚地计算拓扑特征和移除那些细小或者是不太重要的特征。常用的拓扑 分析方法如r e e b 图和轮廓树,它们都可以揭示数据场的拓扑结构 1 3 1 9 】。但 是m o r s e s m a l e 复形无疑是一个更加全面的描述,因为它在上面的优点之上还能 检测到等值面的拓扑变化。 m o r s e s m a l e 复形是一种拓扑数据结构,这个结构可以抽象地表示数据场上 的梯度流1 2 0 ,2 1 】。e d e l s b r u n n e r 2 2 1 在分段线性2 维流形上定义了m o r s e s m a l e 复 形,用分段线性函数来代替光滑的m o r s e 函数,同时也给出了一种构建m o r s e - s m a l e 复形的方法。b r e m e r 2 3 改进了前面的算法,同时给出了在数据场上 的多分辨率的表示。这两个算法都是从鞍点开始构造上升流形和下降流形 一2 一 第一章绪论 的。在这个基础上,还可以通过不断移除不重要的c d f i c a lp o i n t s 简化拓扑信 息【2 4 】。f o r m a n 2 5 把光滑的理论扩展到离散的函数上;l e w i n e r 2 6 提出了离散 的梯度向量场,可以用来确定2 维m o r s e s m a l e 复形;g y u l a s s y 2 7 提出了一个更 有效地构造3 维上升流形和下降流形的算法,但是,这一算法在复杂的数据场上 比较难应用,很难用极值点来有效表示拓扑特征。 除了对数据场从拓扑方面进行特征提取和分析之外,几何分析是另一种 有效的方法。一种方法是基于网格收缩操作的几何简化,如边界收缩 1 3 。2 8 - 3 0 。特别地,l e v e ls e t 方法是一种典型的基于几何轮廓演化的分割技术 3 1 , 3 2 。这种方法基于隐式曲线( 曲面) 的连续性公式,在每一步根据运动界面隐 式化为场函数的零等值面。在演化的过程中,它仅仅依靠着几何测度,而不需 要重新参数化和显示表示,这个优点可以使这个方法可以适应拓扑变化,从而 应用于复杂的数据场分析,比如分子场数据。 面对各种各样的数据场,学者们提出了多种l e v e ls e t 模型,并应用于更 多的相关领域,特别是在医学图像和生物数据分析上 3 3 - 3 5 1 ,有了很大的发 展。例加:w h i t a k e r 3 6 针对电子断层扫描( e r i ) 数据场和核磁共振( m r i ) 数据场 设计l e v e ls e t 方程,抽取医学器官模型;m a g e e 3 7 ,3 8 结合统计模型与基本 的l e v e ls e t 模型分割c t 体数据中的腹腔动脉瘤;z h u k o v 3 9 对d t - m r i 大脑数据 实现l e v e ls e t 建模和分割;t o l g ac a n 【4 0 】利用l e v e ls e t 方法抽取分子表面等。 但是在目前涉及到蛋白质大分子功能预测和活性区域定位方面的研究技术还不 多见,更鲜有对动态数据的分析和研究。 1 3 本文工作 在本文中,主要的研究对象是生物大分子的分子场。首先,以已有的l e v e l s e t 理论为基础,设定了一个新的l e v e ls e t 方程,在这个p d e 方程中,由两个部 分组成:外部能量和内部能量。外部能量是用来控制活动轮廓线的移动( 或者 说演化) ,而内部能量则作为l e v e ls e t 函数的惩罚项,以避免该模型在迭代过程 中周期性地重新初始化。在定义了l e v e ls e t 方程之后,本文计算演化模型的几 何测度,确定收敛法则,在计算的过程中不断改变方程中每个分支中相应的参 数,用此来分析在整个演化过程中这些参数对最后结果的影响。应用这个方 法,我们成功地从给定的大分子的分子场中抽取了具有生物和化学意义的特征 区域。在实验结果中,我们以d p s 蛋白质和h i v - i 蛋白酶为例,描述了利用l e v e l s e t 理论分析分子场特征的过程。主要思路是:针对蛋白质分子场数据,首先选 一3 一 第一章绪论 取能量跃变区域,利用上面设计的l e v e ls e t 模型来描述分子场特征;其次构造 体特征函数分析l e v e ls e t 曲面的拓扑特征区域;最后对同一蛋白质分子在不同 运动状态下的l e v e ls e t 曲面进行多属性比对,分析其特点。通过计算同一蛋白 质分子场的l e v e ls e t 曲面在不同演化时刻的相似度,来判断演化曲面的收敛情 况,进而证明分子场是稳定的三维数据场。此外,对同一蛋白质不同运动状态 的分子场计算多属性l e v e ls e t 曲面,根据属性的相似程度,寻找分子运动过程 中分子场出现显著变化的关键时刻。通过上述特征分析方法,结合多种面以及 体可视化绘制技术,本文成功地揭示了蛋白质分子场的重要特征。初步实验表 明,本文的方法计算出来的特征与已有生物学结论一致,如d p s 蛋白质与铁离 子结合的空腔区域,h i v - i 蛋白酶内部的水分子排除通道,以及h i v - 1 蛋白酶在 水溶液中进行s m d 模拟时的生物活性变化等。 本文各个章节的内容安排如下: 第一章简要介绍本文的研究背景、已有的研究方法和本文的工作。 第二章主要讨论了分子场上无需周期初始化的l e v e ls e t 公式的设计,并对 其进行数值求解。 第三章主要讨论了基于l e v e ls e t 曲面的静态和动态分子场的特征分析,同 时计算多属性l e v e ls e t 曲面,根据属性的相似程度,寻找分子运动过程中 显著变化的关键时刻。 最后一章是对本文的总结,并提出了展望。 一4 一 第二章面向生物分子场的l e v e ls e t 模型 2 1 引言 第二章面向生物分子场的l e v e ls e t 模型 l e v e ls e t 模型首先由s e t h i a n 和o s h e r 在1 9 8 8 年提出来的,主要通过偏微分方 程来描述界面演化的动态过程,可以自然地揭示出界面演化中拓扑结构的改 变。九十年代以来,许多学者相继开展了对l e v e ls e t 方法的研究,使得l e v e l s e t 方法被广泛应用于计算机图形学、计算物理、图像处理、计算机视觉、化 学、控制理论等众多领域。本文在这一章节中尝试应用改进的l e v e ls e t 模型, 主要就是定义一个新颖的对几何活动轮廓线模型的变分方程,来进行生物分子 场特征区域的演化和抽取,以期得到具有生物化学意义的实验结果。 2 2 相关工作一l e v e ls e t 方法的研究现状 o s h e r 与s e t h i a n 提出了l e v e ls e t 模型,同时给出了严格的数学推导过程和数 值求解格式【4 l _ 4 3 】,为后续研究工作奠定了坚实的理论基础。在众多研究人员 的共同努力下,l e v e ls e t 方法得到不断发展和完善。下面简要介绍l e v e ls e t 方法 在图形图像领域中一些具有代表性的研究成果。 2 2 1 网格模型的处理 计算机图形学通常使用三角网格来表示物体。通过三维扫描仪等手段可以 获取实体模型采样点的空间位置信息,但这些原始数据必须通过重建、去噪、 编辑等处理后才能真正被使用。而l e v e ls e t 方法在网格模型的数字几何处理中 起到了重要作用。 散乱点网格重建是对模型进行数字几何处理的第一步。z h a o 等将重建的三 角网格曲面定义为散乱点张成的极小曲面,提出了变分l e v e ls e t 方法1 4 4 ,4 5 】。 该方法首先在散乱点周围区域内构建初始网格,定义变分能量方程驱动界面演 化,利用l e v e ls e t 方法能有效处理拓扑结构改变的优点,得到了很好的三角网 格曲面重建结果,如图2 1 所示。 t a s d i z e n 等将图像与信号处理的技术应用于网格处理。算法首先建立变分方 程修正顶点法向朝向,再根据新的法向信息改变顶点的空间位置,顺次迭代, 得到曲面去噪、光顺或增强的效果 4 6 】,如图2 2 所示。 一5 一 第二章面向生物分子场的l e v e ls e 幞型 l - 。一 _ “ 晒酗 : o = = “? 。 ( a ) l l a k d i 帕模型i 建彻b t a l d h a * 自i l 建 4 5 1 图2 l散乱点三角网格蓐建 倒倒q 魍嬲魍 圈2 2= 角阿格曲面去噪、光顺与增强 4 6 】 2 2 2 图像视频处理 在图像视频处理中,经常需要进行图像增强、分割、去噪、修复等操作 特别是在医学图像处理中,特征识别非常重要。l e v e ls e t 方法同样提供了强有 力的处理手段。r o s s 3 6 就利用l e v e ls e t 模型在体数据上抽取等值面来移除边 哈舫。 第二章面向生物分子场的l e v e ls e t 模型 界处的噪音,如图23 所示。 ( | ) 岫d d k 白口e m t 自h * 女“l e v e ls e t 方法对n 缸的抽r 图z 3体数据上抽取等值面 3 6 1 k a s s 等 4 7 提出的s n a k e 方法是一个应用于图像分割的经典算 法;c a s e l l e s 等【4 8 】和m a l l a d i 等【4 9 】将l e v ds e t 力 法应用于图像分割,同样达到 了非常好的效果。算法首先在图像上任意给出初始曲线,通过每个象素的能量 值、梯度值等参数设计速度函数驱动活动轮廓线演化,最终到达能量最,| 、的 位置,如图2 4 所示。在此之后,研究人员还提出了许多更好的能量函数定义 方挂改进上述工作 4 8 ,5 0 ,5 1 1 ,c h a r t 等基于m u m f o r d - s h a h 分割函数求解犀小分 割问题的方法也非常经典口2 】。图像处理中的许多方法还被应用于体数据可视 化 5 3 1 、体数据分割 3 1 5 4 ,5 5 和网格分割【5 6 】等领域。 圈2 4k 州s e t 方法应用于图像分割【5 卅 在视频中,根据视频图像序列具有连续性的特性s h i 等提出的实时l e v e l s e t 方法可以达到实时跟踪视频中物体运动边界线的效果睁7 】。该方法使用象素 单元之间的交换操作来演化边界线,同时引入高斯滤波函数保持边界线的光滑 性替代了费时的l e v e ls e t 方程的求解过程。 第二章面向生物分子场的l e v e l s e t 模型 2 23 流体动画 跟踪流体自由表面的演化是l e v e ls e t 模型最基本的应用领域。f e d k i w 等提 出的粒子l e v e ls e t 方法可以达到更高的精度,在表面上自适应分布的粒子不但 被用于修正距离场函数值,而且可以模拟水滴飞溅的效果。该方法已经成功应 用于电影特效制作1 5 7 j 5 1 1 。近几年出现的许多基于物理的方法模拟流体、火焰 等动画效果,也都使用粒子l e v e ls e t 方法捕捉动态演化的界面 5 8 ,6 1 ,6 2 ,如 图2 5 所示。 0 ) 自m 表面 s 8 l忡粘性流体1 6 i 】p ) 曲m ( 6 2 】 网2 5 l e v e ls e t 方法应用丁流体动画 23l e v e ls e t 方法介绍 考虑m 维空间矸”中的一张m 一1 维光滑闭合超曲面r r 确定了m 中的一 个开区域u r 上的点滑着该点的法向咀给定的速度函数f 运动,f 可以是多 个变量的函数,如超曲面的曲率、法向、空间位置等,同时在曲面演化的过程 中忽略曲面的切向速度如图2 6 1 7 幻所示。 用r ( t ) 表示r 运动得到的曲面簇t 为时间变量。给定f 之后,接下来的 目标就是要构造r 的嵌 场函数( l e v e ls e t 函数) ,通过运动方程驱动场函数演 化从而跟踪f 的演化。若f 恒正( 负) ,则界面将总是往外( 内) 扩张,r 的运动不 依赖于时间变量t ,而到达空间定点的时间函数值t ( o ,”) 是唯一确定的,如 图26 ( b ) 所示。 第二章面向生物分子场的l e v e ls e t 模型 f ( a ) 界面r p i l l 度f 沿法向方向演化( ”曲线以速度f o 到达点( z ,y ) 的时间r 图2 6速度函数f 与界面r 的关系 在上面的基础上,我们定义一个光滑的函数( 至少l i p s c h i t z 连续卜l e v e l s e t i 函数妒:f 一p ,满足: i 妒( x ,t ) 0 ,x 碧u 其中x ( t ) 表示点x = ( z 1 ,z 2 ,护) ,m = d i m ( w ) 随时间变化的轨迹函 数,x 0 = o ) 即为初始曲面r ( 亡= o ) 上的点,而妒= o 处就是曲面的边界c = o w 。 在一般情况下,l e v e ls e t 函数妒取为有向距离函数: f d ( x ,t ) , 妒( x ,亡) : o , 【d ( x , x u x a ( 2 2 ) x 譬u 其中d ( x ,亡) = r a i nl p x i ( v p a u ) ,表示点x 到曲面u ( 亡) 的最近欧式距离值, 同时妒满足边界条件: r ( t = 0 ) = xlv ( x ,t ) = 0 ,t = o )( 2 3 ) 式子( 2 2 ) 用来避免数值计算的不稳定性,同时它也可以保证曲线g 和距离函 一9 一 第二章面向生物分子场的l e v e ls e t 模型 数妒之间的一对一的对应关系。顺便要提到的是距离函数妒必须要满足下面所 显示的e i k o n a l 方程【6 3 】: v 妒,t ) l = 1 ( 2 4 ) 当我们在体数据上使用l e v e ls e t 方程的时候,每个网格上都有对应的l e v e l s e t 函数值妒( x ,t ) ,而每一个函数值都随着曲线曲面的演化而不断更新。我们在 每个时间点所需要的就是函数值为0 所构成的等值面。然而,在经过几次迭代 之后,l e v e ls e t 函数可能不会遵循有向距离函数,也就是说妒( x ,t ) 不再满足式 子( 2 4 ) 的要求了。因此,重新初始化就被应用到迭代过程中,来保证稳定的结 果和有效的曲线演化。重新初始化就是对函数妒( x ,f ) 关于有向距离函数进行周 期性的初始化,一种典型的重新初始化方法就是解下面的一个重新初始化的方 程: q a t + s g l l ( 洲v 妒( x ,。) 一1 1 ) = 0 , ( 2 5 ) l妒,0 ) = 9 ( x ) , 、。 其中9 是重新初始化之后的l e v e ls e t 函数,s g n ( 妒) 是符号函数。 在数值计算过程中,这个过程是很重要的,但是加入了重新初始化之 后,l e v e ls e t 方法在理论上和数值计算上就会出现一定的差异,因此,要使最 后的结果不会影响很大的话,如何设计和实现重新初始化妒( x ,t ) 就是一个需要 面对和解决的问题。c h u n m i n gl i 6 4 提出了一种新的l e v e ls e t 方法,不再需要 重新初始化的过程,而同样可以保证稳定的结果和有效的曲线演化。在这个方 法中,他加入了一个惩罚项来自动调整l e v e ls e t 方程,从而可以保证最终结果 的稳定性。 我们不断通过非线性p d e 的求解来改变妒( x ,t ) 的值,而由( 2 2 ) 中第二 式可以看到妒( x ,t ) = 0 代表着边界a u ,因此边界钆就随着妒值的改变而 不断移动。由于点x 是沿着法向元方向运动,得到x t f i = f ( x ( 啪。方 程妒( x ,t = 0 ) = 0 两边分别对t 求导: 慨+ v 妒( x ( t ) ,t ) x 心) = 0( 2 6 ) 一1 0 第二章面向生物分子场的l e v e ls e t 模型 再由x 元= f ( x ( t ) ) ,法向元= 专并和边界条件可得: j 仇+ f lv l ,o ( x ,亡) i = 0 , 【r = 妒( x ,t ) it = o , 这就是动态的l e v e ls e t 方程。 通过方程( 2 6 ) ,在给定的体数据上的等值面就不断变化, 构成了l e v e ls e t 演化的主要过程。 2 4 分子场上的l e v e is e t 公式 ( 2 7 ) 而这个变化也就 在定义了l e v e ls e t 方程之后,接下来要做的就是选取妒的有向距离函数和 速度函数f ,同时通过求解p d e 方程来获取演化曲面的演化过程:在本文中, 我们设计了一种新的l e v e ls e t 方法,这个方法可以有效地避免重新初始化的过 程,同时,我们也给出了求解这个l e v e ls e t 方程的数值解的迭代过程,而此过 程也构成了我们最后用程序来求解演化曲面的基础。 2 4 1 传统的l e v e is e t 方法和变分l e v e is e t 方法 l e v e ls e t 方程的关键部分除了前面讲到的关于妒的有向距离函数的选取 之外,就是速度函数f 的选取,因为它影响着曲面演化的过程。传统的l e v e l s e t 模型主要通过l a g r a n g i a n 函数来实现,c a s e l l e s 和m a l l a d i 提出了几何活动轮廓 线模型( g e o m e t r i ca c t i v ec o n t o u rm o d e l ) : 警_ c ( k + v o ) l v l ,o l ( 2 8 ) 其中k = v ( 帝崭) 是平均曲率,它用来保证演化的光滑性,是传送项常 数,用来支持外部力的推动和控制曲面的扩张和收缩,c 是边界探测器,当演化 曲面快到边界的时候,它可以减缓边界的运动,并且停留在边界处,它具体的 表达式为: 归再雨面素厕 q 9 ) 其中i ( x ) 是输入的体数据,g 叮( x ) 是g a u s s i a n 滤波函数。 尽管这个方程可以很好地用在体数据上,但是它也有明显的缺点,就是对 模糊的边界很难处理;也就是说,对于边界探测器,它可以使得演化速度在边 一11 第二章面向生物分子场的l e v e ls e t 模型 界附近减缓下来,但是在边界处速度并不一定是0 ,而我们很难在演化曲面跨 过边界后再把曲面拉回来。 为了解决这个问题,c a s e l l e s 和k i c h e n a s s a m y 提出了基于梯度流的几何活动 轮廓线模型【4 8 】: 等= c ( 尤+ v o ) l v 妒l + v c v 妒 ( 2 1 0 ) 其中v c v 妒用来拉回演化曲面,当演化曲面跨过边界的时候。更进一步,对 于边界破损或者有缝隙,s i d d i q i 6 5 增加了速度项x v c 2 ,相应的方程也就变 成了: 誊= a ( 饿i v 妒i + v c v 妒) + ( c + 互1 x v c ) l v 妒l ( 2 1 1 ) 在接下来的研究过程中,很多研究者在这个模型上进行了强化和修改,并且把 改进的模型应用于各种各样的数据和不同的领域中 4 8 ,6 5 - - 6 7 。 与上面讲到的通过l a g r a n g i a n 函数来设计l e v e ls e t 方程不同,变分l e v e l s e t 方法是另一种演化的p d e 方法,它是基于e u l e r - l a g r a n g e 变分理论,并且通过 求解能量函数的最小值来进行等值面的演化。m u m f o r d s h a h 模型就是其中的一 种,它是基于区域的变分l e v e ls e t 模型,具体的公式如下所示: f m s ( u ,c ) = p l e n g t h ( c ) + a i u o ( z ,y ) 一u ( x ,y ) 1 2 d x d y + i v u ( x ,可) 2i d x d y - ,q j f l c ( 2 1 2 ) 其中u o :q _ p 是输入的边界光滑的体数据,它是分段连续的;而u 是代求 的未知量。在光滑区域和边界 c ( x ) i 妒( x ) = o ) 上最小化方程( 2 1 2 ) ,可以求 得: u ( x ) = u + ( x ) 日( 妒( x ) ) + 牡- ( x ) ( 1 一日( 妒( x ) ) )( 2 1 3 ) 其中日( 妒( x ) ) 是h e a v i s i d e 函数。 上面所提到的问题可以进行一定的简化,而简化之后的模型就形成了c h a n v e s e 模型( 简写成c v 模型) 【5 2 】。在这个模型中,u ( x ) 被假设为在每一个连通的 分支a c 上是分段常值的,也就是说,我们假设u ( x ) 有下面的表达形式: u ( x ) = c 1 日( 妒( x ) ) + c e ( i 一日( 妒( x ) ) )( 2 1 4 ) 一1 2 一 第二章面向生物分子场的l e v e ls e t 模型 其中c 1 = a v e r a g e ( 在c 内部的咖) ,c 2 = a v e r a g e ( 在c # b 部的咖) 。在这样的假设 下,我们就可以得至1 c h a n v e s e 模型的能量函数,如下所示: 0 ,“a l ,沁= p l e n g t h ( c ) + 正,a r e a ( i n s i d e ( c ) ) + a 1 l ,一c l l 2 日( 妒) d xd y + 入2 i ,一c a l 2 ( 1 一日( 妒) ) d xd y ,n,q ( 2 1 5 ) 其中,是输入的体数据,p l e n g t h ( c ) 和a r e a ( i n s i d e ( c ) ) 是正规项,分别代 表曲线g 的长度和曲线e 形成的内部区域的面积,而剩下两项和是匹配项,它们 用来保证演化曲线可以最终演化到目标形状。 c v 模型给我们提供了一种非常有效的用来分割物体的方法,它可以同时 把光滑边界和不连续边界都分割开来,但是对于比较复杂的数据,重新初始化 还是必不可少的,怎样在c v 模型的基础上进行改进,从而在计算过程中不再 需要重新初始化,这个是一个很大的挑战,而我们的主要工作就是考虑如何 在c v 模型上进行修正来避免重新初始化。 2 4 2 无需周期初始化的l e v e is e t 方程 我们提出了一种新颖的l e v e ls e t 模型,它基于上面提到的c v 模型,但是在 上面增加了一个惩罚项,从而不再需要重新初始化这个过程,使l e v e ls e t 方法 在理论上和数值计算上达到一致。 首先,我们定义一个能量函数,它是下面工作的基础,具体形式如下: 占( 妒) = 岛( 妒) + 尹( 妒) ( 2 1 6 ) 其中( 妒) 是定义在给定体上的一个能量函数,它用来保证变形的等值面向着 目标形状进行演化,我们称这个能量为外部能量;相对应地,p ( 妒) 是一个惩罚 项,用来衡量函数妒和有向距离函数的关系,它用来惩罚l e v e ls e t 方程,从而 避免周期性的重新初始化的过程。 对于外部能量厶( 妒) ,它由两部分组成,其中一部分是停止项,另外还有 一部分就是正规项,这个能量函数跟上面提到的c v 模型中的能量函数非常接 近,唯一的改变就是把上面的能量函数从2 维情况上升到了3 维的情况,具体表 一1 3 一 第二章面向生物分子场的l e v e ls e t 模型 达式如下: 0 ,札a 2= 肛a r e a ( c ) + 王,- v o l u m e ( i n s i d e ( c ) ) + a l i j e l l 2 日( 妒) d x d y d z + a 2 i j c 2 1 2 ( 1 一日( 妒) ) d x d y d z i ,nj q ( 2 1 7 ) 其中p 0 ,i i 0 ,a i ,a 2 0 ,它们都是固定的参数。演化的曲面c 的面积和 由c 形成区域内部的体积是按照下面的式子定义的: a r e a 妒= 0 ) = v o l u m e 妒o ) = | v 日( 妒( z ,y ,名) ) id xd yd z j q 晶( 妒( z ,y ,名) ) l v 妒( z ,y ,名) id xd yd z ( 2 1 8 ) j q h ( 妒( z ,y ,名) ) d x d y d z ( 2 1 9 ) j n 其中日和晶分别表示h e a v i s i d e 函数和一维d i r a c 狈1 度。 为了计算关于妒的e u l e r - l a g r a n g e 方程,我们考虑日和南的正则形式,在这 里用皿和疋来表示。在c 2 ( q ) 上日用公式写出来就是下面的形式: f 研,。) = 【 x x 0 。 这样,我们就完美地定义了方程( 2 1 6 ) 的能量函数,这个函数描述了演化曲 线的运动过程,它的稳定性由最小化( 2 1 6 ) 定义的能量函数来获取。因此,接下 来我们要考虑的就是一个最小化的问题: i n f c 占) 。 根据变分原理和先前c h i l i 作,我们可以 a e u l e r - l a g r a n g e 公式得到下面 的公式( 2 2 6 ) :v = 0 骞一q a o - d i v ( 尚) ) 一撕) 卜幽( 嵩) - v - ) , l ( u o - c 1 ) 2 “( u o - - c , 2 ) 2 ( 2 2 6 ) 同时,根据梯度流理论【6 8 】,我们可以得到关于能量函数( 妒) 的g a t e a u x 导 数( 第一导数) 和关于妒的偏微分的关系,具体关系式如下面( 2 2 7 ) 所示:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论