




已阅读5页,还剩78页未读, 继续免费阅读
(化学工艺专业论文)复杂大分子体系相平衡性质的神经网络预测.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
郑州大学 硕 士 学位论文 摘要 复杂大分子体系相平衡性质的研究是化工过程模拟与优化的基础。其目的就是为了理解 并掌握复杂多元大分子体系的热力学性质,从而来指导相应的工艺开发和过程优化等问题。 本文的研究结果为非对称聚合膜制备的实验研究,蛋白质结晶生长的过程模拟以及结晶反 应器设计提供了基础的理论指导。 由于多元大分子体系较为复杂,基于传统热力学模型和多项式拟合的方法,往往不能很 好地用于模拟和预测这些体系的热力学相平衡性质。具有高度非线性映射的人工神经网络 为此提供了一条有效途径。本文主要基于人工神经网络方法,对研究聚合物成膜体系和蛋 白质体系的热力学相平衡性质进行模拟和预测。并对神经网络中传统的误差反向传播算法 进行了改进,最终对改进算法的性能进行了验证。 本文的主要工作可以简述如下: 1 基于水二甲基乙酰胺聚砜成膜体系的浊点数据对人工神经网络进行训练,并用训 练好的网络预测了其它温度下双结点线,这在一定程度上填补热力学数据的不足, 从而为非对称膜制备的实验研究提供了基础理论指导。 2 基于人工神经网络对生物大分子蛋白质溶菌酵素体系的溶解度进行了模拟和预测, 分析并讨论了各因素对蛋白质溶解度的影响。此外,还与传统热力学模型预测的结 果进行了比较。结果表明,人工神经网络可以很好地用于预测蛋白质溶菌酵素体系 在其它实验条件下的溶解度,虽预测精度高于传统的热力学模型。 3 针对传统误差反向传播学习算法的不足,分别基于动量规则、自适应学习速率系数 和修正的l e v e n b e r g - m a r q u a r d t 算法三个方面对学习算法进行了改进。结果表明,基 于动量规则和自适应学习速率系数这两种算法在一定程度上能够提高网络的预测 精度并加快网络的收敛速率。但与修正的l e v e n b e r g m a r q u a r d t 算法相比,仍存有不 足。因此,对于所研究的复杂大分子体系的相平衡性质,基于修正的 l e v e n b e r g m a r q u a r d t 算法的b p 网络显示较好的训练和预测效果。 4 引入基于自然界生物进化思想的遗传算法,结合遗传算法的并行全局之搜索能力和 修正的l e v e n b e r g m a r q u a r d t 算法快速精确寻优之特点,提出了联合遗传优化 l e v e n b e r g - m a r q u a r d t 算法的新思想。选用蛋白质体系和聚合物成膜体系对新算法的 性能进行了验证,结果表明这种新算法较传统e b p 算法具有更高的预测精度,同时 郑州大 学硕 士 学位论文 也降低了人工神经网络计算的时间消耗。 关键词:大分子,蛋白质,聚合物体系,相平衡,预测,人工神经网络,遗传算法, l e v e n b e r g - m a r q u a r d t 算法 一塑塑查堂堡主堂笪堡塞 a b s t r a c t t h er e s e a r c h e so ft h ep h a s ee q u i l i b r i u mp r o p e r t i e si nc o m p l i c a t e dm a c r o m o l e c u l a r s y s t e m s p r o v i d et h eb a s e sf o rt h es i m u l a t i o na n do p t i m i z a t i o ni nc h e m i c a la n dp r o c e s se n g i n e e r i n g i ti s e s s e n t i a lt ou n d e r s t a n dt h et h e r m o d y n a m i c p r o p e r t i e si nt h e s es y s t e m s a n dc a r lb eu s e df o r g u i d i n g t h ed e v e l o p m e n ta n do p t i m i z a t i o nf o rt h ec h e m i c a le n g i n e e r i n g t h er e s u l t sc a nb eu s e da sa s u p p o r tf o rt h ee x p e r i m e n t a lr e s e a r c hi na s y m m e t r yp o l y m e rm e m b r a n ep r e p a r a t i o na sw e l la st h e s i m u l a t i o no f t h eg r o w t h p r o c e s sa n dt h er e a c t o rf o rc r y s t a l l i z a t i o n s i n c et h et r a d i t i o n a lt h e r m o d y n a m i cm o d e la n dp o l y n o m i a lc o r r e c t i o nm e t h o dc a l ln o tb e w e l lu s e dt os i m u l a t ea n dp r e d i c tt h et h e r m o d y n a m i c p r o p e r t i e si nc o m p l i c a t e dm a c r o m o l e c u l a r s y s t e m s ,t h ea r t i f i c i a ln e u r a ln e t w o r k s ( a n n s ) h a v eb e e np r o v e nt ob ea ne f f e c t i v ew a y t od e a l w i t ht h e s ep r o b l e m sf o rt h e i ri n h e r e n ta b i l i t yt om a p h i g h l yn o n - l i n e a r i nt h i sp a p e r , t h ea n n s w e r eu s e dt op r e d i c tt h ep h a s ee q u i l i b r i u mp r o p e r t i e sb o t hi n p o l y m e rm e m b r a n ef o r m a t i o n s y s t e m a n dp r o t e i n c r y s t a l l i z a t i o ns y s t e m m o r e o v e r , t h ew a d i t i o n a i e r r o r b a c k - p r o p a g a t i o n m e t h o d ,w h i c hw a su s e da st h el e a r na l g o r i t h mi nn e u r a ln e t w o r k s ,h a db e e ni m p r o v e d ,a n dt h e p e r f o r m a n c e so f t h e s ei m p r o v e da l g o r i t h m sh a d b e e nv a l i d a t e d t h em a i nw o r k so f t h i s p a p e r c o u l db es u m m a r i z e da sf o l l o w s : 1t h ea n n sw e r eu s e dt ot r a i nt h ed a t a b a s eo fc l o u dp o i n t si nw a t e r - d m a c - p s f s y s t e m ,a n d t h ew e l lt r a i n e dn e t w o r k sw e r eu s e dt op r e d i c tt h eb i n o d a ic u r v ea to t h e rt e m p e r a t u r e s t h er e s u l t s c o u l dc o m p e n s a t ef o rt h el a c ko ft h et h e r m o d y n a m i cd a t a ,a n dc o u l db eu s e df o rg u i d i n gt h e e x p e r i m e n t a lr e s e a r c h e si np r e p a r a t i o no f t h ea s y m m e t r yp o l y m e rm e m b r a n e s 2a na r t i f i c i a ln e u r a ln e t w o r kw a su s e df o rs i m u l a t i n ga n dp r e d i c t i n gt h es o l u b i l i t yo f l y s o z y m ei nb i n m a c r o m o l e c u l a rl y s o z y m e - n a c l - h 2 0s y s t e m t h ei m p a c t f a c t o r st h a ta f f e c tt h e p r o t e i ns o l u b i l i t y w e r e a n a l y s e da n dd i s c u s s e d m o r e o v e r , t h ep r e d i c t e dp e r f o r m a n c e s w e r e c o m p a r e dt ot h et r a d i t i o n a lt h e r m o d y n a m i cm o d e l s i tw a sf o u n dt h a tap r o p e r l ys e l e c t e da n d t r a i n e dn e u r a ln e t w o r kc o u l d g i v et h ef a v o r a b l e r e s u l t sf o r p r e d i c t i o no f t h el y s o z y m es o l u b i l i t yi n l y s o z y m e n a c i h 2 0s y s t e m ,a n dt h a tt h ep r e d i c t i o na c c u r a c yw a si m p r o v e dc o m p a r e dt ot h e t r a d i t i o n a lt h e r m o d y n a m i cm o d e l s 3t h r e em o d i f i c a t i o n sw h i c hb a s e do nt h em o m e n t u ms t r a t e g y , s e l f - a d a p t i v el e a r n i n gr a t e c o e f f i c i e n ta n dt h em o d i f i e d l e v e n b e r g - m a r q n a r d ta l g o r i t h m w e r eu s e dt o i m p r o v e t h e 3 塑型三! = ;堂 堡主堂垡堡壅 p e r f o r m a n c e sa n do v e r c o m et h ed e f i c i e n c yo ft h et r a d i t i o n a le r r o rb a c k p r o p a g a t i o na l g o r i t h m t h er e s u l t ss h o wt h a tt h ea n n sb a s e d0 1 1 t h em o m e n t u ma n d s e l f - a d a p t i v el e a r n i n g r a t e c o e f f i c i e n tc a r li m p r o v et h ep r e d i c t i o n a c c u r a c ya n da c c e l e r a t et h el e a r n i n gr a t e ,w h e r e a s ,t h e m o d i f i e d l e v e n b e r g m a r q u a r d ta l g o r i t h m s h o w sb e r e r p e r f o r m a n c e t h a nt h et w om o d i f i e d a l g o r i t h m i n t h i sp a p e r , t h e b a c k - p r o p a g a t i o n ( b p ) n e t w o r k s ,w h i c hw e r eb a s e d o nt h em o d i f i e d l e v e n b e r g m a r q u a r d ta l g o r i t h m ,w e r e u s e dt o p r e d i c t t h e p h a s ee q u i l i b r i u mp r o p e r t i e s i n c o m p l i c a t e dm a c r o m o l e c u l a rs y s t e m s i tc o u l d b ef o u n dt h a tt h eb pn e t w o r ks h o w sg o o d p e r f o r m a n c e s b o t hi nt h ep r o c e s so f t r a l n i n ga n dp r e d i c t i n g 4i n t r o d u c i n gt h eg e n e t i ca l g o r i t h m s ( g a s ) t h a tb o r r o w o p e r a t i o n sa n d t h e m e sf r o md r a w i n g e v o l u t i o n ,a n e wa l g o r i t h mt h a tc o m b i n e dt h e h y b r i dg e n e t i ca l g o r i t h m w i t hm o d i f i e d l e v e n b e r g - m a r q u a r d ta l g o r i t h m ( h g a l m ) w a sp r e s e n t e d ag e n e t i ca l g o r i t h mp o s s e s s e st h e c a p a b i l i t y t of r e dag l o b a l o p t i m u mw a si n t e g r a t e dw i t ht h e m o d i f i e dl e v e n b e r g - m a r q u a r d t a l g o r i t h mw h i c hg i v e sag o o da b i l i t yt of i n dt h el o c a la c c u r a c ys o l u t i o ni nt h eh g a l m t h e p e r f o e m a n c eo f t h eh g a l mw a sv a l i d a t e dw i mt w o e x a m p l e s i t c a l lb ef o u n dt h a tt h ep r o p o s e d a l g o r i t h mc a ni m p r o v et h ea c c t t r a c ya n dd e c r e a s et h et i m ed e p l e t i o nc o m p a r i n g t ot h et r a d i t i o n a l e b p a l g o r i t h m k e y w o r d s :m a c r o m o l e c u l e ;p r o t e i n ;p o l y m e rs y s t e m ;p h a s ee q u i l i b r i u m ;p r e d i c t i o n ;a r t i f i c i a l n e u r a ln e t w o r k ;g e n e t i ca l g o d t h m t l e v e n b e r g - m a r q u a r d ta l g o r i t h m 4 郑州大学硕士学位论文 1 1 体系相平衡性质预测方法 1 前言 随着化学工业的发展,世界范围内每年有将近5 0 0 0 亿美元的资金投资于过程工业,主 要包括方案设计、过程工程、详细设计、建筑、试车、设备操作等【”,而过程模拟与优化则 是过程设计与开发的关键技术,在化工过程中占有相当重要的地位。然而,过程模拟需要 对所涉及的纯物质或混合多相体系进行准确的热力学性质预测以及多相( 包括气- 液、液- 液、 液固、气液固等) 相平衡行为的描述。从传统意义上讲,不论是状态方程方法( e o s ) 还是活 度系数法( a c m ) ,都能较好地解决低分子量化合物体系,对于复杂大分子体系( 如聚合物体 系,生物大分子体系) 等,则相关的研究较少,且理论方法还不够成熟。 化工过程中用来描述复杂体系的热力学模型依据其建模理论和基础不同可分为机理模 型和经验模型。机理模型是通过分析过程的物理一化学特性及体系组分间的相互作用机理, 根据化工热力学的基本理论,建立一组描述复杂体系热力学性质的数学模型,如n r t l 模 型、u n i q u a c 模型、u n i f a c 模型、e o s 模型和晶格模型等。3 。通常这种建模方法所需的 开发时间长,对于一些机理复杂或不清晰的过程难以适用。经验模型则是对某一过程的热 力学实验数据进行归纳,分析根据数据所呈现的规律,选择合适的数学函数进行数值拟合, 拟合方法常用线性或非线性回归。经验模型在选择函数时有一定的随意性,其拟合精度往 往受到一定的限制,且无法全面考查所有的影响因素。 为此,本文引入一种大规模的非线性预测方法一人工神经网络,分别对高分子聚合物成 膜体系以及生物大分子蛋白质结晶体系的热力学相平衡性质进行研究。基于文献所提供的 热力学数据,采用人工神经网络成功地预测了其它条件下的热力学相平衡性质。本文的研 究结果为膜分离以及蛋白质结晶生长的过程模拟与优化提供了基础理论指导,同时也在一 定程度上填补了热力学相平衡数据的缺乏, 1 2 复杂大分子体系热力学相平衡的研究初态 1 2 1 高分子聚合物制膜工艺简介 膜分离作为一种新型的分离技术,目前己广泛应用于净化和分离等领域。由于膜 郑州大学硕士 学位论文 分离种类较多,主要包括微滤、超滤、纳滤和反渗透等。当膜分离过程应用于不同的分 离体系时,其对膜材料和膜性能的要求也大为不同。为此,如何制备满足不同分离要求 的分离膜已成为目前膜技术领域研究的热点之一。分离膜的制备方法主要有烧结法、拉 伸法、径迹蚀刻法、溶胶凝胶法和相转化法等【3 1 ,其中尤以相转化法应用最为普遍。 目前工业应用的膜以非对称膜和复合膜为主,许多复合膜也是以非对称膜作为底膜, 再涂上活性分离层或涂上高透量聚合物( 硅橡胶) 堵孔修补膜皮层上孔缺陷。非对膜通常由 l s 法制造。其成膜工艺包括聚合物一溶剂体系的制备、涂覆、溶剂的部分蒸发、凝结浴中 浸没、凝结及最终成膜等步骤。其成膜机理可描述为:通过刮刀或纺丝机将铸膜液加工成 膜,然后浸入非溶剂凝结浴,继而发生溶剂与非溶剂的传质交换,致使聚合物铸膜体系中 非溶剂浓度增加,产生非稳态,导致液一液相分离。假如溶剂的外扩散速率大于非溶剂的内 扩散速率,则膜界面的聚合物浓度升高,形成致密层。而致密层的形成将使溶剂的外扩散 速率下降,从而导致膜内聚合物浓度降低,形成多孔支撑层。随着溶剂与非溶剂的不断交 换,最终将形成疏松多孔的非对称膜。 1 2 2 高分子聚合物成膜体系热力学性质的研究现状 由于聚合物体系的复杂性,目前仅有少数几个热力学模型可以用于预测聚合物体系的 相平衡性质。在这些模型当中,应用较为成功的模型主要有f l o r y - h u g g i n s 模型1 4 j ,e n 们p i c f v ( f r e e v o l u m e ) 活度系数模型【卯,v a i l d e r w a a l s 状态方程( e o s ) 1 6 ,基团贡献晶格流 ( g r o u p c o n t r i b u t i o nl 8 砸c e l u 油状态方程见这些模型已成功地用于二元聚合物溶液相平 衡性质的预测。在三元聚合物成膜体系的应用研究中,文献【4 ,8 卅均采用f l o r y h u g g i n s 理论 来建立成膜体系的热力学模型。基于f l o r y h u g g i n s 理论,采用组分间的相互作用参数来表 征聚合物溶液的非理想性,可以建立三元聚合物成膜体系的热力学模型。对于三元体系而 言,需要同时考虑组分间的二元和三元相互作用参数。由于三个分子同时碰撞的几率远小 于两个分子碰撞的几率,因而在计算过程中有理由忽略三元相互作用参数的影响。这样对 于一般的三元成膜体系,如果仅考虑组分间的二元相互作用参数,并将整个制膜过程视为 热力学等温过程,则体系的混合g i b b s 自由焓表达式为: g 二r r = h i i n 卉+ ”2 i n 晚+ n 3 l i l 九+ 9 1 2 n l 南+ 舶3 n 1 # 3 + 也3 也南 ( 1 。1 ) 化学位的计算可以通过混合g i b b s 自由焓对各组分的摩尔分数求一阶偏导数得到,为了简化 2 郑州大学硕士学位论文 起见,将不同组分间的摩尔体积比用如下变量表示 则成膜体系中各组分化学位的表达式为: ( 1 2 ) 舡水r 地而一s 南+ o + 9 1 2 杰+ m 霸) 仇+ 磊) 一,办一3 6 6 + 伪磊l 0 呐g t 2 ( 1 - 3 ) 却:r t = s l n 如一呜巾鲥蝴,九炀训嘣西如呐陲 ( 1 - 4 ) r a i 3 r t = r l n # 一卉一j 如+ + 船3 磊+ s z 2 3 如炀+ 如) 一g t 2 殖如0 - 5 ) 根据热力学相平衡理论:液一液相平衡时两相的化学位相等,即 “刊 ( 1 - 6 ) 就三元成膜体系而言,如果已知体系的二元相互作用参数,由式( 卜6 ) 即可得到该体系 的连结线。考虑到该体系中稀相和富相共有六个变量,而方程( 1 3 ) ( 1 5 ) 加上两个物料守 衡( 唬:1 ) 共五个方程,尚不能求解,因此必须事先给定一个变量值( 通常假定稀相中聚合 物浓度为零) 。体系的目标函数为: f:壹石2(1-7) 其中: 一= ( “一“) ( 1 - 8 ) 五=s(如一a疋)(1-9) = ,( a 厶一喇) ( 1 - 1 0 1 当体系的目标函数达到最小时,就可得到稀相和富相的平衡组成,即连结线。连结所有连 结线端点,即可得双结点线。 上述即为基于f l o r y h u g g i n s 理论所建立的三元聚合物成膜体系的热力学模型。由于该 理论是采用晶格f 3 】模型来描述聚合物溶液的混合熵,一般认为,f l o r y - h u g g i n s 理论适用于较 郑州i大 学硕士学位论文 高浓度的聚合物溶液。而对于成膜液体系,稀相聚合物浓度一般很小,因此f l o r y h u g g i n s 理论只能是近似符合。此外,该理论将聚合物体系中各组分的化学位表示为仅与组分间的 二元相互作用参数和各组分摩尔体积比相关的复杂函数,而忽略了三元相互作用参数。根据 热力学相平衡理论,当体系达到相平衡时,各组分在两相间的化学位相等,最终得到一个 有约束的非线性目标函数优化问题。通过求解聚合物体系的相平衡组成,可以获得体系的 双结点线。但是,f l o r y - h u g g i n s 模型中组分间的二元相互作用参数较难确定,而且所建立 受到实际物理意义约束的非线性模型的求解较为复杂,不易得到收敛解,因而应用起来较 为不便。 人工神经网络作为一种大规模的非线性预测方法,可以作为种替代传统热力学模型 的有效途径一。本文的研究工作之一就是采用人工神经网络方法对高分子聚合物成膜体系相 平衡性质进行模拟和预测。 1 2 3 蛋白质沉淀和结晶过程概述 蛋白质( p r o t e i n ) 是一类重要的生物大分子。按其分子形状和溶解度不刚1 0 1 ,蛋白质大体 可以分为球状蛋白质( g l o b u l e r p r o t e i n ) ,纤维状蛋白质( f i b r o u s p r o t e i n ) 和膜蛋白 质 ( m e m b r a n e p r o t e i n ) z 大类。对于球状蛋白质,分子对称性好,外形接近球状或椭球状,溶解度较好, 能结晶,大多数蛋白质属于这一类。 蛋白质是由氨基酸组成的大分子化合物,其理化性质一部分与氨基酸相似,如两性电 离、等电点、呈色反应、成盐反应等,也有一部分又不同于氨基酸,如高分子量、胶体性、 变性等。在蛋白质溶液中加入大量的中性盐以破坏蛋白质的胶体稳定性而使其析出,这种 方法称为盐析,也称为盐诱导蛋白质结晶。长期以来,结晶都是化工过程中一种有效的分 离操作,特别是用于制备高纯度的产品。然而,相对于气相和液相而言,结晶过程中因固 相难以处理使得其应用范围在一定程度上受到了限制。在蛋白质结晶过程中常用的盐有硫 酸铵、硫酸钠、氯化钠等,依据不同蛋白质盐析所需的盐浓度及p h 的不同,可对混和蛋白 质组分实施分离。例如半饱和的硫酸铵用来沉淀血清中的球蛋白、饱和硫酸铵可以沉淀血 清中的清蛋白,盐析沉淀的蛋白质,经透析后除盐,仍可保证蛋白质的活性。为了提高蛋 白质结晶的效果,调节蛋白质溶液的p h 至等电点附近,再用盐析法则会更好。 采用x 一射线来确定蛋白质结构时,如何获得高质量蛋白质晶体的生长条件显得尤为 重要。然而,目前为止获得较好的结晶条件的理论指导仍然较为缺乏。结晶生长在很大程 郑州大 学硕 士 学位论文 度上是一个反复试验的过程。由于相图是所有相分离过程的基础,因此,为了得到优化的 结晶条件,准确获取某一蛋白质结晶体系的相图就显得极为重要。蛋白质结晶体系中蛋白 质溶解度是体系相图中的核心部分,因此,如何准确获取结晶体系在不同温度、p h 值和离 子强度下蛋白质的溶解度将成为优化蛋白质结晶过程的基础。 1 2 4 蛋白质结晶体系热力学相平衡的研究现状 对于生物大分子蛋白质体系而言,由于蛋白质溶解度对结晶过程的模拟、优化以及结 晶反应器设计都具有重要的影响。因此如何准确获得某一蛋白质体系在不同条件下的溶解 度,将为结晶过程的模拟以及结晶反应器设计与开发打下良好的基础。文献“”3 采用液一固 相平衡及普遍化u n i q u a c 方程来建立蛋白质结晶体系的热力学模型。其基本思想如下, 要描述蛋白质的溶解度,需要考虑蛋白质的溶液行为以及蛋白质液相和固相问的交换,这 种相间交换可以用溶度积进行表示,而溶液行为则可以采用u n i q u a c 方程进行描述。 1 2 4 1 液一固相平衡 基于相平衡理论来描述结晶相与溶液相之间的蛋白质交换,即: 蛋白质固相叁蛋白质渡相( 1 - 1 1 ) 式中,两相间的传质交换可以用溶度积k 来表示 ( 1 1 2 ) 式( 1 1 2 ) 关联了溶度积与蛋白质的液相摩尔分数( 溶解度) x ,的关系,此外,对于液相活度系 数形,当广寸1 时,有讳- * 0 ,蛋白质的活度系数可以从下面的活度系数项中得到。对于 溶度积k 定义如下: 雠s = t d - 睾”i n ( t ) ( 1 - 1 3 ) 式中a 、b 、c 分别为用于描述溶度积的参数,且为温度的函数。对于所研究的体系,需要确 定这些参数。为了研究方便,假定蛋白质晶体是纯的完美晶体。 郑州 大学硕士 学位论文 1 2 4 2 活度系数项 表示 采用u n i q u a c 方程求解活度系数时,其活度系数可以通过如下的组合项和剩余项来 式中: 其中: i ny ? = i n y c + i ny ?( 1 - 1 4 ) l i l 芹= l i l ( 砖薯) + ( 2 ) 吼l n ( 6 ;秀) + 一( 舜五) 一( 1 - 1 5 ) h 7 r ( t , x ) = - q ,q 。)+ 办钡莩幺b ) ) m 旧 旃:妥l 乙r j x j = ( 2 ) “一毋) 一( 一1 ) 勺卜剖,唧= 矗u t ) - - u i # ) ,= 吲h 0 0 ) 对于一般的蛋白质体系而言,通常需要考虑到体系中蛋白质、虚拟溶剂以及两种离子 共四个组分。对于这样一个四元体系,通过u n i q u a c 方程所建立的模型将有1 0 个相互作 用参数需要确定。其中文献 ”】讨论了盐离子的作用参数,蛋白质分子的作用参数参见文献 i i 1 4 。而文献1 2 1 在求解这些相互作用参数时,通过将多元体系的溶解度数据进行多参数优 化,得到一组拟合的数据。然而,这些相互作用参数并不能给出其准确的物理意义。另外, 通过普遍化u n i q u a c 方程所建立的蛋白质体系热力学模型,其中仅包括了表示物种分子 本身性质的组合项和体现交互作用的剩余项,并没有考虑电解质存在时的d e b y e h u c k e l 项。 因此,普遍化u n i q u a c 方程原则上并不能较好地应用于电解质体系,为此,s a n d e r i 5 1 等 人提出了扩展的u n i q u a c 方程以使模型能用于电解质体系。从这一点上来说,现有文 献中所提供的模型并没有很好地反映蛋白质体系液相的非理想性。 1 2 4 3 经验模型 由于机理模型建立起来较为复杂,且模型中的相互作用参数很难获得,单纯通过实 6 郑州 大学硕士学位论文 验数据进行多参数优化,所得参数不仅物理意义不明确且预测误差较大。针对这些情况, 相关文献1 7 峙艮道了采用经验模型来回归蛋白质溶解度数据。其中文献f 6 1 报道了卵清 蛋白( o v a l b u m i n ) 在硫酸铵溶液中的溶解度。文献考虑到体系的温度、盐浓度以及p h 值 对卵清蛋白溶解度的影响,基于实验数据,将蛋白质溶解度对硫酸铵浓度( 1 8 3 0 ) ,p h 值( 4 5 8 5 4 ) 和温度( o 3 0 ) 进行关联,得到了如下的经验关系式, 1 0 9 。( s ) = 5 0 6 一o 0 0 6 t o 2 0 5 g + o 5 ( p h 一4 5 8 ) + 1 1 ( p 日一4 s s ) 2 ( 1 1 7 ) 虽然采用上述的经验方程可以得到卵清蛋白在一定条件下的溶解度,但该经验方程的预铡 误差较大。其预测误差在5 0 以内的可信度为9 5 。 文献 i 。7 】报道了溶菌酵素( 1 y s o z y m e ) 溶解度( s ) 与温度( x = ) 的关联式。采用如下三次 多项式拟合了p h 值( 4 。0 - - 5 4 ) 、盐浓度( 2 7 ) 下溶菌酵素的溶解度与温度的关系式 ( s :4 + b x + c x :+ 嬲,1 。尽管这些经验方程的预测精度大多在1 0 以内,然而每组参数 只能反映单个p h 值和盐浓度下温度对蛋白质溶解度的影响,并不能综合她反映出p h 值和盐浓度等因素对溶解度的影响,而p h 值和盐浓度对蛋白质溶解度的影响通常较大。 因此,这类经验模型并不能较好地用于预测蛋白质体系的溶解度。 人工神经网络作为一种替代热力学模型和经验方程的有效方法,可以较好地用于预 测生物大分子蛋白质结晶体系的热力学性质。为此,本文的研究工作之二就是引入人工 神经网络的方法对蛋白质结晶体系的溶解度进行模拟和预测。 1 3 人工神经网络 1 3 1 工神经网络简介 人工神经网络在人工智能方面开拓了一个重要的研究和应用领域【l “。神经网络( n n ) 系 统理论已被广泛应用于智能控制、系统优化、信号及信息处理、模型识别和预测预报等领 域,自1 9 4 3 年第一个神经网络模型一m d 模型被提出至今,神经网络的发展十分迅速,特 别是1 9 8 2 年h o p f i e l d 神经网络模型和r u m e l l a r t 于1 9 8 5 年提出的反向传播( b p ) 模型【l 巩, 使h o p f i e l d 模型与多层前馈b p 模型成为用途极为广泛的两种网络模型。它的基本结构是由 大量的网络结点联接而成,适当选择网络的激活函数,使网络状态逐渐达到一个极小值点( 稳 定点) ,从而联想出稳定点处的样本,它具有大规模并行处理、容错性、自适应性和自组织 郑州大学硕士 学位论文 性等特点。目前,神经网络理论和应用已取得了长足进步,出现了多种网络模型,主要有 感知器网络、线性神经网络、b p ( b a c kp r o p a g a t i o n ) 网络、径向基函数网络、自组织竞争人 工神经网络和回归网络等。其中绝大部分的神经网络模型都是采用b p 网络和它的变化形 式,它也是前向网络的核心,并体现了人工神经网络最精华的部分。目前b p 网络主要应用 于: 函数逼近:用输入矢量和相应的输出矢量训练一个网络来逼近一个函数; 模式识别:用一个特定的输出矢量将它与输入矢量联系起来; 分类:把输入矢量以所定义的合适方式进行分类; 数据压缩:减小输出矢量维数以便于传输和存贮。 1 3 2 b p 网络 1 3 2 1b p 网络的基本原理 b p 网络的学习过程是由正向传播和反向 传播所组成的。从结构上讲,b p 网络是典型, 的多层网络,分为输入层、隐含层和输出层, 层与层之间多采用全互连方式,同一层单元之 间不存在相互连接。多层b p 网络的结构如图,: 1 1 所示。b p 网络的基本处理单元为非线性或 线性的输入一输出关系。 当给定b p 网络模型的一个输入向量时,z 该向量由输入单元传入隐含层单元,经隐含层 单元逐层处理后传到输出层单元,由输出层单 元处理后产生一个输出向量。这是一个逐层状 态更新的过程,称为前向传播。如果输出向量 j 嗽nh 妇d 曲o u t p u t h吲bwrh 档r 围1 l 典型的b p 网络结构 与期望输出之间有误差,那么就转入误差后向传播,将误差值逐层沿连接通路传送并修正 连接权值和阈值。对于给定的一个训练集,用每一个个体训练网络,重复前向传播和误差 后向传播过程,直到该网络对训练集中的每个输入向量的实际输出值和期望输出值的误差 郑州人学硕士学位论文 都小于一个设定值为止。归结起来,b p 网络的学习过程为:“向量前向传播,一“误差后 向传播”一“记忆训练”一“学习收敛”, 1 3 。2 2b p 网络的设计考虑 在进行b p 网络设计前,一般应从网络的输入输出,网络层数、隐含层的结点数、权值 与阈值的初始化、学习速率系数以及网络的期望误差等方面进行考虑i ”1 。下面着重从这几 个方面进行分析。 输入与输出层的设计 b p 网络的输入、输出层维数完全可以根据使用者的要求来设计,如果b p 网络用作分 类器,其类别数为i n 个,那么输出一般取m 个神经元。问题确定之后,则输入与输出层的 单元数就确定了,在设计中应注意减小系统的规模,减少学习时间和系统的复杂性。 隐含层层数的确定 1 9 8 9 年,r o b e r th e c h t - n i e l s o n 证明了对于任意在闭区间内的一个连续函数都可以用一 个s 型隐含层加上一个线性输出层的b p 网络来逼近,因而一个三层的b p 网络可以完成任 意n 维到i n 维的映射。增加隐含层的层数主要可以进一步降低网络的误差,提高精度,但 同时也使网络复杂化,从而增加了网络训练时间。由于误差精度的提高实际上也可以通过 增加网络隐含层中的结点数目来获得,其训练效果也比增加层数更容易观察和调整,所以 一般情况下,应优先考虑增加隐含层的结点数。 隐含层结点数的选择 隐含层结点数与问题的要求、输入输出单元的多少都有关系。隐含层结点数太少,不利 于训练出效果好的b p 网络;隐含层结点数太多,又使学习时间过长。以下公式可以作为选 择标准: 啊= 拧+ m + 口( 1 1 8 , 式中,n l 为隐含层结点数,m 为输出神经元数,n 为输入神经元数,a 为1 1 0 之间的常数。 权值和阈值的初始化 由于系统的非线性,初始权值和闽值对于学习是否达到局部最小、是否能够收敛以及 训练时间的长短关系较大。如果初始权值和阈值太大,使得加权后的输入落在激活函数的 饱和区,从而导致其导数,& ) 非常小,而在计算权值和阈值的修正公式中,因为d 正比于 9 郑州人学硕 士 学位论文 ,g ) ,当,。g ) j0 时,则有j _ 0 。使得w _ 0 ,从而使调节过程几乎停顿下来。所以, 般总是希望经过初始加权后每个结点的输出值都接近于零,这样可以保证每个结点的权值 和阂值能够在它们的s 型激活函数变化最大的范围迸行调节。所以,初始权值和阈值一般 取( 1 ,1 ) 的随机数。 学习速率系数的设置 学习速率系数决定网络在每次循环训练中所产生的权值与闽值的变化量。大的学习速率 系数可能导致系统的不稳定性,但过小的学习速率系数又会导致训练时间较长,收敛速度 很慢,不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小误差值。所以在 般的情况下,倾向于选取较小的学习速率系数以保证系统的稳定性。学习速率系数的选取 范围在0 0 1 - - 0 8 之间。 在一个神经网络的设计中,网络要经过几个不同的学习速率系数的训练,通过观察每 一次训练后的误差平方和s 2 的下降速率来判断所选定的学习速率系数是否合适。如果e 2 下降很快,则说明学习速率系数合适,若e 2 出现振荡现象,则说明学习速率系数过大。对 于一个具体网络都存在一个合适的学习速率系数。但对于较复杂的网络,在误差曲面的不 同部位可能需要不同的学习速率系数。为了减少寻找学习速率系数的训练次数以及训练时 间,比较合适的方法是采用变化的自适应学习速率系数,使网络的训练在不同的阶段自动 设置不同的学习速率系数。 期望误差的选取 在设计网络的训练过程中,期望误差值也应当通过对比训练后确定个合适的值,这 个所谓的合适,是相对于所需要的隐含层的节点数来确定,因为较小的期望误差值是要靠 增加隐含层的结点以及训练时间来获得的。一般情况下,作为对比,可以同时对两个不同 的期望误差值的进行训练,然后通过综合因素的考虑来确定选择其中一个网络。 1 3 3 人工神经网络在化工及相关领域中的应用 目前对于化工系统的操作优化,通常采用化工模拟软件,如p r o 和a s p e n p l u s 等, 对现有系统进行模拟,在模拟结果与实际过程基本吻合的情况下,再继续用模拟软件对各 操作参数进行优化,以取得更好的经济效益。为了尽可能减少模拟试验的次数,摸清各因 素对某一指标的影响规律,通常采用正交试验的方法。通过正交分析与回归分析,选取各 1 0 郑州大学硕士学位论文 因素的较优水平再进行验证试验。但这样得到的结果,往往与实际情况不符,有时优化结 果还不如原来的正交试验中的某一次试验,在多因素的情况下更是如此。为此,采用人工 神经网络方法代替正交分析与回归分析,寻找优化结果就显得尤为重要。 目前人工神经网络已广泛应用于化工领域。相关文献。捌报道了采用b p 网络和径向基 函数网络预测气一液相平衡数据。通常用于预测气一液相平衡数据的传统热力学模型较为 繁琐且模型参数一般不易获取。然而,人工神经网络作为一种纯“数字”的黑箱模型,不 需要考虑热力学模型,因而采用人工神经网络可以方便地用于预测气一液相平衡数据。 人工神经网络也能较好应用于聚合物的制备,文献。3 3 报道了采用b p 神经网络确定聚合 物制备的初始条件。通过合理选择和训练的b p 网络可以用于预测丁二烯聚合过程中聚合物 的物化性质和转化率,网络模拟的平均相对误差很小且对连续聚合反应过程具有较高的模 拟精度。网络计算所得到物化性质和实际值非常接近。另外,计算得到聚合物制备的初始 条件和实际的初始条件几乎相同。 人工神经网络除了用于计算或预测热力学性质外,还可以用于动态过程的模拟。文献o ” 报道了采用b p 网络用于模拟稳态非均相气一固反应器,由于传统模型在模拟非均相气一固反 应器时,需要计算反应器内每一点的总反应速率,且必须考虑固体颗粒内部的物料平衡, 通常这种模拟过程非常耗时。该文献提出了采用人工神经网络模拟非均相气一固反应器的新 方法。采用这两种方法分别对甲烷反应器进行模拟计算,其结果非常接近,但人工神经网 络的模拟速度要比传统模型快2 0 倍。此外,相关文献。“分别报道了有关采用人工神经 网络来优化和控制生化和化学工业等过程操作。 然而,b p 网络采用了误差反向传播的学习算法,从本质上说它是一种基于梯度下降的 算法,这就使得网络学习
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Heptyl-nonyl-phthalate-d4-生命科学试剂-MCE
- H-Asn-Arg-OH-diTFA-生命科学试剂-MCE
- 安全培训效果评估与课件
- 2025年宿州市人才集团有限公司招募就业见习人员7人考前自测高频考点模拟试题及答案详解一套
- 2025广西壮族自治区山口红树林生态国家级自然保护区管理中心招聘考前自测高频考点模拟试题及答案详解(全优)
- 健康保健行业消费心理分析
- 合同文件标准化审批流程模版防止遗漏内容
- 2025年猫爬架合作协议书
- 2025河南农业投资集团子公司招聘13人模拟试卷(含答案详解)
- 2025年安徽安科生物工程(集团)股份有限公司招聘考前自测高频考点模拟试题附答案详解(典型题)
- 2024年污水管道维修协议书范文范本
- 新人教版《海水的性质》课件
- 雪糕车租赁合同三篇
- 绘画劳务合同
- 苗木供应质量保证措施方案
- 无人机辅助通信系统研究
- Java 8函数式编程(完整版)
- 司机安全责任协议书
- 代发客户如何做经营分析
- 冠状动脉搭桥手术后的运动康复指导与介绍
- 2025小学道德与法治开学第一课(思想政治理论教育课)
评论
0/150
提交评论