(计算机应用技术专业论文)svm技术在生产工艺中的研究和应用.pdf_第1页
(计算机应用技术专业论文)svm技术在生产工艺中的研究和应用.pdf_第2页
(计算机应用技术专业论文)svm技术在生产工艺中的研究和应用.pdf_第3页
(计算机应用技术专业论文)svm技术在生产工艺中的研究和应用.pdf_第4页
(计算机应用技术专业论文)svm技术在生产工艺中的研究和应用.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(计算机应用技术专业论文)svm技术在生产工艺中的研究和应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ab s t r a c t c h i n e s e t r a d i t i o n a l m e d i c i n e h a s i t s o w n c h a r a c t e r i s t i c s . q u a l i t y c o n t r o l i n v o l v e s s e v e r a l l i n k s . t h e c r a ft p a r a m e t e r c h o i c e o f t h e i n fl u e n c e p r o d u c t q u a l i ty i n d e x g e n e r a l l y i s n e a r w o r k e r s e x p e r i e n c e . t h e v a l u e o f t h e s e p a r a m e t e r s i s a p p l i c a b l e t o a p a r ti c u la r c h i n e s e t r a d i t i o n a l m e d i c i n e p r o d u c t o n l y . t h e p r o d u c t q u a l i ty i s h a r d a s s u r a n c e w i t h t h e p r o d u c t i o n c o n d it i o n b e in g c h a n g e d s u d d e n ly , e s p e c i a l l y t o a n e w c h i n e s e t r a d it i o n a l m e d i c i n e p r o d u c t , f a c e a n e w c r a ft , h a v e n o e x p e r i e n c e a n d m a n u a l o f re f e r e n c e , o n l y h a v e c o n t i n u o u s l y t h e d a t a . a c c o r d i n g t o t h e t r a d i t i o n a l t e c h n i q u e a n d t h e m e t h o d , i t i s v e r y d i ffic u l ty t o b e q u i c k l y t o b u i l d u p a t t h i s t i m e e x c e l l e n t t u r n o f c r a ft p a r a m e t e r . t h i s t h e s i s s e l e c t s p i l u l e m a n u f a c t u r i n g p r o c e s s a s r e s e a r c h o b j e c t a n d t h e q u a l i ty c o n t r o l m e t h o d o f p i l u l e i s d i s c u s s e d 勿p r o c e s s m o d e l i n g , o p t im i z a t i o n a n d c o n t r o l v i a s o ft s e n s o r b a s e d o n s v m. s o m e c r a ft p a r a m e t e r s v a l u e i s g o t a n d t h e ma i n c o n t e n t s o f t h i s d i - t a t i o n a r e a s f o l l o ws : 1 , a c c o r d i n g t o t h e i n s t a n c e o f t h e c o m p a n y , w e e s t a b l i s h t w o c o l l e c t i n g d a t a p l a t f o r m a n d g o t a l o t o f d a t a .t h e s e s y s t e m r e s o l v e t h e b u s i n e s s e n t e r p r i s e i n f o r m a t i o n t o fl o w o f p r o b l e m a n d娜f o u n d a t i o n f o r t h e f o l l o w - u p a n a l y t i c a l r e s e a r c h 2 , a n a l y z i n g t h e c o l l e c t e d d a t a b y u s i n g r e l a t iv i ty a n a l y s i s t h e o ry a n d p r e t r e a t i n g d a t a , w e c r e a t e d a s v m m o d e l u n d e r t h e ma t l a b e n v i r o n m e n t . 3 、a m e t h o d b as e d o n g e n e t i c a l g o r i t h m ( g a ) w i t h g r a y c o d i n g w a s i n t e g r a t e d i n t o t h e t r a in i n g o f s v m f o r p a r a m e t e r s e l e c t i o n . t h e s a m p l e f o r s v m m o d e l i s d e s i gne d b y u s i n g c r o s s e x p e r i m e n t a l m e t h o d . t h e t w o m e d e l s p r e d i c t t h e c h a n g e s o f p i l u l e w a t e r a n d p i l u l e c o a t i n g w e i g h t p r e f e r a b l y a n d r e s o l v e t h e d i f f i c u lt o f t h e c o n t r o l o f p i l u l e q u a l i ty . 4 , t h e t h e s i s e x p l o r e s p r o d u c t i o n o f r e a l - t i m e p r o c e s s c o n t r o l o f e x p l o r a t i o n a n d p r e s e n t s p r o d u c t i o n c o n t r o l fr a m e w o r k p l a n . 5 , t h e o r e t i c a l a n d s im u l a t i o n a n a l y s i s i n d i c a t e s t h a t t h i s me t h o d f e a t u r e s h i g h le a rn i n g s p e e d , g o o d a p p r o x i m a t i o n , w e l l g e n e r a l i z a t i o n a b i l i ty , a n d l i tt l e d e p e n d e n c e o n t h e s a m p le s e t . i t h a s b e t t e r p e r f o r m a n c e t h a n t h e s o ft s e n s o r m o d e l i n g b a s e d o n t h e b p n e u r a l n e t wo r k k e y w o r d s : p i l u l eq u a l i t y c o n t r o l , s v m mo d e l , s o ft s e n s o r 南开大学学位论文版权使用授权书 本人完全了 解南 开大学关于收集、保存、 使用学位论 文的规定,同意如 各项内 容:按照学校要求提交学位论文的印刷本和电子版本:学校有权保存学 位论文的印 刷木和电子版,并采用影印、缩印、扫描、数字化或其它手段保存 论文;学校有权提供目 录检索以 及提供本学位论文全文或者部分的阅览服务; 学校有权按有关规定向国家有关部门 或者机构送交论文的复印 件和电子版;在 不以赢利为 目的的前提下,学校可 以适 当复制论文的部分或全部内容用于学术 活动。 学位论文作者签名: 年月日 经指导教师同意 ,本学位论文属于保密 ,在年解密后适用本授权书 。 指导教师签名:学位论文作者签名: 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: 内部5年 ( 最长5 年,可少于5年) 秘密*1 0 年 ( 最 长1 0 年,可少于 1 0 年) 机密*2 0 年 ( 最 氏2 0 年,可少于2 0年) 南开大学学位论文原创性声明 本人郑重声明: 所呈交的学位论文,是本人在导师指导下, 进行研究工作 所取得的成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含 任何他人创作的、 已公开发表或者没有公开发表的作品的内容。对本论文所涉 及的研究工作做出贡献的其他个人和集体, 均己 在文中以明确方式标明。 本学 位论文原创性声明的法律责任 由本人承担。 学位论文作者签名: 年月日 第一章 绪 论 第一章 绪 论 第一节 背 景 中医药学作为中华民族的优秀文化和智慧结晶,现在正面临着难言的尴 尬,随着国际社会对中药和天然药物的需求日 益增长,各国竟相采用现代技术 研究开发传统药物,抢占国际草药市场,植根于我国的中药,在世界市场的销 售额,仅占 3 % - 5 % ,且在国际市场所占份额日 渐收缩,而韩国、日本分别占 6 0 % , 3 0 % 。尤其近几年“ 洋中药” 大量登陆中国,凸显我国中 药生产水平的落 后,主要表现在产品质量差、科技水平低、创新意识弱、信息意识差、企业人 才少、投资规模小等方面。 近 1 0余年来, 国家对中医药研究才逐渐有所重视, 在 “ 八五”、 “ 九五”攻关计划和 “ 九五”攀登计划中都对中药项目 给予了支 持 , “ 数 字 化 中 药 ” 逐 渐 成 为 了 各 中 药 企 业 的 蓝 图 lil “ 数字化中药”是指在现代计算机技术、网络技术和现代测试技术及现代 计算技术的支撑下,根据中医药传统理论,用数字化的方式描述和表达中药的 内涵,通过对中药成分的结构、含量等多项特征进行数字化测试,以期用定量 科学的数字化方法解释中药的传统理论。它的实现是一个漫长而艰辛的过程, 要经历自 动化、信息化,目 前绝大部分中药企业仅仅迈出了第一步即实现了关 键生产设备的自 动化。大部分中药生产的自 动化设备都是根据不同生产工艺定 制的,自 动分析功能不强,而且中药本身的机理不明确,许多与中药生产质量 息息相关的指标无法实现在线测量、实时监控,只能是实验室检测完以后才能 定性这批产品是否合格, 这种事后检验的方式难以 实时保证产品的 质量, 给中 药数字化带来很大障碍,为解决此问题,以往通常采用两种方法 1 ) 间接的质量 指标控制,但此方法难以保证最终质量指标的控制精度;2 ) 在线分析仪表,并 用硬件予以实现,这种方法开发费用高 ,硬件投资大,原理复杂,除了 在少数 特 殊 情 况 以 外 , 并 没 有 被 工 业 控 制 界 广 泛 接 受 和 采 纳 2 7 在各种因素的影响下中药数字化的步伐很慢,而国际国内市场对中药产品 质量的要求越来越高,在这种形势下如何能快速有效地解决中药产品的质量控 制问题,实现对关键质量指标的在线监控成为各企业的难点. 第一章 绪 论 第二节 当前研究现状和面临的问题 由于我国缺少能让世人相信并保证优质、安全、有效、稳定、可控的中 药系列质量标准规范体系,使得我国中药至今未能作为药品进入国际医药市 场。中药作为药品质量标准的实质,虽然与西药没有区别,但中药有其自 身的 特 殊 性 , 其 质 量 控 制 涉 及 从 原 料 到 成 品 的 每 一 个 环 节 3 4 , 影 响 产 品 质 量 指 标 的工艺参数选择一般是靠工人经验,这些参数值仅仅适用于特定的中药产品, 当生产条件发生变化时产品质量就难以保证。同时,现代中药生产中的计算机 在生产过程中采集大量的数据,这些数据及其关系人工一般是很难理解、辨认 和优化的,特别对一个新的中药产品,面对新的工艺,没有参考的经验和手 册, 只有不断积累的数据, 这时要迅速的建立优化的 工艺参数, 按照传统的 技 术 和 方 法 , 难 度 是 较 大 的 (5 近几年人工智能技术在中药领域的应用, 可以 帮助人们从传统经验和现代 科研信息的大量数据中,提取出许多有价值的信息和线索来。比如在不增加硬 件设备的前提下,通过 “ 数据库知识获取”的方法和技术研究中医方剂,从中 获得影响产品质量的关键指标, 进而改进生产工艺,提高 产品竞争力, 这就是 一 种 软 测 量 技 术 6 软测量技术是建立待测变量与可测或易 测的 过程变量之间的非线性函数 关系, 通过对可测变量的 变换计算,间接得到待测变量的估计值。 人工神经网 络 是 在 工 业 过 程 建 模 和 控 制 中 广 泛 应 用 的 一 种 软 测 量 技 术 7 8 1 9 1 10 7 , 尤 其 是 b p 神经网络。但神经网络存在一些缺陷,比如:需要事先指定或应用启发式算法 在训练过程中修正网络结构;网络权系数的调整方法存在局限性,容易陷入局 部最小;过分依赖学习数据的质量和数量。然而,许多情况下对于问题的输入 空间是高维的,由于受生产条件限制、采集手段参差不齐、标准不同,得到的 训练样本数据是输入空间的稀疏分布且噪声较大, 因此很难保证训练结果的准 确性。 支持向量机理论弥补了神经网络的不足,它是专门针对有限样本进行回 归预测的学习方法。它具有严格的理论和数学基础,是一种新型的结构化学习 方法,而且还很好地解决了基于有限数量的样本构造高维模型的问题,不仅不 存在局部最小问题,小样本学习使它具有很强的泛化能力,而且还不过分依赖 第一章 绪 论 样本的数量和质量,从而较好地弥补了神经网络的缺陷。 第三节 本文的研究内容 论文研究的课题是在 “ 中药现代化”的大背景下,根据企业的实际需要提 出来的,一直是国家重点支持的项目,本课题也是天津市重点项目资助。其主 要研究内容为:以 滴丸生产过程为研究对象,以 滴丸制剂和包衣过程的质量控 制为目 标,利用支持向量机理论对滴丸生产过程中滴丸的含水量和包衣增重进 行了研究,给出了生产过程中如料液温度、化料用时、进风温度、出口温度等 因素的量化指标,并对滴丸制剂和包衣生产工艺进行了优化,以削弱人为的因 素干扰,最终达到提高滴丸产品质量的目的。 本文对支持向量机在中药领域的应用展开研究,根据当前企业生产实际情 况,提出了数据采集平台的建立方案,加强了企业的信息化建设,运用基于统 计分析理论的支持向量机算法对滴丸生产过程的制剂和包衣过程建模研究,较 好地预测了滴丸 含水和包衣增重这两个质量指标, 给出了生产过程各个变量的 指导值,规范了生产操作规程,提高了生产效率和质量。 具体研究内容包括以下几个方面: 1 、滴丸数据采集系统的建立。滴丸生产和质检数据采集系统涵盖了滴丸 从提取到包装整个生产过程,采集了大量一线的生产数据,真实地记录了滴 丸的生产过程,为后续的分析研究莫定了 基础。 2 、数据预处理和模型的建立。在建模之前,首先对采集的数据进行了预 处理,清除了其中的噪声数据,并进行了相关性分析。滴丸含水量模型和包衣 模型的 建 立很 好地 反映 各 个生 产变量对 滴丸 含水 量 和包 衣增重的 影响 关系, 从 而为生产过程控制提供了依据。 3 、模型的优化及应用。运用遗传算法进行了特征选择,去掉了与模型输 出结果影响不大的特征,运用交叉验证方法对模型参数进行了优化,选取了最 佳的模型参数值;通过模型对滴丸含水量和包衣增重进行了预测,进而根据生 产质量标准要求确定了一些生产工艺参数的取值范围,规范了生产操作规程。 4 、对生产过程的实时控制进行了探索, 提出了生产过程控制框架图,比 较了s v m 和神经网络在应用中的差别。 第一章 绪 论 第四节 论文的组织结构 本文的其他章节安排如下: 第二章:论文涉及的主要知识介绍。包括统计学习理论和支持向量机的 介绍。 第三章:设计并实现了数据采集系统。提出了滴丸数据采集系统的设计 方法, 建立了 滴丸生产采集系统和质检数据采集系统。 第四章:运用 s v m理论建模。 针对滴丸生产过程, 对采集数据经过预处 理和相关性分析后,建立了滴丸含水量模型和包衣增重模型. 第五章:模型的优化和应用。该部分主要完成了输入数据的特征选择和 模型参数优化,并运用该模型对滴丸含水量和包衣增重进行很好地预测,和神 经网络进行了比较得出了s v m的优势所在。 第六章:论文的总结与展望。分析了存在的不足,明确了今后需要努力 的方向。 第二章 主要知识 第二章 主要知识 支持向量机是通过统计学习理论中的结构风险最小化归纳原理使得真实 风险尽可能的小,这也是支持向量机区别于神经网络的关键之处,因此 v c维 理论、推广误差边界、结构风险最小化归纳原理等都是支持向量机的理论基础 之一,下面重点介绍一下统计学习理论和支持向量机理论。 第一节 统计学习理论 2 . 1 . 1边界理论与v c 维理论 边界理论主要包含了两部分,一是非构造性边界的理论,它可以通过基于 增长函数的概念获得:二是构造性的边界,它的主要问题是运用构造性的概念 来估计这此函数。主要需要研究的问题是后者。 ( 1 ) v c 维: v c 维主要刻画了 给定的函数可以打散的类别的数目 ; ( 2 ) 一致收敛的泛化边界; 根据样本的分布是否独立,可以分别获得不同性质的学习函数的、可以 控 制学习机器之推广能力的构造性的边界。 v c维,简而言之,它描述了组成学习模型的函数集合的容量,也就是说 刻画了此函数集合的学习能力。v c维越大,函数集合越大,其相应的学习能力 就越强。例如,对于二分类问题而言,h是运用学习机器的函数集合将点集以 2 种方法划分为两类的最大的点数目,即, 对于每个可能的划分,在此函数集 合中 均 存 在一个函 数介, 使得 此函 数 对其中 一 个类取 1 , 而对另外 一 个 类取 - 1 。如果, 取在r ( 2 ) ( 2维实平面) 上的 3个点,易知,3个点最多可以存在 2 ( = 8 ) 种划分, 可以 用一个有向 线来划分这 8种可能。 划分线的方向 所指示的 是+ 1 类,反向所指示的是一 1 类。另外,这样的函数集合无法划分2 维平面中 任意4 个点。所以,函数集合的v c 维等于3 0 2 . 1 . 2推广误差边界 为构造适合于小样本学习的归纳学习原理,可以通过控制学习机器的推广 能力来达到此目的。 下面给出两类学习 机器的推广能力边界。 第二章 主要知识 结构风险最小化的归纳学习过程克服了经验风险最小化的缺点,实用中获 得了更好的学习效果.统计学习理论给出了如下估计真实风险 r ( a ) 的不等式, 即 对 于 任 意 a e r ( r 是 抽 象 参 数 集 合 ) , 以 至 少1 一 77 的 概 率 满 足以 下 不 等 式 : 、_ _h . 兵 甲 ,t 甲= r (a ) “ 一 (a ) + y (i ) h (lo g 臀 + 1) - lo g 4 i ( 2 . 1 ) _ _ _ h r_ _ a_, _ _ _. t ( - ) , , . , 。一_ , 人 , 。 *一人 二 ., 、 , 几 e m p 表示经验风险, 一 1 称为置信风险;l 是样本个数, 参数 h称为 一个函数集合的v e 维,对于线性分类器,满足 h :q w l, r 2 + 1 其中 r为包络训练数据的最小球半径。机器学习过程不仅要使经验风险 最小,还要使 v c维尽量小,对未来样本才会有较好的推广能力,这是结构风 险最小化准则的基本思想。 2 . 1 . 3结构风险最小化归纳原理 结构风险最小化归纳原理的基本想法是:如果要求风险最小,就需要不等 式( 2 . 1 ) 中的两项相互权衡,共同趋于极小;另外,在获得的学习模型经验风 险最小的同时,希望学习模型的推广能力尽可能大,这样就需要 h值尽可能 小,即,置信风险尽可能小 根据风险估计公式( 2 . 1 ) , 如果固定训练样本数目l 的大小, 则控制风险 r ( a ) 的 参 量 有 两 个 : r e p ( a ) 与h o 其 中 , ( 1 )经验风险依赖于学习机器所选定的函数 f ( a , x ) ,这样,我们可以 通过控制a 来控制经验风险。 ( 2 ) v c 维h 依赖于学习机器所工作的函数集合( 如前所述) 。为了获得对h 的控制,可以将函数集合结构化,建立 h与各函数子结构之间的关系, 通过控 制对函数结构的选择来达到控制v c 维h 的目的。具体做法如下: 首先,运用以下的方法将函数集合 f ( x , a ) , a e r 结构化。考虑函数嵌 套子集的集合,如图2 . 1 所示, s , c s z 仁 c s k c“ c s“ 其 中 s k 二 f ( x , a ) , a e r k j , 并 且 有 第二章 主要知识 =气 凡 4 结构 4 气 , s 中的任何元素s k( 或 一 个 函 数 集 合 ) 拥 有 一 个 有 限 的 , c 维 气; 且 图z . 1由函 数的嵌套子集决定的函数的集合 如果 给 定 一组样 本( x v y ) , ( x v y 2 ) , . . ., ( x y ) , 结 构 风 险 最 小 化 原 理在函 数 子 集s * 中 选 择一 个函 数ax , 讨 ) 来 最 小 化 经 验 风险, 同 时,s * 确保 置 信 风险 是最小的。 以上的思想就称为 “ 结构风险最小化归纳原理” 。为了进一步说明,请看 图2 . 2 ,己 知一个嵌套的函 数 子集 序 列s v 3 2 , . . . s, 它们的v c维分 别对 应为 气 , 气 , , 气, 而且有h 5 气5 , - - -, s k。 图中 给出了 真实 风险、 经 验风 险与 置信 风险分别与 v c维 h的函数变化关系曲线。显然随着 h的增加,经验风险 际( a ) 递 减 , 这 是 因 为h 增 加 , 根 据v c 维 的 定 义 , 对 应 的 函 数 集 合 的 描 述 能 力增加,学习机器的学习能力就增强,可以使有限样本的经验风险很快地收 敛, 甚至变为 0 ;根据式( 1 . 1 ) , 真实风险 r ( a ) 是一个凹型曲 线。 虑经验风险与置信风险的取值. 置 信 风 险 t ( 1 ) 随 看 h 的 增 加 而 增 加 ; 这 样 , 所以,要获得最小的真实风险,就需要折中考 第二章 主要知识 欠学习过学习 风险 风险边界 里信风险 经验风险 v c 维 图2 . 2结构风险最小归纳原理图 根据这一分析,可以得到两种运用结构风险最小化归纳原理构造的学习机 器 的 思 路 i il ( 1 ) 给定了一个函数集合,按照上面的方法来组织一个嵌套的函数结构, 在每个子集中求取最小经验风险,然后选择经验风险与置信风险之和最小的子 集。当子集数目较大的时候,此方法较为费时。甚至于不可行。 ( 2 ) 构造函数集合的某种结构,使得在其中的各函数子集均可以取得最小 的经验风险( 例如,使得训练误差为 0 ) 。 然后,在这些子集中选择适当的子集 使得置信风险最小,则相应的函数子集中使得经验风险最小的函数就是所求解 的最优函数。 第二节 支持向量机 2 . 2 . 1 支持向量机的发展历史 的奠基者 v . v a p n i k早在 6 0年代就开始了统计学习理论的研 究 。v . v a p n i k和 a . c h e r v o n e n k i s在 , t h e s u f f i c i e n t e x p e c t e d c o n d i t i o n s f o r t h e 提出了 u n i f o r m s c o n v e r g e n c e n e c e s s a r y o f a v e r a g e s v a l u e s 一文中,s v m 的一个重要的理论基础v c 维理论。 第二章 主要知识 1 9 8 2年,在 “ e s t i m a t i o n o f d e p e n d e n c e s b a s e d o n e m p i r i c a l d a t a 一书中, v . v a p n i k进一步提出了只有划时代意义的结构风险最小化原理,堪 称为s v m 算法的基石。 1 9 9 2年,b o s e r , g u y o n a n d v a p n i k在 , a t r a i n i n g a l g o r i t h m f o r o p t i m a l m a r g i n c l a s s i f i e r s ” 一 书中, 提出 t 最 优 边 界 分 类器。 1 9 9 3 年,c o r t e s 和v a p n i k 在 “ t h e s o f t m a r g i n c l a s s i f i e r 一书中, 进一步探讨了非线性最优边界的分类问题。 1 9 9 5年 ,v . v a p n i k在 “t h e n a t u r e o f s t a t i s t i c a l l e a r n i n g t h e o r y ” 一书中, 完 整 地提出 了s v m 分 类。 1 9 9 7年,v . v a p n i k , s . g o k o w i c h和 a . s m o l a ,发表的 “ s u p p o r t v e c t o r m e t h o d f o r f u n c t i o n a p p r o x i m a t i o n , r e g r e s s i o n e s t i m a t i o n a n d s i g n a l p r o c e s s i n g ” 一文中, 详细介绍了基于 s v m方法的回归算法和信号处 理方法。 由于 s v m算法的潜在应用价值,吸引了国际上众多的知名学者,近几年出 现了 许多发展和改进的 支持向 量机算法, 值得一提的是: 1 9 9 8年,s m o l a在他 的博士论文中 详细研究了 s v m算法中 各种核的 机理和应用,为进一步完善 s v m 非线性算法做出了重要的贡献。 s v m 在 模 式 识 别 领 域 已 经 有 了 一 些 应 用 12 3 , 手 写 体 数 字 识 别 、 人 脸 识 别 与 人脸检测以及文本分类等各种领域。此外,s v m 还很好地应用于时间序列分析 和 回 归 分 析 等 领 域 的 研 究 13 如 , m i t , b e l l l a b 和 微 软 研 究 所 等 己 成 功 地 将 s v m 算法应用于动态图象的人脸跟踪, 信号处理,语音识别,图象分类和控制系统 等诸多领域. 2 . 2 . 2支持向量机的基本说明 s v m 的基本思想是: 通过某种非线性映射, 将输入向 量x 映射到一个高维的 特征空间,在这个高维的特征空间 z中,构造最优分离超平面.如图 2 . 3所 不 。 第二章 主要知识 在特征空间中的最优超平面特征空间 特征空间 . . . . 卜 。 空 间 . . i 输 入 空间 图2 . 3 输入空间与高维特征空间之间的映射关系 首 先, 考 虑 一 个 非 线 性的 映 射沪 : x , -*z , 。 其 中x ; 为输 入空间 的 输 入向 量,z ; 为高维的 特征空间z的向 量。 如果在z中 求解最 优分离超平面,就需要 在高维特征空间计算内积 ( o ( x ) 劝 ( x i ) ) ,则定义这个内积为核函数, k ( x ; , x ) = o ( x , ) t .o ( x ) , 这 样 决 策 函 数 可 表 示 为 : ax ) = w t p ( x , ) + b k ( xx ) 输入向量x 图2 . 4支持向量机网 络 第二章 主要知识 图2 . 4 中形象化地给出了支持向量机工作的逻辑概念框架。它与神经元网络最 大的差别是,神经元网络中的节点是 “ 无结构单元” ,这样, 在进行训练学习 过程中无法控制其学习能力,这种学习能力可能是无穷大,因而容易出现过学 习现象.而支持向量机网络的学习单元是有结构的,而且通过结构风险最小化 归纳原理控制了此学习单元的v c 维的上界,也就是限 制了学习单元的学习能 力,因此不易出现过学习现象。 支持向 量机的 重 要特征 之 一是 解的 稀疏性, 即多 数最优值a , 为0 , 只有少 量的a , 不为0 ,也就是说只需少量样本( 支持向 量) 就可构成最优分类器, 这样 有用的样本数据大大压缩。 总之,支持向量机具有结构简单、推广性能好、学习速度快、优化求解时 具有唯一的极小点等优点;另外,通过修正核函数, 可以得到各种不同的分类 曲 面 143 2 . 2 . 3支持向量回归机 问题可以描述如下: 己知数据样本 x= x y 。 一 y = y 1 1 y 2 + . . ., y. j 求函数 y = f ( x ) ,使之通过样本训练后,对于测试样本 x, 通过 f找出 对 应 的y 。利 用 非 线 性 映 射 v ( -) 将 训 练 数 据 集 非 线 性 地 映 射 到 一 个 高 维 特 征 空 间,将非线性函数估计问题转化为高维特征空间中的线性函数估计问题。设函 数具有下式的形式: ax ) = w g ( x t ) + b w r , b e r ( 2 .2 ) 其 中 非 线 性 函 数 w 0. r 分r 将 输 入 空 间 映 射 到 一 个 高 维 特 征 空 间 , 特征空间的维数不固定,有可能是无穷维,b 为偏置量。求解目的是要寻找参 数 记和 b , 使 得 对 于 样 本 以 外 的 输 入 x , 有 .f ( x ) 一 w t y ( x k ) 一 b l s 统计学理论指出, 寻找式( 1 ) 的 参数等价于求解下面的 优化问 题: 目 标函数:mi n m =于 日 ( 2 . 3 ) 第二章 主要知识 戈 一 w t (v ( x , ) 一 b e w t 0 ) c ? 0 表 示函数f 的 平滑度和允 许误差大于e的数值之间的 折衷。君不灵 敏损失函 数的形式 如下: i y 一 ax ) i = 0 , y 一 ax ) is e i y 一 f ( x ) 一 二 , 其他 ( 2 . 5 ) 通过式( 2 .4 ) 的 对偶形式 可以 求它的 最优解式。 采用拉 格朗日 乘子法求解这个具 有线性约束的二次规划问题,即 w112 + c 全 ( i十 ry k7 1 ) 一 生 a i (s + 一 : + w t p (x i) + b ) i = 1 i = 1 1一,山 一- l 一 y a i (# + , k i = 1 + y i _ w t (o (x i) - b ) 一 全 械十 。 *刃 ) i = t ( 2 . 6 ) 其 中 对 偶 变 量 a . ,t可 , q - 犷 _ o , 对式( 2 .6 ) 求偏导, 可得: a l 一 女 a b 7 _ j a l = w 一 a w a l_ ,二二c a ; ( 2 . 乃 艺( a ;e一 a ,) q, ( x ; ) = 。( 2 . 8 ) ( 2 . 9 ) 将式( 2 .7 ) ( 2 .8 ) ( 2 . 9 ) 代入式( 2 .6 ) 可得对偶优化问 题: 目标函数: 第二章 主要知识 . . ,一一, 一, , 一一叫,一, ,-.口 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .曰 . . . . . . . . . . . . . . . . . . . . . . . . . . .叫 . . . . 一 ,i 俄 d训, ma x人 了=ma x 一 a , ) ( a f 一 a , ) ( 2 . 1 0 ) 一 8 i ( a , + a , ) + y y , (a , 一 a ; ) 约束条件 艺( a , , a ) 二 0 a ; 一 a e 0 , c 由 ( 2 . 8 )可得w 和估计函数 一 a ; ) ( x , ) ( a , 一 “ ) + 吞 ( 2 . 1 1 ) 其 中 a , - a * # 0 对 应 的 x , 为 支 持 向 量 。 变 量 w 反 映 了 函 数 的 复 杂 度 , 是 非 线 性 映 射函 数q, ( . 的 线 性 组 合。 从 这 个 意 义 上 说 , 利 用 支 持向 量 进 行函 数 估 计 的计算复杂度和输入空间的维数是不相关的,依赖于支持向量的数目。 偏置量 b 可以通过k t t 条件计算。由于支持向量算法仅依赖于输入数据的点积,为了找 到 非 线 性映 射函 数,p ( . , 可以 引 进 核 函 数 来 代 替 非 线 性 映 射,即 k ( x x ) = , 则( 2 . 1 1 ) 可以 写 为 1 5 1 6 w = 艺 ( a ; 一 a , ) ( x ,) a x ) = 艺( a , 一 a ) k ( x x ) + b 其 中 核 函 数k ( x x ) = ex p ( - il x 一 x ; iiz 1 2 a 2 ) 第三章 数据采集系统的设计 第三章 数据采集系统的设计 数据采集系统是针对滴丸制剂、包衣和质检过程中相关工艺参数数据的全 面采集。只有对生产过程进行数字化的全面改造,提高制剂、包衣过程的数字 化程度,削弱人为的干扰因素,才能最终达到提高滴丸产品质量的目的。 第一节 引言 一般系统建模方法主要包括基于数据的建模和基于机理的建模。 其中 基于 机理的建模方式建立在对过程的物理、化学机理分析的基础上,利用一系列己 知的定理、定律和原理写出机理方程,该建模方法的优点在于所建模型有明确 的物理意义,所建模型有很强的适应性,不足之处在于对某些工业过程,人们 还难以写出它们的数学表达式,或对其中某些参数未知或不确定。基于数据的 建模方式则是根据从生产过程采集的大量历史操作记录数据,利用统计、人工 智能、数据挖掘等工具对数据进行分析,获取过程模型,该方式的最大优点是 无需深究过程的机理模型,而只需利用现有的数据即可完成模型建立,其不足 之处在于所建模型难以反映过程的机理。 对于中药滴制剂过程而言,它的一个典型特点就是机理不明确,生产过程 所发生的物理化学反应不是很清楚。此外,滴制制剂是我国中药的一个独特剂 型, 在国际国内不存在一个现成的标准生产线, 需要企业根据自 身特点而自 行 研制,制剂过程中使用的设备没有参考标准,特点各异,很难对其建立清晰而 一致的机理模型,因此本文主要研究如何基于数据的建模。滴丸生产过程中的 制剂过程包括化料、滴制、分离三个过程,在这个过程中影响滴丸含水量的因 素很多,很难了解原辅料在这个过程中发生的物理、化学反应从而直接得到滴 丸含水量的表达式,所能得到的就是采集到的大量相关数据,因此滴丸含水量 模型只能基于数据的建模方法,采用软测量技术解决。包衣增重同样受进风温 度、转速、出口 温度、投料量等诸多因素影响, 包衣机理不很明确,只能利用 采集系统得到的 数据进行建模 w 1 第三章 数据采集系统的设计 第二节 滴丸采集系统总体设计 本文数据采集分析思路是以滴丸生产过程为研究对象,以滴丸生产过程 的质量控制为目标,利用计算机技术和控制理论与技术,从理论上对滴丸生产 过程进行分析,给出生产过程中的一些量化关系,并对生产过程进行优化, 最 终实现滴丸生产过程的数据采集,提高生产过程的数字化程度,以减少人为因 素干扰,达到提高滴丸产品质量的目的。 滴丸的生产过程主要包括三个工序: 一是萃取工序,即将药材原料按一定的处方配比后,通过某种提取方式将 其主要成分提取出来, 浓缩成药膏,经检验合格的药膏再供给制剂工序,作为 制剂工序的原料: 二是制剂工序,主要完成将萃取工序提炼的药膏,通过融化滴制生成药 丸; 三是包衣工序,是 将素丸经过包衣机后, 在其外表包一层辅料。 萃取工艺的研究本身是一个结合化工、药学、控制的专门主题,本文不研 究这两方面的内容,而将研究重点集中在制剂和包衣工艺的改进上。制剂和包 衣过程涉及的滴制剂生产线规模比较大,且产量较高,整个滴制生产线都是根 据所生产滴丸的产品特点所设计的, 具有自 主的知识产权。经过多年的逐步完 善和改进,其制剂效率和制剂质量都得到了较大的提高,并获得了很多宝贵的 质量控制经验和方法。但还没有从理论上形成一个体系,很多经验还比较模 糊,没有一个量化的总结和分析。在制剂过程的自动化监控系统中,也进行了 初步的尝试,部分工艺参数变量实现了在线检测,但由于工艺和技术的原因, 还有很多 重要工艺参数变量没有纳入在线检测系统中,比如滴丸的含水、料液 含水、 滴制速度、 冷凝液温度、 滴制罐药液的液位等很多工艺参数还必须依赖 于人工获取或化验室送检分析。这些参数变量难以实现在线检测的原因,一方 面是由于实现成本太高,另一方面则是还没有研制出可实用的检测设备。化验 室的 送检的 参数变量属于后验式分析,对制剂过程的实时控制价值不大。因此 在对该滴制过程建模时必须考虑上述各方面的因素,充分采集现有可测参数, 对不可测或难测参数,则研究采用其他间 接方式进行获取,以尽可能较为全面 的 获 取 生 产 过 程 的 各 种 信 息 , 构 建 可 用 的 生 产 模 型 17 1 第三章 数据采集系统的设计 针对滴丸制剂的上述特点,设计了以下的研究思路: 首先构建分布式数据采集系统。 利用此平台对制剂过程和包衣过程进行大 范围的数据采集,运用人工采集和自 动采集相结合的办法,尽量多的采用自 动 采集,减少人工的参与,以保证采集数据的准确性;同时根据专家建议和业务 流程设计了多个功能模块,针对数十个工艺点进行了现场采集、汇总,为后续 建模奠定了基础。 其次要在数据采集的基础上运用软测量技术对生产过程中的很多重要变量 实现在线检测,参与系统实时测控。图3 . 1 给出了设计示意图 了 - - - - - - - - - - 一 一护 - - 一一 、 、 一 m*xlf a 共 ; r 一 - - - -, : s ql 数据库 尹 “ 一 户 咖 户 .一 口 , 口 , 月 , 白 , 、 曰州一川 axyd 3j f a布 下 黔 、 吟 _ 侧l 种 一 一 几 种 份 份 一户 s v m 模 o飞 s v m m 丸 包 衣 模 型 一 . sv m n ih,9 * #9一 人工采集 自动采集 蒸么 案熟 整 焦 熏 烈 愁众 佗 。 乳 吮礼 不 卜 香 弥 扩 叙 、 护 乍 图3 . 1 滴丸数据采集过程示意图 在这个总体设计中首先完成了数据采集平台,主要完成了滴丸制剂和包衣 过程的多个工艺点参数值的自动和人工采集、分析,根据生产需要对一些过程 变量的取值给出了一个合理的范围,但在实时控制方面还有待于进一步研究. 第三节 滴丸采集系统架构 滴丸数据采集系统是一个分布式的系统,要充分利用企业现有的局域网, 部署在不同平台上,而传统的 c / s ( c l i e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论