




已阅读5页,还剩49页未读, 继续免费阅读
(计算数学专业论文)基于神经网络的数学公式符号分割与识别系统.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要 人工神经网络发展到今天,已有五十多年的历史,在一代又一代学者的 不懈努力下,不但理论基础逐渐充实、成熟,而且在信号处理、计算机视觉、 模式识别、专家系统、工业控制与气象预测等许多领域有了广泛的应用。神 经网络模式识别方法是近几年兴起的模式识别领域的一个新的研究方向。神 经网络模式识别系统的研究,无论对神经网络理论的发展,还是对模式识别 技术的实际应用,都有特别重要意义。 b p 网络是当前应用最广泛的一种人工神经网络。已被人们广泛地应用 于神经网络模式识别( 特别是图像及字符的识别) 问题。 k o h o n e n 提出的自组织特征映射( s e l f - o r g a n i z i n gf e a t u r em a p ) 神经网 络( s o f m ) 因具有较强的拓扑组织能力和抗干扰能力,也广泛地应用于神 经网络模式识别领域。 本文的工作主要是以下两个方面,分别侧重于有关神经网络的数学理论 及实际应用。 1 广义逆矩阵在如神经网络计算等方面o 2 1 有广泛的应用。但在国内 文献中尚未见到对此概念的清晰而简明的表述。在文献【3 】中,以线性变换 广义逆的形式讨论了广义逆矩阵问题,用到的工具主要是张量概念及记号等 抽象代数方法。这些工具比较生僻难懂,而且不便于直接应用。 本文用矩阵及r “中向量内积这样一些简单而实用的数学工具,给出广 义逆矩阵概念的一个统一而又简洁的描述。我们首先定义广义左逆( 2 1 ) 及广义右逆( 2 2 ) ,然后在此基础上定义广义逆( 2 3 ) 。在2 4 中指出 如何用特征元素表示广义逆矩阵。广义逆矩阵的一些性质在2 5 给出。最 后,我们在2 6 讨论广义逆矩阵在神经网络计算中的一些应用。 2 神经网络被广泛用于模式识别问题,特别是用于各种字符的识别 ( o c r ) 。然而,一方面,目前的很多研究工作都是在假设已经对字符等符 号正确分割的前提下进行的,是针对单个字符的,而且对初始条件有着严格 的要求:另方面,专门针对数学公式的分割与识别的研究工作也较少。而 这两方面恰恰是神经网络模式识别耍达到实际应用阶段所必经的两个关键 步骤。 中文摘要 本文基于b p 神经网络和k o h o n e n 的自组织特征映射网络( s o f m ) 两 种网络和矩方法,设计出个数学公式的分割与识别系统,完成从接收扫描 而来的数据,经过图象的预处理,字符的分割,字符的识别到字符的重组等 4 个阶段的任务,实现数学公式处理的自动化。 在第三章,对扫描文档的进行前期处理并在此基础上进行分割识别系统 中的关键一环数学符号的分割。针对数学符号的复杂性,采用三种不同 的分割方法,对原图自上而下,自左而右的遍历,不断进行边缘检测和分割。 与其他学者的一些工作相比,本文侧重于特定的符号集数学符号, 劳在相对大的样本集合上进行分类( 共1 3 4 类样本) ,因此在第四章采用了 多级神经网络。在模式的特征提取上,采用描述区域形状特征的矩不变量与 具有强大的分类能力的b p 网络相结合的方式,具有一定的抗干扰能力。而 且,本文的处理是从扫描的输入开始,一直处理到最后电子文档的形成,因 而具有更高的实际应用价值。 由于特征提取技术的局限性及算法的不成熟,本文的系统模型距离成熟 的实用阶段还有很长的一段,有待于进一步的改进提高。但是我们的实验结 果表明,神经网络可以成功地用于数学公式的识别问题。 一 英文摘要 a b s t r a c t t h en e l l a lu e t w o r kh a sah i s t o r yo fo v e rf i f t yy e a r sn o w g e n e r a t i o n so f r e s e a r c h e r sh a v eb e e nm a k i n gg r e a te f f o r t st ob u i l du pi t st h e o r e t i c a lf o u n d a t i o n a n dt oa p p l yi ti nm a n ya r e a ss u c ha ss i g n a lp r o c e s s i n g ,m a c h i n ev i s i o n ,p a t t e r n r e c o g n i t i o n ,e x p e r ts y s t e m 、i n d u s t r yc o n t r o la n d w e a t h e rf o r e c a s t i nr e c e n ty e a r s , t i l ep a t t e r nr e e o g n i t i o nb a s e do nn e u r a ln e t w o r k sh a sb e c o m ean e wa c t i v ef i e l d t h es t u d yo ft h en e u r a ln e t w o r k s - b a s e dp a t t e r nr e c o g n i t i o ns y s t e mi s v e r y i m p o r t a n t ,n o to n l yt ot h ed e v e l o p m e n to fn e u r a ln e t w o r k st h e o r i e s ,b u ta l s ot o t h ea p p l i c a t i o no f t h e p a t t e mr e c o g n i t i o nt e c h n i q u e s t h e m u l t i l a y e rf e e d - f o r w a r db a c k - p r o p a g a t i o nn e u r a ln e t w o r kh a sf o u n da w i d e l ye x p a n d i n gr a n g eo f a p p l i c a t i o n s i th a sb e e nu s e de x t e n s i v e l yo no c r t h es o f mp r o p o s e db yk o h o n e ni sa l s ou s e di nt h ea r e ao fp a u e r n r e e n g n i t i e nf o ri t ss t r o n go r g a n i z i n ga b i l i t yo nt o p o l o g ya n di t sr o b u s t n e s s t h ew o r kw eh a v ed o n ei sm a i n l yf o c u s e do nt h e f o l l o w i n gh v op r o b l e m s f i r s t ,t h eg e n e r a l i z e di n v e r s em a a i xh a sm a n yi m p o r t a n ta p p l i e a f i o n ss u c h a sn e u r a l n e t w o r k c o m p u t i n g b u t a t p r e s e n t t h e r ei sn oc l e a ra n d e a s y t o - u n d e r s t a n dt r e a t m e n to ni t i no a rc o u n t a y i np a p e r 3 ,t h eg e n e r a l i z e d i n v e r s em a l r i xi sd e f t n e d b ya b s t r a c ta l g e b r am e t h o d , w h i c hi s d i f f i c u l tt o u n d e r s t a n da n dt on s e i nc h a p t e r2o f t h i sp a p e r , w e t r yt og i v eac o m p r e h e n s i v e t r e a t m e n to f t h ed e f i n i t i o na n d p r o p e r t i e so f g e n e r a l i z e di n v e r s em a t r i xb yu s eo f s o m es i m p l ea n d e a s y - t o - u n d e r s t a n d t o o l ss u c ha sm a t r i c e sa n di r n e rp r o d u c t sa d i s c u s s i o no n i 协a p p l i c a t i o nt on e u r a ln e t w o r k si sa l s op r o v i d e d s e c o n d l y , a sm e n t i o n e da b e v e ,t h en e u r a ln e t w o r k si s h a sb e e nu s e d e x t e n s i v e l yo no c i lb u t 山ep r o b l e mi st l l a tm a n yr e s e a r c h e r sw o r ku n d e rt h e h y p o t h e s i st h a tt h ec h a r a c t e r sw e r es e g m e n t e dp e r f e c t l y m a t sm o r e f e w p a p e rs p e c i a l l yd i s c n s st h er e c o g n i t i o no f s y m b o l si nm a t h e m a t i c a le x p r e s s i o n s b a s e d0 1 1t h en e u r a in e t w o r k s a u t o m a t i e r e c o g n i t i o n o fm a t h e m 撕c a l e x p r e s s i o n s i so n eo ft h e k e y v c h i d e si nt h ed r i v et o w a r d s t r a n s c r i b i n g d o c u m e n t si ns c i e n t i f i ca n d e n g i n e e r i n gl i t e r a t u r e si n t oe l e c t r o n i cf o r m i nt h i s p a p e r , t h es e g m e n t a t i o n a n dt h e r e c o g n i t i o n o fm a t h e m a t i c a l e x p r e s s i o n sa r ec o n s i d e r e d ,b a s e do nt h eb pn e u r a ln e t w o r k s ,s o f mn e t w o r k a n dm o m e n t t e c h n i q u e i t c o n s i s t so ff o u r m a j o rs t a g e s : p r e t r e a t m e n t ,s y m b o ls e g m e n t a t i o n ,s y m b o l r e c o g n i t i o n a n d s t r u c t u r a la n a l y s i s m 英文摘要 i n c h a p t e r 3 ,t h es e g m e n t a t i o n o ft h em a t h e m a t i c a l e x p r e s s i o n s i s p r o c e e d e d a f t e rt h e p r e t r e a t m e n t w e u s et h r e e s e g m e n t a t i o n m e t h o d s a c c o r d i n g t ov a r i o u sf e a t u r e so ft h e s y m b o l s t h i s p a p e r i sf o c u s e do nt h e s p e c i a l s 、i n b o l s s e t 一一a t l l e m a t i c a l e x p r e s s i o nw h i c hh a s1 3 4p a t t e r n s s oam u l t i - s t a g en e u r a ln e t w o r k s ( m s n n ) i s a d o p t e d i n o r d e rt oa c c o u n tf o r t h e r e c o g n i t i o n o f m a t h e m a t i c a ls y m b o l sw i t ht r a n s l a t i o n ,r o t a t i o na n ds c a l i n gi na c e r t a i nr a n g e ,w ep r e p r o c e s sb ym o m e n t t e c h n i q u eag r e a tn u m b e r o fe x a m p l e st oc h o o s eaf i n a ls e to f r e p r e s e n t a t i v e 打a m i n gs e t a n d b e c a u s et h er e c o g n i t i o ni sl i a k e dw i t hs e g m e n t a t i o n ,t h es y s t e mp r o v e st ob e m o r e p r a c t i c a l d u et ot h el i m i t a t i o no ft h ee x a m p l e ss e l e c t e da n dt h ea l g o r i t h m su s e d ,t h e m o d e lw e p r o p o s e ds t i l ln e e d sf u r t h e ri m p r o v e m e n t f o rp r a c t i c a la p p l i c a t i o nb u t t h er e s u l t sh a v es h o w nt h a tt h en e u r a ln e t w o r k sc a nw o r ks u c c e s s f u l l yo nt h e r e c o g n i t i o no f m a t h e m a f i c a ls y m b o l s 第一章文献综述 第一章文献综述 1 1 神经网络简介 人工神经网络( a r t i f i c i a ln e u r a ln e t w o r k s ) 是一门新兴的交叉学科, 是模拟人脑智能结构和功能而开发出来的非线性信息处理系统。从结构上 看,该系统是由大量的简单单元形式神经元高度错综复杂联结而成的。 拓扑结构、结点特性和学习算法是确定一个网络的三个要素。神经网络具 有学习能力、并行性、容错性及易于硬件实现等基本特征,主要用于解决 模式分类、函数逼近和数据压缩等问题。近二十年来,神经网络得到了迅 猛的发展,在众多领域得到了广泛的应用。 a l e k s a n d e r 和m o r t o n 1 l 在广义上定义了一种神经网络。他们给出的定 义如下: 神经计算是对具有自适应节点的网络的研究,通过对任务的学习过程, 存储经验知识并使其可用。 模仿人的大脑,神经网络也可以具有可塑性( 修改自身拓扑结构的能 力) 。人工神经网络的学习算法是以一种有规律的方式用于突触权值的过 程。下面是h e c h t - n i e l s e n 2 l 给出的神经网络定义: 神经网络是一种并行的分布式信息处理结构,它通过称为连接的单向 信号通路将一些处理单元( 具有局部存储并能执行局部信息处理能力) 互 连而组成。每一个处理单元都有一个单输出到所期望的连接。每一个处理 单元传送相同的信号处理单元输出信号。处理单元的输出信号可以是 任种所要求的数学类型。在每一个处理单元中执行的信息可以被任意定 义,但必须是完全局部的,即它必须只依赖于处理单元所接受的输八激励 信号的当前值和处理单元本身所存储记忆的值。 神经网络的基本单元 为形式神经元( 如图1 1 ) , 它是一个多输入单输出的 非线性阈值器件。以r , z 2 ,z 。表示某一神 经元的 个输入;矽。表示 * 一,( f n 自一b ) 第,个神经元与第j 个神经元的图l1 形式神经元模型 第一章文献综述 突触连接强度,其值称为权值;a ,表示第7 个神经的输入总和:y 。表示 第,个神经元的输出:只表示神经元的闽值,则有下述关系式 h 4 。= 。厂目;, ( 1 l 1 ) = 1 儿= f 。) 。( 1 l 2 ) 式中,f ( a 。) 表示神经元输入一输出关系的函数,称为作用函数或活化函 数。 除神经元特征外,网络的拓扑结构也是神经网络的一个重要特征。神 经网络发展到今天,虽然己产生了数十种模型,但已有的网络模型大致可 以分为三类:即前馈网络( f e e d f o r w a r d n n s ) ( 图1 2 ) 、反馈网络( f e e d b a c k n n s ) ( 图l3 ) 和自组织网络( s e 峪o r g a n i z i n gn n s ) ( 图1 4 ) 。 溪禽 图1 2 具有一个隐层的前馈网络圉13 单层全连接反馈网络 而b p 算法是前馈网络最重要应 用最普遍的学习算法。由b p 算法( 反 向传播算法) 训练的多层前馈网络,是 神经网络分类器中最普遍、最通用的形 式之一。已经证明的基本结论是:由一 个隐层和非线性活化函数组成的多层感 知器网络,能够逼近相当复杂的决策边 1 2p 界。给定一个表示输入模式的由一系列图1 4 自组织特征映射( s o f m ) 特征组成的输入矢量及与之相对应的代表正确分类的输出( 教师信号) ,通 过网络的循环迭代,搜索到在误差允许范围内能够对输入模式进行正确分 类的权空间的过程,称之为( 对输入模式) 学习或训练。网络的学习过程 实际上就是对输入模式的特征提取的过程。 通过学习获取知识并改进自身性能是神经网络的一个重要特点。这种 第一章文献综述 性能的改善通常是按某种预定的度量通过不断调节自身参数( 如权值) 随 时间逐步达到的。学习方式有三种:有教师学习、无教师学习和强化学习。 神经网络的学习算法也是其非常重要的组成部分。通常有三种学习规则: h e b b 学习、误差修正学习和竞争( c o m p e t i t i v e ) 学习。其中,误差修正学 习算法也称j 学习规则,是神经网络学习中最重要的方法之一,像感知机、 b p 学习均属此类。 神经网络在经历r4 0 多年的曲折发展之后,在信息科学领域等许多应 用方面已显示出巨大潜力和广阔的应用前景。神经网络的如下特性在其广 泛的应用中起着重要的作用: 自适应性强有力的学习算法和白组织规则使它能在不断变化的环 境中对每一要求进行自适应。 1 线性处理具有执行非线性任务和去除噪音的能力,使它能够很 好地用于分类和预测问题。 并行处理大量广泛互连的处理单元组成的结构,提供了并行处理 和分布信息存储的能力。 神经网络模式识别方法是进几年兴起的模式识别领域的一个新的研究 方向。由于神经网络的高速并行处理,分布存储信息等特性符合人类视觉 系统的基本工作原理,具有很强的自学习性,自组织性,容错性高,非线 性高,鲁棒性强,并具有联想记忆功能和推理意识功能等,能够实现日前 基于计算理论层次上的模式识别理论所无法完成的模式信息处理工作,所 以,采用神经网络进行模式识别,突破了传统模式识别技术的束缚,开辟 了模式识别发展的新途经。同时,神经网络模式识别也成为神经网络最成 功最有前途的应用领域之一。研究神经网络模式识别系统,无论对神经网 络理论的发展,还是对模式识别技术的实际应用都有特别重要意义。 1 2b p 网络结构及算法简介 b p ( b a c k p r o p a g a t i o n ,反向传播) 算法是训练多层前传网络的常用 算法,它的完整理论是由r u m e l h a r t 等科学家于1 9 8 6 年提出的。尽管随着 神经网络科学的发展产生了许多优秀的算法,而b p 算法本身又存在收敛 速度慢,易陷入局部极小值和推广能力差等不足。但又由于其简单易行, 计算量小,并行性强,数学基础强等优点,目前仍是多层前馈式网络训练 的首选算法之一,并且已被人们广泛地应用于神经网络模式识别( 特别是 图像及字符的识别) 问题。图1 5 给出了通常的带有一个隐层的b p 网络模 型。 其中,o 。表示输出单元,巧表示隐单元,f 。表示输入单元。从输入单 兰二童塞堕堡堕 一 元到隐单元j 的连接权为”扛,从隐单元,到输出单元f 的连接权为, = ( ,w ) 表示所有的连接权。单元下标i = i “2 j 总是针对输出单元的, j = l ,2 j 针对隐单元,k = l , 2 ,k 对应输入单元。我们用上标摩示不同的 输入模式,用p 表示输入模式数( 旷l 2 - 尹 ,g l 和g2 分别对应于适当选 定的隐层和输出层活化函数。 输出层 连接权 隐含层 连接权 输入层 图15 带有一个隐层的b p 网络模型 对给定的输入模式,隐单元,的输入为 ( 1 3 1 ) 这里, w 辟为对应于输入单元和隐单元,的连接权,初始值为在适当范 围内产生的随机值。隐单元,的输出为 = 蜀( 形) = 蜀( w 肚彰) , ( 132 ) = l 其中,g ,为隐层活化函数,一般取为s i g m o i d 函数。 对输出单元i 的输入为 ( 13 3 ) 鬈 冲 w 。 i i 掣 、,彭 肛 w 。 ,tg ,川 i i ,!乏 = 日 第一章文献综述 形,为对应于隐单元j 和输出单元i 的连接权,在一定范围内随机初始。 最终的输出为 d ? = 9 2 ( 日? ) = 9 2 ( w , g ( w 业掌劫。 ( 134 ) j = 1 = 1 g ! 为输出层活化函数。0 7 为相应于模式及输出单元i 的实际输出。 对于反向传播算法【3 j ,通常使用的网络误差是熟知的均方差。相应于 任一输入模式和输出单元f ,定义在线误差( 或瞬时误差) 函数为: 点“) = 圭( 一吖) 2 = 三( 甜一g :( 莓占。( 莓w 止嚣) ) 一( 1 3s ) 秽为对应于输入模式a 的期望输出( 教师) 。e ”( 6 9 ) 为对应单个输入模 式的误差函数,它关于权w 及矽可微。 相对输出单元,总误差函数( 又称能量函数) 为: e ) = ”) = 去( 一o ? ) 2 , ( 136 ) p 2 l口2 l 相应于e “( 彩) ,e ) 是关于所有输入模式善1 善9 的总误差函数。 作为隐层和输出层的活化函数, g t 和9 2 通常采用s i g m o i d ( s 形) 函数。常用的s i g m o i d 函数是指数型函数 删3 鬲面1 丽( ”o ) , ( 1 3 7 ) 或正切型函数 g ( x ) = t a n h ( 肛)( o ) 。 ( 138 ) b p 算法学习的实质是:采用优化理论中普遍使用的梯度下降法去寻找 权向量( 由各个权值及阐值做分量所构成) ,使得误差函数达到最小, 从而最终达到某一( 全局的或局部的) 极小值。以在线误差函数( 1 35 ) 为例,对于隐单元到输出单元之间的连接权矩阵及输入模式“有 兰二雯塞丛叁堕 = - 叩筹训j , ( 1 ,- 9 ) 其中,r o ,为适当选定的学习步长, 5 7 = 9 2 ( a ? ) ( f ? 一o y ) , ( 1 3 1 0 ) 同理,对于从输入单元到隐单元之间的连接权矩阵w ,利用链式法则可得 蛳辟一碍筹一玎筹筹= r f i j q 。? , sm 蛳辟一碍瓦一玎砑菇2 。,o3 n 其中, 彰= 9 1 ) ( 彬匹影。 ( 1 3 1 2 ) 这样我们就可以对权& ) = ( 矽,w ) 实现实时更新: 一“= o d + ,( 13 1 3 ) 彩= ( 巩w ) 。 通过不断地迭代更新,最终网络将收敛到: e 如) = e 9 ) = ( 秽一掣) 2 s = l冉= 1 占为预先设定的收敛标准。 以上我们以“在线”( o n l i n e ) 的方式作为对权空间进行学习训练的 更新规则,即在输入端提供模式之后,利用在线误差函数( 1 3 5 式) 实 时更新所有的权。也就是说,每一单独的模式矢量产生一个梯度,算法按 照输入模式的顺序沿着每一个梯度来进行,每一次更新都是局部的。本文 就采用了在线的方法,图1 6 给出了b p 算法的流程图。虽然目前对于“在 线”式b p 算法( o n l i n eb a c kp r o p a g a t i o na l g o r i t h m ) 收敛性还没有给出 明确的证明,但很多学者已经开始着手进行这方面的工作,并取得了一定 的成果。其中,吴微和许跃生在t 9 9 9 年鲍工作中1 7 2 】,给出了采用“在线 梯度法”( o g m ) 作为学习算法的单层感知器的弱收敛定理( 关于g ) ) 和强收敛定理( 关于翻) ,并精确地估计出了算法的收敛速度;而进一步 的工作多层网络的o g m 收敛性的证明也已经展开。 另种更新方式是使用基于总误差函数( 1 3 ,6 式) 得到的“批”方式, 即在提供所有的输入模式之后才更新权。由于误差调节要在所有输入模式 - 6 m m 3 3 ( ( 笙二兰茎堕堡堡一 i 二取平均,n i l :“批”方式在数值方面更稳健,而“在线”方式对单独模 式中的噪声更敏感。但在样本数据比较庞杂的情况下,“批”方式显然要付 出更高的计算代价,对硬件的要求更高。一般认为,“在线”式的更新规则 在计算i l i i :,效率和精度上都较“批”方式优越,并且由于其随机。i 峰i i i i i 点,也有利于在迭代过程中i i i i 局部极小。 图1 6b p 算法流程图 1 3 自组织特征映射( s o f m ) 生理学基础实验表明:某一个外界信息所引起的并不是对一个神经细 胞的兴奋刺激,而是对以某一个细胞为中心的一个区域的神经细胞的兴奋 刺激,并且这种刺激的强度不是均一的,有强弱之分。如图l7 所示,大 脑神经的刺激趋势与强度呈墨西哥帽 m e x i c a nh a t ) 的形状。神经元受兴 奋刺激的强度,在区域中心最大,随着区域半径的增大,强度逐渐减弱, 远离区域中心的神经元相反要受到抑制性作用。 1 9 8 1 年,由芬兰学者k o h o n e n 提出了一个比较完整的、分类性能较好 7 第一章文献综述 的自组织特征映射( s e l f - o r g a n i z i n gf e a t u r em a p ) 神经网络( 简称s o f m ) 方案。模型基于实际神经细胞中的一种特征敏感细胞在外界信号刺激下, 形成对某种特征特别敏感,它们这种特性的形成是通过自组织得到的。神 经细胞模型中还存在一种细胞聚类的功能柱,它是由多个细胞聚合而成的t 在接受外界刺激后,它们会自动形成,一个功能柱中的细胞完成同一种功 能。s o f m 网络的结构如图l8 所示。 网络由输入层和竞争层组成。输入层由p 个输入神经元组成,竞争层 由门门个输出神经元组成,且形成一个二维平面阵列。输入层各神经元 与竞争层各神经元之间实现全互连接。有时,竞争层各神经元之间也实行 相邻神经元侧抑制连接。s o f m 网络根据学习规则,在无教师示教的情况 下,通过对输入模式的反复学习,捕捉住各个输入模式中所含的模式特征, 并对其进行自组织,在竞争层将分类结果表现出来。这种表现形式方式与 其它类型的神经网络的区别是:它不是以一个神经元或着一个神经元向量 来反映分类的结果,而是以若干神经元同时反映分类结果。与这若干神经 元相连接的权向量虽略有差别,但这些神经元的分类作用基本上是并列的, 即其中任何一个神经元都可以代表分类结果或近似分类结果。一旦由于某 种原因,某个神经元受到损害( 在实际应用中,表现为连接权溢出、计算 误差超限、硬件故障等) 或完全失效,剩下的神经元仍可以保证所对应的 记忆信息不会消失。从这一点看,s o f m 网络基本上模拟了大脑神经细胞 对外界信息刺激的反映,克服了所谓“祖母细胞”现象。另外这种网络之 所以被称为特征映射网络,是因为网络对输入学习模式的记忆不是一次性 完成的,而是通过反复学习,将输入模式的统计特征“溶解”到各个连接 权上的。所以这种网络具有较强的抗干扰能力。 ,。f 1j 图l7 墨西哥帽函数 1 2p 图18 自组织特征映射( s o f m ) s o f m 网络的学习及检测过程如下。 将输入样本记为: x ”= x l vz :”,x 了p = 1 , 2 ,u , 第一章文献综述 其中上标v 表示不同的输入样本u 为输入样本数,尸为输入神经元数。 与输出神经元j 相对的权矢量为: m ,= m j i ,m 川,m j = 1 ,2 ,2 n , 其中,” 为输出神经元数。 相对第y 个输入样本,神经元j 的输出为:r ,j = 1 ,2 ,2 行。 学习过程采用自组织竞争机制。选取权矢量与输入样本有最小欧氏范 数的输出神经元作为获胜神经元。用j ( r ) 来指定获胜神经元标号有 f 僻。) 一当j p 。一”l 图象倾斜角度的调整 符号分割) 利用神经网络进行符 号识别 符号重组。这一章主要讨论数学公式符号的前期处理和分割过 程,分割后得到的符号的识别将在第四章讨论。 3 1 印刷品的扫描输入及其前期处理 在通常在字符识别中,破坏符号轮廓特征的因素主要包括毛刺、污块、 飞自点、连笔、断笔等。这一阶段的任务是把电子信息作技术处理,减少 不必要的象元,使字形规格化、字符特征更加突出,从而便于计算机的分 割与识别。 3 1 1 扫描仪输入 首先要将印刷在书面上的英文文档经光电转换设备扫描仪转换成 2 9 第三章数学公式符号的分割 电信号,经过驱动程序软件处理后,形成2 5 6 级灰度的数字图象,成为我 们这个数学公式识别系统的输入。在这个步骤中,原英文文档的印刷质量 纸张的光洁程度,扫描仪的分辨率等因素都直接关系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 西藏支教活动方案
- 河南焊工考试题及答案
- 国企金融考试题及答案
- 关于林果考试题及答案
- 股票期权考试题及答案
- 高考日语考试题及答案
- 幼儿园教学教案设计:安全用书包
- (正式版)DB15∕T 3643-2024 《气象灾害风险评估技术规范 暴雨》
- (正式版)DB15∕T 3393-2024 《绿色勘查技术规程》
- 动态血压考试题及答案
- 小学学校作业管理优化实施细则(2025修订版)
- 公务员面试人际关系题人际关系面试题及答案
- 青海招警考试真题及答案
- 酷家乐教学课件下载
- 自动化生产线安装、调试和维护技术 第2版 教案全套 模块1-7 认识柔性自动化生产线-全线运行控制方案设计与调试
- 浙江名校协作体(G12)2025年9月2026届高三返校联考政治(含答案)
- 2025至2030年中国鹿茸药品行业市场发展现状及投资方向研究报告
- Unit 1 This is me!第5课时 Integration 说课稿- 2024-2025学年译林版(2024)七年级上册英语
- 2025-2026学年苏教版小学数学四年级上册(全册)教学设计(附目录P197)
- 《中华人民共和国学前教育法》试题库及答案
- 2025年住院医师规范化培训考试(超声诊断科)试题及答案
评论
0/150
提交评论