




已阅读5页,还剩66页未读, 继续免费阅读
(计算机软件与理论专业论文)属性论指导、含有反馈机制、基于内容的图像分类.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 电控系统是起重设备的中枢部分,电控系统的性能直接决定整个起重设备的性 能。传统起重机电控系统不管是采用有级调速还是无级调速,直流调速还是交流调 速,都存在一定的问题。为了适应起重设备电控系统的发展趋势,本文采用开关磁 阻电动机调速系统( s w i t c h e dr e l u c t a n c ed r i v e ,简称s r d ) 作为起重机的驱动系 统,针对桥式起重机,提出了一种新的基于s r d 调速系统的电控系统。 s r d 是一种新型电机调速系统,具有良好的调速性能和四象限运行能力,控制 方法灵活,可控参数多。本文在分析了开关磁阻电机( s w i t c h e dr e l u c t a n c em o m t o r 简称s r ) 线性模型和非线性模型的基础上,建立了s r 电机的s i m u l i n k 仿真模型, 并采用不同的驱动控制方式对s r d 调速系统进行了动态仿真,分析了各种驱动控制 方式的优劣。 分析和研究了港口起重设备的现状和发展趋势及开关磁阻电机调速系统的优 缺点。对开关型磁阻电机调速系统在港口起重设备中的应用进行了探讨,对方案的 可行性进行了论证。 本文针对起重设备对调速驱动系统的要求对s r d 调速系统进行了软硬件设计, 硬件设计中控制器采用数字信号处理器,功率电路采用i p m ( i n t e l l i g e n tp o w e r m o d u l e ) 智能功率模块,软件设计采用模块化设计方法,增加了程序的可读性和可 移植性。 由于起重机的负载没有规律,并经常承受过载,尤其是起升机构拖动电机要频 繁的起动、制动并且经常工作在正反转状态,工作环境恶劣。本文采用s r d 调速系 统来改进原桥式起重机电控系统,提出了如何改进的方案,并将其与变频调速控制 进行了对比分析。针对起重机对拖动系统的要求,提出低速电流斩波和高速电压斩 波相结合的开关磁阻电机控制方式。 关键词:港口起重设备,s r d ,d s p ,仿真 a b s t r a c t w t 胁t h eo v e r a r c h i n gd e v e l o p m e n to fi n t e r n e tr e t i e v a ti n d u s t r yt h e s ey e a r s , l i m i t a t i o no fa t t e n t i o no nw e b s i t er e t i e v a lh a sr e a d yb e e nt r a n s e n d e di nt e r m so f r e t r i e v a lc o n t e n t f l e t i e v a l so fs u c hc o m p l i c a t e di m f o r m a t i o na sm u s i c , i m a g e 。v e d i o a r ec o n s t a n t l yp o p p i n gu p ,w h i c hl e a d st ot h ee x t e n s i v ea p p l i c a t i o no fi m a g e r e t i e v a lt e c h n i q u e a tr e a s e n t s i n c et h et h et e x t - b a s e dp i c t u r er e r i e v a lt e c h n i q u e , w h i c hr e l i e so nk e y w o r da sac l u ew i t hl e s sr e s o u r c es p e n d i n g ,i sa d o p t e di na l lt h e m a i n s t r e a ms e a r c he n g i n e s 。c o n t e n t b a s e dr e t i e v a lp i c t u r et e c h n i q u e 、i ,i t hm o r e p r e f e r a b l es e a r c hr e s u l t si sm o r ea d a p t i v et ot h ed e m a n do fi n t e m e ti m a g er e t i e v a l d e v e l o p m e n ta n dh a sp r a t l c a ls i g n i f i c e n c e t h i sp a p e rr e a l i z e st h ec o s te f f e c t i v e p s e u d o s e m a n t i c c o n t e n t - b a s e d i m a g e r e t r i e v a l s y s t e m ,w h i c h i sc a l l e d i n t e m e t - o r i e n t e dp i c t u r er e t r i e v a lt e c h n i q u e ( i p 明i nt h i sp a p e r a t t r i b u t et h e o r yp r o p o s e db yp r o f f e n g ,i sam e t h o do fa r t i f i c i a li n t e l l i g e n c e u n d e rt h eg u i d e l i n eo fr u l e o f q u a l i t i t i v ea n dq u a n t i t i v ec h a n g ei n d i a l e c t i c m a t e r i a l i s m 骶t h e o r ya i m sa tf i n d i n go u tt h ee s s e n c eo fo b j e c tv i ai t sq u a l 黼v e a n dq u a n t i t i v ea t t r i b u t ea n dp u tf o r w a r das e r i e so fm e t h o d so fp a t t e mr e c o g n i t i o n 。 m a c h i n el e a m i n g ,e v a l u a t i o na n dd e c i s i o n - m a k i n ge c t o nt h eb a s i so fq u a l i t i t i v e m a p p i n g t h i sp a p e ru s e sa t t r i b u t et h e o r y a sr e f e r e n c ew h e nb u i l d i n gf e a t u r e e x t r a c t i o na l g o r i t h mo fi p r ts y s t e ma n da p p l i e st h e 。a n a l y s i sa p p r o a c ho fa t t r i b u t e c o o r d i n a t e 。i n t ot h er e t r i e v a lo fu s e r sp s y c h o l o g i c a lp r e f e r e n c e t h em a i na s p e c t sd e a l tw f f ht h i sp a p e ra r es t r u c t u r e da sf o l l o w s : ,p r o p o s i n gt h ec o n c e p to f 。p s e u d o s e m a n t i cr e t d v a l d e s i g n i n ga n dr e a l i z i n g t h ec o m p l e t e di p r ts y s t e m ,ak i n do fc b i rs y s t e mf o c u s i n gi t sr e t r i e v a lo nt h e i n t e g r a t i o no ff o u rf e a t u r e sa sc o i o u r , t e x t u r e 。s h a p ea n ds k e t c hw i t hp r e f e r a b l e a c c u r a c y ,h i g h e rc o v e r a g ea n df a s t e re x e c u t i o ns p e e d 2 i m p r o v i n gt h ei m a g ef e a t u r ee x t r a c t i o na l g o r i t h m 。a d o p 耄 n g 搬eh s vc o l o u r s p a c e 。w h i c hj sm o r ef i t t e dt oo c u l a ri m a g e 。t oe x p r e s st h ep r o c e s so fc o l o u r , t e x t u r e ,s h a p ea n ds k e t c he x t r a c t i o n 。d i v i d i n gt h ec o k ) u r s p a c ei n t ol e v e l so f 2 18 x 3 x 3 w h i c hn o to n l yc o n t a i n st h e c o l o u rj m f o r m a t i o nb u ta l s oh a sf e w e r d i m e n s i o n st h a nt h et r a d i t i o n a l2 5 6 - l e v e lg r a ye x p r e s s i o n t h ec o m p l e x i t yo ft h i s f e a t u r ee x t r a c t i o na l g o r i t h mi nc o n t r o l l e dw i t h i n o ( mx t v ) 3 i nt e r m so ff e t u r ee x t r a c t i o no fc o l o u r , s h a p ea n ds k e t c h 。p r o p o s i n gt h e 。t h r e e - l e v e ls k e t c h i n gm e t h o d 。a n d 。d i f f e r e n c ea l g o r i t h mo ns i m p l eb l o c kl e v e l w h i c hh a v ep r e f e r a b l er u n n i n ge f f i c i e n c ya n dr o b u s t n e s s 4 a p p m n gt h e 。a n a l y s i sa p p r o a c ho fa t t r i b u t ec o o r d i n a t e i n “a t t r i b u t et h e o r y t or e c o r du s e y sb e h a v i o ri nt h ep r o c e s so fr e t r i e v a la n dd i s t i t h eu s e d s p s y c h o l o g i c a lp r e f e r e n c e 。w h i c hc a np r o v i d em o r es a t i s f a c t o r yr e t r i v a l r e s u l t sf o r t h eu s e r s 5 。i n t r o d u c i n gt h ef e e d b a c km a c h a n i s mf o rp s y c h o l o g i c a lp r e f e r e n c et e a m i n g , w h i c hm a k e st h er e t r i e v a lr e s u l t ss t e a d i l ya p p r o a c hu s e r se x p e c t a t i o n k e y w o r d s :i p r t 。p s e u d o s e m a n t i cr e t r i v a l 。c o n t e n t - b a s e di m a g er e t r i e v a l , a n a l y s i sa p p r o a c h o fa t t r i b u t ec o o r d i n a t e ,t h r e e - l e v e ls k e t c h i n gm e t h o d , d i f f e r e n c eo fh s va v e r a g ev a l u eo ns i m p l eb l o c kl e v e l ,f e a t u r ee x t r a c t i o n , p s y c h o l o g i c a lp r e f e r e n c e ,f e e d b a c km a n h a n i s m 3 徐飘( 计算税软俘鸯理论) d i r e c t e db yj i a l if e n g 论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。 论文中除了特别加以标注和致谢的地方外,不包括其他人或其他机构已 经发表或撰写过的研究成果。其他同志对本研究的启发和所做的贡献均 已在论文中作了明确的说明并表示了谢意。 作者签名: 论勿乙 论文使用授权声明 本人同意上海海事大学有关保留、使用学位论文的规定,即:学校 有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以上网公 布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论 文。保密的论文在解密后遵守此规定。 作者躲企丝导师躲逸觑2 吼巫丛! 生 第1 章概述 互联网上的信息浩如烟海,人们需要行之有效的途径在众多的信息资源中检索出 自己所需的。伴随着这种需求,互联网搜索业务得到了空前的发展,商业价值巨大。 目前,在访问量距世界前1 0 名的商业网站中,以搜索业务为主营业务的网站就有4 家,其它排名靠前的网站也有很多提供了搜索业务( 表1 3 ) 。 表1 12 0 0 7 年6 月商业网站访问量排名( 部分) 排 商业网站 搜索业务范围 名网页 图像音乐视频 1y a h o o c o m 3 g o o g l e c o m 5l i v e c o m 7b a i d u t o m 信息来源:h t t p :v n w a l e x a a o m 互联网搜索业务不再仅限于网页、网站的搜索,其搜索范围已经拓展到音乐、图 像、视频等复杂信息。其中,图像搜索已经成为仅次于网页搜索的第二大搜索服务。 大量的图像正在不断的涌现在互联网上,人们渴望一种方便的浏览、检索手段。 1 1 1 互联网图像检索研究的意义 互联网的繁荣源于超文本网页和浏览器的普及,在一个超文本网页中,最基本的 信息是文字和图片。显然,直观地看图像比文字包含更多的信息。 图1 1 关键字匹配图像搜索示意图 长期以来,由于受到技术条件、商业规律的制约,网页搜索服务一直依赖于“关 键字匹配”检索。现在,虽然各商业搜索引擎都推出了图像搜索功能,但其实现原理, 依然是利用对图片所在网页的相关文本信息进行“关键字匹配”( 图1 1 ) 。 搜索引擎派出的“爬虫”( 一种检索互联网资源的程序、进程,也称为“网络蜘 蛛”) ,通过对网页的h t m l 语法进行分析,凭借经验可从“ 、 , 、 ”等标记中提取可能与图片相关的描述信息。这些信息由 于各种原因,往往是不可靠的,甚至与对应图像没有内容上的联系。因此,以它们为 依据搜索出来的图像信息,会有很大的差错,而这种差错只能依靠用户自己的双眼来 纠正。 自二十世纪7 0 年代始,有关图像检索的研究就已开始,当时主要是基于文本的 图像检索技术( t e x t b a s e di m a g er e t r i e v a l ,简称t b i r ) 。利用文本描述图像的 特征,“关键字匹配”就是一种t b i r 技术。9 0 年代以后,出现了对图像的内容语义, 如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检 索( c o n t e n t b a s e di m a g er e t r i e v a l ,简称c b i r ) 可是,到了2 0 0 7 年为止,c b i r 技术仍然没有被运用在互联网图像搜索上。这里 的困难有两个:一方面:c b i r 技术的实现成本远高于t b i r ;另一方面,要在关键字 和图像之间建立联系涉及到了“语义”理解问题。事实上,目前几乎没有商业网页搜 索引擎提供基于语义的搜索,更不用说将基于语义的检索用语多媒体信息搜索了。众 多搜索引擎服务商在这两个团难前止步了。 因此,寻找一种关键字为线索、资源开销较小、搜索结果较好的基于内容的图像 检索技术以适应互联网图像搜索发展的需要,有很现实的意义。 本文把我们要寻找的这种检索技术称为“面向互联网搜索的图像检索技术” ( i n t e r n e t o r i e n t e dp i c t u r er e t r i e v a lt e c h n i q u e ) ,简记为i p r t 。 1 1 2i p r t 是互联网视频搜索的基础 视觉是人类接收外界信息的重要手段。视觉接收信息的基础是静态图像,视频信 息其实是一组时间有序的静态图像( 图1 2 ) 视频流由成千上万的图像帧组成,帧 是组成视频的最小单位,如果对每一帧都进行单独处理,则索引和检索的效率会很低 幸运的是,视频通常是由大量的逻辑单位或分块组成,我们称这些分块为视频镜头 2 一个镜头是相邻帧的短序列,它描绘同一场景,表示一个摄像机动作,一个事件或连 续的动作。任何视频都是由镜头衔接起来的,镜头是视频检索的基本单元。关键帧是 表达镜头内容的代表帧,是从视频数据中抽取出来的、能概括镜头内容的静态图像。 图1 2 典型视频结构图 因此,有人提出了基于关键帧的视频检索技术,其基本思想是嘲:a 运用场景 转换检测( s 0 1 ) ) 技术将原始视频流( v i d e o ) 分割成长短不一的镜头单元( s h o t ) ;b 运 用关键帧抽取技术对每个镜头单元提取关键帧或代表帧( r 帧) 。并对这些r 帧进行特 征提取颜色、纹理、形状等特征) ,建立索引,存入数据库;c 用户运用浏览、草 图或范例等手段对索引数据库进行匹配运算,检索出符合查询要求的关键帧图像,最 后系统提供的结果是与关键帧相关联的镜头序列或在线播放和下载相关视频。 可见,根据这一技术,视频检索问题最终归结为图像检索问题。由于互联网上基 于内容的视频搜索服务,目前也是限于“关键字匹配”技术的。因此,i p r t 的研究 可以作为互联网视频搜索研究的基础。 1 2 图像检索方法的研究综述 图像检索的目的就是为了解决图像数据库与用户需求的匹配和选择问题。图像检 索( 又称函像查询) 就是要提供一种图像的组织形式和检索方法,以方便用户的查询 从这个意义上看,图像检索与通常的关系数据库的文本检索是相似的。但是由于图像 本身包含的信息量非常丰富,而关系数据库是为文本和数值信息的组织和检索服务 的,并不适合于处理图像信息,所以必须寻求一种新的数据组织形式和检索方法。 1 2 1 基于文本的检索方法 基于文本的图像检索技术( t e x t b a s e di m a g er e t r i e v a l ,简称t b i r ) 的研究 始于上世纪7 0 年代人们那时尝试利用关系型数据库管理系统来管理多媒体数据, 3 由人工去注解多媒体数据,再利用基于文本的数据库管理系统来检索图像。这种思路 虽然可以利用许多比较成熟的文本检索技术,但也存在着其缺点“”:一方面,人工注 解工作量非常大,尤其是对于大型的多媒体数据库;另一方面,人工注解中不可避免 的主观性和不准确性可能导致检索失败。同时,图像的某些可视信息,例如:纹理,形状 等,很难用文本准确描述。 1 2 2 基于内容的检索方法 上世纪9 0 年代,出现了对图像的内容语义进行分析和检索的图像检索技术,即 基于内容的图像检索( c o n t e n t b a s e di m a g er e t r i e v a l ,简称c b i r ) 。鉴于t b i r 技术的缺陷,c b i r 技术逐渐被人们所重视。这种技术由机器自动分析抽取含图像内 容的底层视觉特征:颜色( c o l o r ) 、纹理( t e x t u r e ) 、形状( s h a p e ) 、草图( s k e t c h , 即:对象的位置和相互关系) 等,对数据库中图像和查询样本图像在特征空间进行相 似匹配,检索出与样本相似的图像o ”1 。在底层的视觉特征上,特征的提取主要采用 计算机视觉和数字图像处理技术,而图像相似性的匹配主要利用模式识别技术。由于 包含了图像内容的可视特征,相对于传统的基予文本的检索方式,这种方式提高了检 索效率和检索的准确率。 ( 1 ) 颜色特征提取与匹配方法有:直方图相交法、距离法、中心距法、参考颜色表 法、累加颜色直方图法。这方一特征的研究最多,效果也较好。通常,累加直 方图法要优于一般直方图法,该法对量化参数的变化不敏感,鲁棒性强,比较 有前途嘲;中心矩法通过调整h 、s 、v 的加权系数可以取得与累加直方图相 近的实验效果”1 。 。 ( 2 ) 纹理特征提取与匹配方法有:统计方法、几何法、模型法、信号处理法。统计 方法的典型代表有g o t l i e b 和k r e y s z i g 提出的基于灰度共生矩阵的纹理特征 分析方法和基于自相关函数( 即能量谱函数) 的纹理特征分析方法;几何法中, 比较有影响的算法是v o r o n i o 棋盘格特征法和结构法;典型模型法有马尔可夫 ( m a r k o v ) 随机场( m r f ) 模型法和g i b b s 随机场模型法;信号处理法的代 表有g a b o r 滤波器嘲、t a m u r a 纹理特征、自回归纹理模型、小波变换。”等 纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力 ( 3 ) 形状特征提取与匹配方法有:边界特征法、傅里叶形状描述符( f o u r i e rs h a p e 4 d e s c r i p t o r s ) 、几何参数法、形状不变矩法、有限元法( f i n i t ee l e m e n tm e t h o d 或 f e m ) 、旋转函数( t u r n i n gf u n c t i o n ) 和小波描述符( w a v e l e td e s c r i p t o r ) 等 方法。 ( 4 ) 草图特征提取与匹配方法有两种:一种方法是首先对图像进行自动分割,划分 出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立 索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图 像子块提取特征,并建立索引。草图特征可加强对图像内容的描述区分能力, 但需要配合其它特征来检索。 可是,基于上述特征的检索方法都存在不足之处。 图1 3 直方图搜索方法的缺陷 例如,在直方图搜索方法中,由于主要考虑了颜色性质而忽略了区域性质,图 1 3 中图像( d ) 的颜色特征被简单的提取为( a ) 和( b ) ,这样可能会有两幅根本不同的 i 虱像具有完全一样的颜色直方图,不反映颜色位置信息“”,使得我们的检索只能就图 像的颜色之类的低级语义信息进行检索,无法进行高级语言检索。 图1 4 基于区域搜索方法的缺陷 再如,在基于区域的搜索中,图1 4 河边斑马的身体就很难被准确分割成合理的 区域。人类的视觉系统对物体进行分割,是依靠了人类的经验和常识,但是对于计算 机来说,要进行准确的分割,是非常困难的。 又如:在基于纹理特征的检索中,一个很明显的缺点是当图像的分辨率变化的时 候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的 影响,从2 一d 图像中反映出来的纹理不一定是3 一d 物体表面真实的纹理。 现在的通用c b i r 系统根掘特征提取手段可以大致分为三类嗍:直方图搜索、颜 色布局搜索和基于区域的搜索。当然也有些系统采取联合检索,把个别的数学运算法 则检索结果依照加权和匹配距离联合起来,当然还有其他的融合方案。在特征向量提 取完毕之后,紧接着的步骤就是决定一个比较规则,包括一个查询方案和图像之问每 种相似处度量标准的定义。在绝大多数图像检索系统,一个查询是对想要检索的图像 的详细说明。我们称此为“全局搜索”,由于建立在所有的图像性质相似点上。与之 形成对比的是,也有一些“局部偏好搜索”查询系统依照图像的特定区域进行检索。 近些年已经有大量的c b i r 系统涌现出来。1 。商业软件方面,比较有名的有最早 出现的i b mq b i c 以及后来的i b mt j w a t s o n 、v i r a g e 、n e c a m o r a 、b e l ll a b o r a t o r y 和i n t e r p i x 理论界也开发出很多系统,其中最早发明的是m i tp h o t o b o o k ,后来比 较有名的有b e r k e l e yb l o b w o r l d 、c o l u m b i av i s u a l s e e k a n dw e b s e e k 、c m u i n f o r m e d i a 、o c s bn e t r a 、u c s d 、马里兰大学、斯坦福的e m d 和w b i i s 等系统。 这些c b i r 系统结构基本类似,其结构如图1 5 所示。 图1 5 基于内容的图像检索系统结构图 6 1 2 3 包含语义的图像检索 由于基于内容的图像检索( c b i r ) 抽取的图像特征是一些底层视觉特征,很难与抽 象概念建立联系。因此,国外大多数对图像数据库的研究都把对图像内容深层语义信 息的自动推导作为兴趣的焦点。他们试图找到这样一套方法,它能根据自动得到的图 像特征从一个图像数据库中检索出语义相关的图像。 图像语义,也就是图像的含义,由若干层次之分。由低到高,这些层次分别可以 粗略的分为: ( 1 ) 语义的类型( 例如:风景照片、c l i pa r t ) ; ( 2 ) 物体的组合( 例如:一辆自行车和一辆小汽车停放在海滩上,日落景象) ; ( 3 ) 抽象的语义( 例如:人在打假,快乐的人,惹人反感的照片) ; ( 4 ) 详细的语义( 例如:对给定图片详细地描述) 。 1 2 4 用户反馈技术 c b i r 里的一个主要问题是在典型的从图像中提取的低级特征和用户拥有和使用 的高级语义之间存在鸿沟。对这个问题的解决方法就是把文档检索里的相关性反馈思 想运用到基于内容的图像检索里。用户提供的反馈的特征可以选择出一些积极的或相 关的图像( 基本上能允许进行密度估算) 。更通常的情况是,一些系统能同时提供积 极反馈和消极反馈( 也就存在一个分类问题) 和更进一步的描述,比如相关度和不相 关度,或者是一个相对的判断,而不是和一个成功的定义或非成功定义显然从用户 那里可以获得额外信息,并被有效利用。在检索语义里的鸿沟可以被减少。 1 2 5 图像检索系统得性能指标和评价标准 检索策略的性能评估的比较通用的两个准则是效率( e f f i c i e n c y ) 和有效性 ( e f f e c t i v i t y ) ,分别代表检索的速度和查找与查询图像相似图像的成功率。检索的 有效性用查准率( p r e c i s i o n ) 、查全率( r e c a l l ) 来评估,分别定义如下: 查准率- 塑糍黼掣 “- , 7 力。 查全率。丝童尝墼璺堡妻堡耋曼掣 ( 1 2 ) 所有相关的图像数目 查全率反映系统检索相关图像的能力,而查准率则反映系统拒绝无关图像的能 1 3 面向互联网的图像检索( i p r t ) 的研究特点 根据上一节的介绍,可以看出本文提出的面向互联网的图像检索( i p r t ) 是一种 基于内容的图像检索( c b i r ) 。但是,由于面对的是互联网上海量图片的检索,因此 与其它c b i r 系统有所区别。 面向互联网的图像检索( i p r t ) 具备以下特点: 图像的相似性以人类视觉标准为准,并且具有明显的偏好: 以“关键字”为检索依据,而并非样本图像; 图像分辨率和长宽比例存在较大的差异; 图像类别丰富,包含:人物、风景、漫画、素描、指纹等各类型的图片; 图像格式种类繁多,包括:j p g 、b m p 、g i f 、p n g 等; 图像搜索过程中始终伴随着人机交互; 每次网页刷新只显示部分检索结果; 图像搜索各过程中用户的行为间接体现了他的检索偏好 图1 6 设想的i p r t 检索系统结构图 8 1 4 本文的研究思路 参考了i p r t 的研究特点,本文提出了一套使i p r t 检索系统的结构( 图1 6 ) 。 我们在这一系统中提出了如下设想: 1 4 1 “伪语义”检索 由于互联网用户已经习惯于通过“关键字”检索图片。因此,在i p r t 中利用了 目前商业图像搜索引擎基于关键字匹配的技术。在检索的第一步,依然根据关键字搜 索出文本匹配的图像,从第二步开始,则根据检索用户选择的满意图片,修正搜索结 果,使结果更接近用户的需求。这些将在本文第4 章着重介绍。 1 4 2 多特征整合检索 由于基于各种图像特征的检索都存在自身无法克服的缺陷,因此本文中i p r t 系 统要综合颜色、纹理、形状和草图特征进行检索。由于颜色和纹理特征的抽取方法较 为成熟,本文将选择适合的算法提取这两项特征。对于形状特征和草图特征,本文分 别提出了“三层轮廓法”和“简单分块差分法”。这些将在第3 章介绍。 1 4 3 特征压缩处理 本文中,被提取出来的特征必须精简,这包括两个方面:一方面,互联网上的图 片尺寸千差万别,但图像的分辨率大小直接关系到特征抽取的计算量。因此,本文将 要抽取特征的图像分辨率进行压缩,作为特征抽取的预处理另一方面,抽取出来的 特征将被存储在特征数据库中,特征的大小直接关系到数据服务器存储空间的开销, 并且会影响检索速度。因此,对抽取出来的特征我们都要在确保信息量的前提下,进 行精简。这些将在第3 章介绍。 9 1 4 4 基于用户操作反馈的心理权重调节 用户期望检索的内容,有时是无法通过“关键字”准确描述的。本文中,我们通 过“属性坐标分析法”,对检索用户的操作行为进行学习,从中提取出该用户的心理 偏好,以此束优化检索结果。并且,通过用户操作的反馈机制,心罩权重和检索结果 都会不断得到优化。这些内容将在第2 章和第4 章中分别介绍。 第2 章属性论方法 根据我个人对属性论的理解,属性论是一种以辨证唯物主义尤其是质变量变规律 为指导,以人工智能和思维科学为研究方向,以属性( 包括量特征和质特征) 为描述 手段研究客观对象,使用非线性数学方法特别是定性映射和转化程度函数为研究手 段,由冯嘉礼教授提出的一系列相互联系的观点、定理和算法。 由于属性论以属性为依据研究对象及其质特征,而图像通过象素属性反映其特征 的客观对象,因此,属性论方法的一些结论特别是“属性坐标分析法”,应当可以适 用于体现检索用户心理偏好的i p r t 图像检索系统。 2 1 属性论的基本思想 人工智能发展至今,不仅针对智能信息处理任务的各种不同类型,提出了能模拟 不同领域专家经验的专家系统、能模拟人脑自学习、自适应的功能人工神经网络、针 对人类语言存在模糊性的模糊计算、针对随机性的b a y e s i a n 计算、具有竞争和进化 功能的遗传算法、能将非线性划分转化为线性划分的支持向量机和面向社会群体智能 的a g e n t 计算等,各种智能方法和技术,而且,还提出了将上述若干不同智能方法和 技术,组合在一起的混合智能系统( h y b r i di n t e l l i g e n c es y s t e m ) ,以应对仅用 单一方法和技术无法完成的智能信息处理任务。 2 1 1 人工智能是否存在统一规律 然而,混合不等于融合,当人们试图将各种智能方法和技术有机地融合为一体, 形成所谓智能融合( i n t e l l i g e n c ef u s i o n ) 方法和技术时,首先碰到的就是“各种人 工智能方法和技术能相互融合和统一吗? ”这样一个理论上仍存在较大争议的难题。 我们知道,人工智能至少分三个学派,即:符号主义、连接主义和行为主义,它 们在哲学观点、基本原理、表示方法和实现技术等,各方面都存在着巨大的差异( 表 2 1 ) 。因此,许多人都认为:分属不同学派的各种方法,是不可能融合在一起的 例如:人工智能大师m m i n s k y 在其。心理的社会”一书中,根据各a g e n t 之间存在 的各种矛盾性和不一致性就认为:“不存在一种人工智能理论和方法,使各种矛盾性 l l 和不一致性得到协调和统一。”“ 表2 1 人r :智能三大学派的比较 二人学派土要观点基本理论基本原理实现技术 人脑处理的信息是物理符号操 知识门鼙 符号主义学派各种心理或逻辑符 信息加i :论作或心理符 号。 号逻辑计算 或专家系统 是人脑产生各种神 经电脉冲,其处理网络连接强 连接主义学派 是神经元和神经网 并行 络的电生理和电化 分布式处理 度调节的数人工神经网络 值计算 学过程。 是外部世界对人脑 的各种刺激,其处 自适应反馈 行为主义学派理表现为大脑的自 控制论智能机器人 适应和反馈调节的 控制调节 控制过程。 由于外部世界是一个复杂的充满各种矛盾和冲突的世界,在接收并处理外部世界 的各种信息时,人脑会因面临各种冲突和矛盾,而处于一种“左右为难”的矛盾状态。 生活中,确实有人因无法摆脱各种冲突和矛盾,而导致其大脑产生精神分裂乃至崩溃。 但对绝大多数人来说,其大脑不仅不会陷于不能自拔的状态,相反,却在处理各种矛 盾的过程中,自身创造出、或向他人学会了各种解决矛盾的机制、策略和办法一个 人或动物所能解决的各种冲突和矛盾的复杂程度,则是衡量一个人或动物是否“聪明” 或“智能”的重要标准之一。 冯嘉礼教授在研究这一问题的过程中发现一个事实,即:“尽管人工智能仍处于 一种无法统一的状态,但人脑作为一个开放的复杂巨系统,其运行、调度和指挥机制, 却是统一而和谐的”冯教授根据这一事实,提出了重要的猜想,即:“思维应当是 有规律的,人工智能各学派之间存在互联系并相互协调一致地融合机制”并以此为 基础展开了“属性论”的研究,其目标就是要找到使各种人工智能方法相互融合的机 制。 2 1 2 属性论的研究思路 厂砷锄氐嘲螂藤网渤r 圈 仑问“冬;、 ? ,7 。 i ;7 m 盎,i 。 z 幽弋步。善5 。 ;t ,。5 参t l 楚鎏1 卿也坚j 圆l 蓊测筒i 签 图2 1 精神与物质世界的l - t :较 物质与精神是对立统一的。参考人类对物质世界规律的研究经验( 图2 1 ) ,属 性论提出对精神( 包含“智能”) 世界规律的研究思路: ( 1 ) 智能规律能够用数学等科学方法和研究手段进行研究。 ( 2 ) 思维的非线性。涌现”规律,决定了我们必须采用非线性方法研究思维规律。 ( 3 ) 人工智能三大学派理论存在相同的哲学本质,可以统一在同一理论框架下。 2 1 3 智能的基础是属性 人脑与一般物质的最本质区别在于它是一个开放的系统。生命有新陈代谢,在其 形成过程中,需要与外界交换能量。因此,能量交换是生命区别于一般物质,或对一 般物质加以否定的最根本特征。而一般物质系统,尽管可能很复杂,也很巨大,但大 多都是一个封闭系统。 同样,精神对一般物质和生命的否定,是它要与外界交换信息,既:即从外部接 收信息,又向外界反馈信息。信息交换是精神和思维区别于一般生命的根本特征。 如果说对“信息是什么”的不同理解,是导致人工智能分裂为三个学派的基本原 因的话,那么,如果能找到一个能为三大学派都接受的理解,那么,就有可能将它们 统一起来。 表2 2 人类的感觉和属性举例 感觉属性 视觉视觉属性( 光) 嗅觉嗅觉( 化学) 属性( 如气体) 味觉味觉( 化学) 属性( 酸、甜) 肤觉温度、压力属性 常识告诉我们,人脑接收的途径是感觉,感觉是大脑的门户。感觉接收和处理的 信息是属性。 以上事实表明: 命题1 :人脑接收的信息是,且只能是感觉能对之敏感的各种感觉属性。 哲学上认为:任何事物都有质和量的两种规定性,“事物在与其他事物发生联系 时表现出来的质叫做属性,人们是通过观察,分析事物属性,认识事物的质的。”, 这一定义和说法分别等价于: 命题2 :事物是通过其属性来表现其自身的质的。 命题3 :人们只有通过属性才能认识事物本身及其质。 2 1 4 属性的两种特征值 事物有质和量两种规定性,故其属性不仅也有量和质的两种特征值,如: 表2 j 事物属性的晕特征和质特征例举 事物的属性量特征质特征 光波欧 颜色 声音频率音( 唱) 名 温度度数值“冷。暖” 气味( 分子) 浓度“香气“臭” 伦敦大学神经生理学家s z e k i 根据“表面反射的光的波长是随照度的变化而变 化的,而脑却能够赋予这些波长一种不变的颜色”提出了:“脑的任务是从其 获自物体的大批不断变化的信息中抽取物体恒定不变的( 质) 特征。”的看法。若将 其中的“信息”二字,改为“量特征x ”,则s z e k i 的话就是:“脑的任务是从获 自物体的大批不断变化的量特征x 中抽取物体恒定不变的( 质) 特征( p ( x ,0 ) ) ”。 图2 2 属性论的事物属性模型 1 4 量特征x 的定量测量是由( 物理或化学) 仪器进行的,人类感觉对量特征的检测 是“有感无数”,即无法确定量的数值;反之,仪器对事物属性的质特征( 或性 质) p ( x ,o ) 则是“无知无识”的。例如:温度计能测出对0 c 的数值,但却不具有对 对0 c 作出”冷”或”热”的定性判断,也没有这种定性意识。这种情况不仅表明, 人脑感觉系统和仪器的功能具有根本性区别,而且说明,感觉特征抽取系统是一个将 感觉属性a ( o ) 的量特征x ,转化为其对应质特征或性质p ( x ,0 ) 的转化器。 2 2 定性映射 人类经验和神经科学实验都表明,特征抽取和特征整合是感觉信息处理的两个最 基本的操作,属性论研究的前十年,主要针对属性“整合”及其诱导的数学结构,以 及它们在推理、概念抽象、评估、决策、关系和系统生成等进行了认真的研究,建立 了相应的数学模型,得到一些有用的结果。自1 9 9 6 年以来,针对特征“抽取”进行 了一系列更深入的探索,初步理清了一条能将某些人工智能理论和方法联系起来的思 路和线索。 2 2 1 定性映射的定义和性质 若设p j ( x ,o ) 为命题“具有量x 的对象o 具有性质p ,( x ,o ) ”,p : p ,( x ,o ) ,并 将性质p j ( x ,o ) 的“度”,即:保持性质p ,( x ,0 ) 不变的量x 的变化范围 o l , 阳,称 为p 。( x ,o ) 的定性基准,r :( e l , 6 。则量质转化规律,或从量x 到性质p j ( x ,o ) 的转化操作,不难翻译为下述定性映射: 定义2 h 设a ( o ) 是对象o 的某个属性,x x g t 是属性a ( o ) 的一个量值,p ( o ) e p o 是属性a ( o ) 的某个性质, i j e r 是性质p ( o ) 的定性基准,则称映射f :x x r 一 0 ,1 x p o ,使得: 俳朋脚脚印( d ) - 祟) 嘶x e a j 以, 卢j : ( 2 1 ) 式中7 为问题。x 是否属于 a j ,b j ”的算子,又称特征抽取或量质转化算子 啪- 弋。震嚣 。 为性质命题p ( x ,0 ) 的真值。 性质2 1 :设x 是对象0 带有的量特征, a ,b 是p ( 0 ) 的定性基准,则量x 属于 ( 或满足) p ( o ) 的定性基准,当且仅当,带有量特征x 的对象0 具有性质p ( o ) ,即: x e a ,b p ( 0 ) ( 2 2 ) 称( 式2 2 ) 为定性( 判断) 映射( 式2 1 ) 诱导的( 等价) 推理。 11 因 o 【,p 既是一个区间,又是一个以亭= 寺 + 卢) 为球心,以6 t 寺妒- a ) 半径的 拓扑邻域n ( 岛6 ) ,还构成一个以斫b 为顶点的单纯形,故由( 式2 2 ) 可得下述等 价关系: x p a s x 邛x = ( 卜t ) a + t p ,t o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年春七年级生物下册 第四单元 第七章 第一节 分析人类活动对生态环境的影响说课稿 (新版)新人教版
- 1.4.1地形图的判读说课稿2025-2026学年人教版七年级地理上册
- 2025年基础护理课程解答题库及答案
- 任务一 三股辫我会编说课稿小学劳动浙教版二年级下册-浙教版
- Unit1 Animal Friends. Section A(2a-2f)说课稿 人教版英语七年级下册
- 2025年基础护理学头皮护理题库及答案
- 2025年休克的护理题库及答案
- 库存商品的核算教学设计中职专业课-企业财务会计-纳税事务-财经商贸大类
- 新疆喀什地区网信系统招聘事业单位工作人员考试真题2024
- 社保退休测试题及答案
- 新课标下的小学语文跨学科教学模式探讨
- 冲孔灌注桩施工方案
- 高压输电线路维护保养方案
- 2025年物联网安装调试员(高级)技能鉴定考试题库
- 学校“1530”安全教育记录表(2024年秋季全学期)
- 2025年篮球比赛免责协议书模板
- 新入职教师法律法规培训
- 幼儿园护学岗职责
- 【MOOC】化学与社会-大连理工大学 中国大学慕课MOOC答案
- 2024年吉林省高职高专单招考试数学试题(含答案)
- 实习报告评分标准
评论
0/150
提交评论