(计算机应用技术专业论文)贝叶斯网及其在网上智能中的应用研究.pdf_第1页
(计算机应用技术专业论文)贝叶斯网及其在网上智能中的应用研究.pdf_第2页
(计算机应用技术专业论文)贝叶斯网及其在网上智能中的应用研究.pdf_第3页
(计算机应用技术专业论文)贝叶斯网及其在网上智能中的应用研究.pdf_第4页
(计算机应用技术专业论文)贝叶斯网及其在网上智能中的应用研究.pdf_第5页
已阅读5页,还剩104页未读 继续免费阅读

(计算机应用技术专业论文)贝叶斯网及其在网上智能中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要摘要网上智能是人工智能技术和高级信息技术在w e b 和i n t e m e t 上的应用和发展,是目前人工智能乃至计算机科学中最活跃最开放的研究领域之。短短几年的发展,网上智能就已形成了自己独特的研究体系和概念层次,其研究内容几乎覆盖了目前i t 界所有最热门的研究课题。个性化是网上智能系统所具有的一个重要特征,它的实现离不开对网上客户信息的知识发现。由于网上客户数据是具有很大不确定性的w e b 信息,所以如何在网上智能系统中进行知识发现就成为该领域的一项重要的前沿课题。贝叶斯网是目前不确定知识表达和推理领域最有效的理论模型之一,它在处理不定性问题上具有许多优势,适用于不确定性和概率性的知识表达和推理,所以对贝叶斯网建模技术的研究及其实际应用的拓展一直是近几年来人工智能领域中的一个研究热点。由此可见,本文以贝叶斯网及其在网上智能这一崭新领域中的应用作为研究课题具有重要意义。为了阐述网上智能中的知识发现,本文以电子商务中的知识发现为例,具体分析了在b 2 c 电子商务网站中进行知识发现的流程、技术和应用,并对未来的发展进行了展望。本文采用的知识表达机制主要是贝叶斯网。结合国内外最新的研究成果,我们概括了贝叶斯网模型的学习、推理方法和应用情况,讨论了贝叶斯网未来的发展方向,并提出了一种改进的e i b & b m d l 算法。该算法充分利用贝叶斯网自身结构特点和样本信息所体现的知识,在利用条件独立性测试有效压缩搜索空间的基础上,再次利用所学的互信息知识引导b & b m d l 评分搜索过程,加快了算法的学习过程。实验表明:该算法在保证学习精度的前提下整体的时间性能比原算法有较大的改进。基于上述工作,本文探讨了贝叶斯网模型在网上智能的两个重要领域网上推荐系统和网上智能教学系统中的应用。针对网上推荐系统的个性化问题,本文设计了一个基于贝叶斯网客户购物模型的推荐系统,它把推荐过程形式化为客户购物信息的知识表达和不定性知识的概率推理过程,并把群体客户的一般特征和客户个性的行为特征结合在客户模型的学习中。为了实现更深层次的个性化推荐,本文又提出了一种基于多级客户模型的个性化商品推荐机制。该机制首先利用客户的购物事务库得到客户购物模型,通过推荐引擎的推理得到每个客户各自的推荐集合,然后利用客户自身的偏爱和消费模型,迸一步对推荐集合中的商品类进行定制和定位,过滤出客户喜爱并有能力购买的商品,完成个性化的商品推荐。这种方法借助多级客户模型从客户的购物需求、偏爱特征和消费能力三方面捕获客户的实际需要,凸现了客户的真正需求,提高了推荐效果。北京工业大学工学博士学位论文针对网上个性化教学问题,本文设计并实现了一种基于贝叶斯网学生解题模型的智能教学系统b p u i t s m a t h 系统,重点描述了贝叶斯网模型在该系统中的构造、推理及其在智能教学策略中的应用过程,系统的运行实例说明了用贝叶斯网建立学生解题模型的有效性和实用性。总之,本文以网上智能为研究背景,以贝叶斯网模型为技术主线,在分析总结前人工作成果的基础上,对网上智能商务系统中的知识发现、贝叶斯网模型及其学习算法进行了理论上的探讨,并对贝叶斯网在网上商品推荐、个性化推荐机制和网上智能教学中的应用等问题进行深入研究。所取得的创新性成果主要包括:提出了一种改进的贝叶斯网结构学习算法,丰富了贝叶斯网的算法研究;提出了一个基于贝叶斯网客户购物模型的商品推荐方法;给出了一种基于多级客户模型的个性化商品推荐机制;设计并实现了一种基于贝叶斯网学生解题模型的智能教学系统,这些研究都拓宽了贝叶斯网的应用领域,并具有潜在的应用前景。关键词网上智能;数据挖掘;贝叶斯网;个性化推荐:网上智能教学一i i a b s t r a c ta b s t r a c tw e bi n t e l l i g e n c e ( w i ) i san e wr e s e a r c ha r e ae x p l o i t i n ga r t i f i c i a li n t e l l i g e n c e( a 1 ) a n da d v a n c e di n f o r m a t i o nt e c h n o l o g y ( i t ) o nt h ew e ba n di n t e m e t ;i ti so n eo ft h em o s ta c t i v er e s e a r c hf i e l d si nc u r r e n ta ia n dc o m p u t e rs c i e n c e w i t ht h er a p i dg r o w t ho fw o r l dw i d ew e b ,w ia l m o s tc o v e r sa l lc u r r e n tr e s e a r c ht o p i c si ni i :p e r s o n a l i z a t i o ni sa ni m p o r t a n tc h a r a c t e ro fw e bi n t e l l i g e n ts y s t e m s ,i t sr e a l i z a t i o nd e p e n d so nf i n d i n gt h ek n o w l e d g eo fc u s t o m e r so dw e b a st h e r ei sm u c hu n c e r t a i ni n f o r m a t i o no nw e b ,i ti sar e s e a r c hf o c u sh o wt of i n ds u c hk n o w l e d g ei nt h i sa r e a b a y e s i a nn e t w o r k ( b n ) i so n eo f t h em o s te f f e c t i v et h e o r e t i c a lm o d e l sf o ru n c e r t a i n t yk n o w l e d g ee x p r e s s i n ga n dr e a s o n i n g w i t hm a n ya d v a n t a g e so nd e a l i n gw i t hu n c e r t a i n t yp r o b l e m s ,t h er e s e a r c ha n da p p l i c a t i o n so fb a y e s i a nm o d e l i n gt e c h n o l o g ya r ea l lt h et i m eh o tt o p i c so fa i t h i st h e s i st a k e sb a y e s i a nn e t w o r ka n di t sa p p l i c a t i o nt ow e bi n t e l l i g e n c ea sar e s e a r c ht o p i c t h i st h e s i st a k e st h ek n o w l e d g ed i s c o v e r yi nb 2 ce - c o m m e r c ew e bs i t ea sa ni n s t a n c et os t u d yk n o w l e d g ed i s c o v e r yi nw i t h et h e s i sa n a l y s e si nd e t a i l st h eb a s i cf l o w ,p r i m a r yd a t am i n i n gm e t h o d sa n da p p l i c a t i o n so ft h ek n o w l e d g ed i s c o v e r yi ne c o m m e r c es y s t e m so fb 2 c a n de x p l o r e sf u t u r ed e v e l o p m e n t si nt h i sa r e a b ni st h eb a s i cm e c h a n i s mo fk n o w l e d g ed i s c o v e r yu s e di nt h i st h e s i s ;w er e v i e wt h es t r u c t u r el e a r n i n go fb n ,p r o b a b i l i t yi n t b r e n c eo nb n ,a n da p p l i c a t i o n so fb n ,a n dd i s c u s sf u t u r ed i r e c t i o n so ft h er e s e a r c h w ep r o p o s eam o d i f i e dm e t h o dc a l l e de 1 - b & b m d l t h e r ea r et w om a j o rc o n t r i b u t i o n si nt h i sa l g o r i t h m f i r s t l y ,z e r o o r d e ra n dp a r t i a lf i r s t - o r d e ri n d e p e n d e n c et e s t sa r eu s e dt oo b t a i na no r i g i n a lg r a p ho ft h en e t w o r k ,w h i c hr e d u c e st h en u m b e ro fi n d e p e n d e n c et e s t sa n dd a t a b a s ep a s s e sw h i l ee f f e c t i v e l yl i m i t i n gt h es e a r c hs p a c e s e c o n d l y , b ym e a n so ft h eh e u r i s t i ck n o w l e d g eo fm u t u a li n f o r m a t i o n ,s o r to r d e rf o rc a n d i d a t ep a r e n tn o d e si n c r e a s e st h ec u t o f f so fb & bs e a r c ht r e ea n da c c e l e r a t e ss e a r c hp r o c e s s i ne x p e r i m e n t so nc u r r e n c yd a t a b a s e so f a l a r m ,t h en e wa l g o r i t h mi sm o r ee f f i c i e n ti nt i m ec o n s u m p t i o nt h a nt h eo r i g i n a li - b & b m d la l g o r i t h m t h et w or e s e a r c ha r e a so fw it ow h i c hw ea p p l yb nt e c h n i q u e sa r ep e r s o n a l i z e dr e c o m m e n d a t i o ns y s t e ma n di n t e l l i g e n tt u t o r i n gs y s t e mo nw e b a i m i n ga tt h ep e r s o n a l i z a t i o ni nr e c o m m e n d a t i o ns y s t e mo nw e b ,t h et h e s i sp r e s e n t san e wf r a m e w o r kb a s e do nac u s t o m e rs h o p p i n gm o d e l t h ef r a m e w o r kf o r m a l i z e st h er e c o m m e n d i n gp r o c e s sa sk n o w l e d g er e p r e s e n t a t i o no ft h ec u s t o m e r一一北京工业大学工学博士学位论文s h o p p i n gi n f o r m a t i o na n du n c e r t a i n t yk n o w l e d g ei n f e r e n c ep r o c e s s ,a n dc o m b i n e sg e n e r a lc h a r a c t e r i s t i c so fc o l o n yc u s t o m e r sw i t hi n d i v i d u a lc h a r a c t e r i s t i c so fs i n g l ec u s t o m e ri nm o d e ll e a r n i n g a c c o r d i n gt ot h i si d e a ,t h i st h e s i sa c h i e v e san e wm e t h o dt or e c o m m e n dc o m m o d i t y , w h i c hf i r s tg e t sac u s t o m e rs h o p p i n gm o d e lb yl e a r n i n gf r o mc u s t o m e r ss h o p p i n gt r a n s a c t i o n s ,a n dg e n e r a t e se f f e c t i v e l ya ni n d i v i d u a lr e c o m m e n d a t i o ns e to fc o m m o d i t yf o re a c ho n l i n ec u s t o m e rb yp r o b a b i l i t yi n f e r e n c e e x p e r i m e n t a lr e s u l t so nr e a lw o r l dd a t ad e m o n s t r a t et h a tt h i sm e t h o di sb e t t e rt h a ns o m et r a d i t i o n a lm e t h o d si nr a t e so fa v e r a g ec o v e r a g ea n dp r e c i s i o n ,i no r d e rt os t r e n g t h e nt h ed e g r e eo fp e r s o n a l i z a t i o ni nr e c o m m e n d a t i o n ,t h i st h e s i sp r e s e n t san e wr e c o m m e n d a t i o nm e c h a n i s mb a s e do nam u l t i l e v e lc u s t o m e rm o d e l ,w h i c hc o n s i s t so fd a t ap r e p r o c e s s i n g ,m o d e ll e a r n i n g ,r e c o m m e n d a t i o ns e tg e n e r a t i n g ,a n di n t e l l i g e n tf i l t e r i n g t h em u l t i l e v e lm o d e lc o m p r i s e st h r e es u b p a r t s :c u s t o m e rs h o p p i n gm o d e l ( c s m ) ,c u s t o m e rp r e f e r e n c em o d e l ( c p m ) ,a n dc u s t o m e rc o n s u m p t i o nm o d e l ( c c m ) a f t e rp r e p r o c e s s i n go f r a wd a t a ,t h i sa p p r o a c hf i r s tb u i l d st h ec s mb a s e do nb a y e s i a nn e t w o r k sb yl e a r n i n gf r o mc u s t o m e rs h o p p i n gt r a n s a c t i o n s ,f i n d st h ec p mb ya n a l y z i n gc u s t o m e rs h o p p i n gh i s t o r y , a n df o r m a l i z e st h ec u s t o m e rp u r c h a s i n gp o w e ra sal i n e a rm o d e lc c m t h e nc o m b i n e dw i t ht h ep r e s e n tc u s t o m e rs h o p p i n ga c t i o n ,t h i sa p p r o a c hu s e sar e c o m m e n d a t i o na l g o r i t h mb a s e do np r o b a b i l i t yi n f e r e n c et og e n e r a t ea l li n d i v i d u a lr e c o m m e n d a t i o ns e to fc o m m o d i t i e s f i n a l l yi tu s e sap e r s o n a l i z e df i l t e ri n c l u d i n gc u s t o m i z a t i o no f t h ec p ma n do r i e n t a t i o no ft h ec c mt or e a l i z em o r ep e r s o n a l i z e dr e c o m m e n d a t i o n t h ea p p r o a c hc a p t u r e sac u s t o m e r sp r a c t i c en e e d sf r o mt h r e ea s p e c t s :s h o p p i n gd e m a n d s ,p r e f e r e n c ec h a r a c t e r sa n dp u r c h a s i n gp o w e r , t h u sg i v e sp r o m i n e n c et op e r s o n a l i z e dn e e d sa n di m p r o v e st h ee f f e c t i v e n e s so f r e c o m m e n d a t i o n a i m e da tp e r s o n a l i z a t i o no fa ni n t e l l i g e n tt u t o r i n gs y s t e mo nw e b ,t h i st h e s i sd e s i g n sa n dr e a l i z e sab p u i t s m a t hs y s t e m ,w h i c hu s e sb na ss t u d e n tm o d e lo fs o l v i n gp r o b l e m t h et h e s i se m p h a s i z e st h es t r u c t u r e ,f u n c t i o n sa n dp r o b a b i l i s t i ci n f e r e n c eo fb ni ni t s ar u n n i n ge x a m p l ei m p l e m e n t e di nt h es y s t e ms h o w st h ef e a s i b i l i t ya n dp r a c t i c a b i l i t yo f t h ed e s i g n i ns u m m a r y , t h i st h e s i sp r o p o s e sa ni m p r o v e dl e a r n i n ga l g o r i t h mo f b n ,p r e s e n t san e wm e t h o db a s e do nc s mi nc o m m o d i t yr e c o m m e n d a t i o n ,s t u d i e sap e r s o n a l i z e dr e c o m m e n d a t i o nm e c h a n i s mb a s e do nam u l t i l e v e lc u s t o m e rm o d e l ,a n dd e s i g n sa ni n t e l l i g e n tt u t o r i n gs y s t e mb a s e do ns t u d e n tm o d e lo fs o l v i n gp r o b l e m t h e s er e s u l t se x p a n dt h ea p p l i c a t i o n so fb no nw e bi n t e l l i g e n c e 一一a b s t r a c tk e yw o r d s :w e bi n t e l l i g e n c e ;d a t am i n g ;b a y e s i a nn e t w o r k ;p e r s o n a l i z e dr e c o m m e n d a t i o n ;w e bi n t e l l i g e n tt u t o r i n g 一v 一独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:垄i 壑整日期:2 叨牛弓3 0关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。( 保密的论文在解密后应遵守此规定)签名:壅垒生:导师签名:日期:拯丝;- 弘第1 章绪论i i i i l l i i第1 章绪论网络、数据库、电子商务等i t 技术的飞速发展,把人类社会带入到真正的信息时代。信息在w w w 上肆意地传播和发布,使得信息在深度和广度方面飞速地扩张,充斥了整个社会。面对日益膨胀的w e b 信息,人们想寻找自己所需的信息往往会陷入“信息丰富,知识匮乏”的窘境,因此,如何从这些信息中自动挖掘有用的知识帮助用户更好地学习和生活,成为信息时代交给人工智能领域的一个重要研究课题。1 1 研究背景1 1 1网上智能的兴起与发展网上智能( w i ) 是人工智能技术( a i ) 和高级信息技术( i t ) 在w e b 和i n t e m e t上的应用和发展【l o j 】,从这个定义可看出,技术的基础是a i 和i t 技术,w i研究的支撑平台是w e b 网络,因此w i 的研究目标就是a i 和i t 技术在新的w e b平台上的共同研究目标。换句话说,网上智能就是应用a i 和i t 技术来设计和实现智能w e b 信息系统( i n t e l l i g e n tw e bi n f o r m a t i o ns y s t e m ) ,网上智能系统是一种高级的基于w e b 的智能信息系统,它能够实现类似于人类智能的一些功能,包括推理、学习和自适应等功能。网上智能是目前计算机科学中一个活跃而开放的研究分枝,它随着w e b 信息的收集、存储、处理、传递和使用的发展而不断进化川。w e b 中丰富而复杂的内容使w e b 成为一个非常有用且独一无二的计算机应用和研究平台。w e b 上包含有大量的互相联系的w e b 文档w 曲页面,w e b 页面数量的庞大导致了w e b文档在存储、管理和有效检索时的困难。由于在w e b 环境下系统要处理的不再是结构化且互不相关的同类对象集合,而是结构化、半结构化、非结构化且相互关联混杂的异质的对象集合,这追使人们不得不重新考虑许多现有信息系统中所使用的理论、方法和技术在w e b 领域中的适用性。所以为了满足w e b 发展的需要,人们必须在结合和扩展现有智能信息系统已有成果的基础上研究基于w e b 信息系统的设计和实现问题。尽管以往经常有一些单独的基于w e b 的信息系统被开发实现,但它们没有从概念、体系、技术和方法层次上对系统进行深入的研究。顺应时代发展潮流,在2 0 0 0 年,钟宁、刘际明、姚一豫等人首次提出了网上智能( w e bi n t e l l i g e n c e ,w i ) 的概念,并给出了该体系的技术框架。自此以后许多研究才逐渐开始系统化、体系化,并形成一个全新的研究领域。可见,w e b一1 一北京工业大学工学博士学位论文环境不仅给计算机界的科学家带来了新的机遇和挑战,而且造就了个新的子学科网上智能,它专门从事基于w e b 的智能系统的研究。网上智能是w e b 和智能a g e n t 时代一个关键且最迫切的一个i t 研究领域,它开辟了科学研究和发展的一种新的方向,该方向探究人工智能( a i ) 和高级信息技术( i t ) 在下一代基于w e b 的系统、服务和环境上的基本作用和实际影响。我们可以从以下两个方面认识这个概念:一方面,可以把网上智能看作是将许多现有学科的技术应用在一个全新的领域;另一方面,网上智能概念的形成在为现有的学科提出了一些新问题的同时,也带来了一些新机遇和新挑战,所以网上智能也可被视为是a i 和i t 的一种增强和扩展 2 】。网上智能技术掀起了一场信息收集、存储、处理、表示、共享和使用方式的革命,该技术具有电子化、虚拟化、全球化、标准化、个性化和门户化等特征。网上智能概念一出现,就引起了学者们的极大关注,短短几年的发展就已形成了自己独特的研究体系,并带动了该领域相关技术的迅速发展。自2 0 0 1 年在日本前桥市成功地召开了第一届网上智能国际会议后,网上智能这个计算机科学的子领域得到了计算机界人士的一致认可。网上智能协会( w e bi n t e l l i g e n c ec o n s o r t i u m ) 于2 0 0 2 年8 月5 日正式成立,它是一个致力于促进世界范围内w e b与a g e n t 智能时代的科学研究和工业发展的国际组织。除了发起该领域的研究外,w i c 协会计划通过通讯、国际期干0 和一年一届的国际会议发布和推动它的研究工作。2 0 0 3 年1 0 月在加拿大举办的第二届网上智能国际会议得到了i e e e计算机学会的赞助,获得了巨大的成功。w i c 协会也得到了迅速的发展,相继在加拿大、日本、韩国、瑞典、中国、中国香港等十余个国家和地区建立了研究分会。2 0 0 4 年9 月将在北京举办第三届网上智能国际会议,这次会议由i e e e 、w i c 和a c m 联合组办。国内网上智能的研究工作几乎与国际同步,这是因为w i c 的发起人之一钟宁教授是北京工业大学的特聘教授,通过定期的讲学和交流,带动了国内网上智能研究的发展。1 1 2 网上智能的研究现状智慧w e l b ( w i s a o m w e b ) 将是网上智能研究的下一个目标一1a 新一代的w e b系统除了完成信息搜索和知识查询外,还应使人们在生活、工作和娱乐中获得智慧。w i 对电子商务、电子科学、电子学习、电子政府等领域的潜在贡献是巨大的。目前,人们已经提出并研究了许多具体的应用系统。特别是,涉及终端客户的电子商务正经历着一场重大的变革,跟踪客户浏览行为的能力已使卖主和客户之间的距离空前地缩小,实现了商家和客户间的“零距离”。这使卖主能够大批量地为客户提供个性化的产品服务,从而使目标营销( t a r g e t e d m a r k e t i n g ) 成为一2 一第1 章绪论可能。5 一a 目前,w 曲挖掘( w 曲m i n i n g ) 和w 曲使用分析( w e bu s a g ea n a l y s i s )已经在电子商务中客户关系管理( c u s t o m e rr e l a t i o n s h i pm a n a g e m e n t ,c r m ) 和目标营销的应用中获得了巨大的成功,并发挥着越来越重要的作用。一种更新的挑战是探究在w e b 挖掘和与其相关的智能体体系之间的关系,如w 曲耕种( w e bf a r m i n g ) 技术,它的目标是对商务智能在w e b 上的信息资源进行系统化的精炼。个性化是w i 系统的一个重要特征,利用w i 技术对客户个性化特征的获取能够实现:基于用户的概要信息和使用行为对网上用户进行动态的推荐。根据用户需要,自动修改站点内容和内容的组织结构。将市场营销数据和w e b 使用数据相结合为营销者提供客户如何使用网站的信息。这些任务的完成无疑会增加商务站点的销售额并增强企业的竞争力。当然为了实现个性化服务,w e b 门户站点必须调查访问者的概要特征( p r o f i l e ) 和在线行为( o n l i n eb e h a v i o r s ) ,而不是简单地统计网页的浏览次数,因而需要利用w e b 挖掘技术来捕获和发现客户行为模式并据此实现网上智能系统。可见,网上智能的基石是有能力识别和了解用户,对客户特征的获取是网上智能系统实现个性化和一对服务的基础。面对复杂多变的w 曲环境,如何使用一个能适应新环境和新要求的具有鲁棒性的知识处理技术来实现对客户个性化特征的发现是该领域的一项重要的研究课题。1 1 3 网上智能的研究内容如果把网上智能理解为“基于w e b 的人工智能”,那么网上智能可看作是人工智能在w e b 环境中的具体研究;而如果把网上智能理解为“在w e b 上的人工智能”,那么网上智能可看作是人工智能在w e b 上的新应用【2 j 。人工智能在其它学科的应用常常能导致相应领域中新技术的产生,同理,网上智能的兴起必将伴随着一些新概念、新技术、新体系、新工具、新标准的产生。网上智能的一个最实际的目标是设计和实现i w l s ,i w i s 通常是一个包含有许多子系统的集成系统,它的实现涉及许多理论和技术的应用。目前,网上智能主要包括以下的一些研究主题:基于w e b 的智能电子技术( 电子科学、电子交易、电子学习、电子金融、电子政府、电子社团) 、w e b 信息过滤和检索、w e b 挖掘和放牧、w e b 信息管理、人w e b 的智能交互、基于w e b 的智能计算、w e b 代理、w e b 语义网络及管理、网格( g r i d ) 服务及其智能、w 4 ( w j r i dw i d ew i s d o mw e b ) 技术等,这些主题的研究都是围绕基于w e b 的智能电子技术这一中心进行的。网上智能为智能交易系统的开发和新一代基于w e b 的信息处理技术的研究一j 一北京工业大学工学博士学位论文和发展提供了极其丰富的研究课题。随着w e b 的快速增长,网上智能已引起人们的极大兴趣,已经实现了许多具体的应用系统,这些系统涉及电子商务( e l e c t r o n i cc o m m e r c e ) 、电子银行( e l e c t r o n i cb a n k ) 、电子诊所( e l e c t r o n i cc l i n i c ) 、电子图书馆( e l e c t r o n i cl i b r a r y ) 、电子教育( e l e c t r o n i ce d u c a t i o n ) 等诸领域。目前,网上智能中存在两个最为关键的问题:是在w e b 平台下对系统数据的知识发现。因为i w i s 系统的智能化离不开对w e b 信息的挖掘,所以对网上智能中知识发现的研究具有非常重要的理论和实际意义;二是如何处理w e b 环境下信息的不确定性。w e b 在给人们带来便利的同时也增加了信息的不确定性,因此对w e b 中不定性知识的表达和推理成为另一主要问题。本文的研究工作也是针对这两个问题进行的。1 1 4 网上智能的研究方式网上智能的研究必须高度重视w e b 挖掘、w e b 代理、o n t o l o g y 、网格等技术的发展【3 】,这是因为w i 目前的几个主要研究方式离不开这些技术支持。( 1 ) 语义w e b ( s e m a n t i cw e b ) w i 最基础的一个研究方式是对w e b 上的语义进行研究,即通过对w e b 信息的语义建模来研究语义w e b 。其目的是:允许w e b 上更多的内容能被机器所理解并自动处理。识别w e b 材料所涉及的语义背景。协调不同的用户团体所使用术语的差别。机器对w e b 信息的自动处理极大地促进了智能网络服务如信息经纪人、搜索代理等的发展。目前研究语义w e b 最常使用的技术是o n t o l o g y 和a g e n t 技术。( 2 ) 社会网( s o c i a ln e t w o r k s ) 将w e b 作为一个网络整体来研究能够更好地理解w e b 内容创建的社会性,并能极大地改进w e b 上搜索引擎的效果,促进团体挖掘和知识管理有效算法的开发。这种方式把w e b 视为一个有向的网络,网络中的每一个节点对于另外节点来讲都是一个静态的w e b 主页,因而w e b 能被当作一个图来研究,该图将由一组社会关系( 如友谊、合作或具有公共兴趣的信息交换等) 相联系的一组人( 或组织及其他社会团体) 连接起来。( 3 ) 创建w e b 挖掘网格( w 曲m i n i n gg r i d s ) w 曲挖掘是w i 技术的核心技术之一,人们预见它在未来的智能w e b 信息系统中会发挥越来越重要的作用。但是在实际应用中,人们发现w e b 挖掘过程极其复杂。因为在一个挖掘过程中存在许多标准、阶段、大量的步骤和候选的挖掘技术,且重复过程随处可见,如出现新数据或数据更新时挖掘过程可能就需要重复进行。为了解决这些问题,一种基于网格的方法被提出,它就是w e b 挖掘网格。借助于w e b 挖掘代理( a g e n t )团体的组织,该方法能够实现:一d 一第1 章绪论为不同的任务开发许多种类的w e b 挖掘代理。将w e b 挖掘代理组织到w e b 环境下作为中间件的具有多层次的网格中,该网格能够理解用户提出的问题,并将它们转换为w e b 挖掘任务,发现有关的资源和信息,最终得到一个复合的答案或解答。使用w e b 挖掘代理的网格对分布式的、多重的w e b 数据源进行多方面的分析。通过分布式的相互协作的多级控制授权管理w e b 挖掘代理的网格。换句话讲,挖掘网格是由许多称为w e b 挖掘a g e n t 的较小组件组成,每个a g e n t 自身只能做一些简单的事情,但当把这些a g e n t 组织到网格中,就能完成更为复杂的w e b 挖掘任务。总之,w e b 平台增大了信息被利用和访问的范围,这是以往任何一个计算机应用所无法达到的。w e b 为人们提供了一种其它媒介无法比拟的信息共享和传递的新方式。尽管由w e b 技术启动的革命才刚刚开始,但已给社会带来了许多巨大的变化,电子商务、电子银行和电子刊物等都如雨后春笋般地迅速成长起来。人们很难估计w e b 将会给未来的商业和工业界带来多么巨大的影响,所以致力于与w e b 相关的学科网上智能的研究和应用,对信息社会的未来有着极其重大的意义。1 2 主要技术1 2 1贝叶斯网的发展信息丰富是信息时代的最大特征,然而,在现实社会中的许多信息通常都是不完全、不完整或是不确定的,即使是领域知识或信息资源有时也是不可靠的。不定性知识存在于人们现实生活的每一天,如天气预报报告明天本市西北部地区的降水概率是8 0 ,医学专家称6 0 的发烧病人能对这种病毒产生免疫抗体等都表示了一种不确定的知识。人工智能的许多技术。如机器学习、模糊逻辑、模式识别、神经网络等都在试图处理这类问题,井在一些特定的领域上获得了成功。贝叶斯网作为一种强有力的不确定性知识表达与推理工具,近年来受到学者们的广泛重视,成为迄今为止处理不定性问题最有效的理论模型之一【_ ”。贝叶斯网是人工智能、概率理论、图论、决策理论相结合的产物,它基于概率理论利用对不确定知识的建模和推理来处理不确定问题。2 0 年前,学者们都以为用概率理论会导致许多知识表示上的困难,所以在a i 学术界盛行着概率方法不适用于建立智能系统的观点。从1 9 8 1 年r h o w a r d和5 m a t h e s o n 提出贝叶斯网络以来,贝叶斯网的研究引起了人们相当大的兴趣。一,一北京工业大学工学博士学位论文8 0 年代早期,贝叶斯网成功地应用于专家系统中对不定性知识的表达。1 9 8 5 年a i 领域中不定性问题研究团体的建立,推动了贝叶斯网在人工智能、统计学、运筹学和决策科学等领域的发展。1 9 8 8 年,p e a r l 在总结并发展前a 7 - 作的基础上,提出了许多贝叶斯网理论和技术,促进了贝叶斯网推理的迅速发展;进入9 0 年代,面对信息爆炸的局面,研究人员已经开始尝试直接从数据中学习并生成贝叶斯网的方法,并取得了初步的成果。与其它的人工智能技术相比,贝叶斯网模型在处理不定性问题上具有许多优势】,这是因为它把图形理论的表达和计算能力与概率理论有机地结合在一起。这些优势表现在:灵活的依赖性拓扑结构( 定性的依赖关系结构) ,辅以定量的概率关系计算,使贝叶斯网成为一种定性和定量相统一的知识表达工具。在建模过程中,结构学习和概率计算的分离使这种建模技术更灵活。贝叶斯网模型易于理解和解释,有明显的语义。贝叶斯网本身是种不确定性的因果关联模型,它将多元知识图解可视化为一种概率知识表达与推理模型,更为贴切地反映了网络节点变量间的因果关系及条件相关关系。这种依赖关系的图形表达对于普通用户具有很大的吸引力,易于被人们所接受。贝叶斯网模型具有强大的不确定性问题处理能力。贝叶斯网用条件概率表达节点变量问的依赖强度,能在有限的、不完整、不确定的信息条件下进行学习和推理,便于处理隐藏变量和数据遗失的情况。贝叶斯网能有效地进行多源信息融合。在模型学习中很容易将专家或先验知识结合在学习过程中,便于通过推理得到信息融合后的结论。正因为贝叶斯网模型具有如上的优点,所以人们对它的学习算法的研究和实际应用的兴趣与日巨增,贝叶斯网模型成为当前人工智能领域中不定性知识表达和推理的一个研究热点。1 2 2 贝叶斯网的研究现状目前,国外许多研究团体和机构,如美国的斯坦福大学、加利福尼亚大学、丹麦的奥尔堡大学、哥伦比亚大学、微软公司等,都在对贝叶斯网进行深入的研究。这些研究主要集中在如下的几方面:贝叶斯网的学习、贝叶斯网的推理、贝叶斯网的应用。许多研究已取得阶段性成果,并正在向实际应用方面转化l l 。在国内,清华大学对贝叶斯网学习、推理以及其在数据挖掘等方面的应用进行了较系统的研究【1 1 , 1 2 】;重庆大学在贝叶斯网学习、推理方法方面也进行了许多有益的尝试【1 0 3 3 - 1 8 】:吉林大学在贝叶斯网学习算法、独立关系等方面也进行了深入的研究 1 9 - 2 1j :此外,些学者对基于贝叶斯网的不确定知识处理方法展开了一些研究一6 一第1 章绪论工作【2 。国防科技大学探索了贝叶斯网在设备故障诊断和维修决策中的应用,并着重研究了贝叶斯网的多源信息表达与融合能力和复杂的不确定性问题处理能j 2 3 , 2 4 1 。经过十几年的努力,贝叶斯网络得到了很大的发展,取得了丰硕的成果:在贝叶斯网学习方面,形成了基于条件独立性测度【2 5 。2 7 和基于评分搜索 2 8 - 3 1 的两种结构学习的基本方法,以及基于经典统计学 3 2 1 5 1 1 基于贝叶斯统计学【3 3 l 的两种参数学习的基本方法;在贝叶斯网推理方面,已经建立了一批高效的推理算法 3 4 - 3 6 】,这些算法可分为精确推理和近似推n 3 5 , 3 6 1 两类,由于结构复杂的贝叶斯网推理计算是n p 难题【3 ”,因此目前对贝叶斯网推理的研究重心已经转向了已牺牲部分推理精度来换取快速运行时间的近似推理算法的研究。目前的近似方法可分为三类:基于仿真的方法【3 8 、基于搜索的方法口9 】和基于模型简化的方法【4 0 j 1 1 ;在贝叶斯网应用方面,主要集中在基于贝叶斯网的应用软件系统开发 4 2 1 和基于贝叶斯网的实际应用方面【4 。随着贝叶斯网理论和技术的成熟,贝叶斯网己经成功应用于计算视觉、自然语言处理、机器人导航、金融市场分析、智能机器人、数据挖掘、医疗诊断、决策控制、智能信息检索等领域。1 3 课题的研究意义由于网上的信息具有很大的不确定性,所以我们选择贝叶斯网模型作为网上智能系统中知识表达和推理的基本技术手段,针对贝叶斯网结构学习

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论