![[硕士论文精品]基于模糊本体论的学生就业问题的研究_第1页](http://file.renrendoc.com/FileRoot1/2017-12/8/d8400146-a828-418e-a0a4-03e16abf42db/d8400146-a828-418e-a0a4-03e16abf42db1.gif)
![[硕士论文精品]基于模糊本体论的学生就业问题的研究_第2页](http://file.renrendoc.com/FileRoot1/2017-12/8/d8400146-a828-418e-a0a4-03e16abf42db/d8400146-a828-418e-a0a4-03e16abf42db2.gif)
![[硕士论文精品]基于模糊本体论的学生就业问题的研究_第3页](http://file.renrendoc.com/FileRoot1/2017-12/8/d8400146-a828-418e-a0a4-03e16abf42db/d8400146-a828-418e-a0a4-03e16abf42db3.gif)
![[硕士论文精品]基于模糊本体论的学生就业问题的研究_第4页](http://file.renrendoc.com/FileRoot1/2017-12/8/d8400146-a828-418e-a0a4-03e16abf42db/d8400146-a828-418e-a0a4-03e16abf42db4.gif)
![[硕士论文精品]基于模糊本体论的学生就业问题的研究_第5页](http://file.renrendoc.com/FileRoot1/2017-12/8/d8400146-a828-418e-a0a4-03e16abf42db/d8400146-a828-418e-a0a4-03e16abf42db5.gif)
已阅读5页,还剩55页未读, 继续免费阅读
[硕士论文精品]基于模糊本体论的学生就业问题的研究.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要摘要自2001年TBEMERSLEE提出语义网以来,越来越多的学者对其进行了研究。与万维网相比,语义网能够更好的对信息实现“精细、准确和自动化“的搜索。其中,如何对本体进行划分,与实现语义网中的信息自动搜索密切相关。传统的本体主要是利用明确概念间的语义关系进行信息的查询,而自然语言的一个重要特点就是不确定性,所以将模糊概念与模糊关系应用到本体中进行研究十分必要。随着社会的进步与发展,学生就业问题对一个国家的整体发展具有一定影响,但是用人单位招聘时所提出的条件多数为模糊条件,传统本体不能进行模糊概念的语义查询,因此尚不能做到对信息搜索的查全率与查准率。为了有效地处理雇佣信息的模糊与不确定现象,建立能够进行模糊概念间语义查询的模糊本体是可以合理解决上述问题的一个重要方法。因此,对学生信息领域模糊本体的划分与研究至关重要。首先,本文在基于模糊领域本体与模糊顶层本体定义的基础上,给出四层模糊本体的定义,进而提出基本模糊本体;其次,针对包括学生的自然情况、获奖情况的学生信息领域,将学生信息中包含的知识结构以本体的形式表示出来,即建立关于学生信息领域的四层模糊本体;最后,针对学生就业问题举出实例,将四层模糊本体应用到实例中。根据用人单位的招聘条件,通过求和与加权方法计算出对学生的综合评价,再通过词计算推理以及建立关于模糊概念的语义查询,在保证符合语义条件的信息不遗漏的前提下实现信息搜索,从而提高信息搜索的查全率与查准率。关键词模糊本体;词计算学生信息;语义查询英文摘要ABSTRACTSINCETHECONCEPTOFSEMANTICWEBWASPROPOSEDBYTBEMERSLEEIN2001,MOREANDMORESCHOLARSHAVERESEARCHEDONITCOMPAREDWITHTHE懈RWTHESEMANTICWEBCALLDOBETTERATREALIZING“CAREFULEXACT,AUTOMATIC”SEARCHABOUTTHEINFORMATIONHOWTODIVIDEONTOLOGYISCLOSELYRELATEDTOREALIZEAUTOMATICSEARCHOFSEMANTICWEBINFORMATIONTHETRADITIONALONTOLOGYMAINLYUSESTHESEMANTICRELATIONSOFCRISPCONCEPTSTOQUERYINFORMATIONACCORDINGTOTMEERTAINCHARACTERISTICOFNATURALLANGUAGE,ITSNECESSARYTHATFUZZYCONCEPTSANDFUZZYRELATIONSAREAPPLIEDTOONTOLOGYALONGWITHTHESOCIETYPROGRESSANDDEVELOPMENT,ITSTRUETHATEMPLOYMENTOFSTUDENTSISESSENTIALTOTHEOVERALLDEVELOPMENTOFCOUNTRY,HOWEVER,MOSTOFRECRUITMENTCONDITIONSOFCOMPANIESAREFUZZYCONDITIONS,THESEMANTICQUERYBETWEENFUZZYCONCEPTSCANTSBEPERFORMEDINTHETRADITIONALONTOLOGY,ITCALLTCHECKOVERALLANDEXACTLYINORDERTOHANDLEFUZZYANDUNCERTAINTYOFEMPLOYMENTINFORMATION,AFUZZYONTOLOGYMODELWHICHISCAPABLEOFFUZZYCONCEPTSSEMANTICQUERYWILLBEESTABLISHED,ITISANIMPORTANTMETHODTORESOLVETHEPROBLEMSORESEARCHONHOWTODIVIDEFUZZYONTOLOGYFORSTUDENTSINFORMATIONDOMAINISOFGREATIMPORTANCEINTHISPAPER,WEFIRSTLYPRESENTAFOURLAYERFUZZYONTOLOGYBASEDONFUZZYDOMAINONTOLOGYANDFUZZYTOPLEVELONTOLOGY,THENPRESENTBASICFUZZYONTOLOGYSECONDLY,AIMINGATTHEDOMAINOFSTUDENTSINFORMATIONWHICHINCLUDEDNATURESITUATION,REWARDSSITUATIONANDSOON,THEKNOWLEDGESTRUCTUREOFSTUDENTSINFORMATIONISEXPRESSEDASONTOLOGYWEESTABLISHTHEFOURLAYERFUZZYONTOLOGYFORSTUDENTSINFORMATIONDOMAINFINALLY,THEFOURLAYERFUZZYONTOLOGYMODELWILLBEAPPLIEDTOEMPLOYMENTOFSTUDENTSBASEDONTHERECRUITMENTCONDITIONSOFCOMPANIES,WECALCULATESTUDENTSCOMPREHENSIVEEVALUATINGBYSUMMINGANDWEIGHTING,ANDTHENSEMANTICQUERYBETWEENFUZZYCONCEPTSAREESTABLISHEDBYCOMPUTINGWITHWORDSINFERENCINGTHENTHEFOURLAYERFUZZYONTOLOGYACCOMPLISHESTHESEARCHINGOFINFORMATIONANDTHECONDITIONOFOMIRINGINFORMATIONOFCOINCIDENCESEMANTIC,ANDACHIEVETHEPURPOSEOFIMPROVINGTHEOVERALLANDEXACTLYSEARCHOFINFORMATION英文摘要KEYWORDSFUZZYONTOLOGY;COMPUTINGWITHWORDS;STUDENTSINFORMATION;SEMANTICQUERY大连海事大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明本论文是在导师的指导下,独立进行研究工作所取得的成果,撰写成博硕士学位论文二基王搓攒奎佳途鳆堂生萱些间题的珏究一。除论文中已经注明引用的内容外,对论文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本论文中不包含任何未加明确注明的其他个人或集体已经公开发表或未公开发表的成果。本声明的法律责任由本人承担。学位论文作者签名二埤学位论文版权使用授权书本学位论文作者及指导教师完全了解大连海事大学有关保留、使用研究生学位论文的规定,即大连海事大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权大连海事大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文。同意将本学位论文收录到中国优秀博硕士学位论文全文数据库中国学术期刊光盘版电子杂志社、中国学位论文全文数据库中国科学技术信息研究所等数据库中,并以电子出版物形式出版发行和提供信息服务。保密的论文在解密后遵守此规定。本学位论文属于保密口在年解密后适用本授权书。不保密酉请在以上方框内打“论文作者签名釉习P导师签名日期坳年月彩基于模糊本体论的学生就业问题的研究11研究背景及研究意义第1章绪论111课题研究背景学生就业问题对一个国家的发展具有一定的影响。对招聘单位而言,希望做到有效而准确地搜索出符合条件的学生信息。在目前的信息搜索中,一般采用的方法都是在万维网中,输入所要查询内容的主要条件,然后计算机会根据所输入的条件进行搜索,凡是和条件相关或有相同、相似词语的结果都会搜索出来。但是由于目前的万维网只是对相似词语的匹配,而这其中不包括词语间的语义关系,所以搜索出的内容很多是无关的信息,只能对第一次搜索的结果进行再次筛选。而一些符合应聘条件,但与招聘条件中的要求表达方式有所不同的应聘者,由于计算机不能进行模糊概念的语义查询,所以会导致未必能搜索到这些学生的信息,因此无法做到对信息搜索的查准率和查全率。所以我们希望可以将语义NQ推广,实现对信息的语义搜索。防止在简单的词语匹配中,漏掉符合条件的应聘者,甚至搜索到一些不相关的信息。因此如何实现通过词语的语义关系进行信息搜索变得尤为重要。词计算121T是用“词语代替数字进行推理和计算的一种方法“,可以有效的对词语问的语义关系进行推理,有助于信息搜索。将词计算应用到模糊本体中,可以避免万维网中一些不能解决的搜索问题。通过词计算推理与建立基于模糊语言值的语义查询,实现根据用人单位提出的模糊招聘条件搜索到完全符合条件的应聘者,并提高信息搜索的查准率与查全率。112课题研究意义近年来,对于模糊本体应用的研究越来越受到人们的关注。自TBEMERSLEE【LJ提出如果语义信息在WEB上广泛应用,那么“精细、准确和自动化“的搜索就会实现,进而提出语义网。对于现在社会比较关注的学生就业问题而言,在万维网的搜索中,般的就业网站都是学生输入个人信息后生成一份简历,然后学生可以用这份网络中虚拟的简历去进行应聘,或者用人单位通过输入本单位注重的几项要求在海量的学生简历中进行筛选。对于用人单位而言,即使输入招聘条件也第L章绪论不包括词语间的语义关系,更不包括模糊概念间的序关系、包含关系,因此很难通过一次搜索达到预期结果。针对这一问题,如果先对学生信息领域中包含的知识结构以本体的形式表示,构建成含有模糊概念、模糊关系的模糊本体模型,然后用人单位在这一领域中根据所提出的招聘条件,通过词计算推理与建立基于模糊概念的语义查询,可以实现对信息搜索的查准率与查全率。因此如何实现词语间的语义匹配就显得十分重要了。所以研究语义关系,对模糊本体划分,并将词计算有效地应用于模糊本体中,对学生就业问题有很大的帮助。12国内外研究的现状121词计算及其研究现状从提出词计算以来,许多学者将其应用到不同的领域。文献【3】利用词计算对文本文件的自动分类问题进行了讨论。作者采用ZADEH所提出的标准语言命题和语言变量的量化计算,对信息检索的结果使用模糊查询,进而实现文本文件的自动分类;文献【4】的实质是想建立连接人类自然语言表示与计算机的数值表示之间的一架桥梁,主要讨论在语言层次上,如何通过词计算对信息进行动态地有效利用,进而解决复杂系统的相关问题;文献【5】应用模糊数与模糊数的运算法则,使用词计算从基于感知的信息中进行模糊控制规则的提取;文献【6J将词计算应用到对模糊本体中的信息查询。随着对人工智能的研究,人们越来越关注对语义网的开发与探究,而这其中对本体的分类与如何实现对信息的查准率尤为重要。本文将词计算作为一种基础的文字计算应用到模糊本体中,在规定的领域内,可实现对信息的模糊查询。122模糊本体论的研究现状本体一直是对某个领域进行研究,加入模糊概念和模糊关系的本体结构能够实现对存在抽象概念的领域进行语义查询。文献【7叫提出一种模糊本体模型,分别与代理技术相结合,应用于气象新闻摘要的自动提取。在规定领域,将自然语言中的命题量化后进行计算,不仅可以将冗长的信息简化并自动提取出一篇新闻中的主要信息,也可以对新闻的主要信息准确把握,大大节约了读取新闻的时间;文献【10111提出一个模糊本体框架,将一个模糊关系通过模糊隶属函数去编码属性2基于模糊本体论的学生就业问题的研究值,而文中提出的模糊本体框架则是对上述模糊关系的一个概念描述;文献蚴提出将模糊本体引入语义信息检索中,实现在语义信息检索中提高对模糊信息进行检索的查准率与查全率;文献【13】提出将模糊本体应用到业务知识管理中,并研究了其构造方法;文献【14】将描述逻辑在语义网中推广到模糊本体上;文献【15】提出将模糊本体应用到医学文件检索中;文献【161提出模糊OWL语言。13本文的主要工作本论文最终想实现的结果是通过建立学生信息领域的模糊本体,并针对学生就业问题的实例,用求和与加权法计算出招聘过程中用人单位所关注的学生综合评价情况,再通过词计算推理以及建立关于模糊概念的语义查询,实现在招聘条件为模糊概念的前提下搜索出符合要求的学生信息。保证在不遗漏符合条件的学生信息的同时提高对包含模糊变量的信息搜索的查全率与查准率。本论文的主要工作包括1基于模糊领域本体与模糊顶层本体的定义,给出四层模糊本体的定义。2通过模糊概念间的语义关系,将上述四层模糊本体模型应用到学生信息领域的知识本体结构中。3针对学生就业问题的实际例子,对学生信息领域建立四层模糊本体模型。根据招聘条件与实际问题,通过学生的自然情况和获奖情况,对各项指标进行合理量化与求和、加权的基础上,计算出可以综合评判学生的综合评价,使用人单位可以更好的对符合要求的多名学生择优选择;再通过词计算推理与模糊语言值的语义查询,实现对符合条件的学生信息的搜索。即利用模糊本体可以实现语义与模糊概念层次的信息搜索,从而提高信息搜索的查准率与查全率。第2章模糊理论基础第2章模糊理论基础自ZADEHLL71于1965年在信息与控制杂志上发表了一篇开创性的论文模糊集合以后,模糊集理论引起了学术界高度的重视,同时也吸引了大量学者对其进行研究。自模糊理论诞生以来,这个新兴的理论就一直处于各派的争论之中,一部分学者认可这一理论并开始着手对其进行研究,而另一部分学者认为这与基本的科学原理相违背。但随着科学技术的深入发展,系统中需要我们研究的变量越来越多,而且变量之间的关系也越来越复杂。对系统的分析和推理的精确性要求也越来越高。实践告诉我们复杂的系统是难以精确化的。正如ZADEH所说当系统的复杂性增长时,我们对系统的特性作出精确而有意义的描述的能力将降低,直至达到这样一个阈值,一旦越过它,精确性和复杂性就变成两个相互排斥的特性。因此在这样一个“不相容原理“下,对问题的模糊性进行讨论变得尤其重要。自1975年,MANDANI和ASSILIANTL8LT,J立了模糊控制器的基本框架,并将模糊控制器用于控制蒸汽机以来,多个处理实际系统的模糊控制器相继诞生,模糊理论的大规模应用使其逐渐成为一个独立的领域。21模糊集合及其运算211模糊集合的基本概念在经典集合论中,集合可以表示概念,而集合的运算和变换又可以表示判断和推理。一个对象对于一个集合来说,要么属于,要么不属于,二者必居其一,且仅居其一,绝不允许模棱两可。因此一个集合到底包含哪些对象是明确的,这也是集合论最起码的要求。但在日常生活中,人们除了识别“非此即彼”的概念外,还要识别“亦此亦彼”的不确定概念,例如“天气很热“,这就是一个不确定的概念。每个人对天气热的定义标准不同,可以说27度以上为很热,也可以定义为30度以上为很热。因此对于这个概念而言就不是特征函数仅取1或0的值就能解决的问题,这就要求有一种新的数学工具,它能够处理这种客观事物差异的中间过渡中的“不分明性气模糊数学正好就是用来解决这一问题的数学工具,它将特征函数在模糊数4基于模糊本体论的学生就业问题的研究学中通常将它称为隶属函数的取值从0,1扩充到在0,1中取值。例如,假定X中有六个元素分别表示6个人的身高155,165,160,175,178,180,现在问题是有哪几个人是属于集合高个子的,这样特征函数只能在区间O,1中取值。因此在解决模糊问题上,模糊数学更容易被理解、被接受。定义21【191考虑论域X中的一个普通集合彳,模糊集A可用一个集合或序偶二元关系来定义A戤,PBIXA,1TB【O,1】21其中,“G称为隶属函数,它表示彳中任意一个元素X属于模糊集么的程度。式21给出的定义将彳中的每个元素X与区间0,1中某个实数P_G联系起来,ILB的值越大,则表明该元素X属于模糊集A的程度越高。我们还可以换一种方法来理解式21所给的定义,序偶G,PB中的第一个元素是一个给定的数或者普通集合彳中的一个对象或事物,它们部分地满足某个特性;第二个元素“_G在O,1中取值则表示元素X在什么程度上满足该特性。通过式21已经说明任意一个模糊集都与一个隶属函数对应。在论域是实数集的情形下,常给定一些带有参数的,值域为0,1的函数,供各类实际问题选用,并称之为模糊分布函数。下面简章介绍几种模糊分布函数。1正态型分布【23】三竺12P月B口,OPL。JA,O是参数,且O0222梯形分布23】“一G;口,6,C,D3S型分布【2310XA,DC口,B,C为参数,且加字。24212模糊集合的运算考虑论域X中的两个模糊集彳和BA扛,P4GPG【0,L】B扛,P曰BP口G【0,1】么和B之间的运算可用它们的隶属函数“彳G和“占G之间的运算来表示。定义22【19】1相等两个模糊集彳和B是相等的A曰,当且仅当对每个XX,有P爿GP口B252包含模糊集彳为B所包含0曰,如果对每个XEX,有肛4G“口G263,真子集模糊集彳是模糊集B的真子集0CB当彳是B的一个子集,且么B,即PGPBG对每个工YPGC巅蹴THEN226我们先了解一下模糊命题。有两种形式的模糊命题原子模糊命题与复合模糊命题。原子模糊命题是简14基于模糊本体论的学生就业问题的研究单旬“XISA炒,其中X为语言变量,彳为X的语言值,么用X论域上的模糊集来表示。复合模糊命题是原子模糊命题利用连接词“且、“或及“非“连接而成的命题。例如,用X表示一个人的年龄,则有如下形式X为SX为MX为FX为S或X非膨X非S或工非FX为S且X非F或X为肘这里,S、M和F分别表示模糊集“青年、“中年和“老年”。在复合模糊命题中,原子模糊命题是独立的,且语言变量也不必是一致的。因此,复合命题应该理解为模糊关系。如何确定这些模糊关系的隶属函数呢有以下方法1连接词“且“用模糊交设X,Y为语言变量,其论域分别为U,矿。设丘丑分别为U,Y上的模糊集,则复合命题。X为彳且Y为丑“可以解释为UXG上的模糊关系AXB,AXB的隶属函数定义为AXBX,J,R阻G,丑】227其中T为某R一模。2连接词“或“用模糊并复合命题“X为4或Y为B可以解释为UXV上的模糊关系彳UB,彳UB的隶属函数定义为AOSXZ,Y;S乜B,B】228其中S为某S一模。3连接词“非用模糊补复合命题“非A“解释为A。,其中C为补算子。15第2章模糊理论基础对模糊命题认识清楚以后,我们就可以解释模糊IFTHEN规则了。在经典命题演算下,条件句“IFPTHENQ“写为P9,2,而蕴涵词一其真值由表21定义。表21蕴涵P_Q的真值TAB21THEREALVALUETABLEOFIMPLICATIONP_G因此,从真值角度,P一9PVQ0AQVP,其中,V,A分别表示经典逻辑中“非“、“或“与“且“运算。而模糊IFTHEN规则与经典IFTHEN规则相比只是用模糊命题代替P与G,从而我们对模糊IFTHEN规则进行解释,只需把一,V,A换为模糊定义下的“非“、“或“与“且“算子即可。为此,我们先把模糊IFTHEN规则写为下式IFTHEN229简记为冠一皿其中届,皿分别表示模糊命题。假设B为UU,XUUN上的模糊集,皿为VKK圪上的模糊集,工和Y分别为U,Y上的语言变量,而专表示模糊蕴涵。模糊蕴涵的几种常见的解释1剩余类蕴涵R一蕴涵瞄1设F为卜模则蕴涵算子一,【0,L】2一【0,1】定义为16基于模糊本体论的学生就业问题的研究A,BVC【0,1IR口,C6,VA,B0,1】,230称专,为由,诱导的R一蕴涵。常用的足一蕴涵包括G。DEL蕴涵陋】口一G6J1口6231LB,口6其中TA,6AB;LUKASIEWIEZ蕴涵瞄1口_BLL曲1,1一AB232其中FMA【O,AB一1;GUOGUEN蕴涵圈口一G6皇1233其中TA,6AB。2强蕴涵S一蕴涵瞄1设C为补,S为J一模,则蕴涵算子一【0,1】2一【0,1】定义为A_BSG06234其中VA,B【O,1】,称寸为S一蕴涵。常用的S一蕴涵包括KLEENEDIENES蕴涵捌口寸KB1一AVB235REICHENBACH蕴涵F冽口_RB1一AAB2363量子逻辑蕴涵舛一蕴涵【22】设S为S一模,T为F一模,C为补,则蕴涵算子一【O,1】2一【O,1】称为舛一蕴涵,口斗BSCA,FD,6,V口,B10,1】。常用的舛一蕴涵包括早期ZADEH蕴涵T22JAZB1一AVAB237及蕴涵蚴口B1一AA2B238根据以上三种类型蕴涵,可将模糊规则IFTHEN皿解释为UXV上的模糊蕴涵算子Q,Q的隶属函数如下定义瞄1QG,少,驾G,B,VXU,VYV23917第2章模糊理论基础其中冠寸皿表示了一种整体蕴涵。但是,因为鹚和皿都是模糊命题,蕴涵螂一皿有时只是表示一种局部蕴涵【261,这时,蕴涵算子一也可以解释为MAMDANI蕴涵,这也是实际系统中常用的一种蕴涵。4MAMDANI蕴涵合取型蕴涵圈设,为卜模,若蕴涵算子哼【0,L】2一【O,1】定义为一F,则称F为MAMDANI蕴涵。这时规则IFTHEN解释为UXV上的模糊关系Q,Q的隶属函数如下定义为QX,YTFP。G,必YKWU,渺V240其中,为T一模,最常用的为取小运算与乘积运算。25模糊逻辑与近似推理251经典逻辑与模糊逻辑在经典逻辑中,通常用一个真值表来表述命题间的关系。逻辑公式是将基本的逻辑算子合取“V”,析取“V,蕴涵“一,等价“H”和否定“组合到适当的代数表达式中所形成的。当一个逻辑公式所表达的命题总为真,而无论公式中的基本命题的真值是何值时,称该逻辑公式为永真公式。永真公式的各类形式都可以用作于推理,这就是推理规则。经典逻辑的推理规则常用的为假言推理,即肯定前件和否定后件的假言推理形式。肯定前件式MP规则,也称分离规则22】大前提一般规则若X是4,贝吵是B小前提特殊论据X黝结论Y是B用命题逻辑公式表示形式为00一G专G否定后件式MT规则R22】大前提一般规则若X黝,贝吵是B小前提特殊论据Y不是B结论X不黝用命题逻辑公式表示形式为1口0JQ”专H18基于模糊本体论的学生就业问题的研究三段论规则HS规则F22】假设1若X是4,IUY是B假设2若少是B,IUZ是C结论若X黝,则Z是C用逻辑公式表示的形式为9GG寸,_,在模糊逻辑中,命题均为由模糊语言表述的模糊命题。模糊逻辑的最终目的是将模糊集理论作为一种主要工具,为不精确命题的近似推理提供理论基础。作为传统的假言推理的发展和扩充,模糊逻辑的基本形式也可以有相应的肯定前件式和否定后件式及三段论规则,称为广义的肯定前件式、广义的否定后件式和广义的三段论规则,其形如下广义的肯定前件式GMP瞄】前提1如果Z黝,则Y是B前提2如瓢黝7结论Y是B广义的否定后件式GMT吲前提1如果Z黝,贝吵是B前提2Y是B结论X黝广义的三段论规则GHS【22】前提L如果X黝,贝吵是B前提2如釉是B7,则Z是C结论如瓢黝,则Y是C现已给出模糊逻辑的三条基本原理,如何由前提得到模糊推理的结果,下面介绍模糊推理合成规则。252模糊推理的合成规则推理合成规则1是下面人们熟知的函数过程的一般化假定有一个函数Y厂G,并给出XA,那么从X口和少厂G,能够推断Y6FA,B可以19第2章模糊理论基础看成直线XA与SX的交点在Y轴上的投影。然后再将上面的过程一般化,一般化到口是一个区间,而0是区间值函数。此时,为找出与区间A对应的区间Y6,首选构造一个底为A的柱状集A,即AAXR,找到A与区间值函数曲线的交R,然后把R投影到Y轴上就得到所求的Y,即区间B。下面将一般化的过程再向前推进一步。假定彳是X上的一个模糊子集,而R是X到】,上的一个模糊关系。构造一个彳的柱状模糊集合彳,彳与模糊关系火相交,得到模糊关系彳NR,然后把它投影到Y轴上,得到Y上的模糊子集B,即为推理结果,B如下计算彳G,YAX2410NAG,YF0G,Y,RG,Y”242口V0NRX,YVF阻B,RG,Y】243“;JZ“其中F为任一,一模,也记为木,则有B7V阻GRX,Y】244此种计算推理结果B的方法称为模糊推理合成规则,也称为SUP一事合成,记为BAOR。基于SUP一合成,可以给出GMP、GMT、GHS的推理方法如下广义的前件肯定式瞄】X翮7如果X黝,贝吵是BY是BB彳。0一B计算为曰VXGX阻7G0一召,Y】245其中彳J曰依赖于模糊规则如瓢黝,贝吵是B。以下类同。广义的后件否定式阎Y是B如果工是A,则Y是BX黝基于模糊本体论的学生就业问题的研究则彳曰。0_B1计算为彳7GV岿Y陋木彳一BXX,Y】广义的三段论规则陴1如果X黝,贝吵是B如黔是B,则Z是C如黜黝,则Y是C则彳_C0一B。陋7一C计算为0一C融,ZVYD陋_召融,少幸召一C炒,Z】2L246247第3章词计算第3章词计算词计算【2】的概念是由ZADEH教授最先提出。他的许多篇论文都为其做了良好的理论工作与铺垫。1965年,由ZADEH教授提出的模糊集理论【17】标志着模糊数学的建立。在模糊变量、模糊推理等一系列模糊概念的基础上,ZADEH教授于1973年提出语言变量和信息粒化的概念口71,这些概念的提出对模糊逻辑理论的发展及应用起到了巨大的推动作用。1975年ZADEH教授提出模糊约束和模糊约束传播的相关概念【281。在随后的近十年时间,这些概念在多个领域得到了充分的发展129351。1996年ZADEH首次明确提出“词计算理论“COMPUTINGWITHWORDS。词计算是用词语取代数字而进行计算和推理的一种方法【2】。通常人与人之间的交流都是自然语言。人们通常也是用自然语言进行推理,即从用自然语言表示的前提出发,得到用自然语言表示的结论。词计算正是模仿这种推理,通过人机交流,希望从人类的自然语言出发,计算机能够实现用词语代替数字进行计算、推理,明白人们自然语言所要表达的思想,从而得到用自然语言表示的结论。在词计算中,粒的概念是出发点。因此,下面首先介绍一下与粒相关的概念,进而再简单介绍一下与词计算相关的理论。31粒的相关概念粒是点的模糊集,而这些点是由于相似性或相近性结合在一起的一簇元素。一个词W是一个粒G的标签,粒G是词W的外延。一个词可以是原子词,也可以是复合词,词的外延可以是高阶谓词。粒是粒计算研究对象的单位,是粒计算最初的概念,是求解问题的基本单位。可以将粒看作数据库中的记录,集合的元素或者是子集。一个物体的粒化产生一系列的粒,每个粒可以看作是因为具有相似性而聚集在一起的一簇点。这和我们在经典集合中,集合与元素的关系极为相似,不同之处在于粒是一个模糊概念,没有明确的划分。点粒之间由于难以区别,或接近,或相似,或由于某种功能而结合在一起,因此在一定程度上可以将粒的结构看成空间信息的结构。粒化在本质上是分层次的,最低层次的粒化是基本粒,它可以是不确定的、模糊的,也可以是精确的。“对象彳的粒化是通过不可分辨性、基于模糊本体论的学生就业问题的研究相似性、近似性或泛函性,把A的粒聚集成一组对象嘶3。311信息粒化信息粒化是指在实际生活中,人类经常会遇到大量复杂的信息问题,而如果将这些问题看成一个整体来解决与处理,往往会因为人的能力有限或工作量过于庞大而很难达到预期的结果。因此,把大量的信息按照其各自的特性划分为若干个相对而言较为简单的块,把每一个划分出来的块称为一个粒,这样可以将大量复杂的问题简单化,这种处理信息的方法被称为信息粒化。312模糊信息粒化ZADEH教授曾提出人类的认知过程包括三个概念粒化、组织和因果。粒化主要是指整体分解为部分;组织是指将部分结合为整体;因果是指原因和结果之间存在的逻辑推理关系。人的概念大部分是不精确的、模糊的,因此人脑在对大量信息进行推理的过程中所形成的概念粒也是模糊的,所以模糊粒可以看作是模糊集。处理大脑中大量复杂信息问题的信息粒化可以看作是模糊信息粒化。通过广义约束来刻画的模糊信息粒化称为模糊信息粒化理论37138】TFIGTHEORYOFFUZZYINFORMATIONGRANULATION。粒主要分为可能粒、真实粒、概率粒。在模糊信息粒化理论中,主要的广义方法有模糊化F广义化、粒化G广义化和这两种广义化方法的结合模糊粒化F、G广义化。在模糊逻辑的应用中,语言变量、模糊“IFNEN“规则及模糊图这些基本概念起着决定性作用,并可以使模糊逻辑与其他处理不确定性与不精确性的方法区分开,而F、G一广义化则是这些基本概念的基础。32词计算的原理321模糊约束显示化和标准形式我们所了解的模糊约束显示化是建立在试验得分语义口91基础之上的,在这个语义中,自然语言描述的命题P看作是一种模糊约束,而以自然语言表述的前提的含义则由隐含在自然语言命题中的模糊约束所决定。为了显示前提中的模糊约束,需要将命题P中的模糊约束表示成标准形式。因此用自然语言描述的命第3章词计算题P可以表示为PXISR31这里,R是产生约束作用的模糊关系,X是被约束的语言变量。而在自然语言所表述的命题中,具有模糊约束的模糊关系有许多种,例如等价关系、合取关系、析取关系等。为了更好地表现自然语言中所存在的多种关系,ZADEH教授进一步提出广义约束的概念XISR尺32ISR表示月对X的约束方式,变量,的取值决定了R对彳的约束作用。,取下述元素时所代表的含义为,P等价关系;,D析取关系;厂C合取关系;,P概率关系,矿模糊图等21。322模糊约束传播词计算的主要任务是从自然语言的前提出发得到以自然语言表述的结论。除了将隐含在前提中的模糊约束转化为标准形式,还需要将这种约束传播到结论,这样才能实现从自然语言出发,得到自然语言。因此引入模糊约束传播的概念,它的任务就是将隐含在前提中的模糊约束传播到结论。传播的过程实际就是模糊推理的过程,即在词计算中,模糊约束传播就是运用模糊逻辑推理的过程。下面列出一些主要的模糊约束传播规则【2】其中彳、召是产生模糊约束的模糊关系,析取和合取分别通过T范数和S一范数140来定义。合取规则1XISXTSXISAF、B33基于模糊本体论的学生就业问题的研究合取规则2XU,】,B,ACU,BCVXISAXTSB似,】,ISAXB其中AB表示笛卡儿积。XISA析取删L黜析取规则20CU,BCVXISAXISB伍,YISAXVUUXB这里AXV和UXB分别是A和B得柱状扩展【251。还有投影规则、满射规则、复合规则、三段论规则、矗古。口O343536映射规则和逆映射规则对于多个模糊变量而言,这些主要的模糊约束传播规则可以概括为广义的扩展原理【2】37在这个公式中,可以将X五,置,以看作是数据库变量,分子由初始数据集IDS所导出的模糊约束组成,分母终端数据集TDS表示对问题目,五9E9以的一个模糊约束,F。0表示模糊关系4在映射FUV下的原象,其中么是V上的一个模糊子集,U为厂,置,以的定义域【2】。33词计算的概念结构怎样从自然语言命题的前提出发,通过模糊约束显示化、模糊约束传播和模糊约束重翻译,得到以自然语言描述的结论是词计算的关键,也是词计算主要解决的问题。因此,可以将词计算的概念结构描述为图31【2】第3章词计算图31词计算的概念结构FIG31CONCEPTUALSTRUCTUREOFCWW从图31的结构可以看出,词计算是从自然语言的前题出发,得到自然语言描述的结论的过程。即己知一系列用自然语言描述的命题,将其看作前提,这些前提组成初始数据集IDS,然后模糊约束显示化将隐含在IDS中的模糊约束表示成标准形式,模糊约束传播通过模糊逻辑推理推导出结论,此结论以诱导的模糊约束形式所表示,再通过语言近似将诱导的模糊约束转化为自然语言,从而实现词计算的“计算”过程从自然语言的前提出发,得到以自然语言描述的结论。表示词计算前题的IDS是用自然语言所表示的,其中也包括大量的数字计算。但从概念结构图中来看在词计算的过程中,这些数字的计算都是幕后的,而呈现给用户的只是词语与词语之间的推理与计算,因此词计算的实质就是模糊逻辑。基于模糊本体论的学生就业问题的研究第4章模糊本体论的理论研究41语义网与本体的相关概念及性质411本体的概念与特征“本体论”【4145】最早出现在哲学中,从形而上学的角度讲,是指对世界上的客观存在的事物的描述。到目前为止,本体还没有一个明确的定义,但普遍被人们所认同的定义为“本体是共享概念模型的明确的形式化规范说明”L删。我们也可以理解为“本体就是描述同一领域内概念与概念间的关系“。通过定义可以体现出本体所包含的四大特征【47】1明确。被引用的概念所属于的类以及在使用此概念时的限制条件都应预先给出明确的定义和说明。即首先要明确本体应用的领域。2形式化。本体是为语义网【L增艮务的,因此必须具有良好的机器可读性。3共享。在一个本体中,知识所表达的观念与观点应该不仅被一小部分人接受,而是被整个群体所接受,要让所有在该领域内看到此观念与观点的人都明确其所要表达的意思。体现出共同认可的知识,反映出相关领域中公认的概念集。4概念化。客观世界中某些现象的一个抽象模式。一个本体实际上就是一套关于某一领域概念的规范而清晰的描述。因此为了使本体更易被机器可读与理解,将本体分类或分层表示。本体包括四类,如果用图表的形式去表示某一领域的本体,可以将本体的分类看做对本体的分层。1概念或类。是本体领域的核心,代表了所研究领域的概念集合。2属性。每个概念的属性,描述有关概念的各种特征和属性。3属性值。是指属性的限定条件。4实例。与某个概念相关的实例。在本体的基础上,进一步提出领域本体和顶层本体。定义41147】4明领域本体描述的是特定领域中概念及概念间的关系。定义42【501顶层本体是高层的独立于领域的本体,它可以使完全不同的多个系统同时使用一个共同的知识库,并且从顶层本体可以衍生出领域本体。顶层本体通常表达常识性的概念,这些概念主要局限在抽象的、普遍的、基本的和哲学第4章模糊本体论的理论研究上的概念。412本体与语义网目前被广泛应用的万维网给人们的生活带来了诸多方便,但大部分万维网上的内容仅是设计给人阅读的,而不是让计算程序按着人们的意愿对其进行操作的。万维网的一个最大特征就是广泛性、全球性。超文本链接的威力在于“任何事物之间都可以相链接“。因此,无论是潦草的草稿,还是精致的作品,无论是商业信息还是学术内容,无论何种文化和语言,网络技术对它们都应该是一视同仁的。而我们更希望的是计算机能够“读懂“我们的语言,它能够自行熟练地解析网页的版面,例如对于一篇文章而言,知道哪句是标题,哪个是作者。然而,目前的万维网还没有可靠的方法来处理语义,因此还很难做到像我们想象中这样通过语义进行搜索。如何去解决这一问题,TBEMERSLEE1】提出如果语义信息在WEB上广泛应用,那么“精细、准确和自动化“的搜索就会实现,进而提出语义网。语义网可以理解为能够根据语义进行判断的网络。语义网将结构赋予网页上有意义的内容。在这样的环境下,漫游于各个页面之间的软件代理就能很容易地为用户完成一些复杂的任务了。语义网并非独立的另一个网,而是现在的网络的一个延伸。在这其中,信息有定义完好的含意,更利于人机之间的合作。而这对于我们所要研究的提高信息搜索的查准率与查全率尤其重要。为使语义网工作,计算机必须能访问结构化的信息集合以及有一套推理规则,据此进行自动推理【5卜541。因此将语义的体系结构分层研究,从低到高共分为七层UNICODE和URI,XML,RDF,ONTOLOGY,LOGIC,PROOF,TRUST。其中,XML和RDF都能为所描述的资源提供一定的语义,但它们在处理语义上存在两个问题一个问题是同一概念有时会有多种词汇表示;另一个问题是同一个词语可以有多种含义。而ONTOLOGY本体正是通过概念以及概念间关系的严格定义来精确地确定概念,从而可以较好的解决上述两个问题。这也是语义网较万维网的优越性之一。因此,要想实现在网络中根据语义进行判断搜索,对本体的研究是十分必要的。基于模糊本体论的学生就业问题的研究本体是用于明确描述概念与概念间的关系,是一份正式定义名词之间关系的文档或文件。一般网络上的本体包括分类和一套推理规则。分类定义对象的类别及其之间的关系。类、子类,实体间的关系对于网上应用是非常强大的工具。通过给类指定属性,允许子类继承类的属性,我们能够表达实体之间的大量关系。这与本体分层中所描述的属性、属性值一样,都具有一定继承关系。本体通过许多方法增强网络的功能。通过简单的方法,它们就能改进网上搜索的准确性,使搜索程序只寻找那些指向精确概念的网页,而不是仅仅通过模糊关键字查到的所有页面。以本体技术为核心建立领域语义模型,为信息源提供语义标注信息,使系统内所有代理在对领域内的概念、概念之间的联系及基本公理知识有统一认识的基础上进行信息检索,这更符合人类的思维习惯,可以克服传统检索方法造成的信息冗余和信息丢失的缺点,从而能够显著地提高系统的联想能力和精确性。快速、高效、精确地检索出用户所需的有价值的信息。这也正是语义网的核心与价值之所在。42模糊本体论为了处理模糊信息和不确定现象,将模糊理论加入本体中,使其成为对模糊领域本体和模糊顶层本体的一种延伸,这就是模糊本体【9】。为了更好的掌握模糊本体,下面先介绍一下模糊领域本体和模糊顶层本体。定义43124模糊领域本体是在领域本体中引进模糊概念属性值,并将普通的概念关系扩展为模糊关系和直觉模糊关系。模糊领域本体是一个五元组OF【C,PC,R,P胄,彳,其中1C是概念集。其中每个元素均表示一个概念,需要对其进行明确的规范化描述,也可以将其称为类,每个概念或类都有一组属性用于描述其特征,而这些属性值既可以是精确的,也可以是模糊的。2PC是概念属性的集合。任一个属性PPC都是一个三元的结构PC,1,厂,其中CC为本体概念,为C的属性值,厂为对属性值V的约束。常见的约束有值的类型Z、基数正和取值范围六。属性值的类型有如下几种第4章模糊本体论的理论研究I区间值,即ZINTERVALVALUE。当属性为数值型时,取值可以是某一个区间范围。如“薪水属性的取值可以是一个实数域中的区间1000,3000。II模糊数,即ZFUZZYNUMBER。当属性为数值型,取值可以为模糊数,表示具有一定的不确定性。如“薪水“属性的取值可以是模糊数“接近2000“或“大约2500“等。III简单的数据类型,如整型、实型、字符串型等。复杂的数据类型,如属性取值为本体中的概念类的实例,若取本体中的概念“性别“,则该概念的属性值可为男,女。也可以是枚举类型。V模糊语言变量,即ZFUZZYLINGUISTICVARIABLE。属性为模糊语言变量可以取模糊概念为值。如属性“薪水“可以取语言值“少“、“中等“、“高“等。还可以用限定词去修饰模糊语言值,常用的限定词有“非常“、“有一点“、“大概“等。将限定词作用到模糊语言值上,改变其模糊程度。这样,“薪水“属性值可以是“非常高“、“有一点少“等。3JIC是概念集C上的二元关系集合。概念的语义需要通过概念之间所包含的关系进行描述。这里的灭包括普通关系、模糊关系与直觉模糊关系。概念间常用的基本关系有同义、继承等关系。4PR是关系属性的集合。任一个属性PPR都是一个五元的结构PC。,C2,V,其中,C1C2C为本体概念,为概念间的关系,V为,的属性值,厂为对属性值V的约束。每个关系都有表征其“强度“的缺省属性。对于不同的关系,“强度“的取值如下I普通关系,“强度“的取值有两种1,0,10表示不存在这种关系,1表示存在这种关系。II模糊关系,“强度“的取值为O、1之间的一个数,V【O,1】。1ID直觉模糊关系,“强度的取值为0、1之间的两个数,或O,11的一个子区间V【口,B】。如“公司“乎学生IT技能之间自勺满意度“关系可以取值【O6,08】,表示在一个公司对学生IT技能的满意率介于6080,或者说至少60的公司满意,而至少20的公司不满意。基于模糊本体论的学生就业问题的研究5A是公理及模糊规则集。口A为本体中的公理,表示被大众公认的事实或者推理规则。公理都是永真断言,通常用形式化的逻辑语言来描述。AFA为模糊规则,表示领域专家的经验知识或被人们普遍接受的规则。通过定义可以看出,之所以在模糊领域本体模型中引进模糊概念属性值,并将普通的概念关系扩展为模糊关系与直觉模糊关系,是为了更有利于描述本体中存在的各种模糊现象。但根据属性值进行信息检索时,往往还与信息所包含的语义有直接关系。如何更好的处理特定领域中的模糊与不确定现象,就需要将模糊概念间的语义关系引入到模糊本体中,如序关系、包含关系等。这样才能有效地根据语义去处理信息,从而提高搜索的查全率与查准率。因此下面介绍具有概念间语义关系的模糊顶层本体模型。定义44F55】模糊顶层本体是一个六元组OFC。,CF,R,F,S,U,该本体用于描述一个抽象概念C。与一组模糊概念CF之间存在的语义关系,其中1C。是一个抽象概念,如“薪水、“规模”等。C。的取值是模糊概念,如“薪水“的取值可以是“中等”、“高等,此处模糊概念所有可能的取值组成一个模糊概念集C,。2CF是模糊概念集,表示概念C。的所有可能的取值。如对于“薪水“而言,C。很少,少,中等,高。3R,L,CFXCF是CF上一二元关系集合,表示模糊概念间的语义关系。一类语义关系是序关系与等价关系RD8,如很少少高。另一类语义关系是具有集合性质的关系,R冀互补,包含,相交而不包含,不相交,如“很少“与“不少“是互补关系,“高与“丰厚”是包含关系,“很少与“高”是不相交关系。4F是隶属函数集合,它与模糊概念集CF是同构的。FF为C,中一个模糊概念CF的隶属函数,具有精确表示模糊概念语义的作用。5SISCFQCFECF上的二元运算集合。运算提供了生成新概念的一些规则,常用的运算有并运算、“交运算“与“补运算”等。CF与S一起组成一定的代数结构。3L第4章模糊本体论的理论研究6U为讨论的论域。43四层模糊本体模型定义45结合模糊领域本体与模糊顶层本体,将原有的模糊本体划分为四层资源、属性、属性值、属性值的实例。每一层中的概念既可以是明确概念也可以是模糊概念。1所谓“资源“即研究领域包括的概念,可将资源作为所研究领域的概念集。例如若将抽象概念“学生信息作为研究领域,它所包含的资源可以是学生甲,学生乙,学生丙;2在属性层,每个属性均为资源的属性。例如资源“学生甲“的属性性别,学历,荣誉称号;3属性值是对属性层中的属性取值,即属性的限定条件。例如属性“性别”可以取值男,女,属性“荣誉称号“可以取值三好学生,优秀学生;4属性值的实例与属性值的划分一样,是将属性值中的模糊概念进一步明确化。即对属性值加限定条件。例如属性值“三好学生“包括实例国家级三好学生,省级三好学生,校级三好学生。这种划
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纪委选调面试真题及答案
- 机关招聘面试真题及答案
- 《财务会计岗位职责》课件
- 《周期与持续时间的探究》课件
- 《混凝土结构中预制混凝土构件》课件
- 《商务沟通技巧》课件
- 四川高考英语复习重点单选题100道及答案
- 《核能原理》课件
- 《混凝土结构施工技术解析》课件
- 2025宁夏申论真题及答案b卷
- 职场心态-培训课件
- 第四届全国智能制造应用技术技能大赛决赛-仪器仪表制造工(仪器仪表与智能传感应用技术)赛项竞赛平台主要设备技术标准
- 统编版 高中语文 选择性必修下 第二单元《边城》
- 白内障患者护理教学查房
- 幼儿园 中班心理健康《我会倾诉》
- 机械租赁保障措施
- 2024-2030年中国病号服行业市场发展趋势与前景展望战略分析报告
- 洗煤厂安全应急预案
- 抖音火花合同模板
- 掬水月在手-古典诗词与现代人生智慧树知到期末考试答案章节答案2024年南开大学
- 北京市通州区社区工作者考试题库及参考答案一套
评论
0/150
提交评论