(计算机系统结构专业论文)通用智能人性化排课问题的研究.pdf_第1页
(计算机系统结构专业论文)通用智能人性化排课问题的研究.pdf_第2页
(计算机系统结构专业论文)通用智能人性化排课问题的研究.pdf_第3页
(计算机系统结构专业论文)通用智能人性化排课问题的研究.pdf_第4页
(计算机系统结构专业论文)通用智能人性化排课问题的研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(计算机系统结构专业论文)通用智能人性化排课问题的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 国内外对排课问题都有大量的研究,国外对排课问题的研究成果不适合本国的实际 情况,而国内对排课问题的研究成果不仅有较大的局限性,而且通用性较差,已不能适 应新形势发展的需要。本文对排课系统的研究要达到这三个目的:一是实现排课系统能 适合国内大部分高校需要;二是排出的课程表能体现出合理性、科学性和人性化;三是 方便教师们和学生们使用手机或电脑等工具通过互联网来及时查询课程表信息和教室 信息。 本文从如下三个方面来建立排课系统: 1 排课知识与应用程序的分离。由于常用的知识表示方法无法灵活表示排课过程 中所涉及的排课知识,所以抽象出问题后,用基于本体知识表达方法来表示排课中所涉 及的排课知识;知识与应用程序的分离使得只须对知识进行更新与维护,而不用修改应 用程序便可以实现系统的通用性。 2 用s w r l 语言建立机器理解的规则,借助规则推理工具j e s s 来进行自动推理, 从而实现系统的智能化和人性化。 3 提出了一种基于规则的混合算法。常用的排课的算法都有优势和不足,最主要 的是:算法和规则是耦合在一起的;如果对规则进行更新与维护,则必须重新设计算法; 针对单一算法存在的问题与不足及为了实现算法与规则分离,本文利用混沌的特性,让 标准遗传算法和混沌优化算法相结合,提出一种基于规则的混沌遗传算法,来对高校排 课问题进行组合优化。 最后,本文设计了一个排课系统。初步实现了系统的通用性与智能性以及排出的课 表能突出科学性和体现对人的关怀。 关键词:排课,s w r l ,本体,j e s s ,混沌,标准遗传算法 a bs t r a c t t h e r ea r eal o to fr e s e a r c h e so nc o u r s et i m e t a b l i n gp r o b l e m sa th o m ea n da b r o a d o v e r s e a sr e s e a r c ho nt h ec o u r s ea r r a n g e m e n ti sn o ts u i t a b l ef o rc h i n e s ea c t u a ls i t u a t i o n , w h i l ed o m e s t i cr e s e a r c hr e s u l t so nt h ec o u l s ea r r a n g e m e n th a sg r e a tl i m i t a t i o n s ,l e s s u n i v e r s a l i t ya n dc a n n ol o n g e rf i t n e s sn e e d so ft h en e ws i t u a t i o n c o u r s es c h e d u l i n gs y s t e m f o rt h i sp a p e rt oa c h i e v et h e s et h r e eg o a l s :f i r s t ,c o u r s es c h e d u l i n gs y s t e mt ob ei m p l e m e n t e d i ss u i t a b l ef o rm o s td o m e s t i cu n i v e r s i t i e s n e e d ;s e c o n d ,i tc 觚e m b o d yr a t i o n a l i t y , s c i e n c ea n d h u m a n i t y ;t h 矾,i te n a b l et e a c h e r sa n ds t u d e n t sw h ou s et o o l ss u c ha sm o b i l ep h o n e so r c o m p u t e r sv i a t h e i n t e r n e tt ot i m e l yq u e r yc u r r i c u l u mi n f o r m a t i o na n dc l a s s r o o mi n f o r m a t i o n i nt h i sp a p e r , t h ef o l l o w i n gt h r e ea s p e c t st oc r e a t ec o u r s es c h e d u l i n gs y s t e m : 1 t h es e p a r a t i o no fk n o w l e d g eo fa r r a n g i n gc o u r s ea n da p p l i c a t i o n a sc o m m o n k n o w l e d g er e p r e s e n t a t i o nt h a tc a l ln o tb ef l e x i b l er e p r e s e n tk n o w l e d g ew h i c hi si n v o l v e di n t h ep r o c e s so fa r r a n g i n gc o u r s e ,t h ek n o w l e d g er e p r e s e n t a t i o nm e t h o do fb a s i n go n t o l o g y r e p r e s e n tk n o w l e d g ew h i c hi si n v o l v e di nt h ep r o c e s so fa r r a n g i n gc o u r s ea f t e ra b s t r a c t i n gt h e c o u r s ep r o b l e m t h es e p a r a t i o no fk n o w l e d g ea n da p p l i c a t i o nm a d eo n l yo nt h ek n o w l e d g et o u p d a t ea n dm a i n t a i n ,w i t h o u tc h a n g i n gt h ea p p l i c a t i o nc a n a c h i e v es y s t e mu n i v e r s a l i t y 2 u s i n gt h es w r ll a n g u a g es e tu pt h er u l e sw h i c hc a nb eu n d e r s t o o db yt h em a c h i n e a n du s i n gr u l e - b a s e dr e a s o n i n gt o o lj e s sc o n d u c ta u t o m a t e dr e a s o n i n gi no r d e rt or e a l i z et h e s y s t e m si n t e l l i g e n c ea n dh u m a n i s t 3 ar u l e - b a s e dh y b r i dm e t l l o di sp u t t e df o r w a r d c o u r s es c h e d u l i n ga l g o r i t h m sc o m m o n l y u s e da r et h ea d v a n t a g e sa n dd i s a d v a n t a g e s ,t h em o s ti m p o r t a n ta r e :a l g o r i t h m sa n dr u l e sa r e c o u p l e dt o g e t h e r i ft h er u l e sa r eu p d a t e da n dm a i n t a i n e d ,y o um u s tr e d e s i g na l g o r i t h m t o a i ma ts i n g l ea l g o r i t h m sp r o b l e m sa n ds h o r t c o m i n g sa n dt oa c h i e v es e p a r a t i o no fa l g o r i t h m sa n d r u l e s ,t h i sp a p e rc o m b i n e st h es t a n d a r dg e n e t i ca l g o r i t h mw i t hc h a o so p t i m i z a t i o na l g o r i t h m s i no r d e rt ot a k ea d v a n t a g eo fc h a o t i cf e a t u r e s ar u l e - b a s e dc h a o sg e n e t i ca l g o r i t h mi s p r o p o s e do nt h ei s s u eo nt h eu n i v e r s i t yt i m e t a b l ec o m b i n a t o r i a lo p t i m i z a t i o n f i n a l l d e s i g nac o u r s ea r r a n g e m e n ts y s t e mi nt h ep a p e r s y s t e m su n i v e r s a l i t ya n d i n t e l l i g e n c ei si n i t i a l l yr e a l i z e d ,a n dt h ec o u r s eb e i n ga r r a n g e ds h o ws c i e n t i f i ca n dd i s p l a yt h e c a r eo fp e o p l e k e yw o r d s :c o u r s ea r r a n g e m e n t ,s w r l ,o n t o l o g y , j e s s ,c h a o s ,s t a n d a r dg e n e t i ca l g o r i t h m 西北大学学位论文知识产权声明书 本人完全了解西北大学关于收集、保存、使用学位论文的规定。学校 有权保留并向国家有关部门或机构送交论文的复印件和电子版。本人允许 论文被查阅和借阅。本人授权西北大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存 和汇编本学位论文。同时授权中国科学技术信息研究所等机构将本学位论 文收录到中国学位论文全文数据库或其它相关数据库。 保密论文待解密后适用本声明。 学位论文作者签名:二悼指导教师签名:驾生牡 p l 1 年万月,1 日少汐年月,2 日 西北大学学位论文独创性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工作及 取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,本 论文不包含其它人已经发表或撰写过的研究成果,也不包含为获得西北大 学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:唧名中 一年厂月22 日 西北大学硕士学位论文 第一章绪论 时间表问题( t t p ) 是一类应用非常广泛的研究课题【1 1 。时间表问题典型代表一排课问 题,是计算机应用领域具有一定代表性而又被人们长期关注却又未能圆满解决的信息处 理问题。简单地讲,排课问题就是将排课涉及到的教师、教室、学生、课程等资源按学 校的要求在给定的时间内进行合理调配,使之发生冲突的可能性最小,也就是说要求安 排出一个合理( 最优) 的时间序列。虽然早在6 0 年代国内外就开始对该问题进行探讨,可 由于该问题是一个肛完全的( 完全不确定多项式) ,决定了这一时空组合问题的学术 地位和难度。 1 1 排课问题研究的背景与意义 近年来,随着国家高等教育的普及、全国高校连续几年的大规模扩招以及各种应用 需求的不断增长,这些都对高校的教务管理提出了更高的要求。再加上教学改革的步伐 加快和学分制的逐步实现,使高校教务部门的工作量急剧增大,任务日益繁重。尤其在 排课方面,不仅费时费力,而且还要受到各种各样资源条件的限制和约束( 各方面客观 原因的影响) ,更重要的还要最大程度的利用好高校的各种宝贵资源条件,争取做人尽 其才,物尽其用。 目前,国内的大部分高校还是用手工的方法根据自己本校的实际情况来排课,虽然 有部分高校开发出排课系统,可不管是用手工排课还是用计算机排课,都只解决了排课 的最基本需求,课程表编排得不合理、不科学,没有彰现“以人为本 的精神;这就是 说,对教师而言,不利于教师的教学工作和不能体部分教师的特殊要求;对学生而言, 没有考虑学生大脑皮层机能活动规律和没有合理安排每天的学习强度;这将严重影响课 堂教学的效率和教学的整体效果。 而本体理论一个很重要的目的就是要建立起一个人和机器都可以理解的知识系统, 这就给了本文一个新的研究思路一知识和规则与排课算法实现分离:运用本体理论建 立人和机器都能理解的知识和规则,利用本体推理机r a c e r 和规则推理工具j e s s ,结 合遗传算法及对遗传算法的改进,进行自动推理,进而实现系统的智能化、通用性和可 扩展性。 1 2 国内外研究现状 国内外对排课问题都有大量的研究【2 3 4 】。2 0 世纪5 0 年代,国外开始研究这个课题。 第一章绪论 1 9 6 3 年c c g o t l i b e 提出了时间表问题的数学模型【5 1 ,它标志着时间表这一课题的研究 正式跨入了庄严的科学殿堂;1 9 7 6 年s e v e n 第一次证明了时间表问题是n p - 完全的( 完 全不确定多项式) 【6 1 ,而用一般的结构化程序设计方法解决u t p 问题需指数时间,这是 很不实际的,所以他的论证正式确立了时间表问题的学术地位,把对时间表制定的复杂 性认识提高到了理论的高度;9 0 年代初期,c o l o m 柙等人首先尝试应用遗传算法( g 以c a l g o r i t h m s ,g a ) 来解决u t p 问题;为了节省教务处工作人员大量的时间和精力,国外 许多软件商,作了很大努力,开发出相应的通用自动排课系统,进行管理教学调度工作, 可有关排课算法【8 】未考虑教室的约束因素,不适用于我国现阶段高校教室紧张的情况。 国内对u t p 问题的研究起步比较晚。1 9 8 4 年,清华大学学报【9 】上发表了林漳希 和林尧瑞在该课题上的实验性研究成果,随后南京工学院、大连理工学院等高等院校都 相继开展了这方面的研究工作。一些高等院校开发制作许多相关软件的,具有代表性的 成果有:南京工学院( u n i v e r s i t yt i m e t a b l es c h e d u l i n gs y s t e m ) 系统、清华大学的 t i s e r ( t i m e t a l es c h e d u l e r ) 系统、西安交大自行设计开发的排课系统、大连理工大学的 智能教学组织管理与课程调度等。 从实际使用情况来看,国内外研制开发的这些自动排课系统在实用性上仍不尽如人 意。这有两方面原因: 1 有较大的局限性。这是因为排课过程中用到的知识是和算法耦合在一起的,无法 真正实现分离;专家系统中虽有推理机与知识库相分离的思想,可是目前基于专家系统 的排课算法过于依赖于学校的实际情况,不能形成一种通用有效的排课方法;只有知识 和算法分离还不够,规则也必须和算法分离。这是因为每个高校的约束条件也不一样, 只有做到规则、知识和算法三者都分离,才能真正实现系统的通用性; 2 排出的课表不科学、不合理。由于计算机无法真正模拟人的思维,而必须满足各 种复杂约束条件的排课系统是一个很复杂的系统,排课过程中一个很小的变动,可能要 引起全部排课情况的大调整。 所以,本文借用本体所具有的推理能力来实现系统的智能性,用基于规则的混合算 法来解决单一算法存在的问题和不足,用本体规则语言s w r l 设计排课规则来保证课表 编排的质量。 1 3 本文主要研究内容 国外的排课软件不适合本国的实际情况,而国内的排课软件很少,大部分局限于辅 助人工时间表的制定,并没有任何“智能成分。鉴于这种情况,本文对排课问题进行 2 西北大学硕士学位论文 了研究。 1 研究内容之一:知识的表示问题。 传统的排课算法必须满足各种复杂约束条件,而且无法灵活表示排课中用的知 识,一旦知识和约束条件发生变化,还必须重新修改算法。为了提高排课软件的易 维护性和通用性,必须将知识和约束规则与算法分离。通过对几种常用的知识表示 方法的对比,本文引入了基于本体的知识表示方法,用来描述排课过程中用的知识。 用本体工程来构建排课中用到的知识,有以下几点好处: 1 ) 知识表示丰富。与以前的知识表示方法相比较,基于本体的知识表示方法有 完整的描述逻辑体系和阶层化的架构,容易编码实现,可以表示复杂完备的 知识; 2 ) 是知识分层次表示。所使用的概念及它们之间联系和约束都被精确定义; 3 ) 是知识共享。实现知识共享,主要是解决本体异构问题;传统的知识表示方 法,由于知识资源缺乏统一的语义描述,难以实现相关资源的语义融合,造 成知识难以做到共享;由于本体提供一种明确定义的共识,所以用基于本体 的知识表示方法可以很好地解决知识共享问题; 4 ) 是本体重用。重用已有的本体,既可以减少开发的工作量,又能增强与其它 使用该本体的系统的交互能力。 2 研究内容之二:约束规则库的编排原则与详细设计。 俗话说的好,没有规矩不成方圆。规则是处理问题的基础,它描述了如何运行 商业、怎样制定策略、如何共享信息、怎样实现实施行为。为了编排出科学、合理 和人性化的课程表,应当遵循哪些编排原则,本文进行了分析探讨,并进一步用语 义网规则语言s w r l 详细设计了排课约束库。 3 研究内容之三:排课算法的研究。 人工排课时,随机性很强,没有严格的工作步骤,随情况而变,觉得怎么合理 怎么做。这是因为人的思维既可以收敛,也可以发散,所以排课表时非常灵活;但 计算机就不同,它并不具备人的大脑那样的发散思维能力,只能按照算法设计好的 工作流程来严格的一步一步地执行。计算机排课与人工排课有一定区别。再加上单 一智能算法都有自己的长处和局限性,难以扬长避短、优势互补。因此,本文利用 混合智能算法,开发出有效的课程表编排系统,以期能使学校教学系统运行得更加 顺畅、合理,能节约人力,有效地利用学校的各项资源,节省学校的各项支出。 3 第一章绪论 1 4 本论文的组织结构 本文的章节安排及简要介绍如下: 第一章:绪论。介绍了时间表问题的典型代表一排课问题研究的背景与意义,分析 了目前国内外对u t p 问题的研究现状及传统的排课算法的不足与缺陷,提出了通用智 能人性化排课系统的三个研究内容。 第二章:构建排课资源本体。主要是用基于本体的知识表示方法来解决排课过程中 所用知识的表示问题。首先介绍人工智能与语义网对智能化要求的区别、语义网的分层 方案和本体有关的概念;其次,列出该领域词汇表,分析排课本体中类与类之间层次关 系及定义类的属性。最后,根据建立本体的步骤,用本体描述语言o w ld l 描述了排 课表资源本体及构建排课资源本体。 第三章:排课规则的分析与设计。主要建立了排课规则库。本章首先介绍了相关教 学术语,接着阐明课表编排原则;其次,分析了排课问题模型;最后用语义网规则语言 s w r i ,设计出排课规则。 第四章:基于规则的混合智能算法的研究。主要提出了一种基于规则的混沌遗传算 法。先介绍了回溯算法与遗传算法在排课系统中的应用,随后指出遗传算法的局限性, 其次,引入混沌理论与混沌优化算法,最后提出了一种基于规则的混沌遗传算法。 第五章:排课系统的设计与实现。本章给出了通用智能人性化排课系统的设计实现。 先介绍系统的功能特色、课表编排过程与系统总体架构;其次,给出了系统的详细设计; 最后用实验结果来表明基于规则的混合智能算法在求解优化问题中的优越性。 4 西北大学硕士学位论文 第二章构建排课资源本体 本章首先介绍了基于语义网方法来表示排课问题时涉及的知识表示所要用到的人 工智能和语义网的基础,然后讨论了如何构建排课资源本体,及采用基于本体的知识表 示方法来解决排课过程中知识表示问题的思路。建立一个人和机器都可以理解的知识系 统所采用的知识表示方法有多种,通过对几种常用的知识表示方法优缺点的对比,来分 析为什么用基于本体的知识表示方法来构建排课知识系统;同时详细解绍了用本体方法 建立排课资源本体的方法与步骤。 2 1 人工智能 人工智能( a r t i f i c i a li n t e l l i g e n c e ) 简称灿,顾名思义就是人造智能。目前人工智能 一词是指用计算机模拟和实现人的智能。这可能会是计算机历史中的一个终极目标。早 在1 9 5 0 年,从计算机科学创始人之一的英国数学家阿兰图灵( a l a n t u r i n g ) 提出的测 试机器智能现称为“图灵测试 的方法开始,人工智能就成为计算机科学家们的梦想。 现在,关于人工智能的科学定义学术界还没有统一的认识。下面是部分学者对人工智能 概念的描述,可以看作是他们各自对人工智能所下的定义【1 0 1 。 定义l :人工智能是那些使知觉、推理和行为成为可能的计算的研究( w i n s t o n ,1 9 9 2 年) 。 定义2 :广义地讲,人工智能就是关于人造物的智能行为,而智能行为包括知觉、 推理、学习、交流和在复杂环境中行的为( n i l s s o n ,1 9 9 8 年) 。 定义3 :s m a r tr u s s e l 和r c t e rn i r v i n g 则把已有的一些人工智能的定义分为4 类: 像人一样思考的系统,像人一样行动的系统,理性地思考的系统,理性地行动的系统 ( 2 0 0 3 年) 。 虽然上面的这些定义指出了人工智能的一些特征,可用它们却很难判断一台计算机 是否具有人的智能。尽管人们提出了关于人工智能的不少说法,但都没有完全或严格地 用智能的内涵或外延来定义人工智能。因为什么是智能这个问题是一个很难准确界定的 问题,所以很难判断机器是否具有智能。 2 2 语义网( s e m a n t i0w e b ) 与人工智能的对比 从2 0 0 0 年起,s i r t i mb e r n e r s l e e ( w 曲创始者) 关于语义网的观点引起人们的重 要关注,事实上,它已经象大白鲸一样神乎其神了。语义网是s e m a n t i c w e b 的中文名称。 5 第二章构建排课资源本体 语义网就是能够根据语义进行判断的网络。简单地说,语义网是一种能理解人类语言的 智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与 人之间交流一样轻松。总之,语义网涉及到机器之间的对话,它使得网络更加智能化, 或者象b e m e r s l e e 描述的那样,计算机“在网络中分析所有的数据一内容、链接以及 人机之间的交易处理。在另一个时候,b e r n e r s l e e 把它描述为“为数据设计的似网程 序 ,如对信息再利用的设计。 实现语义网所需的大多数技术是建立在人工智能已有工作的基础之上的。这引出了 人工智能和语义网的一个区别:如果说人工智能的最终目标是建造呈现人类或更高级智 能的智能代理的话,那么语义网的目标就是协助人类用户处理网上的日常事务。 显然,目前并不需要人工智能达到很高的成就,现有的人工智能技术已足以帮助语 义网向其蓝图前进一大步了,而这些技术的发展将促进语义网更好更快的发展。 2 2 语义网的逐层递进 语义网的研究要一步一步地推进,每一步都要在前一层之上搭建新的一层( 1 a y e r ) 。 这样做的理由是,小步前进比较容易达成共识。一般情况下,会有多个团体沿着不同的 方向研究同一个问题,由此产生的不同想法的竞争是科学发展的主要动力。但是,从工 程的角度来看,标准化是必须的。如果大部分的研究者在某些方面达成一致而在另一些 方面不一致,将有助于确立哪些是共同点。这样一来,即使更宏伟的目标失败了,至少 还有一些积极的成果。 一个标准一旦建立,更多团体和公司就会采用它,而不会继续观望哪个研究方案最 终胜出。语义网的本性促使公司和个人用户必须采取行动一开发工具、添加内容和使用 这些内容,而不能坐等语义网蓝图的全部实现( 那可能还需要十年左右的时间) 。 要在语义网的某一层搭建更高一层,应该遵循两个原则: 向下可兼容性。位于某一层的代理应能解释和使用低层的信息。例如,掌握o w l 语义的代理要具备足够的能力,以充分使用r d f 和r d fs c h e m a 描述的信息。 向上的可理解性。另一方面,位于某一层的代理应能部分使用更高层的信息。例如, 一个只掌握r d f 和r d fs c h e m a 语义的代理可以部分地解释用o w l 表达的知识,而无 视r d f 和r d fs c h e m a 之上的其他成分。 图2 1 描绘了语义网设计蓝刚1 1 】的主要层次( t i mb e r n c r s l e e 称之为“l a y e rc a k e ”) , 该体系结构共有七层,自下而上其各层功能逐渐增强。 6 西北大学硕士学位论文 t r u s t p r o o f 置 l o g i c 基 o n t o l o g yv o c a b u l a r y 嚼。 誊 r d f + r d f s c h e m a x m i + n s + x m l s c h e m a u l l i c o d eu l u 图2 - 1语义网的分层方案 第一层:编码定位层( u n i c o d e + u r i ) 是整个语义网络的基础,其中u n i c o d e 负责 处理资源的编码,u r i 负责资源的标识; 第二层:x m l 结构层( x m l + n s + x m l s c h e m a ) ,该层主要负责从语法上表示数据 的内容和结构,通过使用标准的置标语言将网络信息的表现形式、数据结构和信息内容 相分离; 第三层:资源描述层( r d f + r d f s c h e m a ) 用于描述w e b 上的各种资源及其类型; 第四层:本体层( o n t o l o g y v o c a b u l a r y ) 用于描述各种资源之间的联系,与资源描述层 相比,本体提供了对领域知识的共同理解和描述,具有更强的表达能力,支持可保证计 算完整性和可判定性的逻辑推理; 第五层:逻辑层( l o g i c ) 主要描述推理规则; 第六层:证明层( p r 0 0 0 主要提供一种验证机制来保证数据或结论的可靠性; 第七层:信任层( t r u s t ) 主要任务是建立一种信任关系来保证语义网的可靠性。 2 3 知识表示方法的对比 传统的知识表示方法 1 2 】有:规则表示、逻辑表示、框架表示、语义网络表示和基于 本体的知识表示等。不同的知识表示方法都有自己特定的应用领域,下面总结各种知识 表达方法的优缺点,如下表2 1 所示: 基于本体的知识表示法【1 3 】有完整的描述逻辑体系和阶层化的架构,容易编码实现, 可以表示复杂完备的知识,并且实现自动推理。本体论因采用o w l 来描述知识,而o w l 是基于x m l 的,所以在开发领域知识表示中能较好解决知识共享和知识重用问题。 7 第二章构建排课资源本体 表2 1 几种知识表示方法的比较 方法优点缺点 规则表示语法简单,易理解,模块化,修改灵活;无层次性,难以表达复杂完整的知识; 节点的含义模糊,难以处理意外情况, 语义网络 具有层次性,容易查找关系,修改灵活; 难以编码; 表达能力强,容易添加属性和关系,容 难以编码实现,不能推理,缺少构建工 框架表示法易创建特殊的程序,容易创建默认信息 具,无法表现交集等概念,缺乏灵活性; 发现遗漏值; 模块易于修改,表达公式的创建独立于 表示和处理分离;处理大量知识和大型 逻辑表示知识库时效率低下;很难做到知识的分 使用过程,定义严密,模块化程度高: 享和再用。 综上所述,用基于本体的知识表示方法来解决排课知识的知识表示问题,能够解决 上述传统知识表示方法存在的缺限,为实现排课系统的智能化和通用性奠定了良好的基 础。 2 4 本体 本体论( o n t o l o g y ) 这个词来源于哲学。在哲学中,本体论是形而上学的一个分支, 研究存在的本质( 根据希腊文字o w o 柳i a 的直译) ,即什么是最一般意义上真实存在 的,以及如何描述它们。下面这个观察反映了典型的本体论承诺( o n t o l o g i c a l c o m m i t m e n t ) :这个世界是由具体的对象组成的,这些对象可以按照共有属性划分为抽 象的类。 最近几年,计算机科学家借用了很多其它领域的术语并赋予它们与原有含义不相同 的技术性含义,本体这个词就是其中之一。现在我们可以谈论“一个本体 ,原来只能 说“本体 。本文沿用t r g r u b c r 提出、后经r s t u d c r 改进的定义:一个本体是一个概 念体系( c o n 唧t l l a l i z a t i o n ) 的显式的形式化规范【1 4 ,1 5 1 。 一般地说,一个本体形式地刻画了一个论域( d o m a i no f d i s c o u r s e ) 。一个典型的本体 是由有限个术语以及它们之间的关系组成。术语( t e r m ) 指定论域中重要概念( 对象的类) 。 例如,图2 2 表示了一个大学论域的层次结构,而教工、学生、课程、教室和学科是大 学这个论域中的重要概念。 概念间的关系通常包括类的层次关系。如果一个层次结构规定类c 是另一个类c 的子类,则c 中的所有对象都包含在c 中。例如,所有教职人员都是教工。 8 西北大学硕士学位论文 图2 - 2 一个层次结构 除了子类关系之外,本体还可以包括以下信息: 1 属性( 例如,x 教y ) 2 值约束( 例如,只有教职人员才能上课) 3 不相交描述( 例如,教职人员和普通员工不相交) 4 对象间逻辑关系的规定( 例如,一个系至少有l o 个教职员工) 2 5 本体语言的需求 本体语言是用于对于领域模型进行形式化描述,其主要需求【1 6 】是:良好定义语法, 高效率的推理支持,形式语义,充分的表达能力和表达的方便性。 良好定义语法的重要性显然的,这在程序设计语言领域很清楚,它是机器处理语言 的必要条件。如,h t m l ( h y p e r t e x tm a r k u pl a n g u a g e ,超文本标记语言) 、x m l ( e x t e n s i b l e m a r k u pl a n g u a g e ,可扩展性标记语言) 和r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,资源 描述框架) 都有良好定义语法。 形式语义能精确刻画知识的含义。这里,所谓精确的含义是,这种语义并不依据主 要的直觉,也不会因人( 或机器) 而异。在数理逻辑中,形式语义的重要性早已人所共 知。 形式语义的一种用途是允许人们推导知识。对于本体知识,需要进行下列推理 1 类属关系。若x 是类c 的实例,c 是d 的子类,则可以推出x 是d 的实例; 2 类等价。若类a 与类b 等价,类b 与类c 等价,则a 与c 等价; 3 相容。假设声明x 是类a 的实例,a 既是b a c 的子类,也是d 的子类,而且b 和d 不相交,则产生不相容,因为a 是空集,但又有实例x ,这显示本体中有错 9 第二章构建排课资源本体 误: 4 分类。如果已声明一组特定的属性值对是形成类a 成员的充分条件,那么,若 个体x 满足这样的条件,则可推出x 是a 的实例。 语义是推理支持的一个先决条件,诸如上面的推导可以用机器代替手工自动完成。 推理支持的重要作用包括 1 检查本体和知识的相容性; 2 检查类间的隐含关系; 3 对实例进行自动分类。 自动推理比手工能检查的更多,这对多人参与的大型本体设计或不同来源本体的融 合与共享,是十分有益的。 形式语义和推理支持的实现通常是把本体语言对应到已知的逻辑系统,并使用已有 的自动推理机。o w l ( 部分地) 对应描述逻辑( d e s c r i p t i o nl o g i c ) ,利用现有的描述逻辑 推理机如f a c t 和r a c e r 。各种描述逻辑系统是谓词逻辑和一个具有高效率推理支持 的子集。 2 6 手工构建本体 本体的开发和完善是一个反复的叠加过程。本体中的概念应该贴近于要研究的专业 领域中的客观实体( o b j e c t s ) 和关系法贝u ( r e l a t i o n s h i p s ) 。对应于客观实体的概念,其词性应 该是名词;对应于关系法则的概念,其词性应该是动词【1 7 1 。本文以排课本体的建立为例, 进行具体的说明。因为在相关领域中没有可以利用的本体,不能复用现有本体,所以需 要新建领域本体1 8 , 1 9 】。 1 确定本体的专业领域和范畴 本文所构建的教学资源本体是对高校教学资源这个特定领域的一种抽象,构建教学 资源本体的目的就是要建立起一个人和机器都可以理解的知识系统,真正实现算法和知 识的分离,使计算机能模拟人的思维来处理排课过程中遇到的各种教学资源及它们之间 的关系。所构建的教学资源本体主要供所有高等学府教务部门工作人员在用计算机实施 自动排课时使用。另外,教学资源本体还为计算机的自动排课提供了推理基础。最后, 它还对一些典型的u t p 问题有一定的借鉴作用。 2 列出教学资源本体中的重要术语 实际上定义教学资源本体的第一步就是列出在该本体中所有期望出现的相关术语 的一个非结构化列表。例如,名词是类名的基础,动词或动词短语( 如i sp a r to f , h a s 1 0 西北大学硕士学位论文 c o m p o n e n t 等) 是属性名的基础。词汇应尽量选择教学资源领域中已经达成共识的;这 样做的目的是统一概念认识,规范词汇。不用担心表达上的重复,尽可能列出,教学领 域中排课过程可能涉及到的概念。下而列出了部分教学资源本体所定义的词汇,如表2 2 所示。 表2 2 教学资源本体部分词汇表 词汇 类属性 意义说明 c l a s s 类高校以班为单位进行授课的班级资源的父类 c l a s s r o o m 类高校所有可供上课的教室资源的父类 c o m m o nc l a s s r o o m 类 普通教室,没有特殊教学设备的普通教室资源的父类 特殊教室,有特殊教学设备( 如计算机,听力设备,实 s p e c i a lc l a s s r o o m 类 验设备等) 的教室资源的父类 l i s t e n i n gc l a s s r o o m 类听力教室,特殊教室的子类,有听力设备的教室 多媒体教室,特殊教室的子实验室资源的父类类,有多 m u l t i m e d i ac l a s s r o o m 类 媒体设备的教室 l a b o r a t o r y 类高校所有可供上实验课的实验室资源的父类 化学实验室,实验室资源的子类,有上化学实验所需设 c h e m i c a ll a b o r a t o r y 类 备的实验室 物理实验室,实验室资源的子类,有上物理实验所需设 p h y s i c a ll a b o r a t o r y 类 备的实验室 c o u l 葛e 类 所有课程资源的父类 m u l t i m e d i ac o u r s e 类 多媒体课程,课程资源的子类 l i s t e n i n gc o u r s e 类 听力课程,课程资源的子类 课程表的父类,包含一周的每个上课时间段。每周包括 c o u r s es c h e d u l e 类 五天,每天四大节课。 星期一。课程表父类的一个子类。其中包含周一的四个 m o n d a y 类 时段。( 其它子类类似,在这不作具体说明) 时间片,一天的上课时间分为四个时间段,上午和下午 t i m e 类 各两个 t e a c h e r 类高校所有教师资源的父类 e n g l i s ht e a c h e r 类英语教师。教师资源的子类 c o m p u t e rt e a c h e r 类计算机教师。教师资源的子类 a s s i g n c l a s s 对象属性对某班级分配上课时间 a s s i g n c l a s s r o o m对象属性对某教室分配上课时间 u n a s s i g n c l a s s r o o m对象属性某时间空闲的教室 a s s i g n c o u r s e 对象属性对某课程分配上课时间 第二章构建排课资源本体 表2 2 教学资源本体部分词汇表( 续) 词汇 类属性 意义说明 a s s i g n t e a c h e r 对象属性对某教师分配上课时间 h a s e q u i p m e n t对象属性某课程所须的设备或教室所拥有的设备 c l a s s i s数据属性班级的名称 n a m e i s 数据属性课程,教室以及设备的名称 s i z e i s 数据属性 上某课程班级的人数或教室本身的容量 t e a c h e r c o u r s e i s 数据属性教授某课程的教师 3 定义类和类的之间的层次关系 在面向对象程序设计中,如果没继承性机制,则类的对象中数据、方法就会出现大 量重复。继承不仅支持系统的可重用性,而且还促进系统的可扩充性。在教学资源本体 中,也有类似继承性的概念,这种类的层次之间关系的建立,使概念之间的关系十分清 晰明了,而定义之后的子类可以直接继承父类的属性,更有利于今后对这个本体的维护、 复用和扩展。 在对教学资源本体定义类和类的之间的层次关系这步中,采用了自顶向下的方法。 由排课领域中最大概念开始,而后再通过添加子类细化这些概念。就以定义课程类和课 程类的之间的层次关系为例,多种类型课程之间的关系主要是以专业和研究方向来划分 层次关系的。课程是课程本体的父类,英语系课程和计算机系课程类的直接子类,数据 结构、计算机组成原理和离散数学是计算机系课程类。不同的学校,可以根据本校的实 际情况来进行划分。具体示例结构如图2 3 所示: 4 定义类的属性 图2 - 3 课程类别层次示例图 1 2 西北大学硕士学位论文 在上一步对教学资源本体建立好类和类之间的层次关系后,只是简单创建一个类和 划分了本体概念的层次。接下来还要定义类的属性及赋予相应的值。类的属性取决与所 定义的本体的范围,及该概念在这个领域里的重要性。 在o w ld l 中将类的属性分为两种:一种是数据属性,另外一种是对象属性。这两 种属性的共同点是都有定义域( d o m a i n ) 和值域( r a n g e ) ,而且它们定义域的取值范围里的 个体都是类。定义域是具有该属性的个体集合,值域是能成为该属性值的个体集合。不 同点是它们值域的取值范围不同和可以使用的公理也有区别。对象属性值域的取值范围 是之前己经定义的各种类,数据属性的值域取值范围包括a n y ,b o o l e a n ,f l o a t ,i n t e g e r , s h o r t ,s t r i n g 等;对象属性可以使用的公理有f u n c t i o n a l ,i n v e r s ef u n c t i o n a l ,s y m m e t r i c , t r a n s i t i v e 。而数据属性可用的公理只有f u n c t i o n a l ,i n v e r s ef u n c t i o n a l 。 下面列出了部分属性,如表2 3 所示: 表2 3 捧课本体部分属性表 属性属性类型定义域值域 意义说明 对某班级分配上课 a s s i g n c l a s s 对象属性 c o u r s es c h e d u l ec l a s s 时间 对某教室分配上课 a s s i g n c l a s s r o o m对象属性 c o u r s es c h e d u l ec l a s s r o o m 时间 u n a s s i g n c l a s s r o o m 对象属性c l a s s r o o mc o u r $ es c h e d u l e 某时间空闲的教室 对某课程分配上课 a s s i g n c o u r s e 对象属性 c o u r s es c h e d u l e c o u 娼e 时间 对某教师分配上课 a s s i g n t e a c h e r 对象属性 c o l l r s es c h e d u l et e a c h e r 时间 某课程所须的设备 h a s e q u i p m e n t 对象属性 c o u r s ec l a s s r o o m e q u i p m e n t 或教室所拥有的设 备 c l a s s i s 数据属性 c o u r s e s t r i n g 班级的名称 c o u r s ec l a s s r o o m 课程,教室以及设 l l a l l l e i s 数据属性s t r i n g e q u i p m e n t备的名称 上某课程班级的人 s i z e i s 数据属性 c o u r s ec l a s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论