(计算机系统结构专业论文)基于xml与数据挖掘的智能教学系统的设计与实现.pdf_第1页
(计算机系统结构专业论文)基于xml与数据挖掘的智能教学系统的设计与实现.pdf_第2页
(计算机系统结构专业论文)基于xml与数据挖掘的智能教学系统的设计与实现.pdf_第3页
(计算机系统结构专业论文)基于xml与数据挖掘的智能教学系统的设计与实现.pdf_第4页
(计算机系统结构专业论文)基于xml与数据挖掘的智能教学系统的设计与实现.pdf_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东北夫学硕士学位论文摘要 基于x m l 与数据挖掘的智能教学系统的设计与实现 摘要 在这个知识经济时代,知识在社会中扮演越来越重要的角色,如何才能更有效 的获取知识,为学生提供更好的知识服务对人类来说是个极大的挑战。本文论述了 基于x m l 和数据挖掘的智能教学系统。 基于对目前智能教学系统的发展历程的调研,我们提出了一个基于h n e m e t 的 智能导航远程教学系统来满足不同知识背景、学习技能和学科的学生学习的需要。 本文主要着力研究如何实现智能教学系统中的智能导航,我们的目标是实现一个具 有“自适应和自学习”能力的智能教学系统,使得该智能教学系统能够从某种程度 上承担人类教师的角色而指导学生学习。 本文首先给出了智能教学系统的一个总体框架,并针对每个模块的功能做了简 要的阐述。我们以现代的教学理论为指导,研究了与之相关的几个方面理论与技术, 例如:知识表示,概念图,自适应学习,软件设计模式,数据挖掘和x m i 等。 本文接着给出了如何在n e t 平台下实现智能教学系统的软件架构,并介绍了 该架构设计的每层设计方案。如何有效的根据导航策略引到学生进入适合的、e b 界面进行学习是智能教学系统的核心所在,本文告诉我们如何通过设计用户过程组 件来实现在用户界面的高效导航。 本文还研究了如何通过v 皿来建立知识库,文中采用概念图作为一种工具来 评价学生的知识结构,通过最小生成树算法来让我们的系统实现针对复习为学生提 供更高效的步骤。 数据挖掘是现代科学一种先进技术,本文使用决 x 独创性声明 本人声明所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果 除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包 括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均己在论文中作了明确的说明并表示谢意。 学位论文作者签名:瓣 日期:上嗽胡阳 学位论文版权使用授权书 本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定: 即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查 阅和借阅。本人授权东北大学可以将学位论文的全部或部分内容编入有关数据库进 行检索、交流。 ( 如作者和导师同意网上交流,请在下方签名;否则视为不同意。) 学位论文作者签名 签字日期: 导师签名: 签字同期: 东北大学硕士学位论文第一章绪论 第一章绪论帚一早三百y 匕 本章是论文处在调研阶段的撰写篇章,首先阐述了课题研究的背景,分析了 当前计算机辅助教学系统发展历程,同时就目前国外智能教学系统的研究情况做 了简要的概述,并分析了目前智能教学系统的不足之处,给出了本课题研究的目 的和意义,并对本论文的组织结构给出了总体规划。 1 1 课题研究的背景 在2 0 世纪5 0 年代初,计算机在主要是停留在程序教学的阶段上,程序教学 的步骤是,首先确定学生所需要掌握的知识和达到的技能,其次是根据教学目标 小步子呈现教学内容,比如将教材分成多个小片断依照从简单到复杂的原则一步 一步呈现学生面前,到了6 0 年代,引入了分支程序的概念,学生可以在一定程度 上选择学习路径,根据自己的特点选择学习路径,这为个性化教学提供了可能。 2 0 世纪7 0 年代后,计算机在教育上的应用取得了新的进展,计算机可以自动 生成练习答案,并可对学生的回答做出简单的评价,智能教学系统( i t s ) 作为一 个新的概念诞生,于是人们围绕智能教学系统展开了全面深入的研究,理论上和 技术都取得了不少的成功。尤其是受人工智能理论的影响,人们对学习以及学习 过程的认知在不断地发展。 2 0 世纪9 0 年代后,随着网络技术和多媒体技术的发展,给予h l t e 知e t 的网上 教学、资源共享、实时交互、多媒体技术等给传统的智能教学系统( i t s ) 带来了新 的变革,学生可以通过网络共享世界的各种信息资源,并可以选择课程和选择同 一个课程的不同的老师,学生也可以根据自己的特点在自己方便的时候通从互连 网上选择适合自己的学习资源,按照自己的方式来学习。 国外对智能教学系统研究较多,早期s c h o l r ( c a r b o n e l l & c o l l i n s ,1 9 7 0 ) 【”, 他应用人工智能的知识表示方式,其知识库采用语义网络的形式,并由事实、概 念和过程组成,教学方式采用苏格拉底对话式,根据学生的回答,通过推理机产 生更多提问,并评价学生的解答,系统能够诊断学生的一些错误概念并引导学生 自己思考后纠正错误。2 0 世纪8 0 年代认知学和教学理论的发展给i t s 的研究带来 了深远的影响,人们在研究i t s 的时候更多的考虑学生的学习过程,学生获得知 识的过程。c l a n c e y 等开发的智能教学系统g u i d o n 与专家系统m y c i n 的结合1 2 j , 代表了i t s 的一个重大发展。它采用产生式规则的知识表示方法,建立了学生模 1 东北大学硕士学位论文 第一章绪论 型,教学过程是一个交互式的学习环境。但是,g u i d o n 系统中利用m y c i n 的 知识库时缺乏解释和组织教学过程的教学知识,即缺乏教学导航策略。而a n d e r s o n 通过对人类思维和特征的研究,应用人类认知的a c t ( a d a p t i v ec o n 缸o lo f t h o u g h t ) 建立认知模型 引,在智能教学方面取得了较好的成果。 目前国外影响比较大的智能教学系统是由教学研究集团( t 1 1 et u t o rr e s e r c h g r o u p ) 开发的a _ i 】t 砷l t o r f 4 j ,这是一个由多学科研究人员共同参与开发的一个复杂系 统,他们分别来自心理学、计算机科学、语言学、工程和教育学等多个领域。a u t o t u t o r 在教学内容和教学过程等方面的设计都比较全面一个的智能教学系统。 国内对智能教学系统研究起步较晚,大多数比较简单,看不到成熟的产品, 但近来许多大学和研究机构以及一些公司,都在投入大量的资金搞这方面的研究, 虽然国内成型的有特色的产品还未见出现,但是随着i n t c l e t 的发展,各种远程教 学平台都会慢慢走向智能化。 那么究竟什么是“智能教学系统”,比较统一的认识是:智能教学系统是一 个涉及计算机科学、教育学、心理学、认知科学和行为科学的复杂系鲥5 1 ,其研究 的目的是由计算机系统担负起人类教育的责任,即赋予计算机系统以智能,由计 算机系统在一定程度上代替人类教师实现教学。 i t s 由学生模型、教师模型、教学内容、人机交互模块组成阿,他将教学内容 与教学策略分开,根据学生资料库中提供的学生模型,通过智能的搜索与推理, 动态生成适合于个别化教学的内容与策略;通过智能诊断机制判断学生的学习水 平,分析学生产生错误的原因,同时向学生提出更改意见以及进一步需学习内容 的建议;通过对学生个性的分析向学生提供个性化的学习建议和个性化学习环境; 一个理想、完备的学习系统是一个自主优秀的“教师”,他熟悉教育心理学、熟 悉教育内容,精通教学设计的理论和实践,能够很好的根据学生的特点因材施教。 1 2 本课题研究的目的和意义 i t s 的研究和开发是一个非常艰难的过程,现有的智能教学系统存在许多的 不足: ( 1 ) 教学过程是一个非常复杂的过程,许多系统没有坚实的教育理论做基 础,缺乏对教育实践的活动进入深入的研究、总结,把教育过程简单化。 ( 2 ) 教学内容、学习资料的组织、表示方法不理想,可重用性和规范性较差, 不利于教学过程的智能呈现。 2 东北大学硕士学位论文 第一章绪论 ( 3 ) 学生模型太简单,学生的能力特征、认知特征、学习状态难以准确获得、 因材施教缺乏基础。 ( 4 ) 知识的关系网络往往不能够很好的向学生呈现,没有很好的组织和管 理知识与知识之间关系的策略。 ( 5 ) 学生个性化挖掘模型的建立不完善,尤其是在技术上实现没有找到很好 的方法。 ( 6 ) 用户的界面的智能化导航的应用程序实现有待提供,目前国内外研究和 所发表的论文也在这界面智能导航界面呈现方面也大多数停留在理论算 法设计上,对其具体的实现技术这个关键问题也没有太多的阐述。 本课题的研究在基于现有成果的基础上,同时考虑目前智能教学系统的不足 之处,对智能教学系统展开更深入的探讨,主要解决个性特征挖掘,知识结构评 价,界面智能导航等核心环节的实现问题。课题将针对算法设计和技术实现展开 比较详细的研究,摈弃以往此方面的研究总是停留在比较空洞的教学理论和知识 表示等理论算法上。我们的设计建立在更详细的研究删l 和数据挖掘等目前比较 新的技术在智能教学系统中的应用问题上。同时我们将研究如何在n e t 平台下搭 建智能教学系统。在具体算法上我们的理论也将体现更成熟更完善,对x m l 如何 组织和管理知识,如何通过结合自适应理论,挖掘学生特征,对学生的学习界面 进行智能化导航,管理学生的学习过程与学习路径。 1 3 论文的组织结构 本文共分六章: 第一章介绍当前国内外智能教学系统的研究现状,并分析了目前智能教学系 统的不足,然后给出了本课题研究的目的和意义。 第二章介绍了智能教学系统的总体设计思想,并给出了智能教学系统的总体 结构,针对结构中的主要模块的功能做了介绍。同时还简要阐述了) m 正和数据挖 掘在智能教学系统中的应用。 第三章在基于总体设计的思想上对主要相关的理论基础作了介绍,包括知识 库的设计理论和知识表达方法,概念图关系网络理论,适应性学习的概念以及软 件设计中采用的设计模式,同时还详细介绍了数据挖掘的决策树算 - 3 - 东北大学硕士学位论文 第二章系统分析与总体设计 第二章系统分析与总体设计 本章首先分析智能教学系统需实现的基本模块的特点,然后在基于现有智能 教学系统的研究基础上给出了本文在智能教学系统设计上的的总体思想,并在该 思想的基础上设计了智能教学系统的总体结构,针对结构中每个模块的功能作了 简要的阐述,然后对l 和数据挖掘在智能教学系统上的应用给出了概要的介 绍。 2 1 系统分析 智能教学系统是以认知学为理论基础,将人工智能技术应用于c 灿,是智能 化的c a j 。在智能教学系统中,学生的学习也可以借助于智能化的推理机制对大 量知识进行选择、判断与处理,使学习内容更有针对性,从而提高学习效果。一 般的智能教学系统模型的构建应该实现以下几个模块的功能: ( 1 ) 知识库 作为智能教学系统的重要组成部分,知识库主要提供一个指导性的、自适应的、 开放的、可操作的框架和服务设施【刀,为各个学科知识提供规范的知识输入和组织, 其它教学资源,如题库、课件、素材等,均依据它来组织管理,这将使用户可以 建立适用于自己的知识体系,使各类知识应用能够有一个好的开发和集成基础。 另外,核心的教学领域知识将被分解为相互联系的知识点,形成知识树,提供可 视化的、操作性好的知识树编辑界面,方便教师将教学领域的知识输入到知识库。 例如,有的智能教学系统中的知识库,是从知识表示入手,在s c 文法知识表示体 系和知识树映射方法的基础上,提出了一个动态、实时、自适应、交互式知识库 模型【8 1 。模型包括基于s c 文法的知识点表示方法、知识树结构、知识树映射、知 识点学习循环等内容,模型在智能教学系统中经过实例化设计和运用,可以表现 出动态教学、领域无关、人机交互、自适应、个别化、可扩展等智能特点。 ( 2 ) 学生模型 学生模型就是用于表示学生实际认知状况,并通过解释学生的活动得出他对领 域知识和技能的掌握情况。系统中每个学生有唯一的d 标识,建立唯一的学习资 源、学习信息和特征数据库,系统智能功能的实现在于如何动态地、正确地提取 学生的主题特征。 ( 3 ) 专家决策机制 5 东北大学硕士学位论文 第二章系统分析与总体设计 该模块可以看作智能教学系统中的推理机,它一般采用两级推理相结合的方 法,即基于语义网络的推理和基于产生式规则的推理,其中基于语义网络的推理 用于确定教学内容,而基于产生式规则的推理用于确定教学策略。谓词逻辑知识 推理方式也可以应用于教学推理。 ( 4 ) 智能接口模块 该模块实际上是作为系统与用户交互作用的部件,它除了提供学生信息的输 入与注册外,还实现了学生与系统之间的通信功能,能够有效在界面之间导航, 向学生呈现个性化的学习界面。 2 2 系统总体设计思想 智能教学系统采用超文本、超链接方式提供给学生丰富的教学内容和巨大的 信息量,使用智能教学系统的学生,不可能再做被动的学习者。因此,学习的方 法应该是积极的,而且是以学生为中心的学习。在智能教学系统的设计中,为了 达到方便学生学习,除了要求在界面设计友好,操作方便外,还应能引导学生进 行有效的学习,提高学习效率,且不能让学生迷失方向。因此,导航系统的设计 是必需的。智能教学系统的导航要清晰、明确、简单、方便,要符合学生的学习 习惯和对知识掌握的认知心理。对于智能教学系统,导航模块的设计应该能实现 课程浏览的纵向到底,横向到边,既能使学生对某一个知识点的学习进行地非常 深入,又能使学生容易全面地了解章节内容【9 j 。好的导航设计是保证智能教学系统 成功的 课程的所有知识点及知识点间的 关联规则,如并列、前提、后继等关系【。在资源库中,存在与知识点相关联的 资源列表,资源库是以关系数据库来存储。我们的导航规则库和知识库是通过“l 文件来存储,m。格式灵活适合规则和策略动态变化和重组的需要。对数据库中 的数据运用数据挖掘技术,分析学生对各个知识点的理解程度。根据学生对知识 点的理解程度及学生己学习过的资源记录,给出学生应学习的知识点及资源,对 生学习该知识点的后继知识点的资源,对某一知识点理解较差就推荐学习该知识 东北大学硕士学位论文 第二章系统分析与总体设计 该知识点相关的所有资源,而是根据学生对已有资源的学习情况,向学生推荐他 没有学习过的和较生疏的资源学习途径。知识点间的关联规则可以来自教师的经 验也可以来自针对网络日志的数据挖掘结果,以及通过设计知识结构测试模块来 获取。学生对知识点的理解程度取决于许多方面的数据,这需要通过数据挖掘算 法,建立知识结构概念图进行综合评定。 2 3 智能教学系统结构 学生登录与注册 学生 + 导航学习界面 山 用户界蔼导航控制 + 1r 用户事件信息收集 用户状态信息记录 导 、 航 镱 1 日釜件i 略 生 成 建挖掘库il i 二) 1 分析处理和调度 个性化原始信息库 爿。:一 u 一 系统初始化信息库集 关联分析。信息挖掘 nrnk ,- 一 , k影 学习者个性化数据库l k 图2 1 智能教学系统的结构 f i g2 1s 劬c t u r eo f i t s 7 东北大学硕士学位论文第二章系统分析与总体设计 2 4 系统主要模块设计概要 2 4 1 导航学习界面 导航学习界面,它是可重用的通用的学习界面,界面与界面之间的导航关系 将通过用户界面导航控制模块来管理,界面的设计尽量要“原子化”,即一个界 面尽量做到仅完成一个不可拆分的功能呈现,这样的“原子化”界面设计,便于 用户界面界面导航控制模块根据下层的个性策略生成方案智能组合各种界面,建 立个性化界面关联,根据学生的具体知识水平和结构提供智能导航策略所生成的 路径上的各种界面。 2 4 2 用户界面导航控制 用户界面导航控制模块的实现,是本论文技术研究的核心,如何有效的捕捉 用户界面的活动过程,并管理和组织界面,是实现智能导航学习的技术关键。系 统原始信息库里面,系统数据初始化时,基于对现有的学生模型进行具体分析已 经建立起来了按照通用学生类型分别制定的学习导航策略,这种导航策略将把生 成的导航路径信息传递给用户界面导航控制模块,进而用户界面导航控制模块通 过读取路径信息,实现按照该路径对界面进行导航组合。同时,用户界面导航控 制模块还可以捕捉用户在界面上的活动过程,为状态信息记录模块提供相关信息, 并根据这些状态数据生成新的个性导航策略。 2 4 3 用户事件信息收集 用户在界面活动,部分操作将引发各种事件,该模块主要是用来记录用户操 作的事件信息,然后记载在日志文件中,同时分析处理与调度模块将根据搜集的 用户事件信息并结合该用户个性化信息来生成导航策略。 2 4 4 用户状态信息记录 用户导航界面控制模块,能够捕捉用户在各界面上的活动过程,具体需要记 录学生的哪些状态,主要由用户状态信息记录模块来实现。状态信息记录我们可 以通过不同的需要选择不同的存储方式。对用户的评测的原始信息记录也是在用 户状态信息模块中记载。 8 东北大学硕士学位论文第二章系统分析与总体设计 2 4 5 关联分析和信息挖掘 事件信息和状态信息通过数据分析描述,建立起来了个性化原始信息数据库。 关联分析与信息挖掘就是采用相关的数据分析和挖掘策略从个性化原始信息数据 库中,挖掘出学生的个性化数据,并建立学生个性化数据库。 2 4 6 分析处理与调度 该模块主要是综合学生个性化数据库和系统原有的初始化原始数据信息,结 合两者为学生制定最佳的学习策略,并把该策略所生成的学习路径信息传递给用 户界面导航模块,从而由用户界面导航模块为学生提供个性化的学习界面。 2 5 ,和数据挖掘在智能教学系统中的应用 2 5 1 龇在智能教学系统中的应用 ( 1 ) 儿在组织和管理知识显得更灵活 x m l 将是本系统设计实现核心的技术之一。汀l 最大的特点就是在于他的 数据存储格式不受它的显示格式的约束,一般来说,一篇文档包括三个要素:数 据、结构以及显示方式,对于h t m l 来说这三个要素是嵌入在一起的,而对于x m l , 则把文档的三个要素分离开来,它把内容和样式分离,不仅能够很好的表现许多 复杂的数据关系,还可以使得基于“l 的应用程序可以在) a v 匝中准确高效的搜 索相关的数据,而不会迷失在象h t m l 文档中各类混乱的标签中。 我们知道智能教学导航系统可以给学习者提供丰富的信息内容,使学习者可 以自由地进行学习,由于网络课程信息量巨大,内部之间的关系可能异常的复杂, 因此在设计网络课程时,要求在信息结构上组织形式采用分级树型结构,x m l 本 身具有树型结构的特点,可以方便地描述网络课程知识点。 ( 2 ) 沮,能更好的满足学习者个性化的要求 学习者个别差异的存在是一种无法回避的事实,对不同的认知风格的学习者 应提供不同的学习和操作方法。不同的学习者在学习的方法上,对学习内容的媒 体表现方式存在一定的差异,而面对这种事实,智能教学系统的设计者应尽量让 不同的学习者均可获得他所需要的学习方式。咀。具有将同一数据以不同的形式 展现给学习者的特性。 9 东北大学硕士学位论文第二章系统分析与总体设计 ( 3 ) 有利于信息资源的交流和数据格式的统一 由于我国现有教学系统和网络课程的开发,没有遵循同一的标准和规范,造 成重复开发的现象严重,使得资源共享难以实现。由于x 】l 使用u n i c o d e 作为编 码标准,这就使得各种网页不仅容易能够写出各国的文字和符号,甚至允许有混 合编码的实现,如一个中文网页可以显示外文单词,而不会出现乱码问题,使得 各教学平台的信息交流和国际化变得非常容易。 ( 4 ) 异构数据库的集成和管理 ) m 几数据库有利于异构数据库的集成与处理,并益于数据源之间的形式的转 换。x m l 本身可构造数据库,但应该看到在含有大量数据库的情况下是不适合的, 因为尽管x m l 中包含了数据信息,但不同时使用相应的方法来提取,它将是一个 普通的文本文件,数据库系统的其他的一些特点,如数据存储,索引等特点等都 不具备,而且当数据量过大时,用x m l 构建数据库,会导致文件过长、过大。从 而降低效率。因此,在本系统中只考虑把x m l 作为管理、集成知识库和数据库等 各种信息的中间件,为信息库与外界的交换提供一个有效的窗口,从而满足个性 化导航的需求。 ( 5 ) v 几技术可以更方便的实现智能导航 在智能教学系统中,除了采用目录树结构,模块结构等导航措施外,还存在 以下三种导航。 线索导航,这种线索导航可以在学生者访问系统的链和节点时,把学习者的 学习路径记录下来,可以允许学习者按照原来的路径返回,并允许回朔。或者学 习者可以暂时放弃现在的学习任务的学习,并在稍后的某个时间可以继续在放弃 点开始学习。 浏览图导航是建立在学生模型的基础,针对不同类的学生对某个课程制定相 关的可预知的学习路径,系统可以通过设置导航图,让学生非常宏观的看到自己 目前处在学习的什么阶段,以及各个阶段的关系。 检索导航是根据关键字检索出与该关键字和知识点相关的其他的知识点,并 把他们的关系展现出来,采用概念图能够让这种关系网很清晰的向学生展现。 ) 。l 的数据具有“自我描述性”,同时它的结构也可以动态变化,这有利于 实现信息抽取与查询。m 。自我描述性质能够使得基于订l 的应用程序可以在 1 0 东北大学硕士学位论文 第二章系统分析与总体设计 x m l 中高效准确的搜索相关的数据内容,而忽略企图不相关的部分。同时我们可 以通过重写咀。文件,添加导航路径,改变导航图的结构。导航路径的信息都是 存在l 文件中,通过它我们可以根据某个学生的特点抽取相关的导航路径方 案,并且根据该学生的特点,为该学生添加和删除相关路径,并把这种导航方案 存在新的儿文件中。 2 5 2 数据挖掘在智能教学系统中的应用 数据挖掘是从大量的数据中挖掘出隐含的、先前未知的、对决策有潜在价值 的知识和规则的一种技术,我们可以根据学生学习的历史数据和当前访问的数据, 利用数据挖掘技术来挖掘学生的个性特征,从而为学生预取一些w e b 页面,用户 缓冲区的数据可以作为挖掘时的历史数据。本系统中主要是采用面向知识运用的 数据挖掘技术【l ”,它有如下特点: ( 1 ) 过程特点:数据挖掘的主体是具有一定知识背景,知识结构和知识创新能 力的“人”,静态的信息资源是数据挖掘过程中知识运用的基础和载体, 利用已有信息资源,结合个人知识背景,借助辅助工具,实现已有信息资 源的裂变和聚变。 ( 2 ) 结果特点:数据挖掘的结果是人经过思考,选择和决策,通过对信息进行 “聚合”形成的“化合物”,而不是通过简单集成或信息过滤得到的由信 息堆积成的“混合物”。 ( 3 ) 环境特点:鉴于数据挖掘主体知识背景和知识结构的不问,面向知识运 用的数据挖掘技术必须提供一种高度柔性的导向工具,提供数据挖掘主体 运用自身知识的空间和环境。 ( 4 ) 资源组织特点:数据挖掘的结果,除新的信息资源外,更主要的是新的信 息组织模式,鉴于信息资源不断扩展而造成的数据挖掘过程和对象的复杂 性,所以数据挖掘对象的信息资源在衍生过程中,不仅要实现量的扩充, 更要强化信息逻辑资源的组织关系,通过实旆二级或多级抽象,实现内容 和逻辑组织的隔离运行。 东北大学硕士学位论文 第三章系统相关理论与技术 第三章系统相关理论与技术 本章是在基于总体设计的基础上对其中相关的理论和技术做了详细的介绍, 系统相关理论与技术是系统实现的基础,从知识表达和知识工程的研究,到概念 图关系理论的探讨,以及适应性学习的特征分析,都是系统实现的必备知识,对 于数据挖掘和x m l 技术在本章做了详细的介绍,同时就智能教学系统软件实现中 采用的设计模式,我们也给了具体介绍。 3 1 知识表达与知识工程 3 1 1 知识及知识库的设计原则 知识库所提供的知识形式、内容及对知识的组织管理和使用都将影响到教学 系统的性能,在设计知识库时,应遵循的原则大致有【1 2 】: ( 1 ) 知识库中有不同类型的知识,它们的逻辑表达方式存在着差异,因此有 必要将它们合理划分; ( 2 ) 知识库要易于创建、维护和扩充; ( 3 ) 领域知识要能够调用并有高效的查询速度 ( 4 ) 为了逐步完成知识库系统,对知识库的干预不可缺少,良好的交互环境 为此提供支持, 3 1 2 知识库系统 在知识工程领域,领域知识分为三种类型,描述性知识、过程型知识和控制 性知t 1 3 】。描述性知识包括有关问题的概念、定义与事实等内容;过程性知识表 达有关问题求解过程的操作、演算和行为;控制性知识提供控制策略,表达有关 如何选择相应操作、演算和行为等的比较、判断和决策,它引导过程性知识的执 行。智能教学系统采用人工智能的知识表示技术,同时把控制性知识和其他两类 知识分开,即陈述性知识和过程性知识放在领域知识库中,控制性知识放在教学 规则库。 把领域知识和教学知识分离是智能教学系统的一个显著特点,这与就事论事 的编程方法完全不同。显式的表示教学知识,就可以在不同情况和不同领域中灵 】2 东北大学硕士学位论文第三章系统相关理论与技术 活地使用它,课程材料就可以系统的、结构化地组织,而不必考虑这些知识以什 么样的格式传给学生。因此可以利用知识管理的经验和方法集中组织管理所有领 域知识,建成知识库系统。 3 1 2 1 领域知识 一个领域知识库应该能够科学反映本领域的知识,并且适合教学,能够为相 应的教学方法和教学过程提供充足的材料。知识库和教材库的建立则反映了这些 要求。知识体系用于建立每个知识点的属性和知识点之间的关系。一门学科从逻 辑上看是由一个知识体系构成,但从物理上看,是由一系列独立的文档和材料构 成的。知识体系管理的是领域知识的逻辑结构,而教材库管理的是组成该学科教 学内容的具体文档。 ( 1 ) 知识体系 一个知识体系包含知识点属性库和知识点之间的关系库。 1 ) 知识点属性: 难度d :表示在知识点n 上系统认为的问题的难度。这里设定对于不同 程度的学生,知识点n 体现出来的难度值有所不同。 重要程度t 叫) ;表示相对于其他兄弟知识点或相关知识点在所包含它的单元 教学中的重要性。 达到阀值s t ( n ) :当知识点的总评价值不小于6 0 时,才允许离开该节点,进 入下一个知识点学习。 掌握程度s 0 0 :表示学生掌握知识n 的程度,叶子知识点的s ( 1 d 是通过学 生的学习记录所得到的。而上一层知识点为区别之而表示为s ( m ) ,s ( m ) 是通过下一 层的知识点加权平均计算得到,表达式为: + r ( f ) 珊 1 l 掌握要求r ( :按认知能力分类,可分为五种:1 一识记、2 一理解、3 一应 用、4 一分析、5 一综合。 2 ) 知识点间关系划分 包含关系:父亲知识点是否可以学习取决于子知识点是否学习过。 1 3 东北大学硕士学位论文 第三章系统相关理论与技术 依赖关系:一个知识点是否可以学习往往取决于另外一个知识点是否学习过, 或者说后者是前者的前序知识点。 兄弟关系:指知识点划分过程中,某一复合知识点的所有子知识点的相互关 系。这些子知识点是从不同的侧面、不同的角度、不同的深度来围绕某一局部领 域知识阐述的。 相似关系:表示知识点与知识点间存在的部分相同的主题。 ( 2 ) 教材库 教材库存储了教学的具体内容,以及用某个教学方法完成某个知识点教材所需 的全部材料。构造教材库基于两个基本观点:以知识为索引,包括主体知识及辅 助材料。 3 1 2 2 教学规则 教学规则对教学行为作出指导,它涉及两个方面:教学策略和具体的教学操 作“】。教学策略是以规则的形式放在教学规则库中,由推理控制模块解释执行教 学策略,因此教学策略的改动不会影响到其他模块。如何把特定学科的教学原理 用教学策略恰当的表示出来,需要人类教学专家的帮助。由于教学策略属于经验 性知识,系统初始只能根据一般的教学策略提供一定数量的教学规则,但教学专 家在使用过程中可以加入自定义的规则,可以想象,随着系统的不断使用,教学 策略得到不断丰富和完善,最终达到完全适用的阶段。 具体教学操作是教学策略的实例化,即表示在前提条件满足的情况下,要采 取什么样的教学动作,它允许从不同侧面或角度讲解同一知识单元。由于同一知 识单元各个教学操作的前提条件互不相同,导致他们的教学行为也互不相同,从 而实现教学行为的多样化。一般具体教学操作与知识单元不是一一对应关系,同 一知识单元可能有不同的教学操作或一个教学操作可能对多个知识单元进行讲 解。 3 2 概念图 概念图是支持概念结构的一个具体的语义模型,一个概念图是由两个结点构 成的有向、连通偶图,这两种结点一种叫做概念结点,另种叫做关系结点。概 念图是基于建构主义的用以知识表示与组织的一种图形表示方法【1 5 l ,它主要用来 表示概念间的主要关系,主要由节点、连接和说明组成,在概念图中,节点用来 1 4 东北大学硕士学位论文 第三章系统相关理论与技术 表示不同的概念,连线用来表示概念间的相互关系,说明是用概念进一步描述概 念间的关系。 3 2 1 概念图表示知识体系的过程 概念图表示知识体系分为如下两个过程1 5 】: ( 1 ) 针对某一个主题,先分解出该主题的内容所涉及的所有概念。 ( 2 ) 识别这些概念的关键概念、中间概念和次要概念。 关键概念是指与主题内容紧密相关的主要概念,该主题所涉及的内容主要是在 这些概念之上;中间概念是这些概念所代表的内容与该主题所涉及的教学内容有 紧密的联系,这些概念是主题内容的重要组成部分;次要概念指的是与主题内容 有一定的联系,这些概念的内容是主题内容的必要补充。 3 2 2 构建概念图 为了便于描述,我们将三个不通层次的概念在层次上形成一种自下而上的层次 关系,依照这种层次关系,将该主题的所涉及的所有概念形成如下关系【j 6 】: ( 1 ) 将该主题的所有关键概念放在最顶端,形成关键概念层; ( 2 ) 将该主题的所有中间概念放在关键概念的下面,形成主要概念层; ( 3 ) 将该主题的所有次要概念放在最低端,形成次要概念层; 对上述概念的层次关系,依据主要的教学内容,用连线连接不同的教学概念, 初步表示概念之间的相互关系,概念之间的连接可以在同一层次间进行,也可以 在不同的层次间进行。如果两个概念之间有连线联结,表明这两个概念在内容上 有直接的联系。并可以在连线间加上权值和其他说明表示关系类型或强度。 3 3 适应性学习 “适应”一词在心理学上一般指个体调整自己的机体和心理状态,使之与环境 条件的要求符合,这是个体与各种环境因素连续不断相互作用的过程。因此“适 应”而言,包含了三个基本组成部分【1 7 】: ( 1 ) 个体,这是“适应”的主体; ( 2 ) 环境,它与个体相互作用,不仅对个体提出了自然和社会的要求,而且也 1 5 东北大学硕士学位论文 第三章系统相关理论与技术 是个体实现自己需要的来源;其中个体与环境或其他个体的交互是个体“适应” 过程中,环境的重要组成部分; ( 3 ) 改变,这是“适应”的中心环节。现代意义上的“改变”不仅包括个体改 变自身以适应环境,而且也包括个体改变环境使之满足自己的需要,其目的是为 了达到个体和环境的和谐。 个体在学习过程中,要表现出“超越学习情境中的障碍的倾向”,或“个体 克服困难取得较好学习效果的倾向”【l8 1 ,即学习的适应能力。学习适应性应包括 学习观念的适应、学习环境的适应、学习方式的适应三个层面【1 9 1 。“适应性学习” 是为了提高学生的学习适应性,让学习环境通过自身的调整来适应学习者个性特 征和知识水平,满足学习者个别需要的学习过程【2 0 1 。这里包含两层含义:首先适 应性学习可以让学习者选择学习支持工具来定制自己所喜欢的学习环境;其次, 适应性学习可以根据学习者的需要,提供灵活的学习方法来动态呈现学习内容。 即让学习环境模拟传统教师的角色对学习者的学习进行监督和指导。从以往的经 验中,我们知道,提高学习最有效的方法就是要精确识别出学习者的需要以及反 映出关联的学习方法。 3 4 软件设计模式 3 4 1 设计模式的定义和分类 ( 1 ) 定义:设计模式概念是由建筑设计师c l l r i s t o p h e r 舢e x a n d e r 【2 l 】提出:“每 一个模式描述了一个在我们周围不断重复发生的问题,以及该问题的解决方案的 核心。这样,你就能一次又一次地使用该方案而不必做重复劳动。”上述的定义是 对设计模式的广义定义。我们将其应用到面向对象软件的领域内,就形成了对设 计模式的狭义定义。我们可以简单的认为:设计模式就是解决某个特定的面向对 象软件问题的特定方法,设计模式主要用于得到简洁灵活的系统设计。 ( 2 ) 分类:e r i c h g a m m a 等人将设计模式按其解决问题的不同分为三种:创建 型、结构型和行为型三种。通常情况下,设计模式均基于面向对象技术而提出, 也可应用于接口定义良好的结构化方法中。 1 )创建型模式:该类型模式是对对象实例化过程的抽象,它通过采用抽象 类所定义的接口,封装了系统中对象如何创建、组合等信息。 2 )结构型模式:该类模式主要用于如何组合已有的类和对象以获得更大的 结构,一般借承等概念将一个或多个类或对象 】6 东北大学硕士学位论文 第三章系统相关理论与技术 进行组合、封装,以提供统一的外部视图或新的功能。 3 ) 行为模式:该类模式主要用于对象之间职责及其提供的服务的分配,它 不仅描述对象或类的模式,还描述它们之间的通信模式,特别是描述一 组对等的对象怎样相互协作以完成其中任一对象都无法单独完成的任 务。 3 4 2 软件设计模式的特点 设计模式是( 面向对象) 设计经验的凝结,有以下特点: ( 1 ) 设计模式侧重于系统动态行为特征的分析和抽象。 ( 2 ) 设计模式更侧重于对象组合而不是继承。如今软件系统的演化越来越 依赖于对象复合而不是类继承,继承常被认为破坏了封装性( 子类揭 示了父类的实现细节,其实现与父类有紧密的依赖关系) ,基于对象 组合可使类的层次和数量减少,从而设计更为简洁,可扩展性好。 ( 3 ) 设计模式为类继承中的层次划分提供指导。设计模式从系统动态行为 特征的角度,将类之间的相互作用进行分层包装,在此基础上合理分 配各方法属性。 3 4 3 设计模式 在本系统的软件实现的编码开发中,特别是导航应用程序模块的实现中,我 们采用到了如下设计模式: ( 1 )创建模式之a b s t r a c tf a c c o r y ( 抽象工厂) 模式 1 ) 结构: 。 。一。一一一一一一。,。w - 。一一一一一一一一1 。_ 图3 1 抽象工厂模式结构 f i g 3 1s 仇l c t i l r eo f a b s 打邪tf a c l o r yp a n e m 一1 7 蠹盏 东北大学硕士学位论文第三章系统相关理论与技术 2 ) 意图: 提供一个创建一系列相关或相互依赖对象的接口,而无需指定它们具体的类。 3 ) 适用性: 一个系统要独立于它的产品的创建、组合和表示时。 一个系统要由多个产品系列中的一个来配置时。 当你要强调一系列相关的产品对象的设计以便进行联合使用时。 当你提供一个产品类库,而只想显示它们的接口而不是实现时。 ( 2 ) 设计模式之p r o x y ( 代理) 模式 1 ) 结构: 图3 2 代理模式结构 f i g 3 2s 廿u c t u r eo f p r o x yp a t c e m 2 ) 意图:p m x y 为其他对象提供一种代理以控制对这个对象的访问。 3 ) 适用性 远程代理:为一个对象在不同的地址空间提供局部代表。 保护代理:控制对原始对象的访问。保护代理用于对象应该有不同的访问 权限的时候。 智能指引:取代了简单的指针,它在访问对象时执行一些附加操作。 ( 3 ) 行为模式之c h a i l l o f r e s p o n s i b i l i t y ( 职责链) 模式 1 ) 结构: 1 8 东北大学硕士学位论文 第三章系统相关理论与技术 2 ) 意图: 对于界面设计可交性的需求,m v c 把交互系统的组成分解成模型、视图、控 制三种部件。 模型部件是软件所处理问题逻辑在独立于外在显示内容和形式情况下的内在 抽象,封装了问题的核心数据、逻辑和功能的计算关系,他独立于具体的界面表 达和i 0 操作。 视图部件把表示模型数据及逻辑关系和状态的信息及特定形式展示给用户。 它从模型获得显示信息,对于相同的信息可以有多个不同的显示形式或视图。 控制部件是处理用户与软件的交互操作的,其职责是控制提供模型中任何变 化的传播,确保用户界面与模型间对应联系;它接受用户的输入,将输入反馈给 模型,进而实现对模型的计算控制,是使模型和视图协调工作的部件。通常一个 视图具有一个控制器。 3 ) 适用性: 模型、视图与控制器的分离,可以应用于一个模型可以具有多个显示视图的 情况。如果用户通过某个视图的控制器改变了模型的数据,如果需要所有其它依 赖于这些数据的视图都应反映到这些变化。这样可以使用m v c 模式,通过控制器 都会将变化通知所有的视图,导致显示的更新。这实际上是一种模型的变化传播 机制。 3 5 信息论基本思想 信息论是c e s h a n n o n 为解决传递( 通信) 过程问题建立的一系列理论,也称 为统计通信理论【2 2 】。一个传递信息的系统是由发送端( 信源) 和接收端( 信宿) 以及连接两者的通道( 信道) 组成。信息论把通信过程看作是在随机干扰的环境 中传递信息的过程。在这个通信模型中,信息源和干扰( 噪声) 都被理解为某种 随机过程或随机序列。因此,在进行实际的通信之前,收信者( 信宿) 不可能确 切了解信源究竟会发出什么样的具体信息,不可能判断信源处于什么样的状态。 这种情形就称为信宿对于信源状态具有不确定性。由于这种不确定性是存在通信 之前,因而又叫做先验不确定性。 在进行立刻通信之后,信宿收到了信源发来的信息,这种先验不确定才会被消 2 0 东北大学硕士学位论丈第三章系统相关理论与技术 3 6 数据挖掘技术 数据挖掘,简单的鹭耍图搬。蜀叩嚏灞潮隋咐罐浏羹话求以韵鲋魏甄嚣;滩 毙静静叫劐融静乙;叫刨硼分;受醛酎甄;巽靶黧j 醛攀蔷孽薪塑,罄戢黧麓 憩掣裂;副警县型罩个耐雾;然望覃布鹱疆氇捌接拦幢嘎1 随透嚷;川;处一堡个 请求桶问积幽m 驷魅粕b 美亍彳捕峙窜驶型毫裂鲫冒鸶t 燃,撼蟠囊醣型疆坦孔掣 求 运行时刻自动确定。 你想在不明确指定接收者的情况下,向多个对象中的一个提交个请求。 可处理一个请求的对象集合应被动态指定。 ( 4 ) m vc 设计模式 1 ) 结构: 图3 4 m v c 模式结构 f 培3 4s 仃1 j c t u r e0 f m v cp a n e m - 1 9 - x 东北大学硕士学位论文第三章系统相关理论与技术 3 6 2 决策树学习 采用决策树来生成分类器,主要优点有 2 4 】:可以生成可以理解的规则;计算量 相对来说不是很大;可以处理连续和离散字段;决策树可以清晰的显示哪些字段比 较重要,我们采用的基本决策树是构造算法没有考虑噪声,生成的决策树完全与训 练例子拟合。真实世界的数据一般不可能是完美的:可能是某些某些字段属性上缺 值;可能缺少必须的数据而造成数据不完整;可能数据不准确含有噪声,甚至是错 误的。有噪声情况下过分拟合,即对数据的完全拟合反而不是很好的预测性能。剪 枝是一种克服噪声的技术,同时它也能使树得到简化而变得容易理解。 决策树学习是以实例为基础的归纳学习算法。它着眼于从一组无次序、无规则 的事例中推理出决策树表现形式的分类规则。它采用自顶向下的递归方式,在决策 树的内部节点进行属性值的比较,并根据不同的属性值,判断从该节点向下的分支, 在决策树的叶子节点得到结论。从根结点到叶结点的路径就对应一条合取规则,整 个决策树就对应一组析取表达规则。决策树的基本组成部分:决策节点、分支和叶 子。一个决策树包含零个或多个内部节点,和一个或更多的叶子节点。全部的内部 节点有两个和更多的子节点。所有的内部节点包含一个划分,每个叶子节点有个相 关联的类,本文将内部节点的属性称为测试属性。 3 6 2 1 决策树生成 给定一个训练集,构造决策树的一般性描述为【2 4 l : ( 1 ) 树以代表整个训练样本的单节点开始; ( 2 ) 如果所有的当前节点的训练样本属于同一个类别,则该节点成为树叶,用 该类标记,并停止。 ( 3 ) 否则使用最优测量,计算每个集合的每个可能的划分; ( 4 ) 选择最优划分作为当前节点的测试。创建与该划分不通的输出数同样多的 子节点; ( 5 ) 使用该划分的输出标注父亲和儿子之间的边,并使用该划分把训练数据划 分到子节点中; ( 6 ) 把子节点作为当前节点,循环进行( 2 ) 一( 3 ) 步骤,直至不存在可以划分的节 点为止。 建立好决策树后,就要使用决策树对新的事例进行分类。分类是根据事例的 属性值计算它的类标签。一个事例计算它的类标签是将其从树的根节点开始通过 整个树。该事例从根节点开始,相继通过内部节点,最终达到某个叶子节点。在 2 3 东北大学硕士学位论文 第三章系统相关理论与技术 通过每个内部节点时,节点中的测试对事例进行测试,测试的结果决定该事例要 通过哪个分支到达下一个节点。该事例的类就是它最终到达节点所属的类。如果 分类结果和事例所应属于的类不一致,那么该树对该事例分类出错。决策树正确 的分类的比例被称作正确率,相反错误分类的事例的比率称作错误率。 在决策树的建立过程中,一个重要的问题就是树的精确度和复杂度之间要取 一定的平衡。一种方法就是反复的进行对模式进行简单化直到树的精确性和复杂 度达到所需的平衡。这种方法使训练数据保持一定,而不停的对模式进行调整。 另外一种方法就是同时调整模式和训练集。这种方法先建立一个模式,然后删除 一些样本,使模式的在训练集上的自我评估能够最大的提高。这两步交替执行, 直到达到预期的标准。 3 6 _ 2 2 决策树的剪枝 当决策树建立的时候,由于数据中的噪声和孤立点,许多分支反应的就是训 练中的异常。由建树阶段生成的决策树具有适应过度,即决策树可以准确地将给 定的训练集中的记录进行分类,但一旦引入新的数据,预测准确度就会大幅度下 降。针对这一问题,在完成建树阶段后,通常跟随一个修剪阶段,通过对新生成 的树进行修剪,消除适应过渡的情况。通常这种方法使用统计度量,剪去最不可 靠的分支,这将导致较快的分类,提高决策树独立于测试数据正确分类的能力。 有两种常用的剪枝方法瞄】。一种是先剪枝方法。在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论