(计算机应用技术专业论文)基于本体和数据挖掘技术的智能授导系统研究.pdf_第1页
(计算机应用技术专业论文)基于本体和数据挖掘技术的智能授导系统研究.pdf_第2页
(计算机应用技术专业论文)基于本体和数据挖掘技术的智能授导系统研究.pdf_第3页
(计算机应用技术专业论文)基于本体和数据挖掘技术的智能授导系统研究.pdf_第4页
(计算机应用技术专业论文)基于本体和数据挖掘技术的智能授导系统研究.pdf_第5页
已阅读5页,还剩76页未读 继续免费阅读

(计算机应用技术专业论文)基于本体和数据挖掘技术的智能授导系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江工业大学硕士研究生学位论文 基于本体和数据挖掘技术的智能授导系统研究 基于本体和数据挖掘技术的智能授导系统研究 摘要 智能授导系统是借助人工智能的方法与技术,适应性地组织学习资 源、实施教学策略、提供教学服务、进行教学评价的一种数字化学习支持 系统。目前的智能授导系统中往往“智能化”体现不够,资源无法被有效 利用,不能根据学习者个性提供相应的指导,实现个性化教学。我们希望 开发一种智能的自适应授导系统,根据学习者的认知水平和学习行为,分 配学习资源,制定个性化的学习路径,改变传统教育的“一视同仁”,实 施个性化教育。 本文的研究工作是一项计算机应用、人工智能、教育技术学多学科交 叉的研究工作。本文在教育心理学、数据挖掘和本体等方面做了较深入的 研究,开展了以下主要研究工作,并取得一定的研究成果。 l 、通过基于个性化教学原理的网络学习行为智能分析系统的构建和 实施,积累和沉淀有分析价值的实验数据,掌握每个学习者的认知水平和 学习风格等,选择i d 3 算法,并进行改进,分析学习者的学习者模型信息, 形成学习者特征,建立个性化学习行为的决策树分类模型。 2 、引入领域本体,构建智能授导系统中的学习者和学习资源相关本 体模型,同时对学习资源进行语义描述,建立学习资源分配知识库,根据 学习者个体特征生成个性学习导航路径,支持个性化学习。 3 、实现了基于本体和数据挖掘技术的智能授导原型系统开发,包括 浙江工业大学硕七研究生学位论文 基于本体和数据挖掘技术的智能授导系统研究 学习行为分析及管理子系统、学习资源管理子系统、学习资源分配子系统 等三个子系统。通过该系统,为每一个学习者提供了适应其需求特点的学 习资源,使学习者的学习潜能在特定设计的环境下得到充分发挥。 4 、论文的最后总结了本文的研究工作,并讨论了一些未解决的问题 以及进一步研究工作的前景。 关键词智能授导,数据挖掘,本体,个性化学习 浙江t 业大学硕。- :研究生学位论文基于本体和数据挖掘技术的智能授导系统研究 r e s e a r c ho nt h ei n t e l l i g e n tt u t o r i n gs y s t e mb a s e do nt h e o n t o l o g ya n dt h ed a t am i n i n gt e c h n o l o g y a b s t r a c t n l ei n t e l l i g e n tt u t o r i n gs y s t e mi sak i n do fd i g i t i z e ds t u d ys u p p o r ts y s t e mi nv i r t u eo f t h ea r t i f i c i a li n t e l l i g e n c e ,i tc a nc o m p a t i b l yo r g a n i z e st h et e a c h i n gr e s o u r c e s ,i m p l e m e n t s t e a c h i n gs t r a t e g y , p r o v i d e st h et e a c h i n gs e r v i c e a n dc a r r i e so nt h et e a c h i n ga p p r a i s a l n l e i n t e l l e c t u a l i z e dd e g r e eo ft h ep r e s e n ti n t e l l i g e n tt u t o r i n gs y s t e mi si n s u f f i c i e n t ,t h e r e s o u r c e si su n a b l et ob e u s e de f f e c t i v e l y , a n di tc a n n o tp r o v i d et h ec o r r e s p o n d i n g i n s t r u c t i o na c c o r d i n gt ot h el e a r n e r s i n d i v i d u a l i t yt or e a l i z et h ei n d i v i d u a lt e a c h i n g w e h o p e dd e v e l o p i n ga na u t o a d a p t e dt u t o r i n gs y s t e mt o a s s i g ns t u d yr e s o u r c e s ,e s t a b l i s h i n d i v i d u a ls t u d yp a t h ,a n dc h a n g et h e ”i m p a r t i a lt r e a t m e n t ”o ft r a d i t i o n a le d u c m i o n a c c o r d i n gt ot h ec o g n i t i o nl e v e la n dt h es t y l eo fl e a r n e r s ,a n dt h e ni m p l e m e n tt h ei n d i v i d u a l e d u c a t i o n 1 1 1 er e s e a r c ho ft h i sa r t i c l ei sac r o s s e ds t u d yo fc o m p u t e ra p p l i c a t i o n ,a r t i f i c i a l i n t e l l i g e n c e ,a n de d u c a t i o n a lt e c h n i q u e w eh a v ed o n em o r et h o r o u g hr e s e a r c ho nt h e e d u c a t i o n a lp s y c h o l o g y , d a t am i n i n ga n do n t o l o g y t h em a i nr e s e a r c hw o r ka sf o l l o w s ,a n d o b t a i n st h ec e r t a i nr e s e a r c hr e s u l t s 1 b e c a u s eo ft h ec o n s t r u c t i n ga n di m p l e m e n t a t i o no ft h en e t w o r ks t u d yb e h a v i o r i n t e l l i g e n c ea n a l y s i ss y s t e mb a s e do ni n d i v i d u a lt e a c h i n gp r i n c i p l e ,w eh a v ea c c u m u l a t e d t h ee m p i r i c a ld a t at h a th a v ea n a l y s i sv a l u e ,h a v eg r a s p e dt h ec o g n i t i o nl e v e la n dt h es t u d y s t y l eo fe a c hl e a r n e r w ec h o o s et h ei d 3a l g o r i t h m ,a n dm a k et h ei m p r o v e m e n t ,t h e n a n a l y z et h es t u d ym o d e li n f o r m a t i o n ,f o r ml e a r n e rs t u d yc h a r a c t e r i s t i c ,a n de s t a b l i s ht h e t r e ec l a s s i f i c a t i o nm o d e lo fi n d i v i d u a ls t u d yb e h a v i o r 2 w ei n t r o d u c e dd o m a i no n t o l o g y , a n dc o n s t r u c t e dt h er e l a t e do n t o l o g ym o d e lo ft h e l e a r n e r sa n dt h es t u d yr e s o u r c e si nt h ei n t e l l i g e n tt u t o r i n gs y s t e m ,s i m u l t a n e o u s l yc a r r i e do n t h es e m a n t i cd e s c r i p t i o nt ot h es t u d yr e s o u r c e s ,e s t a b l i s h e dt h es t u d yr e s o u r c ed i s t r i b u t i o n l i b r a r y , a n dt h e np r o d u c e di n d i v i d u a ls t u d yn a v i g a t i o nw a ya c c o r d i n gt ot h el e a r n e r s i n d i v i d u a lc h a r a c t e r i s t i ct os u p p o r tt h ei n d i v i d u a ls t u d y 3 t h ep r o t o t y p ei n t e l l i g e n tt u t o r i n gs y s t e mb a s e do nt h eo n t o l o g ya n dt h ed a t am i n i n g t e c h n o l o g yh a sb e e nr e a l i z e d ,i n c l u d i n gt h es t u d ys t y l ea n a l y s i sa n dm a n a g e m e n ts u b s y s t e m , t e a c h i n gr e s o u r c em a n a g e m e n ts u b s y s t e m ,t e a c h i n gr e s o u r c ed i s t r i b u t i o ns u b s y s t e m t l l i s 浙江工业大学硕士研究生学位论文基于本体和数据挖掘技术的智能授导系统研究 s y s t e mp r o v i d e ss t u d yr e s o u r c e st h a ta d a p t e dt ot h ed e m a n d so fe a c hl e a r n e ra n de n a b l e s t h ef u l ld i s p l a yo fs t u d yp o t e n t i a li nt h es p e c i f i cd e s i g n e de n v i r o n m e n t t h ep a p e rf i n a l l ys u m m a r i z e dt h er e s e a r c hw o r ko ft h i sa r t i c l e ,a n dd i s c u s s e ds o m e s o l u t i o no f q u e s t i o na sw e l la st h ef u r t h e rr e s e a r c hw o r kp r o s p e c t k e yw o r d s :t h ei n t e l l i g e n tt u t o r i n gs y s t e m ,d a t am i n i n g ,o n t o l o g y ,i n d i v i d u a ls t u d y 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研 究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包 含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大 学或其它教育机构的学位证书而使用过的材料。对本文的研究做出重要贡献 的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。 作者签名门缈日期渺6 月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查 阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本 学位论文。 本学位论文属于 1 、保密d ,在年解密后适用本授权书。 2 、不保密d 。 ( 请在以上相应方框内打“”) 作者签名伽 导师签名 日期:年月 日 日期:年 月日 新江工业大学颤十研究生学位论文基于奉体和数据挖掘技术的智能授导系统研究 1 1 论文研究背景和意义 第一章绪论 智能授导系统( i n t e l l i g e n tt u t o r i n gs y s t e m ,简称i t s ) 是以学生为中 心,计算机为媒介,利用计算机模拟教学专家的思维过程,形成开放式的人机交 互系统。它是一项涉及人工智能、计算机及网络科学、认知科学、教育学、心理 学和行为科学的综合性课题,其研究的最终目的是赋予计算机系统以智能,由计 算机系统承担对学习者的引导和帮助,在一定程度上模拟人类教师的行为,指导 学习者实现针对其个性特征的最佳学习。随着网络的普及,越来越多的i t s 已经 移植于网络之上,本体与数据挖掘技术的发展也为网络化的i t s 的发展提供了新 的研究思路。 本课题主要是探讨数据挖掘在个性化网络学习系统中的应用以及设计基于本 体和数据挖掘技术的智能授导系统的结构框架。通过数据挖掘,从大量的历史数 据和过去的教学经验中发现对决策有用的知识,构建学习者个性分类模型。然后 把本体引入到学习资源管理中,通过领域本体的构建以及利用领域本体实现学习 资源的语义描述和语义查询。 研究基于本体和数据挖掘技术的智能授导系统,有着重要意义; ( 1 ) 在学习行为的采集和分类上,通过数据挖掘采集学生的学习心理、学习 习惯、学习动机,构建学习个性分类模型,得出的数据模型对推进高校教育和教 学改革有直接的应用和参考价值。以这种方法构建的教学系统更加人性化和科学 化,能够监督老师的教学质量和提高学生的学习效率。 ( 2 ) 在学习模型的研究中,我们采用改进的i d 3 算法对学生的基本信息、学 习行为和取得的阶段性成绩等数据库进行挖掘分析,找出学习行为之间的相关性 以及学习行为对学生成绩的影响。该方法辅助了人类凭直觉和经验的决策。 ( 3 ) 在学习资源的分配和管理中,引入领域本体进行建模。设计基于领域本 体的学习资源管理框架,从知识和语义层次上描述学习资源,使得学习资源可以 实现共享和互操作。 浙江工亚大学硕j :研究生学位论文 幕于本体和数据挖掘技术的智能授导系统研究 总之,网络化与智能化是授导系统发展的两大趋势,也是我国教育信息化的 必然趋势。在网络教学中注入本体理论与数据挖掘技术,为智能化教学发展提供 新契机。 1 2 国内外研究现状与发展趋势 1 2 1 智能授导系统的国内外研究现状 自从2 0 世纪7 0 年代第一个讲授地理知识的智能教学系统s c h o l a r 系 统【2 l 问世以来,i t s 就成为计算机应用于教育领域的研究热点。由于智能授导系统 是新兴的研究领域,相关理论还不成熟,因此国内外都处于探索阶段。但相对而 言,国外的研究领先于国内1 3 。 美国、日本、加拿大、欧洲等国纷纷投入人力、物力和财力从事这方面的研 究,研究的主体主要集中在大学和军方中进行。美国一些知名的大学如s t a n d f o r d , m i t ,m e m p h i s ,c a r n e g i e m e l t o n 以及c a l i f o m i a 等都在进行i t s 的研究工作,研 发出一些具有一定智能的原型系统【4 1 国内对于该领域的研究起步比较晚,少量的研究工作主要分散在大学和研究 机构中进行,且多为研究演示用的原型系统,尚未形成系统化的研究机制与规模。 随着国内数字化教学与教育信息化的进程,最近几年的发展相对比较快,已有很 多研究机构丌始进行i t s 的设计开发工作,且研究重点已经转向智能化网络教学 平台。 近几年,国内智能授导系统的相关研究主要有: 首都师范大学王陆等人探讨了基于教学过程的i t s 系统模型,分析研究了教 师在教学的各个阶段中所承担的角色和完成的工作,并根据教学过程的动态特性, 提出了一个基于测试与诊断的i t s 模型【5 】。通过分析学科知识和测试结果来向学生 提供学习建议,从而进一步提高学生成绩。 上海交通大学申瑞民等人研究了基于数据挖掘的个性化学习导航系统的设计 与实现,在远程教育系统中引入自适应机制,针对远程教育系统的学习者的学习 特点,提供不同的学习资源,即个性化学习导航系统,对用户的已有数据进行数 据挖掘,分析出用户的知识架构,根据已有的全局知识空间,与用户知识架构作 补操作,向用户提供其应学习的资源【6 l 。 2 浙江工业大学硕上研究生学位论文基于本体和数据挖掘技术的智能授导系统研究 中国科学院计算机语言信息工程研究中心黄海燕等人研究了i t s 系统中自 然语言人机接口的设计与实现和知识树增长模型【7 1 。 西南师范大学邓晖等人设计了网络环境下的学生特征分析系统,通过收集、 分析学习者在学习过程中的动态和静态信息,提出了学习者特征分析系统设计的 理论模块1 8 j 。 华南师范大学陈品德、李克东等人提出了一套教学领域知识的组织和表示方 案,用户建模方法和体现智能适应性特征的学习支持系统结构模型,并基于这些 研究成果开发了适应性远程学习支持系统a t u t o r ( a d a p t i v et u t o r ) 1 9 l 。 首都师范大学常子冠等人研究了适应性导学系统及创作工具,结合智能教学 系统,在原个性化学习支持系统的基础上,设计并开发了教学策略编辑工具,使 用教学策略和查询教学策略,协助教师更有效率地组织网上教学【l o 】。 但总体来说,由于目前智能授导系统的发展与人们的期望还存在较大差距以 及i t s 的研究开发相对滞后,我国教育软件仍然贫乏,成规模的教育软件厂商很 少,真正意义上的i t s 则更少,对人们的现实影响还很小。 1 2 2 智能授导系统存在的问题与发展趋势 虽然智能授导系统研究已有多年历史,取得了很多成绩。但由于他涉及到多 学科的知识,在我国现实教学中才刚刚倡导。而学习者缺少这方面能力的培养, 大多数学习者的自主学习能力又较差。i t s 的研究和开发是一个艰难的过程,存在 着不少缺点: ( 1 ) 网络上各种智能授导系统站点上积累了大量有用的教学信息,如用户的 访问日志、注册信息、答疑信息、考试信息、交流信息和学习进度等,却都没有 被有效利用,造成了资源的极大浪费。怎么样挖掘出更多或更有用的资源便于应 用或者重组还有待探究。 ( 2 ) 系统对“智能化”特征的体现明显不够,不能根据学习者的水平和学习 情况提供合适的、个性化的、交互的学习环境,以调动学习者的学习兴趣。系统 仍然束缚在传统教育的模式中,不能根据学习者个性提供相应的指导,实现个性 化教学;不能根据学习者当前的薄弱环节,提供学习者补漏的提示和相应的学习 计划。系统的智能水平在设计阶段就已经基本定型,所谓智能只是对专家知识部 浙江工业大学硕l :研究生学位论文 基于奉体和数据挖掘技术的智能授导系统研究 分的、有限的、显性的反应,多是比较单纯的“推理智慧”,很大程度上依赖推理 机的设计与知识的表示,不能根据实际应用情况不断地修改和丰富知识。 ( 3 ) 系统的可维护性差,升级比较困难。目前的大多教学软件通常以一种或 几种固定的教学策略展示教学内容,一旦需要变动其中的某个部分,整个系统需 要重新编译和配置,造成大量科研经费及人力的浪费。 由此可见,目前国内现存的智能授导系统还处于起步阶段,仍有许多不足, 有待进一步的改进。随着信息技术的飞速发展以及人工智能技术的不断进步,许 多新的技术和思想都将被应用到i t s 的研究中来。其中十分值得关注的是:创建 智能授导系统本体来组织智能授导系统概念和推动共同建构;发展智能授导系统 体系结构分类与应用领域的映射关系;增加教学代理与虚拟人的研究;发展著作 系统【1 1 】的开发;非良构领域的智能授导系统研究;学习机制、严肃游戏【1 2 】与交互 式叙事学习环境、元认识技能支持【1 3 l 、适应性学习支持1 1 4 】等。 1 3 本文的研究目标与内容 1 3 1 研究目标 本文的研究目标是在深刻理解本体理论的基础上,通过数据挖掘技术,建立 准确的学生模型,将学生学习行为分类,结合学习资源分配规则,设计一个网络 学习行为智能分析系统。通过领域本体所定义的严格语义内涵和概念之间的相互 关系,建立起信息资源在本体层的映射关系,开发出以学生为中心具有教育决策 能力的个性化网络智能授导系统。 1 3 2 研究内容 本文研究的具体内容主要有: 1 通过基于个性化教学原理的授导系统的构建和实施,积累和沉淀有分析价 值的实验数据,选择合适的数据挖掘工具,根据w e b 同志和数据库信息挖掘学习 者个性和共性规则,提取数据并建立个性化学习行为的决策树分类模型。 2 选择i d 3 算法,并进行改进,分析学习者的学习者模型信息,掌握每个学 习者的学习基础、认知水平和学习风格等等,形成学习者特征和教学策略规则。 4 浙江工业大学硕上研究生学位论文基于本体和数据挖掘技术的智能授导系统研究 3 引入领域本体进行建模,对学习资源进行语义描述,对资源的组成部分的 显示形式和操作进行描述,建立学习资源分配知识库,支持个性化学习。 4 规划、设计一个具有因材施教和个别指导特征的智能授导系统,为每一个 学习者提供适应其需求特点的学习资源,自动地调整资源内容以适合学习者的兴 趣,使学习者的学习潜能在特定设计的环境下得到充分发挥。 1 4 论文框架 论文的具体框架如下: 第一章为绪论,介绍了论文研究的背景、意义:并与国内外智能授导系统的 发展现状进行比较,提出当前智能授导系统主要存在的问题和将来的发展趋势; 综合论述了本文的研究目标与内容。 第二章从相关理论与技术出发,阐述了教育学中智能授导系统的定义;数据 挖掘技术在本课题中的应用;将本体技术引入智能授导系统,详细介绍了本体模 型构建的方法和选择本体语言描述的标准。 第三章设计网络学习行为智能分析系统,采集并选择学习行为数据的结构、 处理和统计方法;依据决策树分类中的i d 3 算法并进行改进;根据统计结果进行 学习行为分类,建立分类模型并制定标准。 第四章引入领域本体进行建模,对学习资源进行o w l 语义描述,定义学习资 源对学习者的个性化分配规则,支持个性化学习。 第五章智能授导系统的原型设计,包括系统的逻辑模型、学习流程、系统体 系结构与主要数据结构。 第六章总结全文并展望。 5 浙e t 业大学硕l :研究生学位论文摹于奉体和数据挖掘技术的智能授导系统研究 第二章相关理论与技术 智能授导系统必须根据科学的学习理论进行学习过程和学习资源的设计、开 发、利用、管理,帮助学生进行有效的学习。本章主要介绍智能授导系统的理论 构架:数据挖掘的概念,本系统所采用的挖掘方法:基于本体的知识表示理论。 本章是全文的理论基础,为系统的设计、算法选择以及实施提供了理论指导。 2 1 智能授导系统的基本理念 2 1 1 传统的智能授导系统 智能授导系统是一种学习技术系统,能根据学习者的特定目标、需求和偏好, 利用教学方法和学科知识动态地调整学习内容。智能指的是系统具有知道教什么 ( 学习资源) 何时教以及如何教( 教学策略) 的能力【1 5 】。 传统的i t s 按照功能可以划分为领域知识库、学生模型、教学策略模块和人 机界面等主要模块i j6 j 。这种模型具有一个明显的缺点:学习系统主要以系统为中 心,没有充分考虑学生的需求和习惯,不按照人的个性化需求等因素来实施教育, 要求人来适应系统而不是系统来适应用户。学生在学习过程中,需要花很长时间 来适应这种环境,而且知识表示方法单一,缺乏智能性和个性化需求。_ 成不变 的学习环境、不感兴趣的辅助材料使学习也会变得枯燥和无味,不利于学生完全 自由的学习,也无法做到个别化指导。 2 1 2 个性化智能授导系统 利用个性化、智能化服务概念构建网络智能授导系统,是网络教育的一个重 要研究方向。在这种系统中,不是简单的对传统网络学习系统的改进,而是一种 理念上的更新。系统以学生的学习为中心,尊重学生个性,发掘学生学习的潜在 规律,让系统智能的来适应学生,从而更好的支持学生自主选择的学习策略,培 养其元认知能力,在了解学生学习过程的情况下给予适当的、个别的学习指导。 在智能学习环境中,学习是学生通过自身原有知识经验与智能学习系统进行 6 浙江工业大学硕士研究生学位论文基于本体和数据挖掘技术的智能授导系统研究 交互活动来获取知识、获得能力的过程。在这个过程中,学生能够自我组织、制 订并执行学习计划,自主选择学习策略,并能控制整个学习过程,对学习进行自 我评估。它充分地考虑到教学行为的个性化与学习行为的个人化特征,打破了传 统学习群体的结构,把学生作为一个个体,置于一个更为个人化的情景之中。这 种学习具备如下主要特征: ( 1 ) 学习是个别化、人性化的。在智能授导系统中,尊重学生个性、尊重学 生的个人学习风格和学习习惯。学习系统可以对学生特征进行分析,然后通过数 据提取、数据挖掘,得到学生的个人特征模型。学生在这种环境中学习、研究是 基于个别化学习的。 ( 2 ) 学习过程是在学生的掌握和控制中的。智能授导系统对学生模型的建立, 将有助于对学生进行个别化学习的支持和辅助。学生将对自己的全部学习负责, 智能授导系统将对学生的学习进行指导,对学习资源进行推荐,对学习进度和学 习策略给予建议。 ( 3 ) 是种基于资源的学习,但是学习资源( 包括文本、图像、声音、视频、 c a i 软件等) 在呈现上并不是按照事先完全确定的顺序和模式来为学生提供的。 资源的选择和利用将由智能授导系统根据学生的个别化特征来加以呈现,是在学 生的个性化分析、学习风格分析、学习经验分析、原有知识分析等基础上进行的 智能过程,学生的学习过程将是个人特征与学习系统交互作用的过程和与其他人 协作的过程。 本文所研究的授导系统实质是一个数据挖掘和本体描述相结合的智能决策系 统。通过数据挖掘实验和相关分类方法,对网络学习者建立学习者模型,根据学 习者学习行为数据采集来预先了解学习者课程学习特征,为便于软件和用户间的 信息共享沟通,在系统设计前引入本体领域知识,对学习者和学习资源进行语义 描述。 2 2 数据挖掘技术 2 ,2 1 数据挖掘概述 数据挖掘( d a t am i n i n g ) 是提取或“挖掘”知识,从大量的、不完全的、有 噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道 7 浙江t 业大学硕士研究生学位论文 摹于本体和数据挖掘技术的智能授导系统研究 的、但又是潜在有用的信息和知识的过程【1 7 1 。 i t s 系统本身就基于一个庞大的数据库系统中,如果不对这些海量数据进行有 效的利用和分析将会造成资源数据的极大浪费。将数据挖掘中的分类分析应用于 网络教学中,可以得到关于学习者对网络学习资源使用模式的知识,进一步利用 这些知识结合学习者个人的兴趣特征能够实现向学习者的个性化推荐。把数据挖 掘技术引入到i t s 中的应用具体表现在:对站点上保存的学习行为和学习记录 信息进行挖掘,并结合学习资源知识库的信息自动重组课程的内容,使之更符合 教学规律,并结合内容提供其他相关学习资源;通过对学习者学习行为的挖掘, 发现用户的浏览模式,自动重构页面之间的链接,以符合用户的访问习惯。 2 2 2 本系统数据挖掘的方法 大致来讲,数据挖掘中的方法可以分为关联分析、分类分析、聚类分析、预 测分析等几个大类【l 引。本系统中数据挖掘的任务可以描述为:学习已知数据样本 中的分类规律,构成分类器,利用得到的分类器对未知数据样本集进行分类预测。 分类是本系统进行数据挖掘的主要任务。分类在数据挖掘中是一项非常重要 的任务。分类的目的是学会一个分类函数或分类模型( 也称为分类器) ,该模型能把 数据库中的数据项映射到给定类别中的某一个【i9 1 。分类的过程是找出这样的分类 函数或分类模型,以便能够使用模型来预测类标记未知的对象类。导出的模型可 以用多种形式表示,如分类器( i f t h e n 规则) 、判定树、数据公式等。 常用的分类器构造方法有统计方法、机器学习方法、神经网络方法等。统计 方法包括贝叶斯方法和非参数法,对应的知识表示则为判别函数和原型事例。机 器学习方法包括决策树方法和规则归纳法,前者对应的表示为决策树,后者则一 般为产生式规则。神经网络方法主要是b p 算法【硎,它的模型表示是前向反馈神经 网络模型,b p 算法本质上是一种非线性判别函数。最近新兴的一种方法称为粗糙 集方法,其知识表示是产生式规则。 与神经网络和贝叶斯分类相比,决策树提供非常直观地描述,这种描述易于 被吸收,转化为标准的数据库查询。训练神经网络模型时要花费大量的时间,要 进行许多重复操作。与之相比,决策树效率要高得多,适合于大的训练集。决策 树生成算法除了训练集中包含的信息外不需要附加的信息,算法受属性字段的影 8 浙江工业大学硕_ t :研究生学位论文 基于本体和数据挖掘技术的智能授导系统研究 响程度较小。此外,运用决策树所获得的分类模型具有良好的可理解性、可实施 性和通用性,因此本系统采用决策树方法作为构建学习者分类模型的数据挖掘算 法。 决策树学习是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规 则的事例中推理出决策树表示形式的分类规则,通常用来形成分类器和预测模型, 可以对未知数据进行分类或预测、数据挖掘等【2 l 】。决策树结构简单,计算量相对 来说不是很大,并且具有较高的分类精确度,应用非常广泛。决策树算法分两个 部分,一个是建立决策树部分,一个是修剪决策树部分。建立部分要对所有的数 据一直进行演算,直到所有的数据都拥有自己的类别。修剪部分则对决策树最优 化,大部分的算法都遵守最小长度决策树的原则。最典型的决策树算法是i d 3 , 它采用自顶向下不回溯策略,能保证找到一个简单的决策树。还有其他的分类算 法,如c 4 5 ,c a r t ,s l i q ,s p r i n t 等【2 2 】。 2 3 本体 2 3 1 本体概述 本体( o n t o l o g y ) 最早是哲学上的一个概念,指的是人们对世界的某种看法【2 3 1 。 后来本体被引入到了人工智能领域,因为a i 和知识工程需要开发一个领域共享的、 公共的概念,实现知识共享和重用。本体是共享概念模型的明确形式化规范说明, 能够以一种明确的、形式化的方式来表示领域知识,促进知识共享。这包含4 层 含义:概念模型( c o n c e p t u a l i z a t i o n ) 、明确( e x p l i c i t ) 、形式化( f o r m a l ) 和共享 ( s h a r e ) 【2 4 屹5 i 。 “概念模型”指通过抽象出客观世界中一些现象( p h e n o m e n o n ) 的相关概念 而得到的模型。概念模型所表现的含义独立于具体的环境状态。“明确 指所使用 的概念及使用这些概念的约束都有明确的定义。“形式化 指本体是计算机可读的 ( 即能被计算机处理) 。“共享”指本体中体现的是共同认可的知识,反映的是相 关领域中公认的概念集,即本体针对的是团体而非个体的共识。 本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该 领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇( 术语) 和 词汇间相互关系的明确定义。本体能够以一种明确的、形式化的方式来表示领域 9 浙江工业大学而i ! i :研究生学位论文筚于本体和数据挖掘技术的智能授导系统研究 知识,促进知识共享。使用本体来表示知识可以在语义的表现、挖掘隐含的信息 方面有很大的改善,使得知识表示关系变的丰富化,具有较丰富的描述词汇和阶 层化的架构,可以表现完整的且具有描述逻辑的知识库。在描述逻辑中,不但包 含一阶逻辑具有的基础逻辑表示,并将推理中的类别和实例分开,而且可以将类 别之间的关系完整呈现,并使得不同平台之间的知识更加容易实现共享【2 6 1 。本体 结合资源语义描述框架能够为学习资源提供计算机可以理解的描述信息,是实现 资源共享和应用协作的前提基础。 2 3 2 本体在智能授导系统中的应用 基于本体的智能授导系统个性化分析与指导方法的基本设计任务如下: ( 1 ) 建立支持个性化推荐的教学本体模型; ( 2 ) 定义个性化教学内容匹配策略和语义规则; ( 3 ) 将本体文件导入本体有向图模型,推理引擎根据语义策略规则和教学策 略规则,生成含有更多隐含信息的推理有向图模型,在此基础上根据用户的个性 化信息匹配出符合条件的数据集合,过滤掉无关数据。 面向个性化学习的智能授导系统的关键问题包括: ( 1 ) 学习资源的本体建模 将学习资源的本体模型分为数据模型和操作模型。数据模型基于c e l t 标准学 习对象元数据( l o m ) 进行本体建模,通过对学习资源的数据模型进行本体描述, 使其具有机器可以理解的语义信息,使得学习者更容易找到所需信息,实现信息 资源的语义融合,并且使得不同的用户可以根据自己的需求查找到自己所需要的 信息。 ( 2 ) 学习者的本体建模 通过对学习资源的操作模型进行本体描述,使得对于相同的学习资源,不同 的用户得到不同的显示形式,看到不同的界面;而且不同的用户根据自己的需求 看到与其相关的不同的部分,而不是看到所有的部分。同时对于学习资源的不同 组成部分根据用户类别定义不同的操作权限。 l o 浙江工业大学硕l 研究生学位论文 基于本体和数据挖掘技术的智能授导系统研究 2 3 3 本体构建的步骤 本体是领域知识的一种表示方法,各个领域各不相同。在智能授导系统中需 要的本体主要是学习资源关联本体和学习者分类本体。简单的说就是把学习资源 按照科目进行分类,然后对不同属性再分类,形成一种层次结构。本体的构建如 图2 1 所示,一般分为以下五个步骤【2 7 1 : ( 1 ) 确定本体应用的目的和范围:这是建立本体的第一步,也就是所研究的 领域或任务,建立相应的领域本体或过程本体。领域越大,所建本体就越大,因 此需限制研究的范围。 ( 2 ) 本体分析:定义本体所有术语的意义及其之间的关系,该步骤需要领域 专家的参与,对该领域理解越了解,所建本体就越完善。 ( 3 ) 本体表示:一般用语义模型表示本体。 ( 4 ) 本体检验:建立本体的基本标准是清晰性、一致性、完整性、可扩展性 【2 引。清晰性是指本体中的术语应被无歧义地定义;一致性是指术语之间关系逻辑 上应一致;完整性是指本体中的概念及其关系也应是完整的,应包含该领域内所 有概念,但往往很难达到,需不断完善;可扩展性是指本体应该能够扩展,在该 领域不断发展时能加入新的概念。 ( 5 ) 本体的建立:对所建本体按以上标准进行检验,符合要求的可以文件形 式存放,否则转( 2 ) 。 2 3 4 采用o w l 语言描述本体 图2 i 本体构建的方法 虽然具体描述本体的语言很多,但是使用较普遍的语言是o n t o l i n g u a 2 9 1 、r d f ( s ) ( r e s o u r c ed e s c r i p t i o nf r a m e w o r ks c h e m a ) 3 0 1 、o i l ( o n t o l o g yi n t e r c h a n g e l a n g u a g e ) 1 31 i + d a m l ( d a r p aa g e n tm a r k u pl a n g u a g e ) 3 2 】和o w l ( w e bo n t o l o g y i l 浙江工业大学硕十研究生学位论文 基于本体和数据挖掘技术的智能授导系统研究 l a n g u a g e ) 1 3 3 1 等。 本系统采用o w l 语言作为这个本体的描述语言。之所以选择o w l 是因为与 它具有更丰富的语义,即有更多预定义的类、属性,为我们提供了更多描述对象 的方法f 3 4 】。o w l 采用描述逻辑作为本体描述的逻辑基础,具有较丰富的表达能力, 也能用于推理f 3 5 1 。 o w l 是w 3 c 最新推荐的本体描述语言的标准。是在w w w 上发布和共享本 体语义标记语言。作为r d f ( s ) 的扩展,是在d a m l + o i l 的基础上发展起来的, 添加了更多的用于描述属性和类型的词汇,例如类型之间的不相交性、基数、等 价性、属性的更丰富的类型以及枚举类,目的是提供更多的原语以支持更加丰富 的语义表达,并支持推理。o w l 有三个子语言:o w ll i t e 、o w ld l 和o w l f u l l 3 6 】。其中,o w ll i t e 用于提供给那些只需要一个分类层次和简单属性约束的 用户。o w ld l 支持那些需要在推理系统上进行最大程度表达的用户。这里的推 理系统能够保证计算完全性( 即所有的结论都能被计算出来) 和可决定性( 即所 有计算都在有限时问完成) 。o w lf u l l 支持那些需要在没有计算保证的语法自由的 r d f 上进行最大程度表达的用户,它允许一个本体在预定义的( i m f 、o w l ) 词 汇表上增加词汇,从而使任何推理原型均不能支持o w lf u l l 的所有特征。 2 4 本章小结 在本章中,我们对智能授导系统开发的相关理论和技术作了研究,主要内容 为: ( 1 ) 个性化的智能授导系统与传统的智能授导系统的区别; ( 2 ) 通过比较确定本系统采用决策树分类作为构建学习者分类模型的数据挖 掘算法; ( 3 ) 本体知识的概述,确定基于本体的智能授导系统个性化分析与指导方法 的基本设计任务与关键问题。 1 2 浙江工业大学硕士研究生学位论文 基于本体和数据挖掘技术的智能授导系统研究 第三章构建学习分类模型 为了能对学习者学习行为进行跟踪、采集、分析和评价,本章设计了一个网 络学习行为智能分析系统。通过该系统采集有关学习者在学习过程中的心理、行 为、方法和效果数据,经过筛选、量化、分类和评价,最终根据影响学习效果的 学习者内在因素和个性特征对学习者进行分类,简称为学习分类模型,通过学习 分类模型的建立我们可以对学习者未来的学习进行形成性评估。 3 1 网络学习行为分析系统 学习者个体在学习过程中学习能力、学习方式有差异,同时同一个学习者在 学习不同课程时,教学目标、教学内容、教学手段的不同,学习者产生的学习基 础、学习兴趣和学习行为也会有差异,所以研究的信息粒度应以学生课程为基本 单位。 在忽略影响学习效果的外部因素条件( 教学模式、学习资源) 下,影响学习 者学习效果的主要因素来自于学习者内部,如学习者学习能力、学习方式和学习 动机。学习能力、学习方式和学习动机是比较抽象的描述,我们必须采集相关信 息并将其量化,最终判断学习者的学习类型。 学习能力包括学习者在学习课程前原有学科知识水平和元认知水平。原有学 习学科知识水平,是指学习课程前应有和偏好的知识掌握程度,是与学习者将要 学习的内容有关的学科知识。学习者原有的相关领域知识在各种学习活动中都具 有非常重要的意义。对所学习的主题有丰富的先前知识的学习者能够更好地参与 和控制信息搜索和浏览过程,能够识别各种术语之间的联系,不会局限在有限的 信息空间之中,这有利于学习者选择使用有效的学习策略,进行更为有效的网络 学习。元认知指的是学习者对自己的认知过程的认知,包括元认知知识和元认知 控制两个方面。元认知知识是对有效完成任务所需的技能、策略及其来源的意识, 即知道做什么,是在完成任务之前的一种认识。元认知控制是指学习者为了成功 而高效地达到学习目标,有意识地在自己的学习过程中进行积极的计划、监视、 检查、评价、反馈、调整和控制的过程。 1 3 浙江_ t 业 人学硕1 :研究生学位论文基于本体和数据挖掘技术的智能授导系统研究 学习方式是指学习者在学习过程中的个性化特征,主要包括学习策略和学习 倾向。学习策略指学习方法,学习倾向指学习者的学习情绪、态度、坚持性以及 对学习环境、学习内容等方面的偏爱。学习方式的特征直接影响学习者的学习效 果,我们不关心学习者学习方式的具体表象,而是将其本质归结为以下几方面, 包括学习者个体性、合作性、交流性、实践性、探究性、创新性、理智性、适应 性和依赖性。其中个体性指学习者独立学习程度;合作性指学习者合作学习程度: 交流性指学习者学习过程中的交流程度;实践性指学习者运用知识解决问题的能 力;探究性指学习者探讨问题的能力;创新性指学习者的创造能力;理智性指学 习者遇到问题时的处理方式是冲动性地处理还是冷静思考后处理;适应性指学习 者适应新环境的能力;依赖性指对学习环境的依赖程度。 学习动机是指直接推动学习者进行学习活动的内部动力。在影响学生学习的 各种内在因素中,学习动机是十分突出的一个因素。学习动机能激发个体产生某 一学习行为,是引起某种学习行为的原动力。学习动机能使个体的学习行为指向 某一具体目标,并且调节个体学习行为的强度、时间和方向,最终实现目标。 构建学习者学习模型不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论