




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学位论文独创性声明 本人郑重声明: 1 、坚持以“求实、创新的科学精神从事研究工作。 2 、本论文是我个人在导师指导下进行的研究工作和取彳导的研究 成果。 3 、本论文中除引文外,所有实验、数据和有关材料均是真实的。 4 、本论文中除引文和致谢的内容外,不包含其他人或其它机构 已经发表或撰写过的研究成果。 5 、其他同志对本研究所做的贡献均已在论文中作了声明并表示 了黼9 作者妣逝塞 日期:皇们坠堇塑 学位论文使用授权声明 本人完全了解南京师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版;有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅;有权将学位论文的内容编入有关数据库进 行检索;有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定。 作者签名:型虿壑作者签名:型整 日期:五亟:垫 摘要 随着教育信息化的深入,教育资源建没取得了不少的成就,但与此同时,一些深层次, 结构性的问题逐步凸现出来,成为制约教育资源建没的瓶颈。教育资源建设中对技术要求高, 入文关怀环节关注少;资源种类数量越来越多,在琳琅满目的资源面前,用户很容易迷失方 向,无法很快地定位到自己所需求资源的位置。在此背景下,教育资源个性化信息服务的相 关研究具有重要的意义。 首先,本文详细概述了论文的研究背景和相关的理论基础:然后,对实现教育资源个 性化信息服务过程中的核心问题进行了详细的论述;此后对基于聚类个性化信息服务技术的 改进进行了探讨;在以上的基础上,本文提出了一种基于用户聚类教育资源个性化推荐系统 的实现方案,并对实现过程中的核心技术进行了详细的论述;最后依据上面提出的方案,以 南京师范大学图书馆的部分学生图书借阅记录为基础,我们实现了一种简单的实验系统。实 验结果证明了本文提出的系统设计方案和聚类对传统的个性化信息服务技术改进的可行性。 本文的主要贡献利用聚类对传统个性化信息服务技术进行了改进,并提出了一种可行的 基于用户聚类的教育资源个性化推荐系统的具体实现方案。 关键词:教育资源;个性化信息服务;聚类;推荐系统 a b s t r a c t a l o n gw i t ht h ed e v e l o p m e n to fe d u c a t i o ni n f o r m a t i o n ,c o n s t r u c t i o no fe d u c a t i o n r e s o u r c e sh a sa l r e a d yo b t a i n e dt h eh u g ea c h i e v e m e n t b u ta tt h es a m et i m e ,s o m e d e e pa n ds t r u c t u r ep r o b l e m sa r eg r a d u a l l yc o n v e xt oa p p e a r i nt h ep r o c e s so ft h e e d u c a t i o nr e s o u r c ec o n s t r u c t i o n ,h u m a n i s t i cc o n c e r ni si g n o r e dw h i l e h i g ht e c h n i q u e i so f t e nr e q u i r e d w h e nt h er e s o u r c e s c a t e g o r ya n dq u a n t i t yc h a n g em o r ea n dm o r e , p e o p l e l o s eb e a r i n gv e r ye a s i l ya n dc o u l d n tv e r ys o o nf i n dt h ep o s i t i o no f t h en e e d r e s o u r c e s u n d e rt h i sc i r c u m s t a n c e ,t h er e l a t e dr e s e a r c ha b o u tt h ee d u c a t i o nr e s o u r c e p e r s o n a li n f o r m a t i o ns e r v i c eh a st h ei m p o r t a n tm e a n i n g f i r s t l y , t h ep a p e rs u m m a r i e st h eb a c k g r o u n d a n dt h er e l a t e dt h e o r i e so fm y r e s e a r c h t h e n ,t h ec o r ea s p e c t si nt h er e a l i z a t i o no ft h ee d u c a t i o nr e s o u r c ep e r s o n a l i n f o r m a t i o ns e r v i c ea n di m p r o v e m e n t ,i sc a r r i e do nt h ed e t a i l e dt r e a t i s et o o nt h e a b o v ef o u n d a t i o n ,t h ep a p e rp r e s e n ta ne x p l a n a t i o no fh o wa e d u c a t i o nr e s o u r c e p e r s o n a l i z e dr e c o m m e n d e rs y s t e mi sr e a l i z e da n dt h ek e yt e c h n i q u e sa r ed i s c u s s e d a tl a s t ,as i m p l ee x p e r i m e n ts y s t e mb a s e do ns o m eu s e r s d a t a r e s e r v e di nt h e n a n j i n gn o r m a lu n i v e r s i t yl i b r a r yd a t a b a s e i sr e a l i z e d t h e e x p e r i m e n t r e s u l t j u s t i f i e st h a t t h ee d u c a t i o nr e s o u r c er e c o m m e n d e r s y s t e ma n dt h ei m p r o v e m e n tb y c l u s t e r i n gi sf e a s i b l e t h em a i nc o n t r i b u t i o no ft h i sp a p e r t r a d i t i o n a lp e r s o n a li n f o r m a t i o ns e r v i c e s t r u c t u r eo fae d u c a t i o nr e s o u r c ep e r s o n a l i st h a tw ep u tf o r w a r dt h ei m p r o v e m e n to f t e c h n i q u eb a s e do nc l u s t e r i n g a n dt h e r e c o m m e n d e rs y s t e m k e y w o r d s :e d u c a t i o n r e s o u r c e ,p e r s o n a li n f o r m a t i o ns e r v i c e ,c l u s t e r , r e c o m m e n d e rs y s t e m 2 1 1 论文研究背景 第一章绪论 教育信息化是实现教育现代化的重要手段,我国十分重视教育信息化的发展。教育资源 建设是教育信息化的核心,利用先进的计算机技术、通信技术、网络技术,尽力为学习者构 筑一个高效的获取资源和学习平台。随着近几年国家在教育信息化投入了大量的资金,在教 育资源建设方面取得了不少的成就,与此同时我们清醒地认识到,一些深层次,结构性的问 题逐步凸现出来,成为制约教育资源建设的瓶颈。在过去的教育资源建设中,我们过分注重 技术的应用,即对技术的先进性强调较多,对社会的普遍普适性考虑较少,而且缺少人文关 怀,极大地影响了教育资源效果的发挥。人文关怀就是以人为本,满足人的需求,尊重人的 价值,追求人的全面发展。建构主义教育理论认为学生是以学习者为中心,学生者是信息加 工的主体、意义的主动建构者,而不是外部刺激的被动接受者和被灌输的对象。所以教育资 源建设中的人文关怀研究有着极其重要的意义。 1 1 1 当前资源建设出现的问题 ( 1 ) 重技术和设备更新,对用户缺乏关怀 现代信息技术在教育资源建设得到广泛而成功的应用,给教育资源建设带来深刻的变 革。教育资源建设是一个系统工程,能否构建和谐的教育资源使用,与资源建设过程中的均 衡投资有非常大的关系。教育资源建设过程中的投入,涉及到硬件、软件、教学技术的培训、 管理模式和制度的建设、应用的推进,还包括运营服务等。很多人们对技术崇拜达到了狂热 的地步,有人甚至认为教育资源建设是“键盘上的资源”,只要用计算机和丰富的资源武装 起来,一切问题就会迎刃而解。于是出现了那种耐人寻味的现象:教育资源流通系统功能先进, 而资源却没有完全向读者开架借阅:工作人员操作电脑十分娴熟,而对读者却冷若冰霜;计算 机管理系统不断升级换代,而资源利用率却并未上升;为提高现代化技术设备的档次殚精竭 虑,而对如何满足读者最基本的资源需求却表现冷漠。这样的结果是造成了大量资金和人员 投入的设备和教育资源闲置和浪费。这种现象与教育资源建设的以用户为中心的人文理念背 道而驰,是值得人深思的。 ( 2 ) 信息技术的发展导致了“数字鸿沟”。 数字鸿沟( d i g i t a ld i v i d e ) ,又称信息鸿沟【l 】,它是指“信息富有者和信息贫困者之间的 鸿沟”, 是当代信息技术领域中存在的差距现象,是近年来人们关注的热点问题,是客观存 在的。它产生的原因是由于信息基础设施、教育水平和信息化普及水平的差异,在高教育程 度、高收入人群和低教育水平以及相对贫困人群之间出现了对信息、知识、发展机会之间的 3 差距。信息技术的发展没有消除人们在获取、利川信息方面的不平等反而加大了这种不平。 产生了所谓的“数字鸿沟”,它既存在于信息技术的开发领域,也存在于信息技术的戍川领 域,特别是由网络技术产生的差距。数字鸿沟的存在有多方面的原因,包括信息政策的不公 平、经济与技术的不平衡、个人信息素质方面等原因。在教育资源的建设和利用过程中,“数 字鸿沟”的现象也明显的存在。 1 1 2 教育资源建设中技术化与人文关怀的关系 随着计算机与网络技术的蓬勃发展和广泛应用,数字化教育资源建敬成为当代教育资 源建设的主流,目前国内外都在积极实施相关的教育数字化建没项目。我们看到,早期的教 育资源建设理念过多地强调技术色彩,虽然在这一背景下,国内外教育资源都取得了很大 进展,但教育资源建设的建设不是单纯的技术性的,它还关系到诸如法律、道德、信息传播 和利用方式、以及对社会的长远影响等非技术性问题,需要从人文的角度予以审视与解决。 比如,网络信息资源利用中存在的网络安全、隐私权保护、知识产权等问题以及网上信息泛 滥、虚假信息与个性化需求之间的矛盾等等问题都不是单靠技术就可以完全解决的,需要人 文来导航。随着资源的数字化,网络环境对教育资源的信息服务产生了深刻的影响,服务方 式、手段、范围都发生了变化,但以人为本的服务宗旨依然不会变。为满足读者的信息需求,开 展多种形式的网络化信息服务势在必行。包括建立网页进行网上文献借阅服务、网上参考咨 询台、常见问题解答、网上电子公告、电子论坛、意见箱:开展网上信息资源导航、电子文 献的传递服务;开展个性化信息服务如信息推送服务、信息专题门户服务。网络信息服务有 待于进一步地深化与发展,以便于跟上数字化时代的要求,迅速、便捷、准确地满足读者的 个性化信息需求。 因此,在数字时代,在利用信息技术加强教育资源建设的同时,仍要强调“以人为中心” 的指导思想,弘扬入文精神,提倡人文关怀。未来教育资源系统应是人文与技术的完美结合, 实现“我们提倡的科学精神应该是充满高度人文关怀的科学精神”忙1 。 1 2 个性化信息服务技术 1 2 1 个性化信息服务技术的兴起的背景 目前w e b 平台主要采取的是一种单一信息服务方式,w e b 站点向所有用户发布相同的信 息,w e b 信息服务提供的界面往往单一、呆板,对所有用户都是同一种面孔,主要还是一种被 动的信息提供方式,不能够主动感知用户需求实现对浏览者的主动信息服务。然而,1 1 - e b 埘户 的需求是干差万别的,然而服务模式的落后却使用户为信息所累。传统的“人找信息”的服 务模式已经越来越难以适应迅速增长的i n t e r n e t 信息资源,用户迫切需要一种能够根据用户 的特点自动组织和调整信息的服务模式。个性化w e b 信息服务能够通过收集和分析用户信息 4 来学习用户的兴趣和行为,从而实现信息主动推荐的目的口1 。事实上,针对用户个人特征并向 其提供准确恰当信息的个性化w e b 信息服务技术的研究是目前的一个热点课题。 个性化信息服务是i n t e m e t 信息增长的必然结果。1 9 9 5 年至1 9 9 7 年,美国人工智能协 会春季会议( a a a i ) 、国际人工智能联合大会( u c a d ,a c m 智能用户接口会议( a c m i u i ) 和 国际w w w 大会等重要会议发表了多篇个性化信息服务原型系统的论文,标志着个性化信 息服务研究的开始。1 9 9 7 年3 月,c o m m u n i c a t i o n so f t h e a c m ) ) 组织了个性化推荐系统的 专题报道,个性化信息服务己经受到相当的重视。2 0 0 0 年8 月, c o m m u n i c a t i o n so f t h e a c m 再次组织了个性化服务的专刊,个性化信息服务的研究己经进入快速发展阶段。此外,( i e e e i n t e l l i g e n ts y s t e m ) ) 、( ( i e e ec o m p u t e r ) ) 、( u s e rm o d e l i n ga n du s e r - a d a p t e d i n t e r a c t i o n ) ) 也发表 了有关个性化信息服务的重要成果。2 0 0 0 年,美国n s f 基金开始支持有关个性化信息服务 的研究。同年4 月,以美国为主的多国个性化研究机构和网络公司成立了个性化协会,旨在 推动个性化信息服务的发展,同时保护个性化信息服务中涉及的用户隐私。 1 2 2 个性化信息服务的特点 个性化信息服务具有以下特点: ( 1 ) 与用户的双向沟通更加便捷,服务内容具有针对性。 个性化信息服务系统不仅要提供友好界面,而且要方便用户交互,方便用户描述自己的 需求,方便用户反馈对服务结果的评价,以便改进服务内容与服务方式;要能够跟踪与了解 用户的习惯、爱好、兴趣和需求,为用户提供并集中最接近其个性需求的各种信息资源,排 除不相关信息的干扰,为用户提供“量身定制”的个性化信息服务。 ( 2 ) 服务内容,更加丰富,服务方式更加灵活多样。 个性化信息服务不仅要为用户提供更加准确的信息,而且提供的信息不受格式的约束, 并能够按照用户指定的方式进行服务。用户可以完全根据自己的方便和需要,灵活的设置链 接时间,链接方法。通过e m a i l 、对话框、音频、视频等方式获取网上特定信息资源,满 足自己的需求,同时个性化信息服务不受地点及时间的限制,只要用户可以连接到网络,就 可以享受到这种服务。 ( 3 ) 更为注重主动性与时效性。 信息服务者应该不需要用户的及时请求而主动地将适当的信息传送给用户,并能够保证 信息的时效性,实现及时、主动地适当的信息推送。 ( 4 ) 服务更具智能性。 提供个性化服务的服务器可以利用个人信息服务代理和主题搜索代理提高数据传送的 准确性和权威性,控制搜索的深度与广度,过滤掉不必要的信息。因此说这种个性化的信息 服务具有较高的智能性,这一点是传统服务无法比拟的。 5 1 2 3 个性服务信息服务与人文关怀 个性化信息服务是建立在现代人文和信息技术基础上的服务。必须借助智能化技术、集 成化技术、专家系统化技术、信息挖掘技术等先进的信息技术,根据用户多样化的信息需求, 为每一位用户量身定做出知识产品,在服务进程中重视专业化、个性化、可视化、层次化等 以人为本、贴近用户需求的服务理念,最大限度地维护和发扬用户的个性,极具人文色彩。可 以说,人文关怀是个性化信息服务的内涵,而技术支持是其外部表现形式。 1 3 教育资源服务 1 3 i 教育资源的概念 教育资源是指蕴涵了特定的教育信息,那些可以提供给学习者使用,能帮助和促进他们 学习的各类信息资源,特别是能以数字信号在互联网上进行传输的教学资源,数字化和教育 价值是它的核心特征。本文论文讨论的教育资源主要是数字化教育资源。 按照教育部现代远程教学资源建设委员会于2 0 0 0 年5 月所推出的现代远程教学资源 建设技,规范【4 1 的规定,把教育资源分为以下几类: ( 1 ) 媒体素材: 媒体素材是传播教学信息的基本材料单元,可分为五大类:文本类素材、( 图像) 类素材、 音频类素材、视频类素材、动画类素材。 ( 2 ) 题库: 题库( i t e mb a n k ) 是按照一定的教育测量理论,在计算机系统中实现的某个学科题 目的集合,是在数学模型基础上建立起来教育测量工具。 ( 3 ) 试卷素材: 用于进行多种类型测试的典型成套试题。 ( 4 ) 课件- 课件是对一个或几个知识点实砸相对完整教学的用于教育、教学的软件,根据运行平台 划分,可分为网络版和单机版,网络版的课件需要能往标准浏览器中运行,并且能通过网络 教学环境被大家共享单机运行的课件可通过网络下载后在本地计算机上运行。 ( 5 ) 案例: 案例是指由各种媒体元素组合表现的有现实指导意义和教学意义的代表性的事件或现 象。 ( 6 ) 文献资料: 文献资料是指有关教育方面的政策、法规、条例、规章制度,对重大事件的记录、重要 文章、书籍等。 ( 7 ) 常见问题解答: 6 常见问题解答是针对某一具体领域最常出现的问题给出全面的解答。 ( 8 ) 资源目录索引: 列出某一领域中相关的网络资源地址链接和非网络资源的索引。 ( 9 ) 网络课程: 网络课程是通过网络表现的某门学科的教学内容及实施的教学活动的总和,它包括两个 组成部分:按一定的教学目标、教学策略组织起来的教学内容和网络教学支撑环境 1 3 2 教育资源服务的分类 教育资源服务包含教育资源搜集、组织、管理、信息服务等。 ( 1 ) 教育资源搜集 教育资源搜集是资源加工、处理,是实现教育资源数字化的起点。一般教育资源库的资 源获取方式有独自开发,购买和搜集免费资源等几种三种方式。独立开发单位具有较高的办 学水平和师资队伍,一般是国家级教学基地;有较强的网络课程研究、开发与制作能力,有一 支稳定的软件队伍,并承担过教学软件制作任务:具有规模开发、制作网络课程所需的软、 硬件环境和条件。文献资源的价格却不断上涨,所以在购买地时候将面i 临经常性的经费压力, 必须思考如何有效地运用有限经费,如何分配、争取合理的计价模式以及避免重复投资。在 数字资源环境下,对一些资源将从资源的拥有权转变为资源的使用权。就期刊数据库来说, 图书馆每年需要重复投资以保障信息资源的可用性,也就是说必须每年持续向数据商付费才 能继续取得数字资源的使用权。 ( 2 ) 教育资源组织 教育资源组织即教育资源的序化,是按照一定的科学规则和方法,通过对资源的外在特 征和内容特征的描述和序化,实现无序向有序的转化。 序是事物的一种结构形式,是指事物或系统得各个结构要素之间的相互关系以及这种关 系在时间和空间中的表现。当事物结构要素具有某种约束性且在时间序列和空间序列上呈现 某种规律性时,这一事物就处于有序状态。 资源组织可以帮助帮助用户有效地获取和利用信息,实现资源的有效流通和组合。比较 常用的资源组织方法有分类法,主题法,元数据法等。 1 ) 分类法:所谓资源的分类法,指根据资源内容的学科属性和相关的其他特征,对各 种类型的信息资源予以系统地揭示、区分、并进行组织的一种方法。通过对资源的分类可以 帮助人们了解资源的本质属性,以便正确的判断信息资源所属的学科性质和专业领域及其范 围,能过对不同的资源从内容特征或形式特征进行比较,区别不同的资源类型。同时,我们 可以将区分开米的信息资源,按照一定的组织标准( 如分类标准) 将资源及其相关记录存储 于资源体系的逻辑系统中。 2 ) 主题法:所谓的主题法,一般是指就直接以表达主题内容的语词作检索标识、以资 序为主要检索途径、并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。主 题法实际上有两种含义:第一,是指资源的主题整序方法,用语词标识标引资源和组织检索 7 系统的方法。第二,是指主题标引语言,也就是说,主题法包含主题标引语言和主题标引; 主题词就是该语言的主体,而主题标引是指对资源进行主题分析,用主题语言表达分析出的 主题,赋予信息主题检索标识的过程。主题法在资源组织中的作用,主要用来处理资源、编 制各种检索工具及检索系统。 3 ) 元数据法。“元数据( m e t a d a t a ) ”就是“关于数据的数据“,是对数据进行组织和处 理的基础。他最早出现于美国国家航空与航天局( n a s a ) 的目录交换格式( d i r e c t o r y i n t e r c h a n gf o r m a t ,d i f ) 的手册中。元数据法就是对资源单元及其集合进行规范描述从而形 成元数据,并依其将分布式的资源整合成有机体系的基准、方法和工具。从某种角度上看, 大家熟悉的图书馆书目记录就是一种元数据。书目记录通常包含作者、出版商、主题和载体 描述之类的标识信息,这是印刷文献环境中的最明显的元数据应用。元数据能对资源对象的 内容和位置进行描述,从而为信息对象的存取和利用奠定了必要的基础。 ( 3 ) 教育资源管理 教育资源管理具体可分为教育资源的宏观管理和微观管理 1 ) 宏观管理 针对教育资源库管理系统之间的互操作,在宏观管理的时候,提出相应的解决方案, 该方案以制定规范的形式详细阐释和定了不同资源库管理系统之间进行互操作的体系结构 规范、接口规范、数据规范。通过制定一个这样的方案,为不同教育资源库管理系统进行互 操作构建了框架标准,为最大限度内实现数据共享提供了保证。解决教育资源的集中和分布 问题,也是宏观管理要考虑的问题。资源分布存储、目录集中管理的分布式资源网可以有效 地解决这种大范围内教育资源整合的问题,资源网的基本思想有两个:一是为用户提供一个 覆盖本地区所有教育资源站点最新资源目录,实现本地区不同教育资源站点的系统互访和资 源共享;二是资源数据分布存储:教育资源网是由多个资源站点的组成,资源网内每个提供 资源信息服务的站点都是资源网中的一个节点,存储实际的物理资源,资源节点之间基于一 定的信任授权关系进行资源互访,资源元数据信息与目录中心进行目录信息同步,从而最终 实现资源网内资源的分布式存取、分布式管理,并提供基于共享的资源服务体系。 2 ) 微观管理 教育资源的微观管理是涉及到资源的安全管理、教学管理等问题。资源的安全指的是资 源所涉及的硬件、软件及应用系统受到保护,以防范和抵御对信息资源不合法的使用与访问, 以及有意无意的泄漏和破坏。海量的资源既为教育带来强有力的服务功能,也为资源的管理 和建设带来挑战。数字化资源具有数据量大、形式多样、针对性强、教育性强等特点,如何 将分散无序的资源加以整合,使学习者更能方便高效的将其运用到自己的教学和学习过程中 去,使资源的建设者必须慎重面对的问题。 ( 4 ) 教育资源信息服务 传统教育资源信息服务包括在线查询、检索等,随着网络化技术的发展和用户需求的不 断提高,人们开始尝试开展某些特色服务项目如信息推送服务、定向专题服务和个性化定制 服务等。信息服务应对所开展的服务项目、服务方式、服务内容和服务要求进行宣传和介绍。 服务营销的目的是增强用户利用数字信息资源的满足程度和心理上的满意程度。教育资源服 8 务不仅要不断扩大服务范围,深化服务内容,使用户能方便、快捷地利用所需的信息,还需 重视每一用户的心理要求,有针对性地满足每一位用户的信息诉求,提高用户利用资源的满 意度。 1 3 3 教育资源个性化信息服务 教育资源个性化信息服务是根据用户( 这里指学习者) 的使用行为和特点,来向用户提供 满足其个性的教育资源信息需求的一种服务。由于学习者的学习起点、学习风格、学习愿望、 学习步调等方面存在个体差异,在进行资源库建设时要考虑资源库建设的多层次、多元化、 开放性和动态更新及时性,让不同的学习者能在资源库中取得各自所需要的资源。教学资源 个性化信息服务是基于网络的个性化信息服务的一个重要分支,它是个性化信息服务在教育 资源服务方面的一个具体应用。它们之间有许多共同点,比如信息的海量化以及信息源的动 态性,然而毕竟教育资源个性化服务是一个具体的应用,它与普通的基于网络的个性化信息 服务有如下不同点: ( 1 ) 教育资源个性化信息服务的用户具有稳定性,不像普通的基于网络的个性化信息服 务的用户那样有很强的不确定性: ( 2 ) 教育资源个性化信息服务有一定的连续性,由于知识具有连续性,一般情况下,学 习者在学习某一门课程时,他会关注该课程的先行课程和后续课程的相关知识: ( 3 ) 教育资源个性化信息服务操作的教学资源是结构化的,不像普通的基于网络的个性 化信息服务可利用的信息是无组织的,多种结构形式的。 1 4 论文的研究内容及组织结构 1 4 1 论文的研究内容 本文对基于聚类的教育资源个性化信息服务实现过程中的相关问题进行了详细的研究。 本文主要研究内容的如下: ( 1 ) 实现教育资源个性化信息服务的核心问题: ( 2 ) 基于用户聚类的传统个性化信息服务技术的改进; ( 3 ) 一种教育资源个性化推荐系统的具体实现方案。 按照研究的主要内容,论文核心内容分为三个部分: ( 1 ) 是围绕着实现个性化服务中的几个核心问题展开,详细介绍了各个核心问题的流行 的实现方法; ( 2 ) 关于聚类在个性化信息服务应用研究,从聚类技术的介绍和基于用户聚类的个性化 信息服务改进两个方面展开,最后通过实验证明了其可行性; 9 ( 3 ) 介绍一种教育个性化推荐系统的具体的实现设计方案,并实现了一种实验系统来证 明了方案的可行性。 1 4 2 论文的组织结构 论文的组织结构如图1 1 所示: 图1 1 论文的组织结构 第一章绪论以后的各章的具体内容如下: ( 1 ) 文章第二章实现教育资源个性化信息服务的核心问题。本章围绕着实现教育资源个性 化信息服务过程中的核心问题展开,并详细对每个核心问题的主要的实现方法进行了总结和 分析。 ( 2 ) 文章第三章基于聚类的个性化信息服务技术。首先对聚类的基本概念和主要聚类算法 进行了简单的介绍;然后对基于聚类的个性化推荐算法进行了详细的研究。 ( 3 ) 文章第四章一种基于用户聚类的协同过滤教育资源个性化推荐系统的设计。本章以第 二章和第三章为基础,提出了一种教育资源个性化推荐系统的具体实现方案,首先对该推荐 系统的体系结构进行了分析,然后详细了介绍了系统关键技术的实现过程。 ( 4 ) 文章第五章实验设计及结果分析。本章在第四章的基础上,实现了一种个性化图书推 荐系统。实验结果证明了聚类对传统推荐技术改进和本文提出的教育资源个性化推荐系统实 现方案的可行性。 ( 5 ) 总结和展望部分,得到研究结论,并对课题的进一步研究做展望。 1 0 第二章实现教育资源个性化信息服务的核心问题 随着计算机技术和网络技术的发展,教育资源库也愈来愈丰富,但海量教育资源和用户 的个性化需求之间的矛盾越来越明显,一个方面造成了教育资源的巨大浪费,另一方面为用 户在搜索和定位自己所需教育资源的造成了障碍。教育资源中增加个性化信息服务,能够通 过分析用户的背景、兴趣和习惯,帮助用户便捷地定位到自己感兴趣的教育资源,能够很好 地解决上面所讲述的问题,所以说对教育资源个性化信息服务的进行相关研究具有较强的实 用价值。 在教育资源个性化信息服务实现过程中涉及剑教育资源表示,用户模型,推荐机制三个 核心问题,下面我们对每个部分进行详细的介绍与分析。 2 1 教育资源表示 2 1 1 教育资源表示概述 教育资源表示是关于如何对教育资源有效描述的探讨。教育资源传统形式有网页,文档, 视频等,是非结构化或者半结构化的形式存在。为了更有效的对教育资源进行检索和共享, 所以教育资源库中要用统一的结构化的形式来描述它里面的所有资源。对它们的描述涉及资 源内容、资源适用对象、资源使用的教学和教学方法学要求、资源使用的技术与过程要求。 教育资源元数据标准是有效描述教育资源,实现资源发现、交流和共享的基础。利用元数据 对它们进行开放和计算机可识别的描述,有助于用户通过智能代理搜寻、选择、利用和集成 教育信息资源。 2 1 2 面向教育资源的元数据1 ( 1 ) 数字信息环境下的教育资源元数据 元数据是关于数据的数据,是数据信息组织和处理的基本工具,它们为各种形态的数字 化信息单元和资源集合提供规范、普遍的描述基准和方法,在数字化网络化信息服务中正发 挥着日益重要的作用。元数据作为一种有效的信息资源组织和管理工具,它不仅为信息对象 提供描述信息,还具有定位、描述、搜索、评估和选择等功能。 教育元数据标准建立的意义主要在于:首先。教育元数据标准为资源创造者提供统一、 规范的著录规则来描述其开发的教育资源,而资源使用者可以通过标准的元数据信息了解教 育资源相关属性:其次,教育元数据标准为教育资源的分类和管理提供依据,使资源使用者 能够快速、有效地检索到所需资源:再次,用户可以从元数据信息中获取教育资源的评价信 息,也可以把自己的评价加入到元数据中,从而为教育资源的获取和利用提供帮助、最后教 育元数据标准为教育资源在网络环境中的交流和共享以及不同系统之间的互操作提供支持。 本节以下部分将对几种主要的教育资源元数据进行简要介绍。 ( 2 ) i e e el o m 元数据 i e e el o m ( i e e el e a r n i n go b 2 j e c tm e t a d a t a ,学习对象元数据) 由i e e e 学习技术标准 委员会p 1 4 8 4 1 1 2 学习对象元数据工作组建立用以完整、充分地描述一个学习对象的特征。 所谓学习对象( l e a r n i n go b j e c t ) 是指任何数字化或非数字化的实体,包括多媒体内容、教育内 容、教育软件和工具、参考资料等,能在学习系统( 如计算机培i jj l 系统、交互学习环境、智能 计算机辅助教育系统、远程学习系统、基于网络的学习系统和协作学习环境等) 被使用、参 考和复用。学习对象相关属性指其类型、作者、所有者、发行类型、格式、廊用环境、教学 要求等。l o m 标准定义了学习对象元数据的语法与语义,目的在于使用最小属性集完成对学 习对象的管理、检索和评估,并且便于将来对其属性进行扩展。l o m 还对安全、隐私、商业 和评估等应用提供了描述符,但l o m 本身并不涉及如何实施这类应用。 i e e el o m 基本结构:l o m 将描述学习对象各方面特征的元素分9 个基本类别,每个 类别包括若干元素,整个元素体系如下。 a g e n e r a l ( 通用类) ,集合了与学习资源总体内容有关的元素,包括:标识符、题名、目录 款目、语言、内容说明、关键词、内容覆盖范围、结构、集成层次等。 b l i f e c y c l e ( 生命周期类) ,集合了与学习对象产生与应用生命周期相关的特征,包括:版 次、版本状态、贡献信息等。 c m e t a m e t a d a t a ( 宏元数据类) ,对学习对象元数据进行描述的元素集合,包括:元数据标 识符、元数据目录款目、元数据贡献信息、元数据格式、语言。 d t e c h n i c a l ( 技术类) ,包括学习对象的技术特征元素集合例如:格式;数字资源大小、资源 位置、技术系统要求、安装说明、技术平台的其它要求( 声卡、运行时间等) 、学习对象 正常播放的持续时间。 e e d u c a t i o n a l ( 教育类) ,包括描述学习对象的教育学和教学学特征的元素集合,例如:交 互度,语义密度、最终用户角色、学习环境、使用者年龄范围、难度、通常学习时间、使用 说明、语言。 f 黜曲t s ( 权利类) ,包括与学习对象使用有关的元素,如是否付费、是否有版权或其它限 制、使用条件说明。 g r e l a t i o n ( 关系类) ,描述与该学习对象关联的其他资源的元素集合,包括:关系种类、关 联资源、关联资源标识符;关联资源说明、关联资源目录款目。 h 1 a n n o t a t i o n ( 注解类) ,包括对学习对象教学的注解,例如注解人、注解日期、注解内容说明。 i c l a s s i f i c a t i o n ( 分类类) ,包括与对象分类有关的元素例如分类目的、分类法路径、分类 法来源、分类类目、分类说明、关键词。 l o m 对每个元素定义了其名称、解释、多值性、域、类型、附注和示例,许多元素可自 动生成或通过模板生成。 ( 3 ) g e m 元数据 g e m ( t h eg a t e w a yt oe d u c a t i o n a lm a 2 t e r i a l s ,教育资源网关) 是美国政府教育部支持的 1 2 项目,致力于组织和整合美国各类网站上的教育资源,以便人们方便地检索和获取。g e m 项 目包括两个部分:g e m 网关和g e m 元素集。前者是一个在线教育资源搜索引擎,整合了广 泛的公共和非公有信息提供者,以及各级教育组织和教育管理部门的信息资源,允许用户检索 包括课程计划、教育网页、书籍、课件、教育文件与标准等教育资源。后者是一套元数据标 准,对教育资源进行简单描述,所产生的元数据记录被组织到g e m 数据库中提供检索支持。 g e m 复用d u b l i nc o r e 的1 5 个元素作为核心元素集,并根据教育资源特点扩展了8 个新元 素,还扩展了部分d c 元素和扩展元素的限制属性( q u a l i f i e r s ) 。遵从d c 的方式g e m 元数据 集中每个元素均可选和可重复,均可通过限制属性来进一步修改。 ( 4 ) d e e d u c a t i o n 元数据 为更有效地利用d c 元数据来描述教育资源,d c m i 于1 9 9 9 年8 月建立了教育资源工 作组( d u b l i nc o r ee d u c a t i o nw o r k i n gg r o u p ,d c e d ) ,于2 0 0 0 年l o 月提出了有关建议。该建 议提出,直接将d c 元数据集复用到d c e d 命名域上( 实际上形成一个d c e d 元数据集) ,并在 d c e d 命名域内补充两个新元素,对d c r e l a t i o n 元素扩展一个限制属性,复用i e e el o m 的三个元素。d c e d 的扩展方式为利用d c 来描述不同资源、适应不同领域应用要求提供了 方便途径,例如d c a g e n t s 、d c g o v e r n 2 m e n t 、d c c i m t i o n 、d c - l i b r a r y 、d c c o l l e c t i o n s 、 d c a d m i n 等。 ( 5 ) a d l s c o r m 元数据 1 9 9 7 年美国国防部与白宫科学技术办公室合作,正式启动了a d l ( a d v a n c e d d i s t r i b u t e d l e a r n i n g ,高级分布式学习) 计划,目的是通过基于计算机和网络的公共技术框架、 对象技术和可移植平台技术,为用户提供个性化、高质量的教育资源,加速动态和经济的网络 学习软件的大规模开发。为此a d l 开发出s c o 蹦( 可共享内容对象参考模型,s h a r a b l e c o u r s e w a r eo b j e c tr e f e r e n c em o d e l ) 。s c o r m 认为,在教育资源( 例如课件) 组织过程中,许 多具体内容可能被独立地应用到多个不同的课件或多个教学过程中,而一个课件或教学过程 又需要利用多个不同的内容;如果能够对最小逻辑内容单元进行描述,并将这些内容单元的元 数据在开放系统进行登记,允许人们通过开放机制对它们进行搜寻、链接、组合、交换,就可 支持教育资源的有效利用和学习系统自动地智能地发现、组建、共享和扩展教育资源。 a d l s c o r m 直接复用i e e el o m 元数据集,但该元数据集中元素在应用于数字资源对象、 可共享内容对象和课程三个不同层次时,根据情况可能必备( m a n d a t o r y ) 、选用( o p t i o n a l ) 或 保 碧( r e s e r v e ) 。实际上,s c o r m 根据i e e el o m 元素适用情况分别组合成:c o u r s em e t a d a t a ( 课程元数据) ,指描述整个课程的元数据;c o n t e n tm e t a d a t a ( 内容元数据) ,描述各s c o 或由 s c o 组合成的内容段( b l o c k ) ;r a w m e d i am e t a d a t a ( 原始媒体元数据) ,描述最底层的媒体文 件。 2 2 用户模型 用户模型是实现教育资源个性化信息服务的基础和核心。个性化信息服务的主旨目标是 为用户提供满足其个性化需求的信息服务,所以首要的任务是把用户的个性信息需求表达明 1 3 确清晰,用户模型则是将这一需求进行形式化描述的最好方法。用户模型的质量直接关系到 个性化信息服务的质量。只有当用户的兴趣、偏好和访问模式等用户信息可以很好地被系统 “理解”的时候,才可能实现理想的个性化信息服务,所以根据用户信息构建用户模型,即 用户建模,也就成为了个性化信息服务的核心和关键技术。 本节下面部分将从用户模型的定义、用户模型的表示、用户模型信息的收集、用户模型 的更新等几个方面详细介绍教育资源个性化信息服务中的用户模型问题。 2 2 1 用户模型的定义 用户模型不仅仅是对用户兴趣的准确描述,作为以计算机平台为依托的个性化信息服务 系统,可计算性是它对用户模型的基本要求。也就是说,个性化信息服务系统中的用户模型不 是对用户个体的一般性描述,而是一种面向算法的,具有特定数据结构的形式化用户描述嵋1 。 2 2 2 用户模型的表示 用户模型的表示提供一种结构化的模型存储形式。用户模型的表示决定了用户模型反映 用户真实信息的能力和可计算能力,同时也在一定程度上限制了用户建模方法的选取。用户 模型的表示目前还没有一个统一的标准,常见的表示方法有以下几种方法: ( 1 ) 基于空问向量模型的表示 向量空间模型( v e c t o rs p a c em o d e l ) 是目前为止最流行的用户模型表示方法。基于向 量空间模型的表示方法是指用关键词向量空间中的向量来表示用户模型的方法。向量空间模 型是文档表示的常用方法 7 1 ,该方法将用户模型表示成一个n 维特征向量 ( t l ,w 1 ) , ( t 2 , w 2 ) ,( t n ,w n ) ) 。权重可取布尔值和实数值,分别表示了用户是否对某个概念感兴趣以 及感兴趣的程度。很多个性化化系统采用了这种向量空间模型表示方法,如l i r a 【8 】, a m a i t h a e a 9 1 、i g i m a t l 0 1 、l e t i z i a i n j 、p e r s o n a lw e bw a t c h e d l2 1 基于向量空间模型的表示方法 能够反映不同概念在用户模型中的重要程度,而且方便了使用标准向量运算来进行后续阶段 的项目匹配任务。 ( 2 ) 关键词列表表示法 用户模型的关键词列表表示法是指以用户感兴趣的信息的关键词来表示用户模型的方 法。如用户对机械类知识感兴趣,则用户模型可以表示为( 力学,机械,自动化,控制l 等。 关键词可以由用户指定,也可以通过学习算法得到。通过学习算法得到表示用户模型的关键 词在本质上与文本分类中的特征选择问题相似,都是通过训练样本得到一个较小的特征集 合。不同的是,前者的目的是要找出能够表现样本的关键词,而后者的目的是为了减少分类 器的计算量,提高分类器的精度。典型的采用关键词列表表示用户模型的个性化服务系统是 w 曲w a t c h e d l 3 1 。w e b w a t c h e r 要求用户输入自己感兴趣的关键词,而后在用户浏览的过程中 向用户推荐页面。 ( 3 ) 主题表示法 1 4 用户模型的主题表示法是指以用户感兴趣的信息的主题来表示用户模型的方法。如用 户对历史学和文学感兴趣,则用户模型表示为 历史,文学 。这种表示方法往往与具体的应 用领域相结合。如y a h o o ! 的个性化入口m y y a h o o 的用户模型就是以用户选择的网站栏目来 表示。如果用户定制了体育和科技,m y y a h o o 就将这一定制记录下来,作为用户模型。下 次用户登录时,m y y a h o 就会显示根据保存的用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吉林省2025年吉林省省直事业单位招聘工作人员4号(64人)笔试历年参考题库附带答案详解
- 北京市2025商务部外贸发展事务局招聘23人笔试历年参考题库附带答案详解
- 2025浙江温州市洞头区机关事业单位(国企)第一期招聘编外用工12人笔试参考题库附带答案详解
- 2025江苏海晟控股集团有限公司下属子公司招聘第一批任务型合同制员工27人笔试参考题库附带答案详解
- 2025广西旅游发展集团有限公司招聘343人笔试参考题库附带答案详解
- 2025年甘肃省民航机场集团劳务派遣工招聘58人笔试参考题库附带答案详解
- 2025年河北张家口怀来经开创新实业有限公司招聘工作人员2名笔试参考题库附带答案详解
- 2025年2月云南思茅产业园区企业用工193人笔试参考题库附带答案详解
- 2025安徽黄山市黄山区国鼎资产运营管理有限公司工作人员招聘1人笔试参考题库附带答案详解
- 2025四川成都交通投资集团有限公司校园招聘10人(第二批)笔试参考题库附带答案详解
- 博饼规则及奖项设置-含预算
- 丝杠安全操作保养规定
- 体育测量与评价PPT课件-第九章 运动员选材的测量与评价
- 数据中心基础设施标识标志
- 工程质量精细化管理思路、关键点及控制方法课件
- 《情满今生》读书笔记模板
- 2021年一级注册消防工程师继续教育试题答案
- 甲醇理化性质及危险特性表MSDS
- GB/T 7216-2009灰铸铁金相检验
- GB/T 5796.3-1986梯形螺纹基本尺寸
- 华北理工大学2016年《互换性及技术测量》期末考试复习题
评论
0/150
提交评论