




已阅读5页,还剩63页未读, 继续免费阅读
(教育技术学专业论文)智慧型教育资源网站内检索系统的研究与设计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 在飞速发展的信息时代,信息日益成为社会各领域中最活跃、最具有决定意 义的因素。从浩瀚的信息海洋中获取必要的信息,不让我们的学生“生活在信息 的海洋中,却忍受着知识的饥渴”1 ,检索在网络时代扮演着非常重要的角色。 搜索引擎成为人们不可缺少的网络查找工具。 但是,搜索引擎不能深度遍历每个网站,而且更新比较慢,导致某些教育资 源不能被学习者检索到,造成了学习上的影响。所以,有必要建立专门的教育资 源网站,教育资源网站的建设是推进教育信息化的一种有效途径,同时,也可以 加快信息化教育发展的步伐。目前,教育资源网站种类繁多,有中小学教育资源 网、面向高等教育的资源网,有学科教育资源网、专题教育资源删。本论文主要 针对中小学教育资源网站站内检索系统文本资源展开研究。 同时,教育资源网站内容丰富,按照不同属性放在不同的目录当中,链接层 次很深。为了方便学习者高效的找到自己所需知识,很多网站都建立了站内的检 索系统,帮助学习者快速定位到自己查找的内容。但是目前的站内检索系统尚存 在一些不足,比如,查全率不高,由于同义词、近义词的问题,导致有些重要内 容不被检索到,对学习者的学习造成影响;机械化检索,不能智能化的给学习者 提供一个自动推荐功能,帮助学习者学习,等等。这些不利因素影响了检索的效 果和效率,对学习者的学习造成一定不利影响。 如何能够给学习者提供一个人性化智能化的检索效果,是非常具有现实意义 的研究课题。 本论文针对中小学教育资源网站,以研究智慧型检索系统为目标,以人本主 义学习理论为指导思想,运用数据库、网络编程、全文检索、数据挖掘等技术, 研究和设计了一个智慧型站内检索系统。该系统可以帮助学习者自动推荐检索同 义词、近义词、相关词汇的相关内容,为学习者的检索提供一个智慧型的自动推 荐检索。浚系统可以帮助学习者高效快速全面的查找到自己所需的内容。具有人 性化,智慧型的特点。 经过测试和运行,系统实现了人性化智能化的检索效果。 关键词:教育资源网智慧型全文检索后控词表关联规则站内检索 张屹祝智鹿,信息时代全球化教育的知识结构,h t t p : , , w , we d uc n 2 0 0 1i1 3 0 3 0 1 2 4 6 4s h t m l a b s t r a c t 。i 。h ee s t a b l i s h m e n to fe d u c a t i o n a lr e s o u r c ew e b s i t el sa ne f t i c i e n tm e a n st ob o o s t t h ei n f o r m a t i o n i z a t i o no fe d u c a t i o n ,a sw e l la st h ea c c e l e r a t i o no fi n f o r m a t i o n e d u c a t i o nd e v e l o p m e n t t h e r ea r ev a r i o u so fe d u c a t i o n a lr e s o u r c ew e b s i t e s s u c ha s p r i m a r ys c h o o la n dm i d d l es c h o o le d u c a t i o n a lr e s o u r c ew e b s i t e ,h i g h e re d u c a t i o n a l r e s o u r c ew e b s i t e ,s u b j e c te d u c a t i o n a lr e s o u r c ew e b s i t ea n ds p e c i a it o p i ce d u c a t i o n a l r e s o u r c ew e b s i t ea n ds oo n t h i sd i s s e r t a t i o n m a i n l y f o c u s e so nt h e s t u d y o f i n f o r m a t i o nr e t r i e v a l s y s t e m o f p r i m a r y s c h o o la n dm i d d l es c h o o le d u c a t i o n a l r e s o u r c ew e b s i t e t h ec o n t e n to fe d u c a t i o n a lr e s o u r c ew e b s i t ev a r i e sl a r g e l y , a n dt h e ya r el o c a t e di n d i f f e r e n t c a t e g o r i e sa c c o r d i n gt o d i f f e r e n t a t t r i b u t e s ,s 0 t h e l i n k i n gp h a s e i s v e r y p r o f o u n d i no r d e rt oh e l pt h e l e a r n e rf i n do u tt h e i rn e c e s s a r yk n o w l e d g ec o n v e n i e n t l y , m a n y w e b s i t ee s t a b l i s h e dr e t r i e v a ls y s t e mw i t h i ni t s e l fh o w e v e r , t h ec u r r e n tr e t r i e v a l s y s t e mw i t h i n t h ew e b s i t eh a ss o m e s h o r t c o m i n g s ,f o re x a m p l e ,t h es p h e r eo f r e t r i e v a l i ss m a l l ,t h es y n o n y m sr e s u l ti nt h em i s s i n go fs o m ei m p o r t a n tc o n t e n t ,w h i c ha l s o b r i n gs o m et r o u b l et ot h el e a r n e r s ;t h em e c h a n i z a t i o no fr e t r i e v a lc a n n o tp r o v i d ea n a u t o m a t i cr e c o m m e n d a t i o nt ot h e1 e a r n e r s a 1 lt h e s ew e a k n e s s e sa f f o c tt h ee f f e c ta n d e f f i c i e n c yo fr e t f i e v a l l a n dg i v eb a d e f f e c to nt h el e a r n e r s h o wt o p r o v i d e ah u m a n i s t i ca n d i n t e l l i g e n t i z e d r e t r i e v a l s y s t e m i sa v e r y m e a n i n g f u lr e s e a r c hs u b j o c t t h i sd i s s e r t a t i o na i m sa tp r i m a r ya n dm i d d l es c h o o le d u c a t i o n a lr e s o u r c ew e b s i t e , t a k e st h es t u d yo fi n t e l l i g e n tr e t r i e v a ls y s t e ma sa no b j e c t ,c o n s i d e rt h eh u m a n b a s e d l e a r n i n gt h e o r y a sag u i d e l i n e ,u s e st h et e c h n o l o g i e ss u c ha sd a t a b a s e ,n e t w o r k p r o g r a m m e ,f u l lt e x tr e t r i e v a l ,d a t am i n ea n d s oo nt os t u d ya n d d e s i g na ni n t e l l i g e n t w e b i n s i d er e t r i e v a ls y s t e m t h i ss y s t e mh a st w om a i ni n t e l l i g e n tc h a r a c t e r i s t i c s ,t h a t i s ,t oh e l pl e a r n e r st a c k l et h ep r o b l e m o fs y n o n y m sr e t r i e v a la n dp r o v i d ea na u t o m a t i c r e c o m m e n d a t i o nr e t r i e v a lt ol e a r n e r s ;w i t ht h ea s s i s t a n c eo fc o m p u t e r , t oa d da p o s t c o n t r o l - w o r d l i s ta u t o m a t i c a l l y s ot h eh u m a n i t y a n di n t e l l i g e n c ea r et w ot r a i t s h e r e a f t e rt h et e s t i n ga n dt r y o u t ,t h ei n t e l l i g e n c ea n de f f e c to ft h es y s t e mw i nh i 曲 p r a i s eu n a n i m o u s l y k e y w o r d s : e d u c a t i o n a lr e s o u r c ew e b s i t e , i n t e l l i g e n c e , f u l lt e x tr e t r i e v a l, p o s t c o a t r 0 1 w o r d l i s c ,r e t r i e v a lw i f b i nw e b s i t c 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及 取得的研究成果。据我所知,除文中已经注明引用的内容外,本论文 不包含其他个人巴经发表或撰写过的研究成果。对本文的研究做出重 要贡献的个人和集体,均已在文中作了明确说明并表示谢意。 作者签名:盛毽硷 日期:丝:! :三; 学位论文使用授权声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版。有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅。有权将学位论文的内容编入有关数据库进 行检索。有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定。 学位论文作者签名:盘毽金 导师签名: 日期:渺s 哆 e f 期: 蛊擅坠硕士学位论文答辩委员会成员名单 姓名职称单位备注 许志祥 教授 上海大学主席 马和民教授华东师范大学 胡鸿毅教授中医药大学 章伟民副教授华东师范大学 叶长青副教授华东师范大学 引言 一、研究背景 引言 信息检索起源于图书馆的参考咨询和文摘索引工作,从最开始的手工检索、 计算机检索到目前网络化、智能化检索等多个发展阶段。互联网的发展明显地促 进了信息检索技术的发展和应用,一大批搜索引擎产品诞生,为人们查找信息带 来了方便。更为学习者查找学习资源发挥了巨大的功能。但是,搜索引擎本身更 新比较慢,不能深入遍历每个网站,造成学习者在网上查找资料的效率不高。在 教育领域,有必要建立专门服务于教育的网站。 同时,随着i n t e r n e t 技术向宽带、高速、多媒体方向的发展,多媒体计算机 在教育教学过程中的应用越来越普遍,硬件设施的发展带动了教育资源网站的建 设,教育资源网站围绕各类学科组织起来的知识资源,直接指向学习过程、学习 内容,有效地减少了学习者因盲目网络冲浪而可能造成的时间浪费。 但是,教育资源网站内容丰富,仅仅依靠级一级目录的进行查找,增加了 查找的时间,不能更好的促进学习,所以有必要在教育资源网站建立站内检索的 功能。教育资源网站的最终目的是为教师教学和学生学习提供服务,那么在评价 一个资源网站的优劣时,考察其提供给终端用户的检索功能就占有很大的比重。 而评价教育资源网站的检索功能,最简洁有效的方式就是对检索结果的评价。目 前,某些教育资源网站建立了,但是站内检索功能单一,查全率不高,没有解决 对于同义词、近义词的查找等问题,不具有人性化智能化的特点。 在检索技术朝着智能化网路化发展、以人为本思想倡导的同时,教育资源网 站站内检索系统有必要对学习者的学习提供智能化的导航检索功能,建立一种智 慧型的教育资源网站内检索系统。 二、研究目标 本论文运用数据库知识、网络编程技术、数据挖掘技术、全文检索技术研究 和设计一个智慧型教育资源网站内检索系统。 本文的研究重点放在中小学教育资源网站及其当中文本资源的检索上。 系统的最终目标是建立一个基于w w w 的教育资源检索系统,面向所有因特网 用户,给教师和学习者提供一个友好、统的奄询界面,使分布在不同地区的用 户能够通过删进行教育资源的检索查询。在检索过程中,教师和学习者可以使 用不同的检索方式( 如标题、日期、作者、全文等方式) 进行检索,实现人性化 智能化的查询检索。主要目标是:实现教育资源的全文检索;( d 并解决解决 同义词近义词的查询问题,提高检索效率;提供智慧型的推荐检索提示,也 就是当学习者检索某一词时,提供给学习者与该词相关的查询推荐。 要实现系统的上述研究目标,主要研究一下几方面的内容: 采用全文检索技术,研究重点一是按字索引和按词索引的异同,建立有效的 索引技术,提高查全率:二是研究有效地检索策略,提高检索的效率; 建立后控词表,解决同义词、近义词查找问题,为学习者的查询提供智慧型 的自动推荐检索; 研究关联规则,力图从学习者大量的检索词中挖掘出某种规律,自动添加到 后控词表; 研究全文检索的算法实现 三、论文框架 本论文的研究过程是发现问题( 第一章) 、分析问题( 第二章) 、解决问题( 第 三、四章) 的过程。并对这个过程作了最后的总结。 本论文共五章: 第一章,教育资源网沾内检索综述。本章阐述了教育资源网站内检索的必要 性,以及教育资源网站内检索存在的问题,提出智慧型教育资源网站内检索的解 决方案。 第二章,智慧型教育资源网站内检索系统的可行性研究。本章从设计可行性 和实现可行性对系统进行了阐述,提出系统要采用的技术,并对系统实现的功能 与特点做了介绍。 第三章,智慧型教育资源网站内检索系统的架构。本章主要对系统进行了设 计,介绍了系统的各个功能模块,并对实现系统的关键技术做了详细的阐述。 第四章,智慧型教育资源网站内检索系统的实现。本章首先介绍了系统实现 的环境与工具,并对系统的实现与运行作了介绍。 第五章,总结和展望。总结了论文的研究成果和不足,总结以后研究的努力 方向,对检索技术的发展做了展望。 由于作者水平有限,文中的疏漏与错误之处在所难免,恳请各位专家和老师 批评指正! 第一章教育资源网站内检索系统研究综述 第一章教育资源网站内检索研究综述 信息检索是指利用一定的检索算法,借助于特定的检索工具,并针对用户的 检索需求,从结构化或非结构化的数据中获取有用信息的过程。信息检索起源于 图书馆的参考咨询和文摘索引工作,从1 9 世纪下半叶首先开始发展,至2 0 世纪 4 0 年代,索引和检索成为图书馆独立的工具和用户服务项目。随着1 9 4 6 年世 界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索 理论紧密结合起来。 同时,随着网络技术和教育技术的发展,各高校、中小学纷纷建立校园网, 各高校网络学院纷纷建立,中小学教育资源建设是校园网建设的重点,教学资源 内容丰富,包括不同年级、不同学科、不同形式的资源,如何更快地高效地找出 符合自己的查找的内容,单凭导航浏览的方法来找花费的时间很多,而且容易迷 航,如何快速查找到目标信息,很容易让学习者想到的就是检索。 第一节站内检索必要性研究 2 0 世纪9 0 年代以来,信息技术突飞猛进,特别是i n t e r n e t 的迅猛发展,改 变了信息收集、加工和服务的方式,成为目前最大、最流行的国际计算机互联网 络,信息的日益丰富使得传统意义的信息管理无法满足及时、准确、高效的管理 信息和用户网上查询的要求。信息检索系统以其较高的查全率和查准率,在网络 上得到了广泛的应用。 一、基于w w w 检索系统的发展 1 、需求:信息海洋需要检索 信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发 展阶段。互联网的发展明显地促进了信息检索技术的发展和应用,一大批搜索引 擎产品诞生,为人们查找信息带来了方便。更为学习者查找学习资源发挥了巨大 的功能。 随着计算机技术和网络技术的飞速发展,特别是w e b 技术的刺激和i n t e r n e t 的商业化,i n t e r n e t 成为信息传递、交流的最有力的工具之一。网络的迅猛发 展使得信息的采集、传播和利用在规模上和速度上都达到了空前的水平,网络已 成为一个巨大的信息共享资源库,大量有价值的信息资源蕴藏在这个宝库中。网 络所能提供给人们的信息量越来越大,网上的信息几乎是呈指数级增长。 然而与之俱来的问题是:大量的信息有时使人无所适从,从浩如烟海的信 第一章教育资源网站内检索系统研究综述 息海洋中迅速而准确地获取自己最需要的信息变得非常困难。网海寻珍,单凭简 单的浏览工具很容易迷失在信息的海洋中。这时用户自然就有一种快速的找到目 标信息的需求,使信息资源得到有效的利用,以w e b 上的信息为主要处理对象的 w e b 搜索引擎( w e bs e a r c he n g i n e ) 在这样的需求中脱颖而出,访问w e b 搜索 引擎站点已成为用户查找i n t e r n e t 网上信息资源最常用、最便捷的途径之一。 现在人们很容易想到用搜索引擎快速地找到目标信息,人们开始习惯互联网的搜 索时代。 2 、从目录检索到搜索引擎 自从有了计算机以后,人类开始用计算机保存信息,有保存,就有查找, 于是检索技术诞生了。随着计算机和网络技术的发展,信息检索技术发生了巨大 的变化。 首先是检索信息存贮介质的变化:由传统的纸介质,发展为磁介质等,存贮介 质的变化致使检索手段和检索途径发生了巨大的变革,由过去手工检索,发展为 计算机检索,检索途径也变得更加丰富。第二是检索空间的变化:在计算机和网络 发展初期,信息检索大多只能在单机或局域网内进行,而计算机和网络发展到今 天,人们已经可在与i n t e r n e t 相连的任何空间和时间内进行检索活动。 商业化搜索引擎经历了几个标志性的时代:因特网刚刚产生时,信息量比较 小,目录检索产生并占据了主要地位;随着因特网迅速发展,信息量呈指数级增 长,单一目录系统远远不能满足需求,真f 意义上的搜索引擎的诞生和目录检索 系统相辅相成更好地为用户服务,搜索引擎向纵深发展。 i n t e r n e t 信息检索刚开始时,以通过人工方式或半自动方式搜集信息,依 靠编辑人员的知识进行甄别,并在此基础上进行分类的目录式搜索引擎为主,用 户可以在这个分类结构中进行浏览,这就是目录检索系统,但它并不是严格意义 上的搜索引擎。目录信息检索系统由于加入了人工处理,所以信息准确,导航质 量高,但是由于人工成本高,维护工作量大,导致信息量少,信息更新不及时。 随着因特网的商业化,因特网发展日新月异,信息急剧膨胀,已有的目录检 索系统数据量有限、更新不及时、相对成本较高等弊端逐渐显露出来。一个全自 动、大数据量的网络导航系统迫在眉睫,即严格意义上的搜索引擎。 因特网搜索引擎是针对互联网所有网页进行全文检索,它在因特网上发现各 种信息并对其进行整理和建立索引,然后在用户录入关键字后进行检索,检索结 果中一并附以摘要。 搜索引擎从1 9 9 4 年以l y c o s 、a l t a v i s t a 为代表的第一代搜索引擎到以 g o o g l e 、百度为代表的第四代搜索引擎,用户对搜索引擎结果的精确度以及服务 本地化要求也越来越高。 d 第一章教育资源网站内检索系统研究综述 二、站内检索与搜索引擎的界定 互联网的发展明显地促进了信息检索技术的发展和应用,一大批搜索引擎产 品诞生,为网民提供了很好的快速信息获取和网络信息导航工具,但是将信息的 站内检索等同于使用搜索引擎就陷入了误区,互联网信息搜索和网站站内的信息 检索是不同的。主要表现在以下几个方面: 1 、数据量不同 传统信息检索系统一般索引库规模多在g b 级,但互联网网页搜索需要处理 几千万上亿的网页,搜索引擎的基本策略都是采用检索服务器群集,搜索引擎并 不会深度遍历一个网站,而将网站所有的内容都索引进去,比如g o o g l e 就喜欢 静态网页,而且是最新更新的,而不喜欢动态网页,g o o g l e 甚至会定期将缺少 入口的网站内容逐渐抛弃,对大多数动态网站或个人网站应用是不合适和不必要 的,并不适用于网站站内的查询。 2 、内容相关性不同 信息太多,查准和排序就特别重要,g o o g l e 等搜索引擎发展了网页链接分 析技术,根据互联网上网页被连接次数作为重要性评判的依据。但网站内部的网 页链接由网站内容采编发布系统决定,其链接次数存在偶然因素,不能作为判别 重要性的依据。一般网站中应用的检索要求基于内容的相关性排序,就是说,和 检索要求最相关的信息排在检索结果的前面,链接分析技术此种排序基本不起作 用。 搜索引擎需要通过页面内容提取技术将导航条,页头页尾等内容过滤掉,反 而不如直接从后台数据库提取数据来得直接,这种摘要和排序机制是很难实现 的。 3 、实时性,更新速度不同 搜索引擎的索引生成和检索服务是分开的,周期性更新和同步数据,大的搜 索引擎的更新周期需要以周乃至月度量;而站内资源的信息检索需要实时反映内 外信息变化,搜索引擎系统机制并不能适应一般网站中动态性数据增长和修改的 要求。 搜索引擎针对站点的更新频率也是有一定周期的,很多内容需要一定时问后 才能进入g o o g l e 的索引:目前g o o g l ed a n c e 的周期是2 l 天左右: 4 、安全性不同 互联网搜索引擎都基于文件系统,但网站站内检索应用中内容一般均会安全 和集中地存放在数据库中以保证数据安全和管理的要求。 5 、个性化和智能化 由于搜索引擎数据和客户规模的限制,相关反馈、知识检索、知识挖掘等计 第一章教育资源网站内检索系统研究综述 算密集的智能技术很难应用,有更多的输出需求,按时间排序,按价格,按点击 量,按类目过滤等,而网站站内的信息检索应用能在智能化和个性走得更远。 三、站内检索的必要性 前面我们已经知道,自从有了计算机以后,人类开始用计算机保存信息,有 保存,就有查找,于是检索技术诞生了。人们很容易想到用搜索引擎快速地找到 目标信息,人们开始习惯互联网的搜索时代。与此同时,站内检索的需求也逐渐 显露出来。 为什么有了搜索引擎还需要站内检索? 用搜索引擎不是直接可以查到吗? 这其中有两个问题:搜索某个信息,会搜索到成千上万个网页,排在后面的 网页,搜索者可能永远也不会去看。搜索引擎对于网站内隐藏很深的网页很难 索引到,因为它不会深度遍历一个网站,所以使用站内检索是必然的,最主要的 原因在于以卜+ 几点: 1 、快速找到所需信息 经常会发生这样的事情:明明记得某网站上有一篇自己喜欢的文章,就是想 不起存放在什么地方了。或者是知道某个网站上说了关于最近上海房产的信息, 但不知道具体的链接在哪里。另外,要是隐藏在目录很深的h t m l 文档可能自从 网站建立到整个网站关闭也没有一个人看过,这些都不是网站设计者所想要的。 站内检索毫无疑问可以解决上述问题。 2 、了解访问者的意图 通过站内检索技术,可以了解用户的需要,对网站的进一步发展决策很重要。 站内检索的日志功能可以记录每个访问者的检索词和检索结果,这是访问者意图 的最直接的表现。通过分析这些信息,可以调整网站结构,把访问者最想要的放 在明显的位置,避免访问者因寻找带来的麻烦,提高网站信息的利用率。 3 、符合用户的习惯 根据调查表明,6 8 3 的上网者经常使用搜索引擎。大部分人已经习惯通过 检索来找到他们想要的东西,而不是按照某个栏目一级一级往下找。在网站内如 果没有检索,大部分用户会有些不习惯。所以建立网站站内检索符合大部分用户 的习惯。 4 、提升网站信息价值 信息量总在不断增长,而访问者的耐心却逐渐下降。据统计,每需要多点击 一次鼠标,就有三分之一的用户选择放弃2 。这意味如果有1 0 0 个访问者访问某 个网站,如果需要点击三次鼠标才能找到所需要的东西,那么就只剩下不到4 个人了。根据第十一次中国互联网信息调查表明,5 3 1 的人上网是为了获取信 2 使用站内检索的五大理由,h t t p :w w w f u l l s e a r c h e r e o m n 2 0 0 4 9 1 0 1 6 5 5 2 1 7 3 5 a s p 第一章教育资源网站内检索系统研究综述 息,大部分网站的目的是让外界了解自己,了解的人越多,效果就越好。把访问 者最想要的返回给用户,就可让更多的用户了解自己,这样站内检索成为必然选 择。 同时,按照一个主题把所有相关文档提供给访问者,可以让访问者更全面的 了解他所想要的东西,这增加了网站信息问的组织性和逻辑性,方便了访问者的 使用。 5 、网站更加专业化 一个网站建立站内检索体现了一个网站的专业性,大部分国外公司的网站, 都在首页最明显的区域放置了一个搜索框3 。这向我们传达的信息就是:专业的 网站都有站内检索。从对用户角度来看,一个比较专业的网站应提供站内检索功 能。 第二节教育资源网站内检索的必要性研究 一、信息检索在教育领域的重要作用 信息检索在教育领域同样发挥着非常重要的作用,主要体现在以下几个方 面: 1 、信息检索是知识更新的主要途径,是促进教育的重要手段 目前科学技术高速发展,约经过3 5 年,就有全新的知识出现,如何赶上科 技发展掌握新知识的查找方法,是信息检索的重要目的。通过检索,可以找到科 研课题在不同科技发展时期所产生的新见解、新概念、新发现和新发明。尤其是 随着网络教育的发展,在网上进行学习,成为人们现代学习的一种方式,通过网 络可以快速查找自己所需要的知识,也是自己获取知识的一种能力,因此,信息 检索是促进知识更新的主要途径,是提高自学能力、开拓科研思路、提供科研课 题主攻方向的重要手段。 2 、促进科研人员的研究 每一个从事科技研究的人员,每项科研的丌始,都应对他所属的专题范围进 行全面的检索。了解国内外对这项内容研究的最新动态,从而周密对自己的课题 进行论证、选题、立题,避免重复他人的劳动,起着之难得作用。对于研究的不 同的论点,研究过程中遇到的困难,都需要查阅前人的科研文献,找出研究的方 法和思路。科研结束时,也要进行检索,判定成果的先进性、科学性和实用性。 因此,检索对于从事教育领域的科研人员非常重要,它贯穿于科研工作的始终, 是科研工作的重要组成部分。 3 使用站内检索的五大理由,h t t p :w w w f u l l s e a r c h e r c o m n 2 0 0 4 9 1 0 1 6 5 5 2 1 7 3 5 a s p 第一章教育资源网站内检索系统研究综述 2 、提高学习的效率 利用完善的检索工具和检索系统,尤其是计算机和网络的使用,将大大减少 学习者查阅文献的时间和精力。学习者只要想了解关于某个方面的知识,都可以 通过网络检索,以最快的速度获得所需要的知识,节省了时间。为学习者下步 的学习提供良好的基础,提高学习的效率。 二、教育资源网站的发展状况 ( 本论文主要针对中小学教育资源网站、及其中文本资源进行研究) 随着i n t e r n e t 技术向宽带、高速、多媒体方向的发展,多媒体计算机在教育 教学过程中的应用越来越普遍,它以更具人性化的应用方式推动着教育的信息化 的飞速前进。教育资源网的建设是推进教育信息化的一种有效途径,同时,也可 以加快信息化教育发展的步伐。 高等教育领域,网络教育作为一种能延伸拓展学习时空的教育形式越来越受 到教育人士的普遍关注,网络化学习的浪潮已经到来。在网络教育的实施过程中, 教育资源是整个系统的一个重要组成部分,它突破传统教育资源在人员、地域、 时空上的多重限制,而提供大量、全面、开放的资料,为网络教育的成功开展提 供了必要保障。教育资源的网化趋势已成必然。目前国内网络教育资源存在着需 求大、来源广、数量众、种类多等系列特点。 在基础教育领域,为了适应面向2 l 世纪教育的发展和全民终身教育的需要, 尤其是自教育部2 0 0 0 年l o 月提出“校校通”工程以来,校园网络在各级学校的 广泛建立,教学网站不断涌现,为教学现代化提供了坚实的硬件基础。 有了信息资源,才能提供服务,才能方便教师和学生的教与学,方便学校的 规划管理,方便教师、学生、学校、家庭、社会之间的信息交流。由于网上缺乏 教育教学信息资源,造成“有路无车无货”局面,“缺乏标准,重硬轻软,应用 不足,设备闲置”,校园网络纯属摆设,造成了设备的大量闲置与浪费,使投巨 资所建的校园网难以发挥应有的作用和效益。教育教学信息资源的缺乏已成为制 约我国中、小学网络化教育发展的“瓶颈”。因此,组织建设一批网上教育教学 信息资源库( 中心网站) ,是我国中小学网络化教育能否发挥作用的关键。同时, 校园网建起之后,就是要充分利用校园网已有的硬件资源,进一步加强各种应用 软件的建设,做好校园网的二次开发工作,首要工作就是进行教育资源网站的建 设。 为此,国家教育部在“校校通”工程通知也已明确要求“用5 1 0 年时间, 使全国9 0 左右的独立建制的中小学校能够上网,使中小学师生都能共享网上教 育资源,提高中小学的教育教学质量”4 ; 4 “教育部关于在中小学实施校校通工程的通知”,教基 2 0 0 0 1 3 4 号文件,2 0 0 0 1 1 1 1 4 第一章教育资源网站内检索系统研究综述 正是在这种需求的背景下,专门的教育资源网站应运而生,比较专业的网 站有中国中小学教育教学网( 简称中国k 1 2 网站) 、中国基础教育网以及各省市建 立的教育网站。这些网站内容丰富,涉及中小学各个年级,各个学科。另外,还 有学校自己建立的教学资源网,网站内容包括本校各个年级、各个学科。 当前教育资源库( 网站) 的建设有两个主要特点:一是资源库规模不断扩大, 资源库覆盖范围向多学科、多年级阶段发展,资源库的建设包括单个学校、区县 级、市级甚至国家级,资源扩充很快,海量资源库成为主流;二是资源库使用依 托网络技术,采用b s 运行模式,数据流通过t c p i p 协议传输,用户通过浏览 器进行资源检索。 三、教育资源网站内检索的意义 在前面的内容中,对网站站内检索的必要性作了研究探讨,除了以上论述的 几个必要性之外,根据教育资源网自身的特点,建立站内检索还有以下重要意义。 最基本的出发点就是方便学习者查询,从而帮助学习者学习,提高学习效率。 在教育资源网建立一个检索系统,避免了学习者查询相关的知识点需要不断从一 个页面跳转到另一个页面,提高了学习者查询的效率,从而提高学习了的效率。 其次,有利于探究式学习和协作学习的开展。教育资源网站的建设使得教育 资源的利用受到重视,并随着出现了新型的教学模式,比如,基于资源的自助探 究式学习、协作学习等等。在学习的过程中,学习者要查找多方面的资料,站内 检索的建立无疑对学习者的探究学习提供了很好的帮助。 最后,促进学生信息素养能力的培养。在飞速发展的信息时代,信息本身已 经不再重要,重要的是如何获取信息以及如何处理这些信息。培养学习者的信息 能力成为当前开展信息教育的必然趋势。信息能力是一种基本的信息素养,培养 学生的信息能力,提高学生的信息素养是信息技术教育的根本目标。信息能力包 括几方面的能力,其中最基本的就是获取信息的能力。在教育资源网站提供站内 检索培养学习者是指从信息资源中检索自己所需要的信息,无疑可以促进学习者 获取信息能力的培养。 第三节教育资源网站内检索存在的问题 虽然,教育资源网站提供的资源琳琅满目,但是大部分网络资源的导航系统 不强,使用者在网络“迷航”现象十分普遍,结果只能是在网上走马观花地浏览, 不仅找不到合适的内容,且浪费了时间和精力。有的网站虽然建立了检索功能, 但还存在着以下几个问题: 1 、检索效率不高,导致学生厌烦 有的网i ; 占提供信息检索的功能,但是由于检索效率不高,花很长时间找不到 第一章教育资源州站内检索系统研究综述 合适的学习内容,学生容易产生厌烦心理:而且由于中小学生自控能力差,很可 能忘记了自己的学习目标。而花大量的时间去光顾那些影视、娱乐网站,网上的 一些信息垃圾成为他们浏览的热点,极大地影响了他们的身心健康。 2 、检索结果不够全面 目前,某些教育资源网比如说部分学校资源网,仅仅是是采用与文件名匹配 的检索方法,严重的影响了检索效果。如果用户查找的一个词在文中出现了而且 0 频率很高,而在文件名中没有,那么对学习者的学习可能造成一定影响。 3 、不能解决同义词、近义词以及相关词汇查找问题 目前一些教育资源网站采用的是全文检索技术,在提高查全率方面有所提 高,但是只能机械的匹配,不具备智能检索的能力,没有解决同义词、近义词、 相关词汇的查找。现实中存在的问题可能于作者用词的不统一,影响了学习者的 查找。例如,查找“非典型性肺炎”,由于不同的文章中使用的词汇不同,如“非 典型性肺炎”、“s a r s ”、“非典”等,只用某一词查找就可能出现漏检,如果让 学习者或用户去列举出所有同义词来检索,势必增加了学习者的检索负担。 而同义词、近义词、相关词汇对于学习者的检索有很大的帮助。举个例子来 说,学习者只知道“非典”,而不知道它的英文名称“s a r s ”,而在网站资源的 文章中恰恰都是以“s a r s ”来表示。如果不提供同义词的查询,学习者在查找 不到“非典型性肺炎”,为学习者的学习带来不利影响,同时造成了资源没有得 到利用的浪费。如果资源网站中提供同义词的检索,则可以帮助学习者查找 “s a r s ”的相关知识,从而也会了解到更多的知识。 这里只是举了一个例子来说明同义词、近义词以及相关词汇查找的重要性, 实际的查找中相信每个人都体会过百度相关查找带来的方便,同样在站内检索 中,提供同义词、近义词以及相关词汇的检索功能也为学习者的学习带来很大的 便利。 第四节解决方案智慧型教育资源网站内检索系统的 建设 智慧型教育资源网站内检索主要针对中小学教育资源网及其中的文本资源 检索展丌研究。 从目前教育资源网站内检索存在的问题出发,分析比较现有的检索技术,智 慧型教育资网站内检索系统采用全文检索技术、后控词表和关联规则等技术来建 设实现一一个智慧型的检索系统,解决同义词、近义词以及相关词汇的检索问题。 本系统的智慧型主要体现在两方面,一是智能推荐同义词、近义词以及相关 1 0 第一章教育资源删站内检索系统研究综述 词汇的检索,一是对后控词表的自动添加。系统主要是采用了以下主要技术实现 了这两方面的智慧型的检索。 体现智慧型特点的后控词表的应用。利用后控词表,可以为学习者提供智能 检索推荐。在学习者检索某个词的过程中,系统会自动把该检索词的相关词 汇职能推荐给学习者,供学习者检索参考。 体现智慧型特点的是关联规则的应用。除了人工可以随时添加或更改后控词 表以外,系统力图实现计算机自动添加后控词表。通过记录学习者输入的 检索词,利用关联规则的知识进行分析,类似数据挖掘知识中啤酒和尿布的 经典案例,找出学习者对于检索词之间的检索规律,自动把这些检索词添加 到后控词表中,弥补人工建立后控词表的不足。 另外,就是全文检索技术的应用。不管检索的词出现在文章中的哪个位置, 利用全文检索技术可以把它检索出来,从而有效地提高查全率。 与一般的站内检索相比,智慧型的站内检索提供了主题检索和全文检索。两 种检索都会为学习者提供智能推荐检索。 智慧型教育资源网站内检索系统是一个基于w 州的检索系统,采用了b s ( 浏 览器服务器) 结构,w e b 与数据库的结合。一般采取的结构如图2 1 : 图2 1 基于w w 检索系统的一般结构 采用这种结构,一方面,用户无法直接访问数据库,有利于数据库的安全, 另一方面,有利于w e b 页面的设计。 系统在客户端以w e b 网页的形式供用户的浏览器浏览,教育资源则存储在 后台s q ls e r v e r 数据库中。在浏览器端通过提供给学习者一个友好、统一的查 询界面,使分布在不同地点的用户能够通过w w w 进行教育资源的检索,浏览 器通过调用a s p 接口程序将用户查询请求提交给w e b 服务器,w e b 服务器通过 分析用户的查询方式,确定以何种方式进行检索,对数据库中的教育资源进行检 索,并把检索结果以h t m l 的形式提交给用户。 第二章智慧型教育资源网站内检索系统的可行性分析 第二章智慧型教育资源网站内检索系统 的可行性分析 本章一开始对常用的检索技术进行了分析介绍,通过比较得出采用全文检索 技术可以有效地提高检索的查全率,并在分析全文检索技术的基础上,探索改进 的方法,提出了一种有效的检索技术,即全文检索技术和后控词表、关联规则相 结合的一种方法。 在确定本论文所要采用的检索技术的基础上,第二节对本论文所要完成的系 统即智慧型教育资源网站内检索系统的实现从技术支持作了阐述,第三节对系统 的功能与特点方面做了一个简要地介绍。 第一节智慧型教育资源网站内检索系统的设计分析 本节主要分析常用检索技术,在此基础上,分析比较得出有效的检索技术, 提出本论文的检索技术,提出对现有教育资源站内检索系统存在的问题的技术解 决途径。 一、 教育资源网常用站内检索技术研究 目前,教育资源网站普遍采用的检索技术主要有以下几种: 1 、分类目录检索 分类目录检索是指用户按照资源的专题性质进行检索。教育资源按树型的主 题分类组织,树根下依据科目、年级、资源类型等不同维度建立分级目录。学习 者根据目标资源所属类别经历树根一树干一分支一树叶的遍历,查找到自己所需 的资源。这种检索方式实际上就是让学习者进行浏览检索,它要求学习者对目标 资源所属资源库的类别非常清楚,其缺陷在于有些资源可能无法正确归类,或者 出现多重归类,导致检索效率比较低下,时间耗费较长。 2 、关键词检索 关键词检索是教育资源网站检索中最常见的检索方式之一。实现的机理是对 每一单位的教育资源,资源库维护者手工标识或通过机器自动标识一些最能够表 现资源特征的词语,存储在引擎数据库的主题词字段中,并以此字段作为引擎数 据库的索引。用户输入其目标信息的一个或多个关键词语,资源库搜索引擎检索 主题词字段,输出相对应的资源或链接。该检索方式实现中的难点在于,手工标 引需要人员具备较高的专业水平,机器自动标引也要求自动抽词或赋词算法的智 第二章智慧型教育资源刚站内检索系统的可行性分析 能化程度高。另外,由于主题词的标引工作没有确定的资源特征分类标准所指导, 往往难以较为全面地反映教育资源的各类特征,导致关键词检索具有查准率高、 查全率低的特点。 3 、全文检索 全文检索技术是一种面向全文和提供全文的检索技术,以文本数据为主要 处理对象,根据数据资料的内容而不是外在特征来实现的信息检索手段。它的基 本工作方式是能够将所有包含检索此类的文献检索出来,不管这个词出现在文献 的什么位置;或者说文献中的任意一个词都可以作为检索到该文献的条件。 比起目录检索,全文检索提供了全新的、强大的检索功能,可以直接根据文 献资料的内容迸行检索,支持多角度、多侧面地综合利用信息资源。全文检索帮 助用户实现了对文档的所有内容的检索,扩展了用户查询的自由度,打破了主题 词对检索的限制,提高了检索的查全率。 全文检索技术是信息检索的一个分支,它的出现导致了信息检索领域的一场 革命。与以前的信息检索相比,全文检索提供了全新的、强大的检索功能。 4 、本系统拟采用全文检索技术 从以上对三种检索技术的研究来看,全文检索的检索性能明显优于分类目录 检索和关键词检索,所以本系统拟采用全文检索技术作为基础的检索技术,来提 高系统的查全率。 2 0 世纪9 0 年代以来,信息技术突飞猛进,特别是互联网的迅猛发展,改变 了信息收集、加工和服务的方式。信息的日益丰富使得传统意义的信息管理无法 满足及时、准确、高效的管理信息和用户网上查询的要求。全文检索系统以其较 高的查全率和查准率,在网络上得到了广泛的应用。 全文检索技术能够提供性能更优良、功能更强大的检索系统。 二、拟改进的全文检索技术 从以上分析当中,智慧型教育资源网站内检索系统拟采用全文检索技术来提 高检索的查全率,针对同义词、近义词以及相关词汇的解决,本系统采用后控词 表、关联规则对全文检索技术进行完善。 1 、全文检索技术 全文检索技术通过前面的介绍,已经有所了解,具有较高的查全率,目前是 应用比较广泛的检索技术。“文海捞针”5 是对全文检索的形象描述。 全文检索的出现,导致了信息检索领域的一场革命。全文检索除了可以实现 对文献资料的文献号、标题、作者、摘要和附录等的一般检索功能,还能直接根 据文献资料的内容进行检索,实现了支持多角度、各侧面地综合利用信息资源。 5 程清亮中文全文检索的发展,山西电子技术,2 0 0 0 年第3 期 第一章智慧型教育资源网站
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 园区商家安全管理制度
- 员工外出学习管理制度
- 多人活动安全管理制度
- 售后配件发货管理制度
- 城市配送仓库管理制度
- 兼职私人教练管理制度
- 完善单位各项管理制度
- 医院安保日常管理制度
- 学校病例随访管理制度
- 大型净水设备管理制度
- 2025届辽宁省葫芦岛市第二次模拟考试二模英语试题(原卷版+解析版)
- 中国碳化硼陶瓷项目商业计划书
- 2025新疆交投集团所属子公司招56人笔试参考题库附带答案详解
- 2025-2030年中国铜合金散热器材料行业市场现状供需分析及投资评估规划分析研究报告
- 第五讲铸牢中华民族共同体意识-2024年形势与政策
- 中华人民共和国学前教育法
- NB-T 47013.1-2015 承压设备无损检测 第1部分-通用要求
- GB/T 13912-2020金属覆盖层钢铁制件热浸镀锌层技术要求及试验方法
- 脑梗死标准病历、病程记录、出院记录模板
- 幕墙设计任务书
- 修井作业标准
评论
0/150
提交评论