基于主题搜索的通用教学资源共享平台设计_第1页
基于主题搜索的通用教学资源共享平台设计_第2页
基于主题搜索的通用教学资源共享平台设计_第3页
基于主题搜索的通用教学资源共享平台设计_第4页
基于主题搜索的通用教学资源共享平台设计_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于主题搜索的通用教学资源共享平台设计 技术应用xx?3月基于主题搜索的通用教学资源共享平台设计*徐朝军【摘要】本文提出利用主题搜索技术从互联网搜集分散教学资源的共享平台的设计思想,并借助于Lucene索单 一、?引和检索技术为用户提供高效的教学资源服务,避免了资源库建设过程中出现的以开发为主、维护工作?大等问题。 提高了现有互联网闲散资源的利用率,从而减少资源重复开发所导致的新动?足、财、物的浪费及时间上的低效,从技术上为教学资源建设和共享提供了新的思?和方法。 人、【关键词】主题搜索;教学资源共享【】G40-057【】B (xx)【】1009458x03006403在教育信息化大背景下,教学资源建设是各级、各类教育主管部门、机构、培训部门教育、教学改革的重要内容。 从上世纪90?代初的CAI课件开发、资源库建设,到本世纪初提出、现已全国遍地开花的网络课程资源建设,以及突破部门、地区等区域限制的教学资源联盟,其资源?外乎两种渠道一是自?开发,二是引进共享。 本着集约、共享原则,本文提出通用教学资源共享平台的设计思想,期望借?于主题蜘蛛技术搜集分散在互联网各个节点的教学资源,根据用户的需求进?分类索引,提供统一的教学资源服务。 该平台具有低成本、通用性强、资源?新快等特点。 实验数据表明,该方案具有较高的可?性。 间比比皆是,以“教学资源网”为主题的网站?是数?胜数。 在这些网站中除了部分商业资源外,很大一部分是的,可以共享使用。 如果能充分利用这些分散在各个网络空间站点的教学资源,可以极大地节约资源开发建设所需的人、财、物,避免了自主开发在时间上的低效,还可以保证教学资源的持续?新。 二、共享平台设计1.设计思?基于上述想法,结合已有工作,本文提出以主题搜索技术为核心的通用教学资源共享平台。 首先,采用主题蜘蛛技术345,从给定的种子网站开始,下载存储种子网站的所有链接资源,并根据网页Title、URL锚文本、URL链接字符?等信息,按主题资源目录树进?规则分类6;对于种子网站外的链接,则随机从这些网站下载10个网页,抽取这些网页的文本信息,计算这些网页与主题的相关度,如果达到设定的阈值,则该外部网站作为候选种子网站,在人工确认后加入种子网站。 为?于用户资源使用,平台除了提供主题目录检索外,还提供按文字全文检索。 开源软件Lucene提供了?捷的全文索引和检索功能,平台可以根据网页Title、网页正文、URL锚文本、URL链接字符?进 一、概述随着教育信息化的推进,教学资源的应用需求日益旺盛,为满足此需求,从教师个体到学校、区县教育局,乃至市、省、国家级的教育主管部门都开始了声势浩大、形式多样的教学资源开发、建设工作,课件、资源库、主题网站、网络课程等?一而足1。 网络使用成本的下降及“校校通”工程等政策的推动,为资源表达和交流提供了网络平台和空间,Web2.0?念及技术的深入,?是激发了教师资源发布和交流的欲望,互联网上个人教学网站、博客、空课题编*全国教育科学“十一五”规划xx?度教育部青?专项课题“网络课程使用现状自动?化评价系统研究”(号ECA090441)的研究成果之一。 64中国远程教育技术应用xx?3月?资源检索。 为减少自动系统可能存在的信息抽取的?准确,保证资源描述信息的规范性,系统采用Web2.0技术,向注册用户开放资源描述信息修正接口,以资源描述信息修正积分、最新资源推送服务激励注册用户共同努?,维护资源信息的规范性。 2.平台结构笔者研究小组设计了如图1所示教学资源共享平台,其核心模块包括主题蜘蛛、主题规则库、主题网站识别三个部分。 图2基础主题树与分类目录节点的词条都作为主题词纳入主题词库T。 (3)资源分类过程平台采用规则分类算法进?资源分类。 锚文本是对它所指向资源的描述,而网页标题则是对本网页或网站主题的概括,所以根据网页锚文本和标题进?分类可以取得较高的精度,而规则分类算法比较适合于短文本分类。 具体分类步骤如下下载网页,对网页内容进?解析,提取出网页标题、所有超级链接等信息;图1基于主题搜索的通用教学资源共享平台结构分析网页中的每一个超级链接,如果超级链接的锚文本、ALT说明文本中包括主题词ti,则根据其在主题分类树中的节点位置,结合模糊规则?论,综合判断其所属学段、学科等类别属性,如“高二物?(静电场部分)测试题”是中国基础教育网物?栏首页(.cbe21./sub-)的一个链接,根据锚文本的ject/physics/index.php关键词条“高二”、“物?”、“静电场”、“测试,可以得出式2所示信息题”3.核心技术为充分展示平台的工作原?和特点,下面对平台中设计的核心技术作详细介绍。 (1)教学资源表示式1是多媒体资源在共享平台中的表示方法,其中部分冗余类别信息是为了提高资源分类精度。 struct Resourcestring Url;string Text;string Grade;string Subject;物?、信息技术等)高中物?等)string Type;它辅助材?)string Abstract;/资源摘要或简介;/资源类型(课件、教案、练习与测试、其/资源网址(超链接URL)/资源描述文本(超链接锚文本)/资源学段类别(小学、初中、高中等)/资源学科类别(语文、数学、英语、 (1)Resource.Url=.cbe21./subject/physics/html/100404/xx_05/xx0527_100351.html;Resource.Text=高二物?(静电场部分)测试题;Resource.Grade=高中;Resource.Subject=物?;Resource.GradeSubject=高中物?;Resource.Type=练习与测试;2)(string GradeSubject;/学段与学科的组合类别(初中语文、根据网页间的链接关系、超级链接信息、网页简介、文件类型等其它属性;正文,抽取资源的描述、保存上述资源信息至教学资源库。 (4)主题网站识别识别新的主题网站是为了在已有种子网站的基础上,进一步充实种子网站库。 过程如下从每个初始种子网站下载10个网页,并抽取其文本,以主题词库T为分词词典,采用TF/IDF算法(见式3)7进?文档训练;w ij=tf ijidf j=tf ij*log(N/n j) (3)随机抽取外部网站的10个网页文本,根据DISTANCE EDUCATIONIN CHINA (2)主题数与主题库图2是基础主题树与分类目录。 主题树是系统的灵魂,它是整个基础体系的代表,也是资源分类依据和资源检索目录树的组成部分,它的构建应在基础教育专家和互联网专家共同合非终端节点)下都有?干作下完成。 在每个子目录(专业主题词条ti(tiT,T是主题词库),即每一个主题词条都属于一定的类别,ti为叶子节点。 树中每个65技术应用xx?3月VSM算法(见式4)8,计算其与初始主题的相关现的以自主开发为主、单 一、?新动?足、维护工作?大等问题,而是着眼于提高现有互联网资源的利用率,减少资源重复开发,在技术上通用性较强。 1.低成本资源平台通过主题搜索技术,发掘互联网现有闲散资源,提高现有资源的利用率,而?是重新开发。 因此,资源服务所需人、财、物及时间成本较低。 2.通用性强如果根据新的主题资源服务需求,?换平台中新20个左右)和主题库,主题相关种子初始网站库(该平台就可以适用于新的主题资源服务。 在实践中,我们以该平台为核心,先后用于基础、中学物?、学前、职业等系统服务项目的开发,并得到用户的认可。 3.资源?新快主题蜘蛛是?断连续运?的程序,它周期性地扫描种子网站,发现新的资源,?新、删除死的资源链接,持续动态的提供资源服务,对个人兴趣爱好、?政政策、经济利益等依赖很小。 主题蜘蛛遍历种子网站的周期即为资源?新周期,在一般情况下,一个月即可对所有资源遍历一次,一个星期内即可发现网站上95%的最新资源。 参考文献刘美凤.中小学教学资源现存问题透析J.中小学信息技1徐恩芹, (11)术教育,xx,.?京图书馆出版社,2罗志勇.知识共享机制研究M.?京xx.清华大学出版社,3徐根宝.搜索引擎与信息获取技术M.?京xx.ULUSOY(O).Exploiting interclassrules for4ALTING(O)VDE IS,focused crawlingJ.IEEE IntelligentSystems,xx,19 (6)66-73.5Jun Li,Kazutaka Furuse,Kazunori YamaguchiFocused crawlingbyexploiting anchortext usingdecision treeJ.(Special interest1190-1191tracks andposters)xx孙丽华.基于规则的自动分类在文本分类中的应用J.中6李渝勤,文信息学报, (4)xx,189-14.江岚.基于改进TF-IDF的中文网页关键词抽取-以新闻7钱爱兵,网页为例J.情报?论与实践 (6)xx,31945-950.李艳梅,唐琦.基于VSM的文本相似度计算的研究J.计8郭庆琳,算机应用研究, (11)xx,253256-3258.)的网站列入度,将高于预设值(本文实验值为0.8候选种子网站,供进一步手工确认,在丰富资源的同时,保证种子网站的权威性。 Msim(D i,D j)=Wk=1ik.W jkM2姨(W ik)(W jk)k=1k=1M (4)2 三、实验实践中,开发小组以WindowsxxServer/I-IS6.0/SQL Serverxx/.xx为开发运?平台,实现了基础服务平台,主题蜘蛛运?于普通PC平台,并对相关数据进?了统计。 基础初始种子网站为20个,主题树如图2所示,其下主题词共为32729条。 系统在连续运?15天后,共得到URL链接23717个,其中有效资源为205394,新发现种子网站53个,对有效的资源,研究按表 1、表2进?了统计,从数据来看主题搜索技术可以从互联网发现多种文件类型的教学资源,为教学资源建设提供新的思?。 表1按文件类型进?资源分类的统计结果文件类型HtmDocZipSwfRarJpgPdfPptExeWmvMp3Gif资源数19015341352165199515721286748656549516474224百分比92.58%2.01%1.05%0.97%0.77%0.63%0.36%0.32%0.27%0.25%0.23%0.11%文件类型ramasfxlswmamidavigspmpga7wa6wwmf资源数220191138135824542362651百分比0.11%0.09%0.07%0.07%0.04%0.02%0.02%0.02%0.01%0.00%0.00%表2按媒体类型进?资源分类的统计结果(?包含网页类资源)媒体类型多媒体课件音频素材视频素材教育图片压缩文档可执?文件Word文档总数对应的文件类型*.a6w、*.a7w、*.gsp、*.ppt、*.swf*.ram、*.wma、*.mp 3、*.mid*.asf、*.avi、*.mpg、*.wmv*.gif、*.jpg、*.wmf*.rar、*.zip*.exe*.doc资源数百分比324021.8%9106.1%7885.3%151110.2%373725.1%5493.7%413527.8%14870100.0%xx0930作者简介徐朝军,讲师,在读博士,南京师范大学教育技术系 (210097)。 四、结论本研究构建的平台避免了资源库建设过程中出郑重66中国远程教育英文摘要xx?3月ing motivation,learnersself-efficacy,anxiety-arousing aspectsof distance English learning,and measurestakento dealwith anxiety.Findings showthat nearly80%of thestudents encountereddifficulties intheirdistance Englishlearning andabout70%experienced anxiety.Anxiety-arousing factorsincluded courseworkload,examination,course material,and theproductive skillsof speakingand writingespecially whenrelatedto activeuse ofvocabulary andgrammar,as wellas styleand genericstructure.Findings alsoin-dicate thatstudents favouredself-help overhelp-seeking strategiesto dealwith anxiety.Pedagogical im-plications arediscussed fromthe perspectiveof institution,teacher andstudent.Keywords:distanceEnglishlearning;learning anxiety;Chinas Open UniversitiesProviding CommunityEducation forBoth Urbanand RuralAreasvia Chinas OpenUniversities:A CaseStudyLi Weilinand ChenJieyuCommunity educationis animportant mediumfor lifelonglearning.This papermade acase studyofJiaxing OpenUniversity inZhejiang Provinceto investigateeffective strategiesadopted to provide mu-nity educationfor bothurban andrural areas.Chinas OpenUniversities forma nationalwork structuredonits administrativedivision andwith richeducational resourcesas wellas soundinfrastructure.Therefore,the authorsmaintain thatit mayserve asa platformtoprovidemunity educationfor bothurban andruralareas.They alsodiscuss possibleways forthe OpenUniversities workto playa keypart in-munity education.Keywords:urban andrural integration;munity education;OpenUniversitieswork;development modelDesigningan EducationalResources SharingPlatform SupportedbyTheme-based RetrievalTechnologyXu ChaojunDevelopingeducational resourcesis anintegral ponentof educationalreform inthe informationage.This articleputs forwardthe design concept ofus

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论