基于RDF的教育资源描述_第1页
基于RDF的教育资源描述_第2页
基于RDF的教育资源描述_第3页
基于RDF的教育资源描述_第4页
基于RDF的教育资源描述_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,姓名,导师,张书涵,夏幼明教授,基于RDF的教育资源描述,目录,1,2,3,4,元数据与教育资源建设技术规范,XML语言与资源描述框架RDF,基于RDF模型的半结构化知识表示,教育资源特征提取与分类算法,元数据与教育资源技术规范,什么是元数据?,元数据可以出现在数据内部、独立于数据、伴随着数据、与数据包裹在一起等形式。,元数据,最常见的宽泛定义是关于数据的数据,具体讲的是关于数据的结构化数据。,元数据与教育资源技术规范,元数据的种类,对于元数据的种类有不同的分类方法,一般分为描述性元数据、结构性元数据、存取控制性元数据、评价性元数据。,元数据与教育资源技术规范,元数据在教育领域中的应用,1、用于教育信息资源的组织,2、用于教育信息资源的检索与导航,3、用于教育信息资源数据库的设计与维护,4、用于系统管理机制的描述,元数据与教育资源技术规范,现有的教育资源元数据标准,1、都柏林核心元数据标准,英文名是“DublinCoreMetadata”,简称DC元数据。它于1995年3月,由美国联机图书馆中心与国家超级计算应用中心联合发起,目的是希望建立一套描述网络学习资源的方法,方便人们检索。,元数据与教育资源技术规范,现有的教育资源元数据标准,1、都柏林核心元数据标准,DC元数据为网络教育资源制定了一组通用核心集,该标准对网络教育资源相关的15个核心元素进行了规定,并分成了三类。一是教育资源内容描述类,主要包括Title,Subject,Description,Source,Language,Relation等;二是知识产权类,包括Creator,Publisher等;三是外部属性描述类,包括Date,Type,Format等。,元数据与教育资源技术规范,现有的教育资源元数据标准,1、都柏林核心元数据标准,DC元数据比较简单,容易理解,规定的内容也较少,是一个良好的教育资源描述元数据集。但是,在描述较复杂的学习对象时,不能详细的对教育资源的属性进行描述,具有一定的局限性。,元数据与教育资源技术规范,现有的教育资源元数据标准,2、学习对象元数据(LearningObjectMetadata),简称LOM元数据,是与学习对象相关的一切信息。它于1996年IEEE的学习技术标准委员会研究产生,方便对学习对象进行检索、查询、定位和管理。,元数据与教育资源技术规范,现有的教育资源元数据标准,2、学习对象元数据(LearningObjectMetadata),IEEELOM主要对学习对象的9个基础类别的特征进行规范和描述:,通用类、生存周期类、元-元数据、技术类、教育类、权利类、关联类、注释类、分类类,元数据与教育资源技术规范,现有的教育资源元数据标准,2、学习对象元数据(LearningObjectMetadata),从元素构成上看,LOM较为复杂,分为9大类,每一类下面由有二级元素,一共47个左右。但是其修饰词却不复杂,只有部分元素有修饰词。,从资源描述能力上看,相比DC元数据,LOM的资源描述深度和广度要强的多,是更专业的教育资源描述工具。,元数据与教育资源技术规范,现有的教育资源元数据标准,3、中国网络教育技术标准,英文名称ChinaE-LearningTechnologyStandards,简称CELTS。它于2001年由中国教育信息化技术标准委员会提出,是一个具有中国特色的网络技术标准。,元数据与教育资源技术规范,现有的教育资源元数据标准,3、中国网络教育技术标准,学习对象元数据规范CELTS-3,教育资源建设技术规范CELTS-41,基础教育教学资源元数据规范CELTS-42,XML语言与资源描述框架RDF,什么是资源描述框架RDF?,RDF是一种元数据框架,它借助网络实现机器可识别应用程序之间的互操作性,使网络资源自动化处理。,RDF的主要目标是为了解决互联网中信息的语义化,它支持对元数据语义的描述以及元数据之间的互操作性,在应用中也支持基于推理的知识发现而不是全文匹配检索。,XML语言与资源描述框架RDF,RDF框架,RDF数据模型、RDF模式和RDF语法,1、RDF数据模型RDF数据模型形成对资源的形式描述,通过使用标记图(或“节点和弧”图)表示,包括:资源、属性、属性值三部分。,资源可能是整个网页、网页的一部分或页面的全部集合,或者是不能通过Web直接访问的对象,属性是描述某个资源特定的方面、特征、性质或关系,XML语言与资源描述框架RDF,2、RDF模式(RDFSchema)RDF模式定义了RDF描述资源时所用的词汇集,包括类和属性。,3、RDF语法-基于XML的语法,XML语言与资源描述框架RDF,xmlns:g=“grid:/,XML语言与资源描述框架RDF,网格中资源基本属性,XML语言与资源描述框架RDF,”xmlns:rdf=“/1999/02/22-rdf-syntax-ns#”xmlns:rdf=“/2000/01/rdf-schema#”xml:base=“,基于RDF模型的半结构化知识表示,设有目标域为D,D中所以数据源的集合为SD=Si,Si为二元组,E为Si中数据元素的集合E=e,R为Si中数据元素之间关系的集合R=e,e,rik(e,eEi),则有:Si,f,sM,f(si)=f()=f()f(si)=f(e)E,f(e),f(e),f(e)R,设目标域D上的元数据M,其描述能力为二元组,E为M支持的数据元素的集合,E=ei,R为M中数据元素之间的关系集合R=ei,ej,rk(ei,ej)E),RDF形式化模型,基于RDF模型的半结构化知识表示,LOM=General,Lifecycle,Metamedata,Technical,Educational,Rights,Relation,Annotation,ClassificationGeneral=Identifier,Title,Catalogentry,Language,Description,Keywords,Coverage,Structure,AggregationievelLifecycle=Version,Status,ContributeMetamedata=Identifier,Catalogentry,Contribute,Metadataschema,LanguageTechnical=Format,Size,Requirment,Installatio_remarks,Other_latform,Requirements,DurationEducational=Interactivity_type,Learning_resource_type,Interactivity_level,Semantic_density,Intend-ed_enduser_role,Context,Typical_agerange,Difficulty,Typica_larning_time,Description,LanguageRights=Cost,Copyrightandrestructions,DescriptionRelation=Kind,ResourceAnnotation=Person,Date,DescriptionClassification=Purpose,Taxopath,Description,Keyword,RDF形式化描述-LOM基本命名空间的缩写,基于RDF模型的半结构化知识表示,Baseschemaxmlns:rdf=“/1999/02/22-rdf-syntax-ns#”xmlns:rdfs=“/2000/01/rdf-schema#”xmlns:dc=“/dc/elements/1.1/”xmlns:dcterms=“/dc/terms/”xml:base=“/2002/09/lom-base#”ISO8601InstancesofthisclassaredatesandtimesencodedwithISO8601.EntityInstancesofthisclassarepersonsororganizationsdescribedbyCards,RDF形式化描述-RDFS词汇表示例,教育资源特征提取与聚类算法,聚类框架,混合XML文档,文档约简,约简文档,WordNetaddpij到PiEND,教育资源特征提取与聚类算法,语义相似度计算,算法语义相似度计算输入矢量特征模型Doc;输出语义相似度矩阵Begin抽取XML文档中的全部元素;while(Doci在文档集D中)创建扩展元素向量Doci;while(Doci在文档集D中)while(Docj在文档集D中)计算Doci与Docj的相似度;END,该算法比传统的仅考虑词频的相似度计算方法相比,元素匹配程度提高了50%-100%。但是该方法未考虑元素所在层次结构对相似度的影响。,2001年美国Jung-WonLee发表在IEEE上的文章PreparationsforSemantics-BasedXMLMining提出了一种计算XML文档语义相似度的方法,该算法抽取XML文档的元素节点,然后对每个元素节点建立扩展标记向量,通过扩展标记向量中的元素匹配程度进行语义相似度计算,时间复杂度为O(N2),其中N是文档数目。,教育资源特征提取与聚类算法,在XML文档中,层次越高的元素往往比层次的的元素更能反映文档的信息,在描述文档的时候更具有意义,因此在计算语义相似度时,应把层次作为因子纳入计算。,层次影响因子,层次影响因子(LayerAffectingFactor)是指在XML文档中,元素在文档树结构中所处层次对语义相似度的影响程度。定义为:,其中,是文档i中第P个元素所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论