(计算机应用技术专业论文)基于语义web的个性化网络课件研究.pdf_第1页
(计算机应用技术专业论文)基于语义web的个性化网络课件研究.pdf_第2页
(计算机应用技术专业论文)基于语义web的个性化网络课件研究.pdf_第3页
(计算机应用技术专业论文)基于语义web的个性化网络课件研究.pdf_第4页
(计算机应用技术专业论文)基于语义web的个性化网络课件研究.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着网络技术的快速发展,依托网络,发挥网络信息资源丰富和不受时空 限制的优势,实现网络教学,已经日趋普及。但是,由于学员个性千差万别, 若使用划一的、模式化的教学形式,将否定或无视学员丰富多彩的个性,这是 与创新教育的要求和现代教学理论相悖的。 而同时,至今为止,互联网都不能作为一个计算机可以理解的,并能自动 处理的数据与信息的载体。如果用面向计算机的数据来扩充网页,同时加入仅 供计算机阅读和处理的文件,我们就把互联网变成了语义w e b 。计算机跟踪通向 关键术语的定义以及对这些术语进行逻辑推理的规则的超连接,就可以发现语 义数据的意义。这样所得到的基础结构将促进自动化网上服务( 如个性化网络 课件) 的开发。 本文首先基于w e b 具有的一些特征以及应用于语义w e b 的知识表示语言, 比较了语义w e b 中知识表示和传统知识表示的不同,提出了语义w e b 知识表示 的评价标准,界定了本体的概念并介绍了本体在知识表示中的应用。 接下来从检索、处理个性化网络课件的需求出发,对基础教育元数据进行 增改,使其更适用于个性化网络学习,然后在新的标记方案的基础上利用r d f 表示课件。 最后,设计了个性化网络课件系统体系结构以及它所能实现的功能。 关键词:语义w e b资源描述框架个性化网络课件 a b s t r a c t w i t ht h eh i g hs p e e dd e v e l o p i n go fi n t e r n e t ,i tp r o v i d e sal o to fi n t e r e s t i n ga n d s i g n i f i c a n ti n f o r m a t i o n w e c a na c h i e v en e t w o r ke d u c a t i o nb yi tw i t h o u tt h el i m i t so f t i m ea n ds p a c e b u tp e r f o r m i n gt h es a m et e a c h i n gp a t t e r nt ot h ev a r i o u ss t u d e n t sw i l l d oh a r mt oi n n o v a t i o ne d u c a t i o na n dt h es t u d e n t sp e r s o n a l i t i e s a tt h es a m et i m e i n t e r n e ti ss t i l ln o tac a r r i e ro fm a c h i n eu n d e r s t a n d a b l e i n f o r m a t i o n t os o l v ei t ,t h er e s e a r c ho ns e m a n t i cw e bh a sb e e np u tf o r w a r d , i nt h i sp a p e r ,s e m a n t i cw e bi sf i r s ti n t r o d u c e di n c l u d i n gs o m ek e yt e c h n i q u e s s u c ha sk n o w l e d g ee x p r e s s i o na n do n t o l o g y s e c o n d l y ,w ed i s c u s ss p e c i f i c a t i o no f c o n t e n tl a b e lf o rw e bc o u r s e w ea p p e n dl a b e lf o rw e bc o u r s eb a s e du p o nr d f ( s ) i nt h el a s tp a r to ft h i sd i s s e r t a t i o n ,a c c o r d i n gt ot h ee x p e r i e n c ei nt h ea r c h i t e c t u r e d e v e l o p m e n t ,w eb r i n gu pt h ep e r s o n a l i z e dw e bc o l 3 s es y s t e m , k e y w o r d :s e m a n t i cw e b ,r d i ? , p e r s o n a l i z e dw e bc o u r s e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究 成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过 的研究成果,也不包含为获得丞洼盍堂或其他教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示了谢意。 学位论文作者签名:签字日期:年月曰 学位论文版权使用授权书 本学位论文作者完全了解丢整盎堂有关保留、使用学位论文的规定。特授权 丢叠太堂可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、 缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构 送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 导师签名: 签字日期:年月日签字日期瑶 第一章绪论 第一章绪论 1 1 网络教育的发展和网络课件的开发现状 1 1 1 国内外网络教育的发展情况 远程教育的发展经历了第一代采用文字、印刷品、邮寄函授等形式传播知 识和第二代运用广播、电视模拟信号传播知识,现在发展到了用计算机网络技 术和多媒体数字技术进行交互式学习的第三代远程教育一一网络教育。网络教 育就是指学生在老师的引导和协助下,利用多媒体技术、计算机技术和网络技 术获得学习指导和信息资源,并采用最有效的方式实现学习目标的新型教育模 式 1 。 在国外,1 9 9 6 年美国民众中就掀起了旨在推动学校联网的“网络日”志愿 活动,克林顿政府提出“教育技术行动”纲领。到目前为止,一个覆盖全国主 要教育机构的网络业已经形成,几乎全国所有的学校都能开展网络教育。在高 校,网络教育所开设的学历、学位课程已超过5 万门,基本覆盖了美国高等学 校所有的学科和专业。英国开放大学( o p e nu n i v e r s i t y ) 是最早应用多种媒体 教学的远程教育学校,目前,在网络上学习的学生超过6 万,提供各种层次的 教育( 结业证书或课程证书、毕业证书、硕士学位) ,几乎包括所有学科的课 程。全球已有8 0 0 多所大学通过i t i t e r n e t 提供网上学位课程,像哈佛大学、麻 省理工学院、剑桥大学都已允许国外学生进行网上注册、异地学习学位课程。 我国的网络教育始于1 9 9 4 年实施”中国教育科研网示范工程”,之后就以较 快的速度发展,】9 9 5 年开通中国教育科研网( c e r n e t ) ,2 0 0 1 年全面实施中小 学“校校通”工程,以信息化带动教育的现代化,努力实现基础教育跨越式发 展。如今有几百所面向中小学的网络学校,如:1 0 l 远程教育网校、联想网校 等。另外还有一些专业基础教育网站,如:h t t p :f r e e s c h 0 0 1 n e t , h t c p :w w w k 1 2 e o m o n 等,这些网络教育机构使得普通中小学校的学生接受 到名校优秀教师的辅导,因此很受欢迎。高校网络教育方面,1 9 9 8 年开办四个 试点现代远程教育学校:清华大学、北京邮电大学、湖南大学、浙江大学,】9 9 9 年又增加了六所学校,到目前为止,已有近百所大学的网络学院有权进行学历 教育。清华大学已开发了近1 0 0 门网络课程,用于校内及网络远程教育 2 。 第一章绪论 从这些数据我们可以看出网络教育在我国已经有了一定规模的发展,随着 我国计算机信息及网络技术的不断进步和日臻成熟,基于计算机网络技术的网 络教育将能够逐步满足人们在学习上的不同需求,并对学校教育的各个层面进 行逐步改善: ( 1 ) 扩大高等教育。我国目前在适龄人口之中能够进入各大专院校( 含成 人教育学院) 的比例为十分之一左右。高等教育的规模与人们的需求形成巨大 矛盾,网络教育就可以为失去接受学校高等教育机会的不同年龄的人带来了希 望。 ( 2 ) 开展继续教育。在经济与技术飞速发展的当今社会,知识更新的速度 正在不断加快,一个人只有不断地充实自己,才能在日益激烈的竞争中立于不 败之地,这使”终生学习”己成为每个人生中的必要活动。但对于已经工作的 人来说,长期脱产到学校去参加学习与培训是不现实的,他们需要的是一种能 够由自己决定学习内容、时间和地点的学习方式,网络教育正好能满足这种需 求 ( 3 ) 完善基础教育。目前中小学网校不仅可以让学生享受到优秀的教学资 源和科学的家庭教育辅导,而且还很注重课外辅导,加强学生综合能力的培养。 1 1 2 网络课件的内容及特点 随着网络教育的蓬勃发展,与之相适应的资源建设也日益受到人们的重视。 众所周知,网络教育有三大基础:硬件、软件和网络教育资源 3 。随着i n t e r n e t 技术及其向宽带、高速、多媒体化方向的快速发展,软、硬件将不再是制约网 络教育发展的主要因素,教育资源的重要性则会日益凸显,最终将成为决定网络 教育成败的关键所在。而网络课程是教育资源非常重要的组成部分,网络可以 使教与学活动产生时空分离,教师不再是直接的教育者,教育目标通过网络课程 来实现,教学活动围绕着网络课程展开,因此开发适用于网络课程的高质量的课 件成为发展网络教育的一个非常重要而迫切的课题。 课件( c o u r s e ) ,指专门为进行教学活动而设计的计算机软件 4 。现在大多 数c a i 课件因种种原因无法共享资源,造成了教育资源的极大浪费,而且重复 开发与不合理开发的现状严重,同一f 了课程有十几个、几十个单位重复研制单 第一章绪论 机版c a i 课件的情况并不少见,造成人力、财力的巨大浪费。随着全球计算机 网络化的飞速发展,随着教育部门、各学校、普通家庭的计算机网络化,网络 时代呼唤着”超媒体网络课件”的问世。 网络课件( w e bc o u r s e ) ,就是应用于网络环境的课件。现在的网络课件般 是基于b r o w s e r s e r v e r ( 浏览器n 务器) 模式开发、能在i n t e r n e t 或 n t r a n e t 上发布的c a i 课件,其本质是一种w e b 应用程序 5 。 目前,非专业人员开发的网络课件一般是网页型的。由于网页具有多媒体 超文本实现能力,并且有良好的交互和动态特性。i n t e r n e t 是一座连接老师与 学生的桥梁,网络课件运行在服务器上,学生只要上网浏览就可以了,也就是 说在客户端真正做到了”免安装、免维护”,方便、快捷而且信息量大,内容更 新快。所以,借助i n t e r n e t 来实现计算机辅助教学和远程教育已经开始得到 大力的发展和推广。但现有的网络课件主要是基于h t m l 网页的,制定者按一定 的思路,以h t m l 网页形式呈现教学内容,通过网页集成图形、图像、动画、音 频、视频等媒体表现形式,嵌入脚本生成动态网页,以同一模式呈现给所有的 浏览者。 由此我们也可以看出,传统的网络课件仅仅是通过对学习者进行多媒体学 习资源对象的展现和播放来实现课程知识的传授。不足之处主要有两点:一是 以知识的灌输为主,缺乏学生的自主参与及学习效果信息的反馈;二是往往只 是基于单机环境的c a i 课件的w e b 翻版,没有充分利用网络在资源共享和协作 化学习上的优势。 1 1 3 个性化网络课件 我们都知道教育的目的将不仅是教会学生知识本身,更重要的是培养学生 运用知识解决实际问题的能力。网络学员的个性千差万别,若使用划一的、模 式化的网络课件将否定或无视学员的丰富多彩的个性。而随着科技的发展和人 才竞争的加剧,社会对人才的要求已经发生了深刻地变化。因此,我们在组织 实施网络教学过程中,对网络教学课件的开发应体现个性化,实现在学习过程 中,呈现给学员的网络教学内容个性化,显示的页面样式个性化,并有个性化 的学习指导。这样学员在独自进行的网络学习中不会盲目学习,使之更有针对 性和目的性。 个性化的网络课件,既能给学生提供满足其个性需要和学习进度的学习环 第一章绪论 机版c a i 课件的情况并不少见,造成人力、财力的巨大浪费。随着全球计算机 网络化的飞速发展,随着教育部门、各学校、普通家庭的计算机网络化,网络 时代呼唤着”超媒体刚络课件”的问世。 网络课件( w e bc o u r s e ) ,就是应用于网络环境的课件。现在的网络课件般 是基于b r o w s e r s e r v e r ( 浏览器且日务器) 模式开发、能在i n t e r n e t 或 n t r a n e t 上发布的c a i 课件,其本质是一种w e b 应用程序 5j 。 目前,非专业人员开发的网络课件一般是网页型的。由于网页具有多媒体 超文本实现能力并且有良好的交互和动态特性。i n t e r n e t 是一座连接老师与 学生的桥梁,网络课件运行在服务器上,学生只要上网浏览就可以了,也就是 说在客户端真正做到了”免安装、免维护”,方便、快捷而且信息量大,内容更 新快。所以,借助i n t e r n e t 来实现计算机辅助教学和远程教育已经开始得到 大力的发展和推广。但现有的网络课件主要是基于h t m l 网页的,制定者按一定 的思路,以h t m l 网页形式呈现教学内容,通过网页集成图形、图像、动画、音 频、视频等媒体表现形式,嵌入脚率生成动态网页,以同一模式呈现给所有的 浏览者。 由此我们也可以看出,传统的网络课件仅仅足通过对学习者进行多媒体学 习资源对象的展现和播放来实现课程知识的传授。不足之处主要有两点:一是 以知识的灌输为土,缺乏学生的自主参与胜学习效果信息的反馈;二是往往只 是基于单机环境的c a i 课件的w e b 翻版,没有充分利用网络在资源共享和协作 化学习上的优势。 113 个性化网络课件 我们都知道教育的目的将不仅是教会学生知识本身,更重要的是培养学生 运用知识解决实际问题的能力。网络学员的个性干差万别,若使用划一的、模 式化的网络课件将否定或无视学员的丰富多彩的个性。而随着科技的发展和人 才竞争的加剧,社会对人才的要求已经发生了深刻地变化。因此,我们在组织 实旅网络教学过程中,对网络教学课件的开发应体现个性化,实现在学习过程 中,呈现给学员的刚络教学内容个性化,显示的页面样式个性化,并有个性化 的学习指导。这样学员在独自进行的网络学习中不会盲日学习,使之更有针对 性和目的性。 个件化的网络课件,既能给学生提供满足其个性需要和学习进度的学习环 个性化的网络课件,既能给学生提供满足其个性需要和学习进度的学习环 第一章绪论 境及学习内容,又能提供相应的协作学习活动。依据建构主义的理论,个性化 网络课件是对具有不同学习特征的学习者创设相应的学习环境,实现所学知识 的意义建构,完成课程学习的任务 6 。个性化网络课件的关键技术如下 7 : ( 1 ) 学习者个人模型 个性化的实现首先要求系统对学生个体的识别,建立学生模型及记录其学 习情况是实现个性化的基础。如何构建学生的个性化模型,可以从学生的学习 倾向特征、目前关注的兴趣主题、偏爱和喜好、学习进度等几个方面研究。根 据对学习倾向特征的研究,学习者的学习倾向有四种类型:转变型、任务型、环 境适应型、逆反型。在确定学习者的学习倾向类型时,大致可以采用两种方法: 通过学习倾向的问卷调查l o q ( t h el e a r n i n go r i e n t a t i o i lq u e s t i o n n a i r e ) , 另一种方法是通过学习者的学习活动,逐步识别和确认学习者的学习倾向类型。 前一种方法较为直接容易实现。后一种方法,需要分析学生的学习行为,不仅 要用到学习心理学的研究成果,还要运用机器学习、数据挖掘知识发现、神经 网络的模式识别和聚类等相关技术。 我们采用网上问卷调查的形式确认学习者的基本学习倾向类型。同时,在 学习中,根据其学习行为表现,对学习倾向类型作相应调整。针对学习倾向, 为不同类型的学习者定制相应的学习指导建议、安排学习活动。 除了学习倾向类型的不同外,学习者对不同学习主题的关注程度也不相同。 学习主题就是按知识内容划分的各个学习模块。各个学习模块中又围绕技能要 求子目标划分成子专题。这些学习活动的安排方式要针对不同学习者的要求展 开。界面的偏爱和喜好可由学习者自己定制或系统给出默认值。学习进度由系 统根据学习者的学习效果反馈加以控制。 上述的这些关于学习者个性的信息,由于在学习活动中长期有效,因此需 要作为学生模型保存在系统的数据库中。此外,依据这些信息,还可以实现个 性化的协作学习。 ( 2 ) 协作 对于需要进行意义建构的学习知识目标,可以在其网络课件内部设计交流 协作工具。在没有教师统一指导的网络学习中,学生对课件的学习与学生之间 的交流协作很容易脱节。利用这些嵌于课件内部的会话工具,学生在学习课件 知识的过程中,就能因时因地地通过协作互助进行意义建构。这些内嵌式协作 工具,可以以组件形式嵌入到不同的网络课件中,因此有很高的可重用性。协 作工具可以结合智能代理( a g e n t s ) 技术成为学习者的协作智能代理。例如, 第一章绪论 当学习者在使用网络课件创设的情境中遇到问题时,可以随时随处的通过浏览 器端的协作学习代理与他人( 教师和学习伙伴) 交互讨论,代理接到请求后会 在服务器端的数据库中查找当前正在学习此课程的在线学习伙伴或任课老师, 如果学习伙伴和教师在线且接受协作,则实现协作讨论,否则由代理查找课件 数据库给出此学习目标单元的系统帮助。在网络课件的学习设计中结合这些方 法可以为网络课件扩展其他功能,为课件学习资源对象的共享、网络课件的个 性化等准备了前提条件。 个性化学习不仅局限在单机上,协作可以从另一个角度体现网络学习的个 性化 9 。在系统中,对每个学习者的学习行为和学习现状都要作详细的记录, 以支持学生个性模型的建立及学习中的协作。这些学习记录,是随时间改变而 改变的,使用后导入数据仓库进行分析或被新的记录覆盖。协作学习的实现, 就是通过充分使用这些学习记录,使学生能够相互协作,感到处在个学习的 团体中。个性网络课件中学习者的学习历史记录存放在服务器的数据库上,学 生在选择学习活动时,可参照同类学生的学习情况来预测哪个学习活动更适合 本人,从而选择出最适合的学习活动。通过这种方式,可以为每个学习者动态 生成一系列的学习活动。协作的另一个方面是,学习者可根据其他学习者的学 习历史记录,自己选择或由系统选择学习伙伴。可以建立不同的伙伴关系:同 伴关系或辅导者与被辅导者的关系。在课件学习中,学生使用通信工具或学习 代理完成“会话”,实现学习上的协作。 ( 3 ) 个性化的主题安排 个性化网络课件要求主题中有多样的学习环境,包括不同的创设情境、学 习资源对象、协作化工具等,以便满足学习者的个性要求。从认知领域来讲, 一个主题所涉及的相关知识内容,有认知、理解、应用、分析、综合和评价这 六个方面的要求。为实现这些目标组件,所设计的学习方式可以很灵活,系统 根据学生的个性类别和课程进度,可以选择相应的学习活动。 课程知识按知识的相对完整性和独立性划分成具有等级的各个学习主题。 这些主题按先易后难构成一个分层结构的课程知识主题树 8 。为指导学习者的 学习进度,主题可以按学习计划中的时间安排分层逐级对学习者开放。同一层 中各主题的学习顺序不分先后,可由学习者灵活掌握。对于个性化学习,学习 者可以不受时间限制提前进入下一层各主题的学习,但需要满足一定的条件, 如测试成绩达到要求、对自己的学习评价为良好以上、老师的评价为良好以上 等。当其中的某些必要条件成立时,学习者可以进入下一阶段的学习,否则有 一个最迟学习期限,时间到后系统自动开放下一阶段的主题。按照这种方法安 第一章绪论 排主题的学习顺序,既控制了学习者的学习进度,又有一定的灵活性,体现了 个性化的学习进度安排。 主题内部按学习目标分成各个技能要求的子专题。这些子专题是以知识的 最终应用为目标的,围绕应用目标组织相关的必备学习资源。 ( 4 )目标评价 为了评价主题中各学习活动设计的合理性和学生的学习效果,需要建立一 种结构化的学习目标评价体系。对于以能力和技能培养为目标的课程,应该强 调知识的外化,即在实际场景中运用知识解决实际问题的能力。 学生在创设的情境中获得知识的同时也学会了知识的应用,即学习的外化。 学习效果的评价可以结合学生的自我评价和老师的评价。学生根据习题,测试 的完成情况,及学习中遇到困难的多少,对各学习目标项要求作自我评价,老 师也可根据作业、学习报告、主题讨论等情况,按课程学习的各项要求评价学 生。 按照对课程学习目标的组件化的方法 1 0 ,对课程的最终学习目标划分成 粗细层次不同的几个层次,构成目标评价组件框架。学生的自我评价和老师的 评价都是依据这个框架中的组件来分项评价。评价的等级可以分为较差、一般、 良好、很好、优秀五个等级。量化等级分别为l 、2 、3 、4 、5 。学生的自我评定 和老师的综合评定可以相比较,学生之间也可相互评价,系统把这些评价信息 以图形和表格的形式显示给学生自己。学生按照学习的评价自己组织学习活动 或由系统安排学习活动。 通过这种方法可以分阶段地获得学生学习效果的反馈,解决了传统教学过程 中无法了解学生学习情况的问题。知识的分解有利于知识的综合应用,对课程 知识的结构化使学生按等级逐步学习课程知识和技能,是一个渐进学习的过程。 对课程最终能力目标的评价可作为设计学习活动的依据和使对学生学习效果评 价更明确的一种有效方法。 基于语义w e b 的一些技术( 比如r d f x m l ) 的出现使我们开发个性化的网络 课件这几个关键技术成为可能。x m l 已经被推荐为下一代网页发布语言。使用语 义w e b 技术开发网络课件,至少存在以下几点优势 1 】 ; 1 可实现课件信息的 标准化。r d f x m l 具有良好的语义和清晰的结构,是i n t e r n e t 上不同系统、 不同平台上进行数据交换的理想格式,可以用来定义标准化课件信息格式。2 具有开放性的课件。x m l 强大的数据检索能力为课件信息的开放性提供基础,并 达到课件共享和重用的目的。3 课件信息的组织。采用教育资源标准规范建立 第一章绪论 学习资源对象的元数据,利于课件信息的组织。4 课件内容的维护。r d f x m l 实现了形式与内容的分离,使同一数据可以根据实际情况具有多种表现形式, 真正实现个性化发布。 1 2 本文的内容安排 第一章绪论介绍了国内外网络教育的发展现状,阐述了个性化网络课件对 于远程网络教学的重要性,重点阐明个性化网络课件的关键技术。 第二章基于w e b 具有的一些特征以及应用语义w e b 的知识表示语言,比较 了语义w e b 中知识表示和传统知识表示的不同,提出了语义w e b 知识表示的评 价标准,界定了本体的概念并介绍了本体在知识表示中的应用以及语义w e b 模 型。 第三章从开发个性化网络课件的目标出发,来对课件元数据进行标记,使 计算机能够理解网络内容并对其进行自动处理。r d f 是处理标记的基础,为在 互联网上互相交换机器可理解数据的应用程序提供互操作性。通过本章设计的 新方案可以有助于第一章提出的“学习者个人模型”、“个性化的主题安排”、 “目标评价”这三个问题的解决。 第四章设计个性化网络课件系统体系结构。 第五章是总结与展望。 第二章语义w e b 第二章语义w e b 本章基于w e b 具有的一些特征以及应用语义w e b 的知识表示语言,比较了语义 w e b 中知识表示和传统知识表示的不同,提出了语义w e b 知识表示的评价标准,界 定了本体的概念并介绍了本体在知识表示中的应用和语义w e b 的层次结构。 2 1 语义w e b 的概念 1 9 9 年t j mb e r n e r s l e e 创造性地将“超文本”这种技术应用于计算机网络, 从而直接促成了万维网( w o r i dw i d ew e b ) 的诞生。在此之前,互联网的重心是网 络互联本身,以e m a i 】、f t p 、b b s 、g o p h e r 等简单应用为主。随着网络带宽的发展 以及浏览器的出现,网页又成为利用网络共享信息的载体。可以说万维网的根本性 质在于它的普遍性。超文本链接的威力在于“任何东西都能与其它任何东西链接”。 因此,网络技术不会区分潦草的草稿与精细修饰的成品,不会区分商业信息与学术 信息,不会区分各种不同的文化、语言、媒体等等,也就是说,至今万维网都是作 为一个供人使用的文件的载体而不是作为一个可以自动处理数据与信息的载体而 极其迅速地发展起来的 1 2 。现在网页( h t m l ) 表现信息的方式多为自然语言、图 片、多媒体,这些适应于人们的阅读需求,却因其模糊特性和数据格式多样性而无 法被计算机理解,这就造成了信息孤岛的产生,信息之间缺乏内在联系、应用单调、 整个网绍呈现出被动的特征。 语义w e b 的目标就是要弥补这一缺陷。如果用面向计算机的数据来扩充网页, 同时加入仅供计算机阅读和处理的文件,就可以把万维网变成语义w e b ,从而有助 于信息的智能共享,并使网络能够提供动态与主动的服务。下面用一个经典的搜索 例子来说明语义w e b 的能力:今天的w e b 搜索功能通常会找到数不清的毫不相关的 “结果”,需要大量的手工过滤工作。例如,如果你用关键字“c o o k ”搜索,计算 机根本无法知道你是在找一位厨师,还是找有关烧菜的信息,抑或是其他什么名字 带有“c o o k ”的人、企业或其他什么,问题的根源在于“c o o k ”这个词对计算机来 说根本没有含义。如果语义信息在w e b 上广泛采用,那么“精细、准确和自动化” 的搜索就能够实现。这里的一个程序能够基于一些模糊的知识分类找到一个人:她 的姓是“c o o k ”,她是你的客户之一,她的儿子是你的大学校友。这些信息的组 合并不可能在单个网页中出现,但是语义信息能够让程序更容易分辨不同网页中的 元素,理解“m i k ec o o k 是w e n d yc o o k 的孩子”这样的关系,而且能够把他们结 合在一起。语义信息可以自动处理复杂的过程和事务。 第= 章语义w e b 今天的语义学与当年的超文本技术类似,t i mb e r n e r s l e e 以及他所领导的w 3 c ( w o r l dw i d ew e bc o n s o r t i u m ) 正致力于开发语义w e b 。t i mb e r n e r s l e e 提出的 语义万维网( s e m a n t i cw e b ) 的概念代表了一种全新的w w w 构架,在该构架下w e b 中提供的内容不仅被人浏览、阅读和获取,同时更重要的是这些信息可以被机器直 接或者间接地自动处理和解释。要实现语义w e b ,使枧器能够处理信息,首先必须建 立更高层次的互操作性标准。这些标准的共同目的在于表示网络甚至网络以外的知 识,属于知识表示的范畴。同时语义w e b 不是一个独立的网络,而是当前这个网络 的扩展。在语义w e b 中信息被赋予了明确界定的意义,从而能更好地使计算机和人 协调工作。把语义w e b 纳入现有网络结构中的首批步骤已经在着手进行之中。在不 远的将来,计算机处理并“理解”那些现今他们只能显示的数据的能力将会大大提 高,这样语义w e b 建设的进展就将有助于创造出引人往目的全新功能。 2 2w e b 的特征 毫无疑问w e b 是一个巨大的信息资源集散地,它的出现对于与人们获取信息的 方式有了一个巨大的改变,人们已经非常习惯从互联网中获取自己需要的信息。而 如何有效地获取信息,如何将互联网本身作为一个良好的交互工具却一直没有得到 解决,语义w e b 的目的就在于从根本上解决这个问题。 计算机跟踪通向关键术语的定义以及对这些术语进行逻辑推理的规范的超链 接,就可以发现语义数据的意义,这样所得到的基础结构将促进自动化网上服务( 如 功能强大的代理、内容监管,智能化的文件检索等) 的开发。 w e b 本身具有的一些特征在一定程度上会对语义w e b 中的知识表示提供一些思 路和限制,并最终决定语义w e b 能够达到什么样的高度,作者认为w e b 具有如下的 一些特征: ( 1 ) w e b 是分布式的,w e b 缺乏一些集中的控制机制,从而使它的发展和组织 结构不具有非常严格的体系,作者认为这是w e b 具有的最重要的特征,它直接 影响了语义w e b 的根本特性。例如,对于相同问题的描述,不同的w e bs i t e 会有不同的描述,无法苛求它们必须采用统一的词汇来描述,并且对同一个问 题可能会有不同的观点,同时,无法保证w e b 中的信息是一致的,甚至无法保 证w e b 中的信息是正确的。 第= 章语义w e b ( 2 ) w e b 是动态的,动态性主要表现在内容的增减和链接不可预测性地改变 这些改变对于力图获取信息的个人或者程序来说都会有至关重要的影响。 ( 3 ) w e b 信息是海量的,目前w e b 中存在的网页的数量已经超过了2 0 亿。 ( 4 ) w e b 是开放的,对于一个发现特定信息的a g e n t 而言,无法全部搜集到所 有需要的知识。 目前已经有适应于w e b 特征的一些知识表示方法,例如x m l ,r d f ,r d fs c h e m a 以及d a m l ( d a r p aa g e n tm a r k u pl a n g u a g e ) 和o i l ( o n t o l o g yi n t e r f a c el a y e r ) 。 下面将着重说明知识表示的概念以及传统的和w e b 环境下的知识,表示各自需要的 特性,以及w e b 知识表示方式是如何达到上述要求的。 2 3 知识表示 网络时代的智能系统应该能充分利用人类积累的丰富知识,组成智能系统群 组,共享知识,协同工作,以达到专家组智能水平。在传统智能系统中有多种知识 表示方法,语义网( s e m a n t i cn e t ) 是其中之一。语义网最初用于知识模型结构和 自然语言理解,随着研究的进展,人们逐渐认识到它是一种强有力的知识表示工具。 利用语义网的分块技术可以有效地表示逻辑关系和量词,适应逻辑演绎的需要,并 且能够比较有效地防止问题搜索的组合爆炸问题。在人工智能的研究领域中,知识 表示是重要的研究内容之一,而语义网作为知识表示的主要方法在自然语言的研究 过程中起到了重要的作用 1 3 。 目前摆在语义w e b 研究人员面前的任务是向万维网中加进逻辑,也就是运用规 则进行推理,选择行动路线以及回答问题时所依据的手段。这个任务的复杂性在于 它既涉及数学决策,也涉及工程决策。万维网的逻辑应当有足够强的功能,使其可 以描述目标的复杂性质,但它的功能又不应太强,以免a g e n t s 被弄得昏头昏脑儿 钻进牛角尖。幸运的事,我们希望表达的知识绝大部分都属于“六角头螺栓是一种 机器螺栓”之类的简单知识,这样的知识用现有的语言再加上略微多一点的词汇是 很容易表示出来的。 为了使语义w e b 发挥作用,必须向计算机提供访问结构化的信息集合和推理规 则集的路径,使计算机能够利用这些信息和规则来进行自动推理。这项技术被称为 “知识表示”。知识表示( k n o w l e d g er e p r e s e n t a t i o n ,k r ) 简单地说是“程序怎 样对现实世界建模”。更严格地说知识表示的研究范围应该是知识表示方法,研究 第一二章语义w e b 什么样的描述方式最有利于程序的自动处理和自动推理。多年的研究表明,一个好 的k r 语言必须具有以下特征 1 4 : ( 1 ) 足够简洁( c o m p a c ts y n t a x ) : ( 2 ) 语义严格性( w e l ld e f i n e ds e m a n t i c s ) : ( 3 ) 足够的表达能力( s u f f i cj e n te x p r e s s i v ep o w e r ) ( 4 ) 足够有效和强大的推理能力; ( 5 ) 可用于构建大型知识库。 目前已经知道在一个知识表示系统中,上述的特性是不能兼得的,尤其是上述 的( 3 ) 和( 4 ) ,当一个系统具有足够的表达能力的时候,总是无法期望获得非常简 单的推理算法,一个简单的例子是一个与一阶逻辑等价的知识表示系统中,就可能 存在无法断定的逻辑表达式( 一阶逻辑的半可判断性) 。不同的知识系统会根据不 同的应用需求有一个取舍,为了方便后续的讨论,下面给出一些简单的定义 1 5 。 定义1 :k r s ( i ) 为一个预先给出的知识表示,如框架系统。 定义2 :k b ( i ,j ) 为使用k r s ( i ) 表示的特定知识库,例如诊断系统中的知识库 j 表示特定的领域。 定义3 :r s ( i ,j ,k ) 为推理规则集合,为在已知知识表示k r s ( i ) 和知识库k b ( i ,j ) 的情况下定义的一个规则集合,对应于相同的知识表示和知识库,可能有不同的规 则集和r s ( i ,j ,k ) 存在。 定义4 :s a ( i ,j ,k ) 为一个软件代理,该代理在已知知识表示k r s ( i ) 和知识库 k b ( i ,j ) 和自身的规则集r s ( i ,j ,k ) 的情况下,能够对命题p 进行推理,验证p 是否 为真。 2 4 知识表示系统及其特征 2 4 1 传统的知识表示及其特征 最早的形式化的知识表示方法是语义网,语义网最初是在自然语言理解系统 中,为表达单词的意义而设计的一种表示方法,它实际是对知识的一种图表示法。 在语义网中,个体可以用图的一些节点表示,节点之间通过一组带有标记的弧连结, 带标记的弧表达了节点之间的关系。 第二章语义w e b 框架系统是另一种表示方法。框架( 相当于一个对象) 通常由描述事物的各个 方面的槽( 代表对象的属性) 组成,每个槽可以有个或多个槽值( 相当于对象的 属性值) 。这些槽值可以指向其它的框架。语义网和框架系统都是一阶逻辑的受限 形式,或者说是基于一阶逻辑的子集。 描述逻辑则是由上世纪8 0 年代中期的k l o n e 项目中产生的 1 6 。在描述逻辑 中,使用概念和角色来描述知识,任意表达式的语义在描述逻辑中都有个严格的 数学表示,这样就可以达到较好的计算性,也就是说,逻辑是可判定的而且易于处 理。 传统的知识表示一般都是在一个封闭的系统内进行,而且k r 研究者们常常假 设一个封闭的、集中的知识库,即给定k r s ( i ) 、知识库( i ,j ) 和规则库r s ( i ,j ,k ) , 并设计s a ( i ,j ) 使得任意命题p 可判定。显然在为这样的系统选择k r s ( i ) 时只需要 做到: 给定问题域d ,若命题p e d ,则p 在k r s ( i ) 中可描述 存在算法a ,命题p 可判定; 在系统内p 和! p 不能同时为真,其中! p 表示命题p 的否定。 显然,符合上述条件的k r $ 不需要很强大的描述能力。但是在w e b 的环境下 k r s 的选择就有很大的不同。 2 4 2w e b 知识表示的特征 w e b 具有分布式和开放性的特征,因此如果语义w e b 选择一个知识表示k r s ( i ) , 那么这个k r s ( j ) 需要有足够的表达能力,从而可以锝到k b ( i ,1 ) ,k b ( i ,2 ) , k b ( i ,n ) 各不同的知识库和r s ( i ,1 ,1 ) ,r s ( i ,1 ,2 ) ,r s ( i ,1 ,m ) ,r s ( i ,r l ,1 ) , r s ( i ,n ,2 ) ,r s ( i ,n ,1 1 1 ) 等规则集合。做一个简单的类比,可以将h t m l 作为 个k r s ,而所有的网站就是在该k r s 下不同的知识库。 由此可见,相比于传统的知识表示,问题发生了很大的变化 首先是描述对象无限制地膨胀,几乎所有的命题p 都需要在k r s ( i ) 中得到描 述,即k r s ( i ) 必须满足通用性的要求; 2 第二章语义w e b 其次,对知识的表示必须是与平台无关的,也就是说对软件代理而言,k b r ( ) 必须是一种“世界语”; 出现悖论或无法回答的问题,设p ( i ,n ,m ) 为命题p 在知识表示k r s ( i ) ,知识库 k b ( i ,n ) 和规则库r s ( i ,n ,j 】) 下软件代理s a ( i ,n ,m ) 的推理结果。由于描述对象的无 限膨胀,命题p 在不同的i ,a ,m 下可能取不同的值。甚至会出现命题p 对于某一个 软件代理是可判断的,而对于另一个软件代理是不可判断的情况。 这些变化不是由于知识表示k b r 而引起的,而是由于需要描述的现实世界本来 就充满了不可判定命题和不易处理的难题,因此不能指望通过k b r 的选择达到消除 的目的。但是语义w e b 必须有表示网络甚至网络以外的知识的能力,也就是说w e b 上所有的逻辑数据必须能够被直接或间接表达。不同的软件代理以不同的算法和不 同的规则集使用w e b 上的数据。因此摆在语义w e b 面前的挑战是,提供一种通用语 言,能同时表达数据以及根据数据进行推理的规则。这也是评价知识表示是否适合 语义w e b 的根本标准。当然,对此也有不同的看法,例如o r al a s s i l a 认为简洁和 容易理解是语义w e b 知识表示的选择标准。 2 4 3 语义w e b 中的知识表示 我们使用的两种知识表示方法是“可扩展标记语言x m l ”( e x t e n s i b l em a r k u p l a n g u a g e ) 1 7 和“资源描述框架r d f ”( r e s o u r c ed e s c r i p t i o nf r a m e ) 1 8 1 9 。 ( 1 ) 什么是x m l x m l 技术被称作是下一代网络计算的核心技术,是因为它能够按照定的语法 和词汇表定义各种专业知识,而且还能够以文本的方式在网络上传递,让各种联网 的计算机能够解释这些知识,并协同工作完成不同的计算任务。是一种与h t m l 类似 的标识语言,x m l 使每个人都可以做出自己的标识用作网页或网页上文本段的注解。 程序段可以通过较复杂的方式来利用这些标识,但是编写程序段的人必须了解编写 网页的人为每个标识规定的用处。简言之,借助x m l ,用户可以使他们的文件具有 任意的结构,x m l 与h t m l 不同的是,x m l 语言能把数据与数据表示( 例如界面) 分 开。这种特性能够让x m l 适合在网络上不同计算环境( 无论是不同的操作系统环境, 还是不同的设备显示方式) 中采用一致的信息表示方式。 ( 2 ) x m l 的特点 夺可在本地进行个性化计算和处理。在客户端处理数据,减轻了服务器端负担, 并且可根据不同用户的要求作相应的处理。 第= 章语义w e b 夺各种编辑操作非常方便。特别是支持对文档局部进行更新,减少了数据传输量。 夺广泛的适用性。支持多种应用环境,具有跨平台、跨空间和跨设备的优点,适 合网络传输。 夺表达知识能力强。与h t m l 不同,x m l 主要是描述数据本身而非数据的显示格式, 因此,它特别适合知识表示。 ( 3 ) x m l 带来的好处 夺更有意义的搜索 数据可被x m l 唯一的标识,没有x m l ,搜索软件必须了解每个数据库是如何构 建的。这实际上是不可能的,因为每个数据库描述数据都是不同的。例如:有了x m l , 电子书目就可以很容易以标准的方式按照作者、标题、i s b n 序号或其他的标准分类, 搜索书就变得十分方便。 审开发灵活的并e b 应用软件 数据一旦建立,x m l 能被发送到其他应用软件、对象或者中间层服务器做进一步 地处理,也可以发送到桌面用浏览器浏览。x m l 和h t m l 、脚本、公共对象模式一起 为灵活的三层w e b 应用软件的开发提供了所需的技术。 夺不同来源数据的集成 现在搜索多样的不兼容的数据库实际上是不可能的。x m l 能够使不同来源的结 构化的数据很容易的结合在一起。软件代理商可以在中间层的服务器上对从后端数 据库和其他应用处来的数据进行集成。然后,数据就能被发送到客户或其他服务器 做进步的集合、处理和分发。 夺多种应用得到的数据 x m l 的扩展性和灵活性允许它描述不同种类应用软件中的数据,从描述搜集的 w e b 页到数据记录。同时,由于基于x m l 的数据是自我描述的,数据不需要有内部 描述就麓被交换和处理。 夺本地计算和处理 1 4 第二章语义w e b x m l 格式的数据发送给客户后,客户可以用应用软件解析数据并对数据进行编 辑和处理。使用者可以用不同的方法处理数据,而不仅仅是显示它。x m l 文档对象 模式( d o m ) 允许用脚本或其他编程语言处理数据。数据计算不需要回到服务器就能进 行。分离使用者观看数据的界面,使用简单灵活开放的格式,可以给w e b 创建功能 强大的应用软件,这些软件原来只能建立在赢端数据库上。 夺数据的多样显示 数据发到桌面后,能够用多种方式显示。通过以简单开放扩展的方式描述结果 化的数据,x m l 补充了h t m l ,被广泛的用来描述使用者界面。h t m l 描述数据的外观, 而x m l 描述数据本身。由于数据显示与内容分开,x 乩定义的数据允许指定不同的 显示方式,使数据更合理地表现出来。本地的数据能够以客户配置、使用者选择或 其他标准决定的方式动态地表现出来。c s s (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论