基于RSS的新闻阅读器.doc_第1页
基于RSS的新闻阅读器.doc_第2页
基于RSS的新闻阅读器.doc_第3页
基于RSS的新闻阅读器.doc_第4页
基于RSS的新闻阅读器.doc_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

宁波理工学院毕业论文(设计)开题报告(含文献综述、外文翻译)题 目 基于RSS的新闻阅读器 系统架构和新闻浏览 姓 名 韩 波 学 号 3020811013 分院(系) 信息科学与工程分院 专业班级 02计算机科学与技术(1)班 指导教师(职称) 开题日期 2006 年 03 月 25 日文献综述内容随着互联网的发展,网络信息资源呈几何态势增加。信息资源日益丰富,用户查找所需信息越来越困难,即使借助搜索引擎工具,用户也要经常在所检索的信息中进行筛选。因此,我们一直处在网上“找”信息的时代。近年来出现的可扩展标记语言作为新一代互联网技术规范,其最大的特点是用户可以根据需要制订能够反映数据内容的标签,实现数据内容和数据表现方式的分离。目前,越来越多的网站开发使用XML,这使得将有用信息“推”向用户成为可能。RSS实现了这一功能,可使用户自动获取所需的相关信息。什么是RSS?比较普遍的说法有两种,一种是“Rich Site Summary”或“RDF Site Summary”,另一种是“Really Simple Syndication”,中文分别称作“丰富站点摘要”,“RDF站点摘要”和“简易信息聚合”。RSS是某一站点用来和其它站点之间共享和同步信息内容的一种简易方式。网络用户只要使用支持RSS的新闻聚合工具软件,就能在不打开某个网站页面的情况下阅读支持RSS输出的网站内容,并可以方便地实现对某类信息的全程跟踪、即时更新以及网上搜索。在不远的将来,RSS作为一种全新的资讯传播方式,势必对互联网上的信息接收与发布、新闻出版、电子商务、互动交流等领域产生难以估量的影响。RSS技术诞生于20世纪90年代后期,当时的网景公司(Netscape)定义了一套描述Microsoft公司的IE(Internet Explorer)中的“新闻频道”的语言,用于将网站的信息内容投递到Netscape Navigator互联网浏览器中,这就是RSS。但由于当时网景公司经营环境每况愈下,加之互联网的信息内容匮乏,它在发布了一个0.9版本的RSS规范之后,并没有将研发工作继续下去。2001年,著名的博客戴夫温那(DaveWiner)的公司UserLand接手RSS技术标准的发展工作,并把它作为其博客写作软件的基础功能之一,陆续推出了0.92、0.93和0.94版本。随着网络博客的流行,RSS作为一种基本的功能也被越来越多的网站和博客软件支持。随着RSS技术的应用越来越广泛,许多行内专业人士认识到建立一个通用、标准的RSS规范的必要性。2001年,一个联合小组在0.90版本RSS的开发原则下,根据W3C新一代的语义网技术RDF(Resource Description Framework)对RSS进行了重新定义,发布RSSl.0,并将RSS定义为“RDF Site Summary”。但是这项工作并没有与UserLand进行有效的沟通,UserLand并不承认RSSl.0的有效性,戴夫温那坚持按自己的设想开发RSS的后续版本。UserLand于2002年9月发布了最新版本RSS2.0,并将RSS定义为“Really Simple Syndication”。由于双方的分歧和各自的广泛应用,目前RSS分化为RSS 0.9x2.0和RSS1.0两个阵营,尚没有一个统一、通用的标准化组织的标准1。2004年,美国迎来了RSS的术的飞速发展期。据不完全统计,到2004年年底美国RSS用户数已近千万,而提供RSS订阅服务的网站超过了20万个,短短三年增加了近150倍。英文网站的变化也对国内站点起了潜移默化的影响,那个代表RSS订阅的红色“XML”标记已经越来越多地出现在中文站点上,甚至新华网和新浪这样的传统门户网站也抛开了对新技术的顾虑,投入了RSS的怀抱。目前由“看天下”整理的中文RSS地址目录中大约有500家网站提供了RSS内容。那么RSS是如何工作的,现有的RSS新闻阅读器又是怎样一个状况呢2?您一般需要下载和安装一个RSS新闻阅读器或汇集器,然后从罗列成千上万网站的目录列表中订阅您喜爱的网站的内容。 一旦登录后,您将看到所订阅的每个频道的最新内容新闻标题、摘要,而且有时看到完整的报告和少许照片。你甚至可以点击链接直接进入那个网站,找到新闻的最初来源地。许多RSS软件运行在Web浏览器内部,而另一些则是独立的程序。而且多数程序是免费的。目前国外比较流行的RSS浏览器有FeedDemon、SharpReader、RssReader等,国内比较流行的RSS阅读器有看天下、周博通、新浪点点通。FeedDemon对于初次使用RSS的新手来说是一款不错的入门级RSS阅读器,该软件有多个版本,可以选择使用简体中文版,另外该软件是共享软件,没有注册可以免费体验20天。看天下RSS阅读器是上海玉珀电子科技开发的第一款国人自主版权的RSS阅读器。2003年韩籍华人尹颢等人回国组建团队,由玉珀公司COO兼CTO蔡建新带领技术团队开发看天下RSS阅读器并推出看天下RSS内容聚合网站。该公司致力于开发基于RSS的深度应用,其产品已经在证券等多个行业得到采用。最初蔡建新需要不停地给人解释什么叫“推”技术,后来他简单称看天下阅读器为“网络投递员”。作为中国RSS技术和服务的第一品牌,从2004年4月推出以来,看天下网络资讯浏览器总下载人数突破30万。“看天下”作为国内首屈一指的专业RSS技术开发和服务提供商,不断在产品开发和深化服务方面努力开拓,继推出看天下RSS综合服务体系门户网站()之后,又于近日推出了新版看天下网络资讯浏览器v3.0软件。新版网络资讯浏览器v3.0是一款集信息聚合和内容管理于一身的专业软件。它在以前版本的特色功能基础上,又进一步优化了系统结构,提高了系统响应速度并降低了系统资源占用。在此基础上,还增加和完善了文章管理、程序灵活配置、OPML导入和导出、动态OPML管理、RSS文章过滤、RSS文章搜索、重要文章标记、Windows 98操作系统支持、程序自动远程升级等众多精彩功能,并设计了更加友好的用户界面和操作菜单,以及预装了更多的中文精品内容。周博通是来自海南的一款个人软件,具有自主知识产权,据说目前正在注册公司运作。周博通是目前国内较流行的免费RSS阅读器,其中内置了新华网、天极网、计算机世界等近百个RSS频道。新浪点点通阅读器是为新浪点点通量身打造的一款RSS阅读器,是新浪官方开发的一款软件,其中内置了新浪所有的RSS频道。RSS技术主要应用在以下几个方面3:1 改变网民的浏览方式 在今天,人们已经习惯了打开IE,通过门户网站、搜索引擎获取新闻资讯。然而,随着RSS技术的出现和推广,这不再是唯一的浏览方式。一些网民不再花费大量的时间在互联网上冲浪和下载新闻,而是利用RSS自动收集和组织定制新闻信息,直接传送到个人计算机上,实现“像收邮件一样收看新闻”的效果。有人甚至认为,在不久的将来,互联网很可能面临自WWW出现之后最大的一次革新,IE将成为一个历史名词而取代者正是RSS。2 个人信息发布更为简易 近年来,网络博客的迅速兴起,使得个人信息发布变得异常简单。如今,随着RSS技术的普及和广泛应用,网络博客的发展势必能再上高峰。在Blog引入RSS功能后,Blogger在书写时,可以将所引用的网络文献做成超级链接,并且增加链接网址的简介,此时书写的方式就成了一种索引。阅读者可以选择自己感兴趣的链接文章浏览,于是在同一篇文章下,不同的阅读者组织了不同的文章架构。另外,所链接的网页如果有所更新,将立即在主文章架构下得到反映,并主动更新到订阅者的计算机中。Blogger也可以实时接收到阅读者的反馈,并迅速作出回应。在RSS的帮助下,个人发布信息的手段变得更为简易,更为快捷,读者群更大,影响更广。3 RSS在电子商务上的巨大应用潜力 美国市场调查数据统计公司Mear keter日前评出了2005年期间电子商务的十大新走向,其中RSS位居第二。分析家认为,2005年将是RSS迎来大发展的一年。RSS技术在网络广告、电子出版、企业信息管理、电子商务等领域的应用,将为企业带来无限的商机。RSS聚合新闻对网络媒体发展带来相当大的影响。其中,有利也有弊4。(1)解决内容同质化。目前,国内新闻站点之间相互转载内容非常严重,一方面是同质化的衰败,另一方面则是对知识产权的不尊重。采用RSS方式来共享内容,转载的网站只复制文章的标题和简介,而正文则通过超级链接指向新闻源的原始网站。(2)改变甚至颠覆现今网络媒体的生存方式。用户利用RSS阅读器就可以方便地读到送上门来的新闻,而无需到各家网站逐一浏览。RSS技术依赖于机器的智能化自动处理,对于现在很多网站的“拷贝+粘贴”模式是一个挑战,甚至带来灭顶之灾。不过,据中国人民大学新闻学院彭兰副教授分析,它也会使网络新闻在时效性、丰富性方面的竞争转向权威、深度及专业化方面的竞争。网络新闻会出现两种模式,一种是“快餐式”,这是RSS等机器新闻的特长,另一种是“大餐式”,更讲究“营养”,而这是人工新闻的特长,它们会一起互补地满足市场的需要。(3)流量损失和访问减少。这是如今一站式新闻和RSS新闻订阅两者共存背景下网络媒体遭遇的最大问题。虽然在新闻网站上同样能够看到具备过滤和简化形式的标题新闻乃至摘要索引,但显然没有在RSS阅读器中自动分门别类地汇总在一起更为节时简约,更有主动性。这种文摘式信息、客户端的内容获得必会使得新闻网站面临流量损失和访问减少,从而影响网站排名、内容决策乃至经营业绩等战略问题。(4)广告经营、利润模式的相对虚弱。RSS不支持弹出式广告、F1ash等多媒体插件,这也使得门户网站操作RSS时多少还有点前瞻后顾。而对于重点新闻网站来说,这却成了没有包袱的优势所在,新闻内容本身就有优势,而网站运营大多数都才刚刚起步,还没有明确的盈利模式,更谈不上完全依赖用户而获得创收,因此正好可以借机尝试新的非用户级的业务拓展和经营理念。RSS目前在信息源类和搜索引擎类的网站中有较多的使用,例如博客网“网民使用RSS无需从各家网站逐一浏览新闻”,这对现在很多网站的“拷贝+粘贴”手段模式是一个挑战,甚至带来灭顶之灾,RSS究竟是新闻聚合标准,还是未来互联网的发展趋势? Google、百度等等,也因为节省成本的免编辑新闻模式而被大量的新兴网站当作力推的重点。但RSS在新闻网站的使用才刚刚开始,当简单的信息收集与分类工作已被机器承担时,网络新闻业务的模式将向何方发展,这是所有新闻网站都不可回避的问题。RSS技术就像一把双刃剑,需要抓住机会、因势利导。如今“RSS新闻聚合”带来的冲击就使得各新闻网站回归传统新闻价值、进一步打造品牌栏目等势在必行,而这些原创的独家的人工新闻才是RSS时代网络媒体的核心竞争力所在。像新华网在去年奥运期间推出的奥运五大栏目RSS服务,各地的地方重点新闻网站的地域新闻就是一块很有竞争力的品牌栏目。多了RSS这个管道,媒体与网络读者的关系出现巨变,双方可能不再直接接触,目前国内网络媒体普遍对此表现冷漠。而更重要的也是被很多人忽视的是,新闻网站如何根据自身特点来优化分类信息和索引设置,并不一定要将网站内所有频道的新闻信息拿来RSS,要避免内容同质化的恶瘤又蔓延到RSS上。经过近几年的迅猛发展,如今各新闻网站基本都已经形成了各自不同各有特色的品牌和拳头栏目,这些才是真正符合个性化定制的新闻信息5。RSS全新的新闻聚合服务将使互联网用户能够控制他们的内容,迫使依靠内容获得用户的门户和电子商务网站重新考虑它们的业务方法,这也使得门户网站操作RSS多少还有点前瞻后顾。目前RSS已经在网站的最新消息方面得到了广泛的采用,RSS feed已经成为网络上重要资源,免费的开放的RSS搜索引擎和RSS桌面聚合工具也已经出现。RSS是一种既简单又实用的技术,它所提供的Web内容联合方案可行并且已经在实行。开题报告内容一 选题的背景与意义随着以RSS为代表的信息推广技术被广泛的应用于新闻媒体传播、产品信息发布、博客文章共享等网络应用领域,“信息聚合”这个概念越来越深入人心。“信息聚合”使用户更方便和高效地从互联网上实时收集各种有用信息,并在统一整合的界面中阅读和管理。这就是RSS阅读器。用RSS阅读器你不再需要不厌其烦地辗转于各个博客站点和逐一访问感兴趣的新闻网站只需在软件上订阅这些网站的RSS频道,RSS阅读器将为你读取最新的文章或新闻的标题与简介,你觉得感兴趣以后再下载阅读全文。RSS阅读器又称为新闻聚合器或者是新闻阅读器。它除了可以聚合管理和阅读各个RSS频道的内容以外还可以在各频道的内容中进行搜索。目前,绝大多数的国外大型新闻网站和国内的新浪新华网等网站都提供RSS新闻频道。对网民而言: RSS新闻阅读器没有广告或者图片来影响标题或者文章概要的阅读。RSS阅读器自动更新你定制的网站内容,保持新闻的及时性。用户可以加入多个定制的RSS提要,从多个来源搜集新闻整合到单个数据流中。对网站而言:RSS新闻阅读器扩大了网站内容的传播面,也增加了网站访问量,因为访问者调阅的RSS文件和浏览的网页,都是从网站服务器上下载的。RSS文件的网址是固定不变的,网站可以随时改变其中的内容。RSS内容一旦更新,浏览者看到的内容也随即更新了。二 研究的基本内容与拟解决的主要问题1. 总体系统架构1.1 总体而言将整个软件的功能分为以下五个方面:(1)对网页RSS FEED进行解析,得到频道。(2)对频道进行管理。(3)通过对频道进行刷新,得到新闻项并在软件新闻项列表上将新闻项显示出来。(4)在软件浏览器上将所要阅读的新闻的简要概括,连接地址或者全部文章显示出来。(5)对新闻项的内容进行管理,该功能主要和数据库结合实现。 (6)个人blog管理,包括撰写个人网络日志以及上传到相应的博客站点上。1.2 将系统分解为若干子系统,如下:(1)RSS文件解析:解析RSS Feed文件,从中提取新闻频道;(2)系统设置:对网络、系统参数、数据库的设置;(3)频道管理:通过URL或OPLM新建频道;新建频道组以及对频道组的管理;频道刷新包括对全部频道的刷新和指定频道的刷新,刷新之后得到新闻项,将新闻项存入数据库之后在新闻项列表里将各条新闻项显示出来;频道导出。(4)内容管理:显示新闻项;标记新闻项,包括把新闻项标记为已读,未读,重要;签的新建和删除;对新闻项加标签;通过标题或关键字进行搜索。(5)个人blog管理:新建日志,生成/修改日志,浏览日志,查询日志,生成XML页面;1.3 如此分解系统原因:(1)各模块各自独立,分别都可以独自运行,使软件易维护、扩展和复用;(2)各子系统协调工作,从而实现原系统的功能:子系统之间遵循相同的规范,接口;1.4 系统总体框架如图所示RSS新闻阅读器系统设置个人blog管理内容管理频道管理基本设置数据库管理生成页面上传参数设置新建日志生成修改日志浏览查询日志标题或关键字搜索新闻项加标签新建删除标签标记新闻项显示新闻项导出频道刷新频道新建频道组新建频道2. 系统界面设计2.1 导航栏:频道管理,内容管理,系统全局设置,查看,帮助。2.2 工具栏:新建频道,添加到我的频道,删除频道,刷新所选频道,刷新全部频道,系统设置,搜索,删除新闻项。2.3 频道树:订阅频道,推荐频道,内容管理2.4 新闻项列表:新闻项标题,取回时间,出版时间,作者,所属类别。2.5 新闻项浏览器:最小化,最大化,关闭。3. 浏览器的设计根据对RSS FEED进行解析,得到新闻项,然后将新闻项的连接地址抓取过来,在浏览器中显示新闻项相关信息和连接地址,通过点击地址,访问新闻来源的网页,也可以将整个文章显示出来。4.系统全局设置4.1基本设置:启动初设:程序启动(系统启动时,立即更新所有频道;系统启动是,立即更新所有的动态OPLM;系统启动时,打开最近一次浏览的频道;系统以最小化方式启动;Windows启动时,同时启动系统;)。消息提示(频道中收到新的新闻项时,显示消息提示窗口,仅当主界面隐藏时显示提示窗口)。界面控制(点击主截面最小化按钮时隐藏主截面,点击主界面关闭按钮隐藏主截面)添加频道:添加频道时,需要对频道源的有效性进行检测;添加频道时,同时启动自动发现引擎。删除确认:删除频道组时需要用户确认;删除动态OPLM时需要用户确认;删除频道时需要用户确认;删除新闻项时需要用户确认,删除重要新闻项时素要用户确认。浏览新闻项:单击设置(单击新闻项浏览描述文字内容,如描述文字为空,则直接浏览详细内容页面;单击新闻项直接浏览详细内容页面)。双击设置(双击新闻项直接浏览详细内容页面,在新的TAB窗口打开详细内容页面,在当前TAB窗口打开详细内容页面,使用程序外部的浏览器打开详细内容页面)4.2参数预设:频道更新:更新方式(自动间隔更新,手动更新);更新频率。本地新闻项:限制本地存储的新闻项最大数目(在本地最多保留的新闻项数,多余的新闻项处理即是否直接删除)。5. 拟解决的问题目前流行的几个RSS新闻阅读器主要存在两方面问题:第一,对有的RSS源无法解析;针对这个问题,分析其主要原因是现在流行RSS版本不统一主要在用的有RSS1.0和RSS2.0。那么只要阅读器能对1.0版本和2.0版本都能解析了,那么问题就解决了。第二,运行RSS新闻阅读器软件时,CPU资源消耗过大,对计算机其他工作影响比较大。CPU资源消耗过大主要是因为阅读器刷新的比较频繁。解决这个问题,主要采用对频道树进行有选择的优先刷新方法。因此,在开发本软件时,在实现基本的功能外,还应解决两方面关键问题。三 研究的方法与技术路线RSS是基于XML标准的信息发布“推”技术。对用户而言,可以用专门的RSS阅读器选择,获取,和随时更新所有支持RSS格式的原始信息,而不存在任何的“中间商过滤”。RSS阅读器就是在用户终端的信息“聚合器”,使用户第一次可以对互联网的内容进行完全自主的配置,收集,筛选,和管理。“推”的含义就是当发布者有最新信息时,会自动向订阅的用户“推”出该信息,而毋需用户每天浪费大量时间在多个网站间跳跃,寻觅。对信息发布者而言,RSS聚合技术和阅读器提供了前所未有的达到广大用户的直接渠道,开拓了更公平的市场空间,使发布者可以集中更多精力做出最佳,最及时的信息。采用VC+6.0开发平台,基于RSS技术,通过对RSS FEED网页的解析,实现频道管理,采用SQL后台数据库,实现对频道,新闻项,内容的管理。最终实现新闻阅读器软件。在总体框架上,基本采用“看天下”新闻阅读器的模式。四 研究的总体安排与进度3月20号4月1号完成总体框架设计。4月1号4月5号完成总体界面设计。4月6号4月10号完成浏览器设计。4月11号4月25号完成系统全局设置。4月25号4月30号完成浏览器和系统全局设置的测试。5月1号5月20号对总体软件进行修改,完善。五 主要参考文献1 申凡,陈奕奕.聚合新闻:由“e化”到“易化”的跨越试析网络新闻发展的新趋势J.2005,2(7):1619.2 唧唧歪歪.改变浏览方式的RSSJ.在线技术,2005,7:6263.3 张会娥.RSS的应用研究J.图书馆杂志,2005,2(24):5358.4 易海燕.用好RSS双刃剑EB/OL.,2005-08-08.5 江泽文,李桂蓉. 即将到来的互联网新革命J.全国新闻核心期刊,2005,4647. 外文翻译稿RDF入门1摘要资源描述结构(RDF)是在万维网里代表关于资源信息的一种语言。本文献被用于为读者提供有效地使用RDF的基础知识。它介绍RDF的基础概念并且描述它XML语法。它描述怎么使用RDF词汇描述语言来定义RDF词汇, 和给一些部署的RDF应用概要。本文献也描述其它RDF 规格文件的内容和目的!2介绍资源描述结构(RDF)是在全球信息网里描述关于资源信息的一种语言。资讯科技特别能表现关于网络的资源,譬如标题,作者,网页的修改日期,版权和关于网络文件的许可证信息, 或某一共享资源的有效性日程表。但是,通过归纳网络资源的概念, RDF也能用来表现关于能在网络上被识别的事物资讯,即使当他们不能够直接地在网络上被取回。例如数据传递包括从在线的购物设备(举例来说,关于规格,价格和有效的资讯)得到的关于项目的资讯,或网路使用者的偏爱描述。RDF比较适用于当信息需要被申请处理的情形,而不只是简单的向人们显示。RDF提供表达这些数据通常的架构,因此它能在没有改变原意的申请之间被交换。既然它是一个普通的结构,那么程序软件设计者就能杠杆式的利用普通RDF语法分析器的有效性和处理工具。在不同的申请之间的交换数据的能力意思就是数据可能除了它本来被产生之外还能被申请使用。RDF以识别使用网络标识符(叫做了统一的资源标识符, 或 URLs)的事物概念为基础,并且根据简单的特性和财产评价描述资源。这使RDF能够表述象弧曲线图图这样的资源。RDF 也提供以可扩展标示语言为基础的语法(叫做了RDF/XML)用于记录和交换这些曲线图。注RDF/ XML也包含URLs,连同像邮箱和全名(在一种被缩写的形式中)以及他们的各自的价值 。像HTML,RDF/ XML是机器可处理的,使用 URIs,能联编通过网络的数据。然而,不像传统的超媒体,RDF URIs能涉及任何的可以确认的事物,包括不可能是直接可以在网络上取回的事物。结果是,除了描述如网络页的事物之外,RDF也能描述汽车,生意,人,新闻事件, 等等除此之外,RDF有他们自己的URLs,精确地识别在被联编的项目之间存在的关系。该文献预计提供对RDF的介绍和描述一些现有的RDF应用软件, 为了帮助数据库设计者和软件开发者了解RDF和如何使用他们的特征。特别是入门书预计回答了以下几个问题:1.RDF看起来像什么?2.RDF能表现什么数据?3.RDF数据是如何被产生,存取和处理的?4.现有的数据如何能被和RDF结合?该文献是一份非标准的文件,意谓它不提供一件RDF的限定规格。该文献的例子和其他的说明材料被提供用来帮助读者了解RDF, 但是他们不可能总是提供权威性的或者完美的答案。 在这样的情况下,RDF规格的有关标准部份应该被请教。为了在做这方面提供帮助,该文献扮演了描述这些其他的文件RDF的完全规格的游戏的角色, 而且提供指向标准的规格有关部份的联编。同样需要被关注的是,这些RDF文件在先前做了更新和澄清,出版RD规格,资源描述结构(RDF)和语法规格RDF-MS和资源描述结构(RDF)轮廓规格1.0RDF-S. 结果,已经存在了一些在用辞,语法和观念方面的改变。因此,熟悉较旧规格的读者, 和由于较早的个别指导和以他们为基础的介绍文章,应该注意在现在的规格和那些早先的文件之间可能有不同。追踪文件RDFISSUERDF议题能为一连串的关于早先的RDF规格议题,和他们在现在规格上的决议。RDF 以这样的概念为基础,被描述的事物是有价值的特性,通过陈述能够被描述的资源,类似以上那些被指定的特性和价值。RDF用一种特别的术语谈论陈述的各种不同部份。特别是识别关于陈述是的事物部份被称为主题。识别财产或陈述叙述(创作者,创造-日期, 或这些例子的语言)的主题特性的部份叫做述语,而且识别特性价值的部份叫做物体。3RDF 模型既然RDF使用URIrefs代替用字来命名陈述的事物,RDF引用一组URIrefs作为一个词汇。 在这类词汇中,URIrefs经常被组织,以便他们能被表现的如通常使用的一组前缀QNames 。换言之,通常的namespace URLref将会因为一个词汇的所有术语而被选择, 有代表性地是一个URIref 是在任何人正在定义词汇的控制之下。被包含在词汇里的URIrefs在藉由为目的通常URIref附加个别的地方名字被形成。这中形式用通常的前缀形成一组URIrefs 。 使用普通的URI前缀为一组相关的固定词语提供了一个方便的方法来组织URIrefs。然而,这只是一个协定。RDF模型只认可完整的URIrefs;它没有“往内部看”URIrefs或者使用对他们的结构任何的知识。尤其是,仅仅因为他们有通常的第一位前缀,RDF 不假想在 URIrefs之间有任何的关系。而且,有说由于不同的第一位前缀的URIrefs不能够被考虑相同的字汇部份的无。一个特别的组织,程序,工具,等等都能定义一个对它来说是重要的词汇,以来自若干的其他字汇的 URIrefs 作为它的词汇的部份。 除此之外,有时一个组织将会以字汇的namespace URLref作为提供关于那一个字汇的进一步的资讯网络资源的网址。 在RDF陈述中的对象可能是URIrefs, 或者是由字符串描述的常量(被称为文字的),为了要表现特定类型的值。文字的不可能被当作RDF陈述的主题或述语使用。在画RDF曲线图方面,URIrefs 的节点被显示为椭圆而文字的节被显示为盒子。 既然 RDF 使用 URIrefs 代替字命名陈述的事物,RDF提及一组URIrefs(特别地组为一个特定的想要的目的的特别地组)如一个词汇。时常,在这样的词汇里的URIrefs被组织,以便他们能被表现如使用通常的一组前缀QNames 。换句话说,通常的一个namespace URIref 将会因为一个词汇的所有条件而被选择, 典型地一个在任何人控制之下的URIref就是在定义词汇。这用通常的前缀形成一组URIrefs 。RDF以URIrefs作为RDF陈述的述语。 换句话说, 不是使用字符串(或字), 像“创作者” 或“名字”识别,RDF使用URIrefs。使用URIrefs识别特性对一些推论是重要的。首先,可能从不同特性区分一个人,其他人也可能被同样的字符串识别。以URIrefs作为RDF陈述的主题,述语和对象支持了在网络上的发展和分享的字汇使用,因为人能发现而且开始使用字汇已经被其它用描述事物,反映那些观念的被分享的理解。当然,来自一个特别的字汇的URIrefs能被用于的RDF陈述,即使一个给定的申请可能无法与他们的特别意义发生联系。举例来说,一般的RDF软件会认可上述表达的一份RDF陈述。资讯科技不会简单的跟任何特别意义的三倍数联合因此词汇开发者可能和URIref联合。而且,基于他们的一个给定的词汇的理解, 人们可以写RDF申请给符合被指定给来自那一个字汇的 URIrefs的特别意义行为表现,即使意义将不对不被那样写的RDF申请是可接近的。4.RDF 的可扩展标示语言语法: RDF/XML RDF概念上的模型是一个曲线图。为了写下和交换RDF曲线图,RDF提供了可扩展标示语言语法,叫做了RDF/XML语言。RDF/XML是写RDF的标准语法。RDF/ XML在RDF/XML语法规RDF-语法中被定义。RDF/XML用基本概念来编码一个RDF图表作为XML的原理属性,元素内容和属性值URIrefs的述语(连同一些节点)被写成XML QNames,有表示namespace URI的短前缀,连同一个表示一个合格域名的元素或属性的局部名字一起,如他们形成最初的节点或述语的URIref的双被选择以便如锁链般连续的附录 B. 所描述。当可扩展标示语言归于价值的时候,服从节点的 URIrefs 被写。(物体节的URIrefs可能有时恐怕最好被写如属性价值)文字的节(总是反对节)变成元素本文内容或属性价值。(大部份这些选项稍后在入门书中被描述; 所有的这些选项在RDF-语法中被描述)。RDF/XML语法提供若干的缩写词使通常的使用变成更容易写。举例来说,相同的资源同时与一些特性和价值一起描述是典型的。RDF/XML提供一些方法来表现包含空白的节点曲线图。这些全部在RDF-语法中被描述。例如,一个最直接的方式是分配一个空白的节点标识符到每个空格节点。一个空白的节点标识符服务在特别的 RDF/XML里面识别一个空白的节点文件。但是,不像URIref,在它被分配的文件的外面是未知的。一个空白的节点在 RDF/XML中被提到使用nodeID 属性,藉由如它的价值一个空白的节标识符,在资源的URIref中会以别的方式出现。明确地,如它的主题和一个空白的节一份陈述能在RDF/XML被写使用rdf:和rdf的描述元素:nodeID归于代替rdf:有关属性的事。同样地,如它的物体和一个空白的节一份陈述能被写和rdf一起使用一种特性元素:nodeID归于代替rdf:资源属性。一个缩写的XML实体的使用在RDF/XML中是可选择的,而且在RDF/XML中XML DOCTYPE 声明的使用也是可选择的。(因为读者熟悉的的是XML,RDF/XML是“很好地-形成”XML所必须的。RDF/XML没有被设计成一个确认XML处理器对抗一个文件格式定义有效。)。 虽然写RDF/XML的另外被缩写的表格是可得的, 但是到现在为止列举的工具所提供的只简单的一般的方法就能表达RDF/XML曲线图。使用这些工具, 一个 RDF 曲线图被依下列各项写在 RDF/XML里:所有的空白节点被分配空白的节点标识符。 每个节点依次被列出来。比较对一些更多缩写了在 RDF-语法 中被描述的方法, 这种简单的方式是提供真实的曲线图结构的最直接的表现 , 而且特别地被推荐给申请在输出RDF/XML是被用于较进一步的 RDF处理。5. 其他的RDF能力 RDF还提供若干个附加的能力, 例如内置类型,描述一组资源的特性,RDF陈述和表现XML片段价值的能力。 时常有需要描述群体的事物:例如,说共同创作了一本书被一些作家,或列出课程的学生, 或列出一个里的软件组件。RDF提供一些被预先定义(内建的)类型和能用来描述如此的团体的刀具。RDF 应用软件有时需要描述使用RDF的其他RDF陈述,举例来说,记录关于当陈述被创下的时候的信息,谁制造了他们, 或其他的相似数据.(有时这被称为 “起源” 数据) 有时特性价值需要的是一个可扩展标示语言的碎片,或可能包含可扩展标示语言涨价的本文。举例来说,一个出版者可能维持RDF元数据包括书和文章的名称。如此的名称时常是仅仅是简单的特征直线,不过这不会总是这种情形。举例来说,关于数学的书名称可能包含可能被表现使用MathMLMATHML的数学公式。6. 定义RDF词汇:RDF轮廓RDF 提供一个表达关于资源的简单陈述的方法,使用命名了的特性和价值。然而,RDF使用者团体也需要定义他们想要在那些陈述中使用的字汇的能力,明确地说,就是指出他们正在描述资源的特定类型或种类, 而且将会在描述那些资源方面使用特定的财产外文原稿RDF Primer1. AbstractThe Resource Description Framework (RDF) is a language for representing information about resources in the World Wide Web. This Primer is designed to provide the reader with the basic knowledge required to effectively use RDF. It introduces the basic concepts of RDF and describes its XML syntax. It describes how to define RDF vocabularies using the RDF Vocabulary Description Language, and gives an overview of some deployed RDF applications. It also describes the content and purpose of other RDF specification documents.2. IntroductionThe Resource Description Framework (RDF) is a language for representing information about resources in the World Wide Web. It is particularly intended for representing metadata about Web resources, such as the title, author, and modification date of a Web page, copyright and licensing information about a Web document, or the availability schedule for some shared resource. However, by generalizing the concept of a Web resource, RDF can also be used to represent information about things that can be identified on the Web, even when they cannot be directly retrieved on the Web. Examples include information about items available from on-line shopping facilities (e.g., information about specifications, prices, and availability), or the description of a Web users preferences for information delivery.RDF is intended for situations in which this information needs to be processed by applications, rather than being only displayed to people. RDF provides a common framework for expressing this information so it can be exchanged between applications without loss of meaning. Since it is a common framework, application designers can leverage the availability of common RDF parsers and processing tools. The ability to exchange information between different applications means that the information may be made available to applications other than those for which it was originally created.RDF is based on the idea of identifying things using Web identifiers (called Uniform Resource Identifiers, or URIs), and describing resources in terms of simple properties and property values. This enables RDF to represent simple statements about resources as a graph of nodes and arcs representing the resources, and their properties and values. Note that this RDF/XML also contains URIs, as well as properties like mailbox and fullName (in an abbreviated form), and their respective values , and Eric Miller.Like HTML, this RDF/XML is machine processable and, using URIs, can link pieces of information across the Web. However, unlike conventional hypertext, RDF URIs can refer to any identifiable thing, including things that may not be directly retrievable on the Web (such as the person Eric Miller). The result is that in addition to describing such things as Web pages, RDF can also describe cars, businesses, people, news events, etc. In addition, RDF properties themselves have URIs, to precisely identify the relationships that exist between the linked items. This Primer is intended to provide an introduction to RDF and describe some existing RDF applications, to help information system designers and application developers understand the features of RDF and how to use them. In particular, the Primer is intended to answer such questions as:What does RDF look like? What information can RDF represent? How is RDF information created, accessed, and processed? How can existing information be combined with RDF? The Primer is a non-normative document, which means that it does not provide a definitive specification of RDF. The examples and other explanatory material in the Primer are provided to help readers understand RDF, but they may not always provide definitive or fully-complete answers. In such cases, the relevant normative parts of the RDF specification should be consulted. To help in doing this, the Primer describes the roles these other documents play in the complete specification of RDF, and provides links pointing to the relevant parts of the normative specifications, at appropriate places in the discussion.It should also be noted that these RDF documents update and clarify previously-published RDF specifications, the Resource Description Framework (RDF) Model and Syntax Specification RDF-MS and the Resource Description Framework (RDF) Schema Specification 1.0 RDF-S. As a result, there have been some changes in terminology, syntax, and concepts. This Primer reflects the newer set of RDF specifications given in the bulleted list of RDF documents cited above. Hence, readers familiar with the older specifications, and with earlier tutorial and introductory articles based on them, should be aware that there may be diff

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论