037网检补充Convertor_第1页
037网检补充Convertor_第2页
037网检补充Convertor_第3页
037网检补充Convertor_第4页
037网检补充Convertor_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、补充RSS与Atom 主要内容7.1 RSS概念 7.2 RSS发展7.3 RSS基本内容7.4 Atom概念7.5 Atom发展7.6 RSS与Atom区别7.7 RSS阅读器小结上机实训7.1 RSS概念 通用搜索引擎缺点:1. 关键字进行的搜索可以得到动辄几十万的网页搜索结果而其中真正对用户有用的信息占的比例非常低,需要进行大量的人工筛选工作。2. 由于互联网中的网站数量庞大,通用搜索引擎对于一般网站的更新周期很长(例如Google对一般网站的平均更新周期为3个月)。如果用户要求信息具有时效性(例如气象信息,企业资源信息)那么利用上述方法搜索到的信息就失去了价值。 7.1 RSS概念 R

2、SS源头:Rich Site Summary(丰富站点摘要) RDF(Resource Description Frame) Site Summary”(资源描述框架站点摘要) Really Simple Syndication(真正简单聚合) 7.1 RSS概念 RSS是一种描述和同步网站内容的格式,也是站点用来和其他站点之间共享内容的简易方式(也叫聚合内容),它是目前最广泛的XML应用,RSS使XML成为彼此共享内容的标准方式。典型的RSS订阅标志 7.2 RSS发展 RSS是由Netscape公司推出的定义一套描述新闻频道的语言。 为了简化0.90版本的复杂的RSS规范,Netscape

3、公司之后又推出了一个简化的RSS 0.91版本。 到2001年Netscape公司还没有发布一个正式的RSS规范。 微软也推出了一套支持自己IE的CDF (Channel Definition Format)数据规格,但是却与RSS非常接近。 7.2 RSS发展 Blog逐步成为了网络上最热门的新话题。而RSS也成为了描述Blog主题和更新信息的最基本方法。 RSS 0.91版本被一家专门从事博客写作软件开发的公司UserLand接手了,并把它作为博客写作软件的基础功能之一继续开发,逐步推出了0.92、0.93和0.94版本 2001年,一个联合小组根据W3C World Wide Web C

4、onsortium)新一代的语义网技术RDF(Resource Description Frame)对RSS进行了重新定义,发布了RSS 1.0,并把RSS定义为“RDF Site Summary”。 7.2 RSS发展 RSS开始分化形成了RSS 0.9x/2.0和RSS 1.0两个阵营直到今天,RSS 1.0还没有成为标准化组织的真正标准。2002年9月戴夫·温却独自把RSS升级到了2.0版本,其中的定义完全是全新的模式,并没有任何RSS 1.0的影子。 7.3 RSS基本内容 RSS 基于XML,所有的 RSS 必须遵循W3C网站上公布的XML 1.0 规范。在一个RSS文档中

5、,根元素是<rss>,带有一个必备属性version,用以指明该文档遵循的rss规范。RSS的重要元素:channel,提供关于RSS提要来源的信息。Item,则是那些能够阅读的文章。7.3 RSS基本内容 channel元素channel可以看作是RSS提要的标题信息。dhannel元素说明RSS提要从哪里来、文件的名称是什么、它上次被更新是什么时间,等等。只有很少的channel元素是RSS规约中必须的。 必需的channel元素 元素描述description对于channel的描述link关于这个channel的HTML网站描述titlechannel名称7.3 RSS基本

6、内容 可选的channel元素 元素描述category表明这个channel元素属于哪个类别cloud允许所有进程注册一个cloud,用于获得channel的更新通知,实现一个轻量级的发布订阅协议copyright关于channel内容的版权声明docs指向RSS提要文档的URLgenerator生成该channel的程序名称image与channel一起显示的图片地址languagechannel使用的语言lastBuildDate上次修改channel内容的时间managing editor负责内容编辑的人员的电子邮件pubDate内容的发布时间ratingchannel的PICS等级s

7、kipDays通知使用者哪些天可以忽略,不必检查更新skipHours通知使用者几个小时可以忽略,不必检查更新ttl是time to live的缩写,指示channel更行前的缓存时间webmaster负责处理技术问题的人员的电子邮件textInput指定一个textbox与该channel一起显示7.3 RSS基本内容 item元素RSS提要可以包括多个item元素,每个item元素必须包括title、description元素。 可选的item元素元素描述authoritem作者的电子邮件categoryItem可以包含在一个或多个分类中comments与item相关的评论的URLdesc

8、riptionsitem小结enclosure附加到item的媒体对象guid作为唯一标识符的字符串linkitem的URLpubDateItem的发布时间sourceItem的RSS channel来源titleItem元素的标题7.3 RSS基本内容 RSS两个核心元素 Title元素使我们可以大致了解一篇文章的内容 description元素可以是文章的大纲或者就是文章本身。 事实上并没有一个使用description元素的标准。要决定怎样处理description元素,在开始开发RSS提要阅读器前,必须先查看一下要处理的提要本身。如果description元素中的内容是大纲,我们可以把

9、它看作一本杂志封面的广告。 7.3 RSS基本内容 RSS文件包括五个部分: (1)文档内的第一行为XML声明,定义了XML的版本和文档使用的字符编码。(2)说明所采用的RSS版本,该RSS文档遵循的规范为2.0。(3)描述<channel>元素开始位置,描述<channel>的子元素。(4)<item>元素,<item>元素包含了RSS展示的一些信息(<title>, <link> 和 <description>等)可以添加数个<item>元素。每个<item>都描述了项的标题、链接地

10、址、项的描述、项的发布时间。(5)关闭<channel> 和 <rss> 元素。7.3 RSS基本内容 <item><title>品牌PC五一促销举双核大旗 服务成为附赠品</title> tml</link> <description>双核笔记本跌至万元以下,各厂商力推正版软件与免费服务。</description> <pubDate>2007-04-27 14:45</pubDate> </item><item><title>柯达推出世

11、界最小10倍光学变焦数码相机</title>tml</link> <description>通过内置的蓝牙技术装置,V710可在30英尺内与其他支持蓝牙技术的手机、个人数字助理(PDA)和计算机等连接,进行双向传输。</description> <pubDate>2007-04-27 14:45</pubDate> </item><item><title>杨伟强:从奔四少帅到双核主将</title> <description>双核芯片跟单核相比,就好像摩托车跟汽车

12、,单杠的发动机怎么能跟四杠的比呢?!</description> <pubDate>2007-04-27 14:45</pubDate> </item>7.3 RSS基本内容 在新浪点点通的内容区可以看到这则新闻的全部内容。内容区的地址栏里显示的这个网页的URL地址与代码第一个item元素的link元素的值相同,将这个地址输入到IE地址栏显示的内容和新浪点点通的内容区的页面是完全相同的。<channel>元素内是描述RSS feed的地方对于channel元素来说RSS2.0有很多不同的选择(指内部可选择的元素有很多种)RSS的<

13、;channel>元素是项目内容显示的地方,它就像RSS的标题。一般来讲它不会频繁的改动。 7.3 RSS基本内容 <title>、<link>和 <description>三个内部元素是必须的。<title>元素包含网站和RSS feed简短的说明。<link>元素定义网站主页的链接。 <description>元素描述你的RSS feed。<item>元素是网站连接和描述更新内容的地方。7.3 RSS基本内容 在RSS 2.0 item元素里有很多不同的可选内容,<item>是显示RSS更

14、新内容的地方,它像是文章的标题。当的站点有更新时RSS feed中的<item>元素就会被建立起来。<item>元素里有几个可选的元素,但<title> 或是<description>是必须有的。一个RSS的<item>应该包括 <title>, <link> 和 <description>元素,第一个元素是项目的题目,应该用十分简短的描述,接下来的是元素项目所关联的连接,再下面的一行就是RSS feed的描述部分,这应该是描述RSS feed项目的。7.4 Atom概念RSS缺点:RSS版本号混乱

15、没有一个统一的开放的标准 定义贫乏、表示方法不一致 Atom主要开发一个新的、完全开放的格式以解决这些问题。 7.4 Atom概念Atom实际上是一个项目的名字。Atom最初是定位为RSS的替代格式,由IBM的工程师SamRuby提出来的。这个项目希望提供一个清晰的版本以解决每个人的需要,它的设计是独立的,并不完全依赖于供货商,是一个真正的开放标准,任何人都可以对它进行自由扩展。目前很多网站的都提供Atom和RSS1.0、RSS2.0格式的支持 7.4 Atom概念Atom和RSS1.0、RSS2.0的格式在某些地方有相似之处。但Atom的规范比RSS规范更严格,更标准。Atom除了定义新的摘

16、要格式外,它还希望定义一个标准的档案文件格式和一个标准的博客编辑API,称为Atom API。 7.5 Atom发展Atom是搜索业巨头Google在收购美国著名的博客网站B后提出的。 目前的博客世界分裂为RSS和Atom两大阵营。 RSS和Atom的目的是一致的,都是为博客、新闻或其它Web内容创建XML文本,以方便其它网站引用。 市场的分裂对RSS 2.0标准化产生巨大的影响,但是这样也不足以扼杀死RSS 2.0。 7.6 RSS与Atom区别尽管RSS与Atom所实现的功能一样,有很多相似之处,但是它们的区别还是较大的。主要区别:性质方面 程度方面 7.6 RSS与Atom区别 性质方面

17、1. 起点和时间2005年RSS已被广泛使用。Atom尽管有Google等大公司支持,但也只有少数的接受者。 2. 规范RSS规范不能被修改,版权归哈佛大学拥有。Atom规范由IETF和Internet Engineering Steering Group 讨论并通过,体现了大多数人的意见,不属于某一团体。7.6 RSS与Atom区别3. 协议RSS使用MetaWeblog和Blogger协议。Atom使用Publishing协议。4. 必须的内容RSS需要feed级别的title、link和description,可以不需要出现任何单个项目的字段。Atom需要的是feed和entry都必须包

18、含title,其中title可以是空串,而且还必须要有一个唯一的标记和最后更新的时间戳。 7.6 RSS与Atom区别5. 装载对象RSS可装载的对象只有纯文本和脱机HTML文档,而且不提供辨别这两种类型的方法。Atom有一个良好的装载器payload,内容必须明确指定为以下类型中的一个:1) 纯文本,没有任何标记(默认)2) 脱机HTML文档(与RSS常用的相同)3) 规范的XHTML标记4) 某些其它类型的XML标记库5) 基于base64编码的二进制内容6) 一个指向Web内容的链接,不直接包含在feed中7.6 RSS与Atom区别6. 摘要与内容RSS或者缺省或者可以使用一个<

19、description>元素来容纳入口的完整文本或者大纲,它并没有一个内建的独立方式来判断所容纳的内容的完整性。Atom有单独的<summary>元素来容纳摘要,有单独的<content>元素来判断内容。7.6 RSS与Atom区别7. 自动发现RSS的自动发现依赖于非标准化的application/rss+xml MIME类型。Atom的自动发现使用标准化的application/rss+xml MIME类型,该类型由IANA注册。8. 解析与聚合RSS只能识别<rss>文档格式。Atom允许独立的Atom入口文档,该文档可以被任何网络协议传输,如X

20、MPP等:同时它还支持聚合feed。7.6 RSS与Atom区别 程度方面1. 可扩充性RSS不在XML的命名空间但是可以包含来自其它XML命名空间的元素。Atom处于XML的命名空间并且可以包含来自其它XML命名空间的元素或属性。7.6 RSS与Atom区别2. URIRSS并不指定对相对URI引用的处理,也就是说相对URI不能在RSS feed中使用。Atom允许使用XML的内置xml:base属性来处理相对URI引用。3. 软件库RSS和Atom feed都支持通用标准的HTTP客户端库,支持并鼓励使用标准缓冲技术。处理RSS的库有FeedParser和Rome。处理Atom的库有XML

21、: Atom、XML: Atom:Syndication、FeedParser、Rome和Apache Abdera。7.6 RSS与Atom区别4. 语言标记RSS 使用<language>元素作为他自己的语言标记。Atom使用XML的内置xml:lang属性标记。5. 数字签名与加密如果作为位包处理RSS可以像其它web内容一样进行签名或加密。Atom使用XML Encrypton 和XML Digital Signature 加密和数字签名,与RSS处理位包时的签名和加密效果一样。7.6 RSS与Atom区别6. 作者RSS可以对feed的<managingEditor

22、> 和<webMaster>以及主题的<author>指定一个email地址,有些人并不喜欢共享他的email地址则可以使用<dc:creator>代替。Atom在feed和入口级别中提供<author>和<contributor>元素。7.6 RSS与Atom区别7. 范畴RSS包含两部分:标签和正文。Atom包含三部分,除了标签和正文外还包括另一个可选项:易读性标题。8. 规划RSS规范不包含任何规划。Atom一个非标准化的ISO标准RelaxNG规划,以支持那些想校验用Atom做广告的数据有效性。7.7 RSS阅读器RSS

23、阅读器是一个软件,通过它可以订阅感兴趣的内容,不用打开具体的网站就能够查看更新的内容。下面通过一个具体的RSS阅读器:Sinaddt Reader,讲解阅读器的使用方法。 认识RSS阅读器阅读RSS内容需要借助RSS阅读器,目前这种阅读器有许多,包括新浪点点通阅读器、小蜜蜂阅读器、看天下阅读器等。各种阅读器的使用方法大同小异。7.7 RSS阅读器1.下载一个阅读器安装文件 2.双击安装文件rsssetup.exe 3.根据安装向导的提示一路点击“下一步” 4选择接受安装协议点击“下一步” 5.选择目标文件夹位置一般采用默认位置“C:Program FilesSinaRssReader”点击“下

24、一步” 6.选择需要在开始菜单中创建的程序快捷方式,一般采用默认值“新浪点点通阅读器”,点击“下一步” 7.7 RSS阅读器7.选择附加任务,最好去掉“启动是运行阅读器”,这样不会影响开机速度,选择“在桌面上创建快捷方式图标”,点击“下一步” 8.进入准备安装界面,点击“安装” 9.进入安装完成界面,点击“完成” 10.整个安装过程执行完毕,成功安装后可以在桌面上看到“新浪点点通阅读器”图标,双击图标启动阅读器 7.7 RSS阅读器1)主菜单 文件、查看、精彩频道、帮助文件菜单:添加频道、添加频道组、导入频道列表、导出频道列表、导入收藏夹、到出收藏夹。查看菜单:全部更新或停止更新、删除选定的内

25、容(这些内容包括频道组、频道和标题区中的单个标题项)、搜索、设置频道属性、按不同的标准排列标题去中的标题 7.7 RSS阅读器2)常用工具栏 精彩频道、添加频道、新增频道组、全部更新、搜索、删除、频道属性、设置、帮助、功能演示。3)频道列表区位于主体的左侧,以列表的形式列出所有的频道组和频道。频道组类似于文件夹的概念,频道就像文件夹下存在的文件。单击每个频道组前的加号可以显示该组下已经存在的频道名,在频道名的旁边以参数的形式显示当前未阅读消息数和总消息数的比例。7.7 RSS阅读器4)标题区位于主体的右上侧,在该区内列出频道内所有信息的标题、阅读状态、发布时间等。5)内容区位于主体的右下侧,以模拟浏览器的形式显示在标题中选中的内容。7.7 RSS阅读器 使用阅读器1) 阅读新闻选择频道列表区的一个频道,该频道内的新闻条目将以标题的形式显示在标题区,查看标题区给出的各各条目的内容提要,点击感兴趣的条目,在内容区就可以查看选中条目的全部内容。2) 管理频道频道列表区已经列出一些默认的频道组的相应的节目频道,对这些频道组或频道可以删除或添加。 7.7 RSS阅读器建立频道组步骤:(1)新建频道组点击工具栏中的“文件”“新增频道组”打开对话框。在对话框中输入要建立的频道组名称,点击“确定”,即可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论