数据库-研究生课件:第5部分 WEB数据管理_第1页
数据库-研究生课件:第5部分 WEB数据管理_第2页
数据库-研究生课件:第5部分 WEB数据管理_第3页
数据库-研究生课件:第5部分 WEB数据管理_第4页
数据库-研究生课件:第5部分 WEB数据管理_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Silberschatz, Korth and Sudarshan10.2Database System Conceptsn背景背景n第第15章章 XML数据管理技术数据管理技术n第第16章章 Web数据集成与语义数据集成与语义WEBSilberschatz, Korth and Sudarshan10.3Database System ConceptsnWhile we can take as a fact Web changes everything, we argue that XML is the means for such a change to make a significan

2、t step forward. We therefore regard XML-related research as the most promising and challenging direction for the community of database researchers. - Stefano CeriSilberschatz, Korth and Sudarshan10.4Database System ConceptsnWorld Wide Web(万维网,也简称为万维网,也简称为Web)作为一个全球化信息空间,蕴含着具有巨大潜作为一个全球化信息空间,蕴含着具有巨大潜在

3、价值的信息和知识。在价值的信息和知识。nWWW技术发展为数据管理带来了巨大挑战和技术发展为数据管理带来了巨大挑战和机遇机遇Silberschatz, Korth and Sudarshan10.5Database System ConceptsnWeb起源于起源于1990年,创始人是欧洲粒子年,创始人是欧洲粒子物理研究所的物理研究所的Tim Berners-Lee等,最初等,最初目的是为了便于世界各地的物理学家交目的是为了便于世界各地的物理学家交流研究成果流研究成果Silberschatz, Korth and Sudarshan10.6Database System ConceptsnWeb

4、将计算机网络技术和超媒体技术融合起来,将计算机网络技术和超媒体技术融合起来,在很短时间内就被各个领域的用户广泛接受,信在很短时间内就被各个领域的用户广泛接受,信息量呈爆炸式增长。息量呈爆炸式增长。nWeb中这些海量和多样化数据不同于传统的数据中这些海量和多样化数据不同于传统的数据模型模型Silberschatz, Korth and Sudarshan10.7Database System Conceptsn半结构化或无结构化;半结构化或无结构化;n非规范化,非规范化,Web的开放性和用户的随意性使得的开放性和用户的随意性使得信息资源的质量无法得到保证,其中可能包含信息资源的质量无法得到保证,

5、其中可能包含一些各式各样的内容以及自定义词汇等格式自一些各式各样的内容以及自定义词汇等格式自由的数据;由的数据;n数据格式随意,机器难以自动处理。数据格式随意,机器难以自动处理。Silberschatz, Korth and Sudarshan10.8Database System Concepts全球的互连网络基础结构全球的互连网络基础结构支持文本交换的一组协议支持文本交换的一组协议超连接文档的格式语言超连接文档的格式语言HTML文档抽取技术及其用户界面文档抽取技术及其用户界面多层的多层的Web应用的体系结构应用的体系结构Web信息检索信息检索:基于关键字的搜索引擎基于关键字的搜索引擎数据交

6、换的格式标准数据交换的格式标准XMLSilberschatz, Korth and Sudarshan10.9Database System Conceptsn数据存储和访问大量高度结构化数据的查询语言数据存储和访问大量高度结构化数据的查询语言(SQL)n数据模型和构造数据模型的方法数据模型和构造数据模型的方法(ER/Relationshap)n维护数据完整性和一致性的机制维护数据完整性和一致性的机制n客户客户/服务器体系结构的数据库应用服务器体系结构的数据库应用n新的半结构化数据模型,放松了传统数据库系统新的半结构化数据模型,放松了传统数据库系统对结构的限制对结构的限制Silberschat

7、z, Korth and Sudarshan10.10Database System Conceptsn从狭义的角度来说,从狭义的角度来说,Web不是一个数据库,因不是一个数据库,因为它不是按一定数据模型组织的数据的集合为它不是按一定数据模型组织的数据的集合n从广义数据库理解的角度来说,从广义数据库理解的角度来说,Web是一个数是一个数据库,它是指一组相关的有用的信息的集合据库,它是指一组相关的有用的信息的集合n定义定义: Web数据管理是建立在对数据库技术的数据管理是建立在对数据库技术的广义理解基础上,它是指在广义理解基础上,它是指在Web环境下,对复环境下,对复杂信息的有效组织与集成,方便

8、而准确的信息杂信息的有效组织与集成,方便而准确的信息查询、集成与发布查询、集成与发布 Silberschatz, Korth and Sudarshan10.11Database System Conceptsn观点之一观点之一: Web是一个巨大的数据库是一个巨大的数据库n观点之二观点之二:XML与半结构化数据的结合是与半结构化数据的结合是Web数据研究的崭新的课题,为数据研究的崭新的课题,为Web数据管数据管理和应用提供了一种新的解决方案。理和应用提供了一种新的解决方案。Silberschatz, Korth and Sudarshan10.12Database System Concep

9、tsnWeb数据管理中的数据组织数据管理中的数据组织:是研究是研究Web信息的信息的特点,找出适合特点,找出适合Web信息的合理组织模式,目信息的合理组织模式,目前的研究成果主要体现为前的研究成果主要体现为半结构化数据半结构化数据模式模式的研究。的研究。nWeb上的信息集成上的信息集成:是是Web数据管理的最现实的数据管理的最现实的问题。问题。Web上诸多数据源中的信息如何构成为上诸多数据源中的信息如何构成为一个为用户可用的整体,是目前很多应用亟待一个为用户可用的整体,是目前很多应用亟待解决的问题。解决的问题。Silberschatz, Korth and Sudarshan10.13Data

10、base System ConceptsnWeb查询查询:是指能根据更丰富的语义信息在有效是指能根据更丰富的语义信息在有效数据组织模式下找出更准确的信息数据组织模式下找出更准确的信息nWeb信息发布信息发布:是是Web数据管理有别于传统数据数据管理有别于传统数据管理的新问题。它是指如何把管理的新问题。它是指如何把Web 上的数据按上的数据按用户的需求自动发送给目标用户用户的需求自动发送给目标用户nWeb数据挖掘数据挖掘: 通过机器学习发现通过机器学习发现WEB上的信上的信息结构或模式息结构或模式Silberschatz, Korth and Sudarshan10.14Database Sys

11、tem Conceptsn从技术上讲,从技术上讲,Web数据管理融合了数据管理融合了WWW技技术,数据库技术,信息检索技术,移动计算术,数据库技术,信息检索技术,移动计算技术,多媒体技术以及数据挖掘技术,是一技术,多媒体技术以及数据挖掘技术,是一门综合性的研究领域门综合性的研究领域Silberschatz, Korth and Sudarshan10.15Database System Concepts1. Web数据的管理,特别是半结构化数据的管理技术;数据的管理,特别是半结构化数据的管理技术; 2. Web数据信息抽取,例如结构或者模式的抽取;数据信息抽取,例如结构或者模式的抽取; 3. Web数据检索技术;数据检索技术;4. Web数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论