数据库系统原理及应用-第十一章-半结构化数据模课件_第1页
数据库系统原理及应用-第十一章-半结构化数据模课件_第2页
数据库系统原理及应用-第十一章-半结构化数据模课件_第3页
数据库系统原理及应用-第十一章-半结构化数据模课件_第4页
数据库系统原理及应用-第十一章-半结构化数据模课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/1/41第11章半结构化数据模型第三部分半结构化数据的

建模和程序设计

第11章半结构化数据模型第12章XML程序设计语言2022/12/281第11章半结构化数据模型第三部分半2023/1/42第11章半结构化数据模型第11章半结构化数据模型11.1半结构化数据11.2XML11.3文档类型定义11.4XML模式2022/12/282第11章半结构化数据模型第11章半2023/1/43第11章半结构化数据模型11.1半结构化数据半结构化数据(semistructured-data)模型在数据库系统中有着独特的地位:1.是一种适于数据库集成(integration)的数据模型;2.是一种标记服务的基础模型,用于在Web上共享信息,如:XML;2022/12/283第11章半结构化数据模型11.1半2023/1/44第11章半结构化数据模型11.1半结构化数据11.1.1为何需要半结构化数据模型11.1.2半结构化数据表示11.1.3信息集成与半结构化数据2022/12/284第11章半结构化数据模型11.1半2023/1/4511.1半结构化数据11.1.1为何需要半结构化数据模型关系数据库系统提供的是关系模型,描述数据的模式是关系模式;半结构化模型,更加灵活,因为他是“无模式”、“自描述”的。半结构化数据自身携带了模式信息。2022/12/28511.1半结构化数据11.1.1为2023/1/4611.1半结构化数据11.1.2半结构化数据表示半结构化数据是节点(node)的集合,节点分为叶子节点(leaf)和内部节点(interior);叶子节点表示具体数据,数据的类型是数据库中提供的数据类型,如:数字型、字符串型等;内部节点至少有一条向外的弧,弧上都有一个标签(label),该标签指明连接的节点之间的关系。有一个根节点,没有进入弧。2022/12/28611.1半结构化数据11.1.2半2023/1/4711.1半结构化数据11.1.2半结构化数据表示Movies(title,year,length,genre,studioName,producerC)

名称年份长度(分钟)流派电影公司名称导演证书号MovieStar(name,address,gender,birthdate)

姓名住址性别生日StarsIn(movieTitle,movieYear,starName)

影片名称年份主演姓名MovieExec(name,address,cert,netWorth)

导演姓名住址导演证书号净资产Studio(name,address,presC)

电影公司名称地址老总证书号例如:电影数据库模式如下,电影数据库对应的半结构化数据表示。2022/12/28711.1半结构化数据11.1.2半2023/1/4811.1半结构化数据11.1.2半结构化数据表示例如:电影数据库对应的半结构化数据表示如下:不能说的秘密2007101剧情安乐影片有限公司56334titlelengthyeargenrestudionameproducercrowmoviesrootrowrowmoviestarrowrowstudiorowrow2022/12/28811.1半结构化数据11.1.2半2023/1/4911.1半结构化数据11.1.2半结构化数据表示例如:访问movies关系中的电影名称的路径表达式为:/movies/row/title不能说的秘密2007101剧情安乐影片有限公司56334titlelengthyeargenrestudionameproducercrowmoviesrootrowrowmoviestarrowrowstudiorowrow2022/12/28911.1半结构化数据11.1.2半2023/1/41011.1半结构化数据11.1.3信息集成与半结构化数据半结构数据的灵活与自描述性使其成为数据交换和信息集成的工具;在互联网环境下得到广泛应用;在信息集成中等到广泛应用。集成模型如下:历史数据库历史数据库XML接口应用2022/12/281011.1半结构化数据11.1.32023/1/411第11章半结构化数据模型11.2XMLXML(ExtensibleMarkupLanguage,可扩展标记语言)是一种基于标签的、最初是为“标记”文档而设计的符号语言;11.2.1语义标签11.2.2有模式和无模式的XML11.2.3格式规范的XML11.2.4属性11.2.5连接元素的属性11.2.6命名空间11.2.7XML和数据库2022/12/2811第11章半结构化数据模型11.22023/1/41211.2XML11.2.1语义标签XML中的标签是用尖括号括起来的文本,如:<movies>、<row>、<title>XML中标签是配对的,如:<movies>

……</movies>配对标签和配对标签之间的内容称为XML元素(element)。2022/12/281211.2XML11.2.1语义2023/1/41311.2XML11.2.2有模式和无模式XMLXML可以应用于两种不同的模式:1.格式规范的XML允许用户自定义标签,就像半结构化数据中的弧标签一样。2.合法的XML包括一个DTD(文档类型定义),它指定了允许使用的标签并给出了如何嵌套它们的语法。2022/12/281311.2XML11.2.2有模2023/1/41411.2XML11.2.3格式规范的XML模式规范的XML文档是由一行XML声明和XML元素组成,如:<?xmlversion="1.0"encoding="utf-8"standalone="yes"?><movies><row><title>不能说的秘密</title><year>2007</year><length>101</length><genre>剧情</genre><studioname>安乐影片有限公司</studioname><producerc>56334</producerc></row>

……</movies>2022/12/281411.2XML11.2.3格式2023/1/41511.2XML11.2.4属性11.2.5连接元素的属性11.2.6命名空间2022/12/281511.2XML11.2.4属性2023/1/41611.2XML11.2.7XML和数据库数据库中的关系可以转换为XML数据,如:开放实验的内容;通过XML进行信息集成和信息共享。2022/12/281611.2XML11.2.7XM2023/1/417第11章半结构化数据模型2022/12/2817第11章半结构化数据模型2023/1/418第11章半结构化数据模型电影数据库模式Movies(title,year,length,genre,studioName,producerC)

名称年份长度(分钟)流派电影公司名称导演证书号MovieStar(name,address,gender,birthdate)

姓名住址性别生日StarsIn(movieTitle,movieYear,starName)

影片名称年份主演姓名MovieExec(name,address,cert,netWorth)

导演姓名住址导演证书号净资产Studio(name,address,presC)

电影公司名称地址经理证书号本章示例中使用的电影数据库模式:2022/12/2818第11章半结构化数据模型电影数据库2023/1/419第11章半结构化数据模型第三部分半结构化数据的

建模和程序设计

第11章半结构化数据模型第12章XML程序设计语言2022/12/281第11章半结构化数据模型第三部分半2023/1/420第11章半结构化数据模型第11章半结构化数据模型11.1半结构化数据11.2XML11.3文档类型定义11.4XML模式2022/12/282第11章半结构化数据模型第11章半2023/1/421第11章半结构化数据模型11.1半结构化数据半结构化数据(semistructured-data)模型在数据库系统中有着独特的地位:1.是一种适于数据库集成(integration)的数据模型;2.是一种标记服务的基础模型,用于在Web上共享信息,如:XML;2022/12/283第11章半结构化数据模型11.1半2023/1/422第11章半结构化数据模型11.1半结构化数据11.1.1为何需要半结构化数据模型11.1.2半结构化数据表示11.1.3信息集成与半结构化数据2022/12/284第11章半结构化数据模型11.1半2023/1/42311.1半结构化数据11.1.1为何需要半结构化数据模型关系数据库系统提供的是关系模型,描述数据的模式是关系模式;半结构化模型,更加灵活,因为他是“无模式”、“自描述”的。半结构化数据自身携带了模式信息。2022/12/28511.1半结构化数据11.1.1为2023/1/42411.1半结构化数据11.1.2半结构化数据表示半结构化数据是节点(node)的集合,节点分为叶子节点(leaf)和内部节点(interior);叶子节点表示具体数据,数据的类型是数据库中提供的数据类型,如:数字型、字符串型等;内部节点至少有一条向外的弧,弧上都有一个标签(label),该标签指明连接的节点之间的关系。有一个根节点,没有进入弧。2022/12/28611.1半结构化数据11.1.2半2023/1/42511.1半结构化数据11.1.2半结构化数据表示Movies(title,year,length,genre,studioName,producerC)

名称年份长度(分钟)流派电影公司名称导演证书号MovieStar(name,address,gender,birthdate)

姓名住址性别生日StarsIn(movieTitle,movieYear,starName)

影片名称年份主演姓名MovieExec(name,address,cert,netWorth)

导演姓名住址导演证书号净资产Studio(name,address,presC)

电影公司名称地址老总证书号例如:电影数据库模式如下,电影数据库对应的半结构化数据表示。2022/12/28711.1半结构化数据11.1.2半2023/1/42611.1半结构化数据11.1.2半结构化数据表示例如:电影数据库对应的半结构化数据表示如下:不能说的秘密2007101剧情安乐影片有限公司56334titlelengthyeargenrestudionameproducercrowmoviesrootrowrowmoviestarrowrowstudiorowrow2022/12/28811.1半结构化数据11.1.2半2023/1/42711.1半结构化数据11.1.2半结构化数据表示例如:访问movies关系中的电影名称的路径表达式为:/movies/row/title不能说的秘密2007101剧情安乐影片有限公司56334titlelengthyeargenrestudionameproducercrowmoviesrootrowrowmoviestarrowrowstudiorowrow2022/12/28911.1半结构化数据11.1.2半2023/1/42811.1半结构化数据11.1.3信息集成与半结构化数据半结构数据的灵活与自描述性使其成为数据交换和信息集成的工具;在互联网环境下得到广泛应用;在信息集成中等到广泛应用。集成模型如下:历史数据库历史数据库XML接口应用2022/12/281011.1半结构化数据11.1.32023/1/429第11章半结构化数据模型11.2XMLXML(ExtensibleMarkupLanguage,可扩展标记语言)是一种基于标签的、最初是为“标记”文档而设计的符号语言;11.2.1语义标签11.2.2有模式和无模式的XML11.2.3格式规范的XML11.2.4属性11.2.5连接元素的属性11.2.6命名空间11.2.7XML和数据库2022/12/2811第11章半结构化数据模型11.22023/1/43011.2XML11.2.1语义标签XML中的标签是用尖括号括起来的文本,如:<movies>、<row>、<title>XML中标签是配对的,如:<movies>

……</movies>配对标签和配对标签之间的内容称为XML元素(element)。2022/12/281211.2XML11.2.1语义2023/1/43111.2XML11.2.2有模式和无模式XMLXML可以应用于两种不同的模式:1.格式规范的XML允许用户自定义标签,就像半结构化数据中的弧标签一样。2.合法的XML包括一个DTD(文档类型定义),它指定了允许使用的标签并给出了如何嵌套它们的语法。2022/12/281311.2XML11.2.2有模2023/1/43211.2XML11.2.3格式规范的XML模式规范的XML文档是由一行XML声明和XML元素组成,如:<?xmlversion="1.0"encoding="utf-8"standalone="yes"?><movies><row><title>不能说的秘密</title><year>2007</year><length>101</length><genre>剧情</genre><studioname>安乐影片有限公司</studioname><producerc>56334</producerc></row>

……</movies>2022/12/281411.2XML11.2.3格式2023/1/43311.2XML11.2.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论