版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2023/8/101第11章半结构化数据模型第三部分半结构化数据的
建模和程序设计
第11章半结构化数据模型第12章XML程序设计语言2023/7/291第11章半结构化数据模型第三部分半结2023/8/102第11章半结构化数据模型第11章半结构化数据模型11.1半结构化数据11.2XML11.3文档类型定义11.4XML模式2023/7/292第11章半结构化数据模型第11章半结2023/8/103第11章半结构化数据模型11.1半结构化数据半结构化数据(semistructured-data)模型在数据库系统中有着独特的地位:1.是一种适于数据库集成(integration)的数据模型;2.是一种标记服务的基础模型,用于在Web上共享信息,如:XML;2023/7/293第11章半结构化数据模型11.1半结2023/8/104第11章半结构化数据模型11.1半结构化数据11.1.1为何需要半结构化数据模型11.1.2半结构化数据表示11.1.3信息集成与半结构化数据2023/7/294第11章半结构化数据模型11.1半结2023/8/10511.1半结构化数据11.1.1为何需要半结构化数据模型关系数据库系统提供的是关系模型,描述数据的模式是关系模式;半结构化模型,更加灵活,因为他是“无模式”、“自描述”的。半结构化数据自身携带了模式信息。2023/7/29511.1半结构化数据11.1.1为何2023/8/10611.1半结构化数据11.1.2半结构化数据表示半结构化数据是节点(node)的集合,节点分为叶子节点(leaf)和内部节点(interior);叶子节点表示具体数据,数据的类型是数据库中提供的数据类型,如:数字型、字符串型等;内部节点至少有一条向外的弧,弧上都有一个标签(label),该标签指明连接的节点之间的关系。有一个根节点,没有进入弧。2023/7/29611.1半结构化数据11.1.2半结2023/8/10711.1半结构化数据11.1.2半结构化数据表示Movies(title,year,length,genre,studioName,producerC)
名称年份长度(分钟)流派电影公司名称导演证书号MovieStar(name,address,gender,birthdate)
姓名住址性别生日StarsIn(movieTitle,movieYear,starName)
影片名称年份主演姓名MovieExec(name,address,cert,netWorth)
导演姓名住址导演证书号净资产Studio(name,address,presC)
电影公司名称地址老总证书号例如:电影数据库模式如下,电影数据库对应的半结构化数据表示。2023/7/29711.1半结构化数据11.1.2半结2023/8/10811.1半结构化数据11.1.2半结构化数据表示例如:电影数据库对应的半结构化数据表示如下:不能说的秘密2007101剧情安乐影片有限公司56334titlelengthyeargenrestudionameproducercrowmoviesrootrowrowmoviestarrowrowstudiorowrow2023/7/29811.1半结构化数据11.1.2半结2023/8/10911.1半结构化数据11.1.2半结构化数据表示例如:访问movies关系中的电影名称的路径表达式为:/movies/row/title不能说的秘密2007101剧情安乐影片有限公司56334titlelengthyeargenrestudionameproducercrowmoviesrootrowrowmoviestarrowrowstudiorowrow2023/7/29911.1半结构化数据11.1.2半结2023/8/101011.1半结构化数据11.1.3信息集成与半结构化数据半结构数据的灵活与自描述性使其成为数据交换和信息集成的工具;在互联网环境下得到广泛应用;在信息集成中等到广泛应用。集成模型如下:历史数据库历史数据库XML接口应用2023/7/291011.1半结构化数据11.1.3信2023/8/1011第11章半结构化数据模型11.2XMLXML(ExtensibleMarkupLanguage,可扩展标记语言)是一种基于标签的、最初是为“标记”文档而设计的符号语言;11.2.1语义标签11.2.2有模式和无模式的XML11.2.3格式规范的XML11.2.4属性11.2.5连接元素的属性11.2.6命名空间11.2.7XML和数据库2023/7/2911第11章半结构化数据模型11.22023/8/101211.2XML11.2.1语义标签XML中的标签是用尖括号括起来的文本,如:<movies>、<row>、<title>XML中标签是配对的,如:<movies>
……</movies>配对标签和配对标签之间的内容称为XML元素(element)。2023/7/291211.2XML11.2.1语义标2023/8/101311.2XML11.2.2有模式和无模式XMLXML可以应用于两种不同的模式:1.格式规范的XML允许用户自定义标签,就像半结构化数据中的弧标签一样。2.合法的XML包括一个DTD(文档类型定义),它指定了允许使用的标签并给出了如何嵌套它们的语法。2023/7/291311.2XML11.2.2有模式2023/8/101411.2XML11.2.3格式规范的XML模式规范的XML文档是由一行XML声明和XML元素组成,如:<?xmlversion="1.0"encoding="utf-8"standalone="yes"?><movies><row><title>不能说的秘密</title><year>2007</year><length>101</length><genre>剧情</genre><studioname>安乐影片有限公司</studioname><producerc>56334</producerc></row>
……</movies>2023/7/291411.2XML11.2.3格式规2023/8/101511.2XML11.2.4属性11.2.5连接元素的属性11.2.6命名空间2023/7/291511.2XML11.2.4属性2023/8/101611.2XML11.2.7XML和数据库数据库中的关系可以转换为XML数据,如:开放实验的内容;通过XML进行信息集成和信息共享。2023/7/291611.2XML11.2.7XML2023/8/1017第11章半结构化数据模型2023/7/2917第11章半结构化数据模型2023/8/1018第11章半结构化数据模型电影数据库模式Movies(title,year,length,genre,studioName,producerC)
名称年份长度(分钟)流派电影公司名称导演证书号MovieStar(name,address,gender,birthdate)
姓名住址性别生日StarsIn(movieTitle,movieYear,starName)
影片名称年份主演姓名MovieE
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肠癌防治指南核心2026
- 7.1《青蒿素:人类征服疾病的一小步》课件 统编版高一语文必修下册
- 2026年商标转让协议模板
- 2025-2030中国酒店投资行业发展前景及发展策略与投资风险研究报告
- 2025-2030中国磷酸二氢铵(MAP)行业供需现状与投资契机可行性研究报告
- 2025新焊工重点突破真题及答案
- 2026年清洁卫生服务合同协议
- 2026农产品贸易行业市场供需格局行业政策影响投资布局规划报告
- 2026农业粮食行业市场发展现状供需分析及投资设计规划分析研究报告
- 2025新入团考试题真题与答案
- 高校大创项目申报书撰写指南
- 2024-2025学年辽宁省丹东市第十九中学七年级下学期期中考试数学试题
- 幼儿园中班数学课《认识数字1-10》课件
- 2024广东海洋大学教师招聘考试真题及答案
- 劳技课编手链课件
- 猫宁供应商入驻考试答案50题苏宁考试题库
- 2025年人教版七年级数学下册期中复习题(基础版)(范围:相交线与平行线、实数、平面直角坐标系)解析版
- 武侯祠历史讲解
- 推进信息化建设“十五五”规划-(2025-2025年)-根据学校十五五
- 2025年高考数学全国一卷试题真题及答案详解(精校打印)
- 2025年中考一模卷(贵州)历史试题含答案解析
评论
0/150
提交评论