对数据库当中的逻辑数据模型的个人理解_第1页
对数据库当中的逻辑数据模型的个人理解_第2页
对数据库当中的逻辑数据模型的个人理解_第3页
对数据库当中的逻辑数据模型的个人理解_第4页
对数据库当中的逻辑数据模型的个人理解_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

对数据库的个人理解对数据库的个人理解 年 级 大二 学 号 11214030216 姓 名 盛斐 专 业 信息管理与信息系统 二零一三年九月 1 摘要 访问数据库中的数据取决于数据库实现的数据模型 数据库模型描 述了在数据库中结构化和操纵数据的方法 模型的结构部分规定了数据如何被 描述 例如树 表等 模型的操纵部分规定了数据的添加 删除 显示 维护 打印 查找 选择 排序和更新等操作 导读 什么是数据模型 数据库和数据模型的关系是什么 我们最常用的 数据库有哪些 近期出现的新的数据模型和以往我们使用的数据库有什么不同 现在世界上数据库数据模型的发展趋势是什么 一 什么是数据库 数据库是依照某种数据模型组织起来并存放二级存储器中的数据集合 这 种数据集合具有如下特点 尽可能不重复 以最优方式为某个特定组织的多种 应用服务 其数据结构独立于使用它的应用程序 对数据的增 删 改和检索 由统一软件进行管理和控制 从发展的历史看 数据库是数据管理的高级阶段 它是由文件管理系统发展起来的 数据库的基本结构分三个层次 反映了观察数据库的三种不同角度 1 物理数据层 它是数据库的最内层 是物理存贮设备上实际存储的数据 的集合 这些数据是原始数据 是用户加工的对象 由内部模式描述的指令操 作处理的位串 字符和字组成 2 概念数据层 它是数据库的中间一层 是数据库的整体逻辑表示 指出 了每个数据的逻辑定义及数据间的逻辑联系 是存贮记录的集合 它所涉及的 是数据库所有对象的逻辑关系 而不是它们的物理情况 是数据库管理员概念 下的数据库 2 3 逻辑数据层 它是用户所看到和使用的数据库 表示了一个或一些特 定用户使用的数据集合 即逻辑记录的集合 二 数据库和数据模型有什么关系 访问数据库中的数据取决于数据库实现的数据模型 数据库模型描述了在 数据库中结构化和操纵数据的方法 模型的结构部分规定了数据如何被描述 例如树 表等 模型的操纵部分规定了数据的添加 删除 显示 维护 打 印 查找 选择 排序和更新等操作 数据模型会影响客户端通过 API 对数据 的操作 不同的数据模型可能会提供或多或少的功能 一般而言 数据模型不 会直接提供过多的功能 许多功能必须由客户端自行实现 三 常用的的数据模型 目前最常用的数据库模型是关系数据库 关系实际上就是关系模式在某一 时刻的状态或内容 也就是说 关系模式是型 关系是它的值 关系模式是静 态的 稳定的 而关系是动态的 随时间不断变化的 因为关系操作在不断地 更新着数据库中的数据 关系模型对比其他模型具有如下的优点 1 数据结构单一 关系模型中 不管是实体还是实体之间的联系 都用关系来表示 而关系 都对应一张二维数据表 数据结构简单 清晰 2 关系规范化 并建立在严格的理论基础上 构成关系的基本规范要求关系中每个属性不可再分割 同时关系建立在具 3 有坚实的理论基础的严格数学概念基础上 3 概念简单 操作方便 关系模型最大的优点就是简单 用户容易理解和掌握 一个关系就是一张 二维表格 用户只需用简单的查询语言就能对数据库进行操作 但是随着因特网的出现 关系数据库不能与因特网完美的融合 需要在因 特网和数据库之间加入大量的中间件 这就在无形的当中加大了数据库基于网 络应用的难度 在以 HTTP 为基础 HTML 为文件格式的因特网的需求条件下 关系数据库暴露出了如下的缺点 1 关系数据库建立在一个严格的二维表上 在列的维度上 对于每个属 性其长度和类型是事先定义并且很难扩展的 在行的维度上 每一条记录 行为 record 都不完全相同 2 关系数据库以二维表的方式管理数据 数据以一条条记录的方式存储 每一记录内部包括许多字段 字段名不可重复 对每一记录的每一字段具有惟一 值 字段中不支持子字段 关系数据库在数据类型上主要管理各种字符型 数 值型数据 虽然后来也提供了对于一些超长文本 图像 声音等多媒体以及面 向对象的扩充 但对这些数据类型的扩充仅仅停留在简单的存储与输出上 对于 数据的深层次的检索或其他需求必须通过特别的开发和处理 必然对系统的效 率产生负面影响 3 数据库最核心的技术之一就是数据的检索技术 对于任何一个数据库 系统 数据检索都是其核心内容和精髓所在 而进行数据检索之前必须建立索引 只有建立了严密的索引 才能使数据库强大的检索功能得以发挥 数据库索引 方式的差异决定了数据库的检索方式及检索能力 现有关系数据库支持的索引 4 只限于单字段索引 复合索引 多字段索引 等几种方式 对数据库的检索主要 基于结构化查询语言 SQL 用户通过构造 SQL 查询表达式和设置各种查询条 件 实现对关系数据库的检索 因为受到关系数据库的索引限制 其数据查询能 力也受到很大的限制 4 因特网的迅猛发展使数据库应用环境发生了巨大的变化 以因特网为 平台的 Internet Web 应用向数据库领域提出了前所未有的挑战 电子商务 Web 医院 远程教育 数字图书馆 移动计算等都需要新的数据库技术支持 由于关系数据库从一开始就没有考虑网络时代的应用需求 因而对于网络环境 下应用 如各种非结构化文档信息 多媒体信息以及全文检索需求显得力不从 心 虽然后来关系数据库对于这些需求作出了一些适应性调整 但对于网络环 境应用不可或缺的检索效率 全文检索能力等却无法解决 关系数据库从设计 之初并没有也不可能考虑到以 HTTP 为基础 HTML 为文件格式的因特网的需求 只是在因特网出现后才作出相应的调整 因此关系数据库在基于因特网应用时 由于结构模型等原因的限制 不能与因特网完全融合 需在 Web 服务器与数据 库之间加入大量的中间件 从而在无形中加大了数据库基于网络应用的难度 给 数据库的因特网应用带来了新的网络瓶颈 应用服务器端由于与数据库频繁交 互 因其本身的效率和数据库检索的效率造成因特网应用在应用服务器端的阻 塞 四 最新的出现的数据库有哪些 在最近面对因特网的潮流大势 关系数据库模型已经不能满足人们的需求 所以一种新的数据库模型诞生 这就是非结构化数据库 5 1 非结构化数据库的二维表却不是严格的 在列的维度上 对于每个属 性是可以伸展的 即属性的长度是可变的 2 在非结构化数据库中 字段内容是可重复的 这表现在两个方面 一 是一个字段支持重复字段 即字段在列这个级别上是可重复的 二是在同一个字 段内部允许出现不同的子字段 即字段在行级别上 内容是分层次的 总之 对 于一个字段 可以在行 列方向上有多个值 即非结构化数据库具有支持重复字 段 多值 子字段 子项 的能力 这种能力 使得非结构化数据库可以在记录 中实现二维嵌套 避免由于关系 二维表 连接导致的系统性能问题 3 非结构化数据库在数据类型上不仅可以支持字符型 数值型数据 而 且由于其强大的外部文件支持功能 更可以支持任何文件类型 如超长文本 图 像 声音等扩展型数据类型 同时 非结构化数据库对于文本 RTF 超文本文 档 DOC 等具有检索意义的外部文件类型还能提供强大的索引和全文检索功能 由于有着灵活的数据结构 非结构化数据库中支持的索引方式比关系数据库要 丰富得多 可以满足极其复杂检索的需要 其中字段索引兼容关系数据库的索 引 子字段索引和全文索引 英文单词索引和中文单汉字索引 是非结构化数据 库的特色 非结构化数据库甚至可以支持人工标引索引 中 英文混合索引等方 式 配合非结构化数据库的格式化语言 可以对同一字段进行若干种不同的索 引 以满足特殊检索的需求 数据库系统能够提供的检索方式 是和其对数据库 内容建立的索引密切相关的 高度灵活的索引方式造就了高度灵活的检索方式 非结构化数据库对中文的全文检索效率比关系型数据库要高得多 例如 国信 贝斯软件有限公司开发的 iBASE 非结构化数据库目前支持 8 种索引方式 可以 涵盖所有的关系数据库所提供的 90 以上的检索方式 同时还提供了大量的关 6 系数据库不具备的检索方式 包括简单检索 组合检索 字段检索 右截断检 索 全文检索 扩展检索 相关检索 ANY 词检索 集合检索 二次顺序检索 禁用词顺序检索等 iBASE 非结构化数据库采用 B3 树的索引机制 定位一条记 录最多限于 7 次定位操作 4 利用非结构化数据库全部基于因特网的数据库结构模型 采用网络服 务器和数据库服务器紧密集成的方法 可以将目前传统数据库厂商由 C S 结构 扩展来的浏览器 Web 服务器 应用服务器 数据库服务的三层体系结构 集成为 浏览器 网上资源发布系统式的因特网计算结构 使数据库系统成为因特网的一 个重要有机组成部分 实现在单一平台上融合所有数据库和应用服务器的功能 这不仅大大减少了用户对额外硬件 中间件和其他昂贵的集成业务的需求 而 且极大地缩短了用户开发和采用基于因特网应用的时间 同时非结构化数据库 还有效解决了关系型数据库在因特网应用上出现的检索效率低 全文检索能力 差等弊端 从这个意义上来说 非结构化数据库是真正的网络数据库 5 非结构化数据库处理的对象多为海量数据库 不仅检索功能强而且检 索速度快 在检索速度方面一般不受文献量的影响 以 iBASE 非结构化数据库 为例 每个数据库最大记录数可达 1 000 万条 每条记录的最大长度可达 32000 个汉字 每个数据库最多可有 800 个字段 每个字段的最大长度可达 32000 个汉字 五 未来数据库的发展趋势是什么 对于未来的数据库 是关系数据库浴火重生 还是非结构化数据库一统江 山 或者二者二分天下 到目前为止也是一个没有定论的事情 关系数据库面 对传统数据的强大优势 和非结构化数据库对日新月异的新技术的集成性 二 7 者在目前的数据库来说都不可缺少 后关系时代数据库 面对信息的复杂性 处理的高效性 应用的灵活性这 三个关系数据库的短板 在这里我查到了几种数据库的发展方向 1 XML 语言的出现 给数据库系统的发展开辟了新的天地 它包含下面 四个重要的特性 XML 语言的出现 给数据库系统的发展开辟了一片新的天地 XML 的全 称是 可扩展的标识语言 XML 有下列重要特性 1 XML 是一种表意而非表形的元语言 采用不同的显示页就可以做到 同一数据源却有不同途径的显示结果 2 XML 是 Internet 的标准语言 因而具有跨操作平台 跨区域的特 点 3 由于 XML 能为机器所解读 使得 服务器对服务器 的应用成为 可能 4 XML 是一种可自我描述定义的元语言 所以它可以大量用于制定行 业内及行业间数据交换的标准 其中代表就是 IBM 的新一代数据库 DB29 它第一次实现了关系型引擎与 层次型引擎的结合 实现了混合数据库 这种一方面在原有的系统基础上 增 加对非结构化话数据的支持 实现系统无缝平稳的过渡 是用户最能接受的一 种形式 2 面对新的时代要求 有人提出了内容信息库的概念 从而却带传统的数 据库 所谓 信息库 其实就是利用一个统一的数学模型 对目前的数据库技 术 DataBase 和企业内容管理系统 ecm 进行整合 从而在一个统一的平台上 8 有效地实现对结构化数据和非结构化数据的集中统一管理 在 IBM 的访问中 认为信息库包含以下的内容 1 完善的系统架构 信息库 技术需要考虑如何实现灵活高效的数据模型 如何实现完善的 访问控制管理 以及如何支持大量数据的存储和上千的并发用户 2 数据模型 数据模型的能力直接表现出一个平台适应用户需求的能力 丰富元数据的 模型不是一蹴而就的 这就要求一个面向客户全部信息管理的通用数据模型 以适应客户不断变化的需求 3 检索查询等功能的完备 对于 信息库 技术的最终用户来说 如 何高效准确地找到自己所需要的资源是首要课题 4 内容管理的 API 完整的 API 支持是区别 信息库 技术和一般的 内容管理应用软件的重要依据 3 而最后一种理论在我看来是十分的大胆 他们提出的概念就是让数据库 消失 面对网络时代的大流 云计算的蓬勃发展 大数据步步紧逼 Web 时代 数据技术将向哪个方向走呢 有一种看法是 它将向把数据本身 语义本身结 构化的方向发展 不是在库这个容器中刻划出维度来处理数据 而是要对语言 本身进行结构化处理 把维度内嵌到数据本身之中 这也是第三代互联网的神 髓 从研究的角度出发 Web 上的信息确实就是一个数据库 一个更大 更复 杂的数据库 Web 上的每一个站点就是一个数据源 每个数据源都是异构的 这就构成一个巨大的异构数据库环境 9 充分利用有用的数据 对尽可能多的数据进行有效的存储 管理 分析和 挖掘 这本身就是数据库技术思想的基础 但是 用 Web 来取代数据库 可 能在很多方面还不成熟 包括如进行数据的更新和维护 如何对数据进行保密 毕竟不是每一个用户都愿意将自己的所有数据存放在网络上 4 通过上面三种对数据库未来潮流的讨论 实际上也就表现出了数据库在 如下四个方面的革新目标 数据库技术发展和大多数领域发展一样 必将是应用驱动和技术驱动相结 合 传统的关系数据库 由于其自身的局限性 在使用中受到了很多限制 在 搜索 多媒体 企业内容管理 计算机辅助设计等方面 数据库技术几乎很少 涉足 如能在以下 4 个方面完善数据库技术 数据库将获取更大市场 方向 1 实现非结构化数据管理 企业在信息化过程中需要处理大量报表 账单 影像 电子文档 图片 音频 视频等非机构化数据 这些数据难以用传统的关系型数据库管理 随着 XML 技术的出现 数据库实现对非结构化数据的管理已经成为可能 如果谁能控制 支持和存储所有类型的数据 那么这样的厂商也就有能 力扩展自己其他产品和服务的市场空间 因此整合 XML 对象数据 多媒体数 据 将所有数据类型放在一个平台上将是传统的关系数据库发展的一大趋势 不过 处理结构化数据的关系型数据库从理论到技术上经历了 30 多年发 展 已经相当成熟 而非结构化数据的复杂程度远远高于结构化数据 所以非 结构化数据的存储还存在很多有待解决的难题 比如 如何很好地解决多种异 构数据源的存储和查询就是其中的关键问题 虽然有人认为将来 XML 数据库 将能比较好地解决非结构化数据的管理问题 但将现有文档映射到 XML 文档 10 的工作才刚刚开始 XML 查询语言也远不如 SQL 成熟 方向 2 实现对 Web 数据的挖掘 近年来 随着 Internet 技术的快速普及和迅猛发展 使各种信息可以以非 常低的成本在网络上获得 由于 Internet 在全球互连互通 可以从中取得的数 据量难以计算 而且 Internet 的发展趋势继续看好 特别是电子商务的蓬勃发 展为网络应用提供了强大支持 如何在 Internet 这个全球最大的数据集合中发 现有用信息无疑将成为数据挖掘研究的热点 数据库技术应用于 Web 挖掘主要是为了解决 Web 信息的管理和查询问题 这些问题可以分为三类 Web 信息的建模和查询 信息抽取与集成 Web 站 点建构和重构 从数据库的观点进行 Web 内容挖掘主要是试图建立 Web 站点的数据模型 并加以集成 以支持复杂查询 而不止是简单的基于关键词的搜索 这要通过 找到 Web 文档的模式 建立 Web 数据仓库或 Web 知识库或虚拟数据库来实 现 相关研究主要是基于半结构化数据进行的 长期以来 由于在数据库观点下数据的表示方法比较特殊 其中包含了关 系层次和图形化的数据 所以大部分建立在扁平数据集合之上的数据挖掘方法 不能直接使用 目前已经有人针对多层数据库挖掘算法进行研究 方向 3 对智能搜索技术的支撑 搜索技术是现在互联网的热门应用 不过由于速度慢和并发性差等瓶颈限 制 数据库和搜索技术长期以来都是 大路朝天 各走一边 据陈华介绍 在 目前的搜索技术中 出于速度等方面的考虑 搜索过程中很少有使用数据库工 具的情况 不过随着搜索技术对智能化要求的提高 大量的匹配信息 描述语 11 句出现在搜索过程中 数据库技术如何配合未来的智能搜索 也逐渐被大家关 注 现代网络系统中存在大量的有用数据 例如 每天有几千万个研究 然而 得到这些数据却非常困难 据了解 google 目前正在尝试建立一个体系结构 能够支持新的关于海量 Web 数据的研究 为了支持新研究 Google 以压缩的 形式保存了实际所抓到的文档 Google 的目标之一就是要建立一个环境使其 他研究者能够很快进入这个领域 处理海量 Web 数据 在这样的情况下 无 疑需要数据库技术来对这种系统进行有效的支持 大型 Web 搜索引擎将是个非常复杂的系统 为了提高搜索效率 需要覆 盖大约 1 亿个网页 我们必须有一个巧妙的算法来决定哪些旧网页需要重新抓 取 哪些新网页需要被抓取 受需求驱动 用代理 cache 创建搜索数据库正在 成为目前一个有前途的研究领域 方向 4 辅助软件工程及制造系统的应用 关系数据库技术是为传统的事务处理而开发的 如库存控制 工资 账目 等 但是人们很少将关系数据库技术用于计算机辅助设计 辅助工程 辅助软 件工程及辅助制造 CAD CAE CASE 和 CAM 系统及其应用 传统的数据库系统所支持的事务模型不适合于交互式 协作设计环境下所 必须的长事务 Long duration 传统的数据库系统也不提供表示和管理数据库 的临时变化 包括如像模式的时间和版本变化以及变化的通报 notification 方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论