版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,1.4数据仓库模型设计,第一章数据仓库原理,1.4.1数据仓库模型设计方法概述1.4.2数据仓库设计的三阶段模型1.4.3数据仓库概念模型1.4.4数据仓库的逻辑模型1.4.5数据仓库的物理模型1.4.1数据仓库模型设计方法概述,数据仓库系统设计与数据库系统设计的区别,第一章数据仓库原理,第二章数据仓库模型设计包括概念模型设计、1.4数据仓库模型设计、第一章数据仓库原理、3、1.4.2数据仓库设计三阶段数据模型、数据模型是构建数据仓库的基础。完整、灵活、可靠的数据模型对数据仓库项目的成功起着以下重要作用:1)数据模型是整个系统。2)有助于数据整合。3)通过构建数据模型,可以排除数据说明中的不
2、一致。4)数据模型在逻辑层全面描述了现有信息和信息之间的关系,因此,在将来业务更改或系统要求更改时,系统扩展更容易。1.4数据仓库模型设计,第一章数据仓库原理,4,5)消除数据仓库中的重复数据。数据仓库建模是数据仓库建设正式开始的第一步,准确完整的数据模型反映了用户的业务需求,是数据仓库项目能否成功的最重要的技术因素。目前比较流行的数据仓库设计模型是概念模型、逻辑模型和物理模型3级数据模型。1.4.2数据仓库设计的三阶段数据模型,1.4数据仓库模型设计,第一章数据仓库原理,5,1.4.2数据仓库设计的三阶段数据模型,1,概念模型,概念模型描述了从客观世界到主观认识的映射。进行系统设计时,我们首
3、先要把现实世界抽象成概念模型,然后用计算机世界的模型和语言说明客观世界的具体问题。1.4数据仓库模型设计,第1章数据仓库原理,6,1.4.2数据仓库设计的三阶段数据模型,2,逻辑模型,当前数据仓库通常基于关系数据库。因此,数据仓库设计中使用的逻辑模型是关系模型,无论是主题还是主题。逻辑模型描述了数据仓库主题的逻辑实现。对于关系数据库,每个主题对应的关系表的关系架构定义。直接反映业务部门的需要,同时对系统的物理实施起着重要的指导作用。1.4数据仓库模型设计、第一章数据仓库原理、7、1.4.2数据仓库设计的三阶段数据模型、3、物理模型和物理模型是在数据仓库中实施逻辑模型,包括数据存储结构、数据索引
4、策略、数据存储策略和存储分配优化。1.4数据仓库模型设计,第一章数据仓库原理,8,1.4.2数据仓库设计的三阶段数据模型,4和3个模型之间的关系,1.4数据仓库模型设计,第一章数据仓库原理,9,1.4.低级模型:物理数据模型。中间模型:称为数据项(dis-data item set)。1.4数据仓库模型设计,第一章数据仓库原理,10,1.4.2数据仓库设计第三阶段数据模型,5,高级模型,中级模型和低级模型,dis是E-R图的细分。E-R图片中的每个主题都对应于dis。,1.4数据仓库模型设计,第1章数据仓库原理,11,1.4.2数据仓库设计第3次数据模型,第5次,高级模型,中级模型和低级模型,
5、每个dis中的数据分为4个组:基本数据集,第2次数据集,连接数据集和类型,1)数据集连接通常,连接数据集通常是一个主题的公共代码键。1.4数据仓库模型设计、第1章数据仓库原理、12、1.4.2数据仓库设计的三阶段数据模型、5、高级模型、中间模型和低级模型、2)基本数据集基本数据集在本主题中包含固定、基本不变属性。3)辅助数据集是本主题中偶尔更改的数据,其可靠性比主数据集低。4)类型数据集是本主题中经常更改的数据,稳定性最低。1.4数据仓库模型设计,第1章数据仓库原则,13,1.4.2数据仓库设计第3阶段数据模型,5,高级模型,中级模型和低级模型,如商品ID,客户ID名称性别ID号,地址文化级别
6、电话电子交易ID商品金额购买时间1)定义系统边界,即评估工作和环境,收集和分析需求,了解用户迫切需要解决的问题和解决这些问题所需的信息,全面、明确地了解现有数据库的内容2)确定主要主题域及其内容。即,确定系统中包含的主题域,然后更清楚地说明每个主题域的公共代码密钥、主题域之间的连接以及充分表示主题的属性组。1.4数据仓库模型设计,第一章数据仓库原理,15,1.4.3数据仓库概念模型设计,数据仓库概念模型设计可以使用两种方法:E-R模型和面向对象分析方法。一、E-R模型、E-R图显示了主题和主题之间的联系。使用E-R模型的概念模型设计过程如下:1.4数据仓库模型设计,第一章数据仓库原理,16,1
7、.4.3数据仓库概念模型设计,(1)任务和环境评估,(2)需求收集和分析,(3 2)优先选择在短时间内实现效果的决策主题。3)延迟业务逻辑不适当实施的主题。4)推迟技术难度、可行性、投资风险大的主题。1.4数据仓库模型设计,第一章数据仓库原理,17,1.4.3数据仓库概念模型设计,(4)主题内容说明内容包括:1)主题公共代码密钥。2)主题之间的连接。3)充分表示主题的属性组。(5)E-R图表矩形假定代表主题椭圆形主题的属性组菱形具有三个主题:主题之间的连接、1.4数据仓库模型设计、第1章数据仓库原理、18、示例1:商品、客户和供应商。商品有以下属性组:商品特定信息商品库存信息商品销售信息商品购
8、买信任客户具有以下属性组:客户特定信息客户购物信息供应商具有以下属性组:供应商特定信息供应商品信息可以获得以下E-R图:1.4.3数据仓库概念模型设计,1.4数据仓库模型设计,第一章数据仓库原则,19 1.4.3数据仓库概念模型设计,第一章数据仓库原理,20,1.4.3数据仓库概念模型设计处方中阐明了暗示说应用规律与内部的有机联系,促进了传统医学的发展,加快了新药产品的开发,1.4数据仓库模型设计,第一章数据仓库原理,21,1.4.3数据仓库概念模型设计,处方中的信息可分为两部分,另一部分是主治医生病,这两部分的信息通过处方有机地连接在一起。药的比例是由药理决定的,病的规则又与病的原因和发展的
9、机制密切相关,因此要分析处方药,不研究这两方面的信息是不可能的。因此,主要主题是处方、药物、疾病和需要的数据,包括处方数据、药物数据和疾病数据。1.4数据仓库模型设计,第一章数据仓库原理,22,1.4.3数据仓库概念模型设计,主题说明,1.4数据仓库模型设计,第一章数据仓库原理,23,1.4.3数据仓库概念模型设计1.4.3数据仓库概念模型设计,2,1.4数据仓库模型设计,第一章数据仓库原理,25,1.4.3数据仓库概念模型设计,2,面向对象的分析方法,类中常用的图形表示方法是类表。1.4数据仓库模型设计,第一章数据仓库原理,26,1.4.3数据仓库概念模型设计,2,面向对象的分析方法,面向对象的方法中类之间存在三种关系(继承、包容和关联)。1,继承,1.4数据仓库模型设计,第1章数据仓库原理,27,设计1.4.3数据仓库的概念模型,2,设计面向对象的分析方法,2,包容,1.4数据仓库模型,第1章数据仓库原理类的行为反映了类本身或其他类的作用,关联关系反映了类之间的关系,1.4数据仓库模型设计,第一章数据仓库原理,29,1.4.3数据仓库概念模型设计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 施工项目部组织管理方案
- 建筑工程监测与评估技术方案
- 2026广东佛山高明技师学院、佛山市高明区职业技术学校招聘事业编制教师8人备考题库【达标题】附答案详解
- 地下管线探测与定位方案
- 2026重庆市万州区沙河街道办事处公益性岗位招聘1人备考题库及完整答案详解【易错题】
- 2024年辽宁医药职业学院单招语文数学英语全科模拟题及答案
- 2026四川宜宾珙县总工会第一次招聘社会化工会工作者1人备考题库附完整答案详解(有一套)
- 2026山东济南市妇女儿童活动中心幼儿园(领秀公馆园)招聘实习生备考题库完整参考答案详解
- 2026云南白药集团春季校园招聘备考题库附参考答案详解【完整版】
- 某金属冶炼厂生产管理制度
- 2025(完整)钢结构合同范本
- 金矿融资计划书范文
- 《成人住院患者静脉血栓栓塞症风险评估技术》
- 汽车机械基础课件:第七单元汽车液压传动课件
- 个人房屋买卖合同范本复制
- 肝的生理功能中医
- 大咯血患者急救及护理
- GB/T 44233.2-2024蓄电池和蓄电池组安装的安全要求第2部分:固定型电池
- 地质钻探施工方案
- 2024年河北省中考数学试题(含答案解析)
- Unit2Yummy!(课件)新概念英语青少版StarterA
评论
0/150
提交评论