




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库建模技术2024/3/24数据仓库建模技术数据仓库建模原则满足不同的用户需求兼顾效率与数据粒度的需要支持需求的变化避免对业务运营系统造成影响考虑未来的可扩展性数据仓库建模技术数据仓库建模特点OLTP系统是面向应用数据仓库则一般按照主题(Subject)来建模数据仓库建模技术数据仓库建模的一般步骤对用户需求进行归纳,需要综合考虑业务划分和用户组织两方面的问题;高层模型设计即概念模型设计确定数据仓库的主要主题和相互关系中层模型设计明确各主题域的实体底层模型设计明确各实体的属性数据仓库建模技术数据仓库的建模方法目前较常用的两种建模方法是所谓的第三范式(3NF,即ThirdNormalForm)和星型模式(Star-Schema),数据仓库建模技术什么是第三范式范式是数据库逻辑模型设计的基本理论一个符合第三范式的关系必须具有以下三个条件:每个属性的值唯一,不具有多义性;每个非主属性必须完全依赖于整个主键,而非主键的一部分;每个非主属性不能依赖于其他关系中的属性,因为这样的话,这种属性应该归到其他关系中去。数据仓库建模技术两种属性类別
键属性(Key)非键属性(NonKey)ConsultantIdConsultantLastNameConsultantFirstNameConsultantSpecializationConsultantHourlyRateCONSULTANT键属性非键属性数据仓库建模技术数据规范重复数据组这个设计违反了第一范式,第一范式是设计"外形"的基本定义,即数据的行和列组成一个在任何单元中没有嵌套结构的二维表格,数据库中每一个数据值必须是原子的,没有列表、重复元素或内部结构。
Emp-idemp-nameemp-addresschildren's-namesE1TomBerkeleyJaneE2DonBerkeleyTom,Dick,DonnaE3BobPrinceton------E4JohnNewYorkLisaE5CarolBerkeley------数据仓库建模技术数据规范规范数据仓库建模技术数据规范相同属性的多个用途
转换数据仓库建模技术数据规范相同事实的多个值如果事实由实体的部分健来决定,那么这个实体违犯了第二范式。如果事实通过实体的一些非键属性来了解,那么就违犯了第三范式。
数据仓库建模技术第三范式小结我们有如下规则的三范式总结,它归功于E.F.Codd博士------关系模型之父。如果每个非-键属性取决于键(全部键),没键就什么都没有,这样的实体就是第三范式。规范化的目标的口号是:ONEFACTINONEPLACE!数据仓库建模技术什么是星型模式星型模式是一种多维的数据关系,它由一个事实表(FactTable)和一组维表(DimensionTable)组成。每个维表都有一个维作为主键,所有这些维则组合成事实表的主键,换言之,事实表主键的每个元素都是维表的外键。事实表的非主属性称为事实(Fact),它们一般都是数值或其他可以进行计算的数据;而维大都是文字、时间等类型的数据。数据仓库建模技术第三范式和星型模式在数据仓库中的应用大多数人在设计中央数据仓库的逻辑模型时,都按照第三范式来设计;而在进行物理实施时,则由于数据库引擎的限制,不得不对逻辑模型进行不规范处理(De-Normalize),以提高系统的响应速度。根据数据仓库的测试标准TPC-D规范,在数据仓库系统中,对数据库引擎最大的挑战主要是这样几种操作:多表连接、表的累计、数据排序、大量数据的扫描。数据仓库建模技术第三范式和星型模式在数据仓库中的应用下面列出了一些DBMS在实际系统中针对这些困难所采用的折衷处理办法:
1、如何避免多表连接:在设计模型时对表进行合并,即所谓的预连接(Pre-Join)。当数据规模小时,也可以采用星型模式,这样能提高系统速度,但增加了数据冗余量。
2、如何避免表的累计:在模型中增加有关小计数据(SummarizedData)的项。这样也增加了数据冗余,而且如果某项问题不在预建的累计项内,需临时调整。
3、如何避免数据排序:对数据事先排序。但随着数据仓库系统的运行,不断有新的数据加入,数据库管理员的工作将大大增加。大量的时间将用于对系统的整理,系统的可用性随之降低。
4、如何避免大表扫描:通过使用大量的索引,可以避免对大量数据进行扫描。但这也将增加系统的复杂程度,降低系统进行动态查询的能力。
数据仓库建模技术不规范处理的阶段由于中央数据仓库的数据模型反映了整个企业的业务运行规律,在这里进行不规范处理容易影响整个系统,不利于今后的扩展。而且不规范处理产生的数据冗余将使
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江西中小学教师招聘考试南昌考区模拟试卷及一套答案详解
- 2025年临沂兰陵县教育系统部分事业单位公开招聘教师(5人)模拟试卷带答案详解
- 2025年河南中医药大学招聘高层次人才83人+考前自测高频考点模拟试题及完整答案详解
- 2025广西贵港市公安局港北分局招聘警务辅助人员62人考前自测高频考点模拟试题及参考答案详解
- 2025河南新乡事业单位招录203人考前自测高频考点模拟试题及1套完整答案详解
- 2025内蒙古土地资源收储投资(集团)有限公司常态化招聘急需紧缺专业人员50人模拟试卷及答案详解(考点梳理)
- 2025甘肃陇南市人民检察院招聘司法警察辅助人员5人考前自测高频考点模拟试题及答案详解(夺冠)
- 2025华远国际陆港集团所属企业校园招聘(山西)考前自测高频考点模拟试题及答案详解参考
- 2025北京市民政局所属事业单位第一批招聘75人模拟试卷及完整答案详解
- 2025年中国化学膜涂料行业市场分析及投资价值评估前景预测报告
- 江浙皖高中(县中)发展共同体2025-2026学年高三上学期10月联考技术试题(含答案)
- 2025贵州盐业(集团)遵义有限责任公司招聘15人笔试备考试题及答案解析
- EMS供应商对比方案报告
- 神奇的加密术教学设计-2025-2026学年初中数学北师大版2024八年级上册-北师大版2024
- 《现代施工工程机械》课件(共十四章)
- 价格波动对利润影响分析-洞察及研究
- DZ∕T 0338.1-2020 固体矿产资源量估算规程 第1部分 通则(正式版)
- 2024届唐山市高三高考一模(第一次模拟演练)语文试卷(含标准答案)
- 空调维保投标方案(技术方案)
- 光伏电站全面巡视标准化作业指导书
- 人教版七-九年级课文按文体分类目录
评论
0/150
提交评论