数据仓库-系统设计说明书_第1页
数据仓库-系统设计说明书_第2页
数据仓库-系统设计说明书_第3页
数据仓库-系统设计说明书_第4页
数据仓库-系统设计说明书_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、归一大数据平台数据仓库系统设计说明书牛控制匚受控不受控当编号版本号分册名称第册/共册总、页数止义附录,制审批生效日期修改变更记录:更改条款及内容更改人审批人更改日期创建文档阎飞谢益武2015-11-5目录1 引言51.1 文档编制目的51.2 背景61.3 词汇表61.4 参考资料62 总体设计72.1 软件体系结构72.2 系统运行体系错误!未定义书签。2.2.1 运行体系图错误!未定义书签。2.2.2 程序/模块对应表错误!未定义书签。2.3 系统物理结构72.4 技术路线83 系统接口设计83.1 用户接口84 子系统/模块设计84.1 数据仓库84.1.1 ODL(操作数据)层设计84

2、.1.2 BDL(数据仓库)层设计104.1.3 IDL(宽表)层设计114.1.4 PDL(应用)层设计124.1.5 PUB(维度)层设计154.1.6 数据导出设计165 数据结构与数据库设计176 外部存储结构设计177 故障处理说明178 尚需解决的问题18编写指南:本模板力图给出系统设计阶段可能包括的基本信息,重点在于和需求分析文档相联系。描述系统整体情况。如果某个章节在项目或当前阶段中无法描述,则可保留其标题,注明“不-4-适用”;如果需要对本模板的个别章节详细描述,也可将其形成单独的文档,成为本文档附件。若文档中的某个章节已经在其他项目文档中加以描述,可保留标题,注明“参见(文

3、档编号)(文档名称)(条款)”。形成正式文档后须删除斜体字内容。0报告编制要求这里列出本系统设计报告编制的经验性要求,须由系统设计人员参照其进行裁剪以确定本次报告编制的相关规定。序号要求1对各种结构图要求米用Visio绘制。2软件体系结构图通常包括:子系统实体、子系统间数据流、相关说明。3软件结构图通常包括:模块实体、模块间数据流、数据存储、相关说明。4运行体系图包括:进程实体、启动顺序、并发性、数据交换。5物理结构图包括:物理节点实体、物理节点分布、物理节点描述、物理节点间相互关系。6对数据库结构的描述要求采用结构图方式描述,而非采用过多表格。7数据库结构图主要包括:表实体、表间关系、主要字

4、段、相关说明四部分。8对于平台性产品,要求有系统层次的划分图。9通常要隔离应用对数据库的直接访问。1引言1.1 文档编制目的指导开发人员进行后期的开发工作;指导测试人员进行解决方案级的系统测试;1.2 背景叙述系统设计阶段的目标、作用范围以及其他应向读者说明的理解本报告所需的背景,如与公司其它软件之间的联系等。1.3 词汇表列出本系统设计说明书中专门术语的定义、英文缩写词的原词组和意义、项目组内达成致意见的专用词汇,同时要求继承全部的先前过程中定义过的词汇。词汇名称词汇含义备注备注中注明该词汇的来源,或有其他更详细的解释的文档位置;以及对该词汇的其他叫法。1.4 参考资料需求规格说明书系统架构

5、设计说明书数据仓库命名规范.docx2总体设计2.1 软件体系结构技术架构ft?Is可尸中心以上Jfc速计9所H握牛市虾酎况元刑SM,l*-Lrrjfcr谢h:掘二n刊宛1取库2.2 系统物理结构描述使用本软件系统典型用户的物理设备分布图及设备上相应基本软件配置。软件环境包括:操作系统、数据库、以及其它支撑软件;硬件环境包括:主机类型、网络类型、存储器容量、其它特殊设备。要求:1)尽量为系统的每个物理节点定义一个和功能相关的名称,名称的含义在词汇表中说明;2)结合运行体系图中提到的“程序”,将相关的“运行程序”分布到各个物理节点中;3)采用网络拓扑图表示。2.3 技术路线描述本软件系统在实现过

6、程中所采用的技术路线、方法。对较新的技术给予详细的阐述及必要的说明,在可能的情况下给出相应的技术参考资料。3系统接口设计3.1用户接口无接口。4子系统/模块设计4.1 数据仓库4.1.1 ODL(操作数据层)设计4.1.1.1 功能描述实现从外部系统导入数据到大数据平台,ODL层数据与数据源保持一致同步方式包括:增量同步全量同步数据源类型包括:数据库4.1.1.2 业务流程流程图:数据同步流程图调度系统分布式数据仓库数据源系统开始)数据库:一J远程调用数据库同步读取同步脚本一I.X.J.<是否成功是N0D*施袤异常处理二一葭结束流程说明:1 .调度系统定时启动数据同步作业.2 .作业读取

7、数据同步脚本,远程调用数据库接口.3 .数据库接口返回远程调用结果.4 .接收数据库接口返回的数据集,装载到ODL本地表.异常处理:调度系统捕获异常并处理日志说明:由调度系统负责记录作业(正常和异常)日志.数据源说明:1 .通过视图封装需要同步的物理表,与业务进行隔离.当物理表发生变动尽量通过修改视图兼容.2 .数据同步程序访问数据源视图.数据粒度说明:与数据源保持完全一致。4.1.1.3作业设计详见<<数据同步列表.xlsx>>4.1.2 BDL(事物层)设计BDL层对ODL数据进行清洗、转换,实现统一维度的数据整合。4.1.2.2 业务流程流程说明:1 .调度系统定

8、时启动数据同步作业.2 .作业t取ODL表,进行数据清洗,对不符合规则的数据进行丢弃或转换3 .将转换后的结果数据装载到BDL本地表.异常处理:调度系统捕获异常并处理.日志说明:由调度系统负责记录作业(正常和异常)日志.数据粒度说明:与ODL保持一致.4.1.2.3 作业设计详见<<数据仓库转换文档.xlsx>>4.1.3 IDL(宽表层)设计4.1.3.2 功能描述在IDL层对BDL事实表按主题进行合并,形成一次写多次读的宽表,降低系统整体开销.并实际根据需要进行用户级粒度的聚合,进一步提高查询效率.4.1.3.3 业务流程流程说明:1 .调度系统定时启动数据同步作业

9、.2 .按主题读取相关BDL表,进行关联,尽量补齐维度字段,生成事物级宽表.3 .按用户级粒度聚合,生成用户级宽表.异常处理:调度系统捕获异常并处理日志说明:由调度系统负责记录作业(正常和异常)日志.数据粒度说明:1 .事物级粒度.2 .用户级粒度.4.1.3.3作业设计详见<<数据仓库转换文档.xlsx>>4.1.4PDL(应用层)设计4.1.4.1 功能描述PDL层按业务需求,IDL宽表汇总查询生成各种结果表4.1.4.2 业务流程流程图:流程说明:1 .调度系统定时启动数据同步作业.2 .读取IDL宽表,按业务需求进行聚合,筛选,生成指标数据.3 .结果写入PDL

10、层结果表.异常处理:调度系统捕获异常并处理日志说明:由调度系统负责记录作业(正常和异常)日志.数据粒度说明:1.按业务需求的各种粒度.4.1.4.3 业务账数据统计设计业务账数据统计如下特点:业务账指标由多个交易类型代码组合,一个交易类型代码对应多个业务指标,例如:业务账指标A交易类型代码M00010,M00001,M00002,M00003,业务账指标B交易类型代码M00010,M00011,M00012,M00013,业务账指标C交易类型代码M00000,M00011,M00002,M00023,随需求也业务变化,业务账指标及其交易类型代码也会变化.每个业务账指标统计算法相同,只是其交易类

11、型代码组合不同.每个业务账指标可能会被多个报表调用,例如积分总金额”针对以上特性,通过抽象的方法,设计对指标(交易类型代码)配置化管理、运算统一化技术的功能,减少系统维护成本。4.1.4.4 作业设计详见<<数据仓库转换文档.xlsx>>4.1.5PUB(维度)库设计4.1,5.1功能描述采用异步LOOUP方法,主动捕获非法维度数据,经过人工识别生成维度数据4.1.5.2业务流程流程说明:1 .调度系统定时启动数据同步作业.2 .异步读取ODL表和维表,对比维度映射表查找是否有不存在的维度数据3 .如果发现非法维度数据,经过人工识别,写入维度映射表和维度表.异常处理:调

12、度系统捕获异常并处理日志说明:由调度系统负责记录作业(正常和异常)日志.4.1,5.3作业设计详见<<数据仓库转换文档,xlsx>>4.1.6 业务账(数据集市)库4.1.7 数据导出设计4.1.7.1 功能描述将PDL表和维度导出,同步给mysql库,供统计报表查询使用4.1.7.2 业务流程数据导出流程图调度系统分布式数据仓库门户系统读取同步脚本装载一一统计表、维表PD/、维表抽取流程说明:1 .调度系统定时启动数据同步作业2 .读取PDL表和维表,将数据装载到MYSQL库对应的表中.异常处理:调度系统捕获异常并处理日志说明:由调度系统负责记录作业(正常和异常)日志.4.1.7.3作业设计5数据结构与数据库设计详见<<数据库设计说明书.docx>>6外部存储结构设计说明本系统存贮于磁盘等持久性存贮介质,而且不是由数据库管理系统进行管理的数据的组织结构,包

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论