




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库层次结构规范一. 数据仓库层次结构规范基本分层结构系统的信息模型从存储的内容方面可以分为,STAGE接口信息模型、ODS/DWD信息模型,MID信息模型、DM信息模型、元数据信息模型。在各个信息模型中存储的内容如下描述:层(对应原来数据模型的接口层信息模型:ETLSTAGE层存在的意义在于两点:对数据源作统一的一次性获取,数据仓库中其他部分都依赖于ODS/DWD(对应原模型的ODS和DW层信息模型层ODS/DWDMID信息模型DWDDWD的数据来源于生产型系统,并为满足一些不可预见的需求而进行沉淀; DM信息模型DWDMIDMDW首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据,:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。各层物理表前缀在构建数据仓库时,至少应该具备以下物理几层:联通数据模型规范要求的层次数据中心物理模型层次名称物理表前缀维度数据层DIM_数据集市层(DM)展示层DM_主题域DW_F_轻度汇总层(MID)轻度汇总层DW_M_细节数据层(ODS/DWD)细节数据层DW_V_接口层(STAGE)接口层SRC_数据库对象命名规范所象名均英文字母划线或数来命名得头。用户用户名相似的英文,表空间或多个理文件也应有开用和提应速以上从逻辑上分出的各数据层应当在数据库中用户实现其分离,规定如下:数据层名称用户物理表备注接口层SRCSRC沉淀数据层DWDW_V,DW_M,DW_F数据集市层DMDM_元数据层MDWMDW_目前未设计维度数据层DIMDIM_数据库表空间,原构为准作前缀单大带或者ODS/DWD数据量单太大分和原议单800G议值4G。数据表空间数据仓库分层结构用户表空间名数据文件/裸设备STAGSRCTBS_STAG001……TBS_STAGXXX2G=<单设备文件<=8G,建议值:4GODS/DWDDWTBS_DWV001,……,TBS_DWVXXXdw_v的表INDX_TBS_DWV索引表空间TBS_DWM001,dw_m的表……,TBS_DWMXXXINDX_TBS_DWM索引表空间TBS_DWF001dw_f的表INDX_TBS_DWFDWF索引MIDMIDTBS_MID同上DMDMTBS_DM同上INDX_TBS_DMDM索引MDWMDWTBS_MDW同上DIMDIMTBS_DIM同上数据库表命名规范表名长超字符名中有单能表内容的一个多个英文,多个分割,单词如过长缩写式。命名规则如下:表的类型前缀层次说明示例维度表DIM_DIMDIM_+主键客户视图DW_V_USER_DW_M_USERDW三个视图产品视图DW_V_PROD_DW_M_PROD_DW市场营销视图DW_V_MART_DW_M_MART_DW发展域DW_F_DEV_DW8个主题域根据业务具体分为:移DW_F_DEV_M_智能网DW_F_DEV_I_数固DW_F_DEV_D_收入域DW_F_INCO_DW同上使用域DW_F_USE_DW同上增值域DW_F_INC_DW成本域DW_F_COST_DW资源域DW_F_RES_DW竞争域DW_F_COMP_DW服务域DW_F_SERV_DW数据库分区表规范对于海量数据表要考虑设计为分区表。一般情况应该采用“月份”作为分区。分区的名称应该如“PART200504”这样的形式。如按日建子分区,子分区名称形式如下:PART200504_SUBPART_01数据库表索引命名以IDX+表名+一位流水号.例:IDX_ODS_BUSI_USER_1;如果表名过长可以使用缩写形式数据库表键值主键命名以PK+表名+一位流水号(1~9).例:PK_DEPT_1;如果表名过长可以使用缩写形式外键命名以FK+表名+一位流水号(1~9).例:FK_DEPT_1;如果表名过长可以使用缩写形式数据库字段命名规范数据库字名中含能或多个英单词下划线分割单词如过长形式。一些基本字段名示例:用户idUSER_NO用户USER_COUNTS话单CDR_NUM通话时CALL_DURATION计费次MOBILE_TIMES每个字段必须有注释,并且在生成SQL脚本时一并生成,创建表时必须创建注释。保持字段名和类型的一致性,同一字段名在不同表中必需保持同一数据类型。数据类型长度在定义时应稍大于目前标准的长度,用空间来换取将来变更带来的不便。数据库存储过程规范则:P_注释,范:每一存储过程均应记录执行存储过程的日志信息。必须调用专用写日志的存储过程,同时有exception时的处理机制。范修改时应注释清楚修改人,修改日期,修改原因和修改内容。数据库函数命名规范函数命名规则F_功能,比如F_TRAN_AREA。据库触发器的命名规范触发器以TR作为前缀,触发器名为相应的表的别名加上后缀,INSERT触发器加‘_INSERTDeleteDELETEUpdate‘_UPDAETRCUST_ISERT序列命名规范序列以S作为前缀,序列命名规则为S_字段别名。二. 实施流程规范(完善中(1)对实施计的规划(2)计设计实施方案(包括统一模型的修改)。具体实施过程。对实施结果测试。对实施过程中收集到的相关信息(系统需求、实施中遇到的问题和测试结果等)反馈到相关部门和人员。三. 数据库安全管理规范为了规范管理,做好经营分析数据仓库的安全管理工作,实现不同的责任人不同的层次,将用户权限尽可能的管理起来同时又不影响正常工作,需要对数据库进行安全管理。数据库安全管理从以下几个方面来进行:用户组管理对用户进行分类,目前经营分析应用用户可以分为如下几部分前台程序发人员数据库开数据库管理人员由项目经理和数据经理来掌控,一般情况下不得使用DBA角色登陆数据库。数据人员使用数据库开发人员角色登陆,每个数据人员一个用户,归属数据库开发人员组。前台程序开发人员,由界面开发人员使用,可以查看所有的表,但是无法进行DDL操作。外部使用人员,主要是面向联通用户和临时用户用户权限设定响定原越小越好。用户密码管理对用户密码进行限制,必须由2位以上数字,2位以上字符,2位以上特殊字符组成不允许用户密码和用户名同名不允许用户密码和用户名相似用户资源管理除了系统使用的用户(SRC/ODS/DW)等外对用户使用的系统资源进行限定限定用户使用内存IP限定对于普通用户,实行IP和用户名绑定的策略对于外部开放用户,要进行IP申请,由数据经理或者项目经理审核通过后予以开通数据库监控数据库监控,主要对以下几个方面进行监控:数据库空间占用率查看目前各空间占用情况数据库的无效索引查看目前数据库中的索引情况数据库的无效对象查看目前数据库的对象有效性,主要针对脚本数据库表分区的是否到达限额查看是否有表分区不满足需求的情况,这项监控根据具体需求来数据库内存占用情况查看目前数据库内存的占用情况DDL语句的监控查看各种DDL语句的使用情况,记录操作者的IP,时间,用户名等情况特定DML语句的监控对某些特定的重要的数据库对象,记录DML操作的历史数据库审计语句审计(StatementAuditing)对预先指定的某些SQL语句进行审计。这里从SQL语句的角度出发,进行指定。审计只关心执行的语句。例如,auditCREATETABLE;命令,就表明对"createt
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025店面房屋租赁合同范本
- 2025智能手机买卖合同范本
- 2025年文明安全纪律教育月工作方案
- 2024-2025苏教版科学一年级下册第一单元测试卷附答案
- 2025小学道德与法治教师课标练习卷选择题参考答案
- 2025高中地理教师课标考试模拟试卷及答案(二套)
- 2025资产委托管理合同(投资受托人)
- 2025【深入解析无效合同】合同无效性分析
- 2025供电公司劳动合同
- 2025年农产品交易合同范本
- 新媒体技术应用 课件 5.1.1易企秀如何制作H5
- 如何正确佩戴安全帽
- 【高考真题】2022年新高考物理真题试卷-河北卷(含答案)
- 社保系统保密培训
- 2024-2030年中国临近空间飞行器发展规划及未来前景展望研究报告
- 瑞幸咖啡认证考试题库(值班主管)
- 工厂自动化规划报告
- 2023年LNG设备操作维护手册培训资料
- 一般企业财务报表附注(模板)
- 【MOOC】倾听-音乐的形式与审美-武汉大学 中国大学慕课MOOC答案
- 人力资源调配应急演练
评论
0/150
提交评论