版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
小型超市数据仓库系统SMDW简介
四川大学
智胜公司
数据库与知识工程研究所唐常杰1小型超市数据仓库系统SMDW简介
提纲1SMDW数据仓库要点2
u
SMDW--SmallSuperMarketDataWarehouse,经营资本5000万元以下u
数据仓库概念创始人W.H.Inmon:
“数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合
用以支持经营管理中的决策制订过程。”u
数据仓库技术强调了“处理过程”
而不是强调某一个软件或硬件产品。
1SMDW数据仓库要点3
u
数据仓库是对原始的操作数据从历史的角度组织和储存数据的处理过程
它把各个信息源中与决策支持有关的数据
经过提取(Extract)、转换(Transform)、过滤和装载(Load)集成
按主题存放起来
供决策人员查询和分析
从而作出科学性的和战略性的决策。开发重点和难点在ETL比喻:基本数据库(运行数据库)-----水泥,钢筋,砂
数据集市----预制件
(星型,雪花型)面向被被解决问题(主题),
用预制件组装
比用
水泥,钢筋,砂临时浇铸
快,好
1SMDW数据仓库要点(续)4
数据仓库、数据仓库管理系统(DWMS)和数据仓库工具。核心:数据仓库DWMS,由DBMS+界面+专用程序实现。主题:用DBMS中的一系列表实现。关系数据库在模拟多维数据时将多维结构划分为两类表
事实表和维表。星型模式和雪花模式并存兼容的方式。三部分组成
2SMDW组成5
由于XBase系列在我国曾经大量使用并积累了大量的原始操作数据
基于这一国情
SMDWV1.0版允许XBase系列为数据源
在升级版本中用ODBC连接SQLServer
Oracle
Access等
以形成多数据源的数据仓库。
2SMDW组成(续)6
3SMDW用户界面和主要功能
7
3.1数据提取过滤集成
从超市每日交易的详细数据中提取数据
将不一致的字段长度、不一致的赋值、丢失的数据输入等经过清理过滤
按照统一的编码、统一的格式整合集成
然后装入数据仓库。3.2主题的选择和汇总
SMDW是面向主题
目前版本选取了超市最重要的两个主题
商品和顾客。超市经理最关心问题:某某顾客经常购买哪些商品?哪些商品经常被顾客一起购买?
3SMDW用户界面和主要功能8
顾客主题汇总每个顾客每日购买的商品的购买量和购买额(未购买商品则无相应数据)。每个顾客每周、每月购买商品的购买量和购买额。商品主题汇总每种商品的日销量、日销售额及日利润。每周、每月的销量、销售额和利润及这三个数据的日平均、最大和最小值。
3SMDW用户界面和主要功能9
商品主题:每种商品的每日销量、销售额和利润
每种商品的每周销量、销售额和利润及这三个数据的日平均、最大、最小值
每种商品的每月销量、销售额和利润及这三个数据的日平均、最大、最小值
结果可以表格和图形(直方图、圆饼图、折线图等)两种方式显示。分析出什么商品最畅销
什么商品最赚钱
用以指导超市的经营策略。
查询功能
10
顾客主题
可查询每个顾客每日的购买量和购买额
每周的购买量和购买额
每月的购买量和购买额查询结果可以表格和图形(直方图、圆饼图、折线图等)两种方式显示。查询结果可知顾客的购买力和购买行为
如某顾客经常买高档商品
则说明他的购买力强
某顾客常常买中低档商品
少有买高档商品
则说明他的购买力一般
超市从而可有针对性地培养顾客群。
查询功能
11
l
可分析超市日销售额、日利润月趋势周销售额、周利润年趋势月销售额、月利润年趋势并以表格和图形(直方图、折线图、圆饼图等)两种方式显示结果。l
可作历史比较和趋势分析。可作关联规则挖掘
“在购买面包和黄油的顾客中
有90%的人同时也买了牛奶”(面包+黄油→牛奶)。关联规则挖掘在给定支持度阈值后,
使用Apriori算法
分析哪些商品顾客最有可能一起购买
从而预测顾客未来的购买行为
以便为顾客提供更好的服务以吸引顾客
扩大市场。
数据挖掘分析
12
系统把用户分为超级用户和一般用户并拥有不同的权限和口令。一般用户只能见到常规数据无权查看敏感数据。SMDW的系统安全管理
13
4SMDW体系结构
DB1
DBn数据提取数据过滤集成数据加载当前数据历史数据综合数据仓库管理元数据库用户查询工具用户分析工具14
l
源数据
SMDW的数据来源于超市各分店每日交易数据
即多个关系数据库。l
提取转换
l
仓库管理
元数据(数据结构、转换规划、仓库结构、控制信息)。仓库管理包括对数据的安全、归档、备份、维护、恢复等工作
这些工作需要利用数据库管理系统(DBMS)的功能。l
查询分析工具
用于完成实际决策问题所需的查询检索工具、L数据挖掘分析工具等
以实现决策支持系统的各种要求。
4SMDW体系结构(续)15
扩展的雪花模式有多个事实表的雪花模式
。
操作数据存储ODS简化SMDW的数据传输接口和SMDW管理数据的复杂度特殊技术
16
雪花模式(在事实表周围放射出多层次的维表)维表商店id店名地址Tel事实表商店id商品id顾客id售货员id日期id售价数量金额维表顾客id顾客名称地区地址Tel维表商品id商品名称厂家id商品类别进货日期进价库存数维表日期id日月年维表售货员id姓名性别年龄地址Tel维表厂家id名称地址Tel维表商品类别类别名称档次维表地区省别维表商店id店名地址Tel维表周次日期段事实表1商店id商品id周次总销量最大最小平均事实表2商店id商品id周次销售总额最大最小平均事实表3商店id商品id周次总利润最大最小平均维表商品类别类别名称档次维表商品id商品名称厂家id商品类别进货日期进价库存数维表厂家id名称地址Tel17
日总结采用简单堆积文件手动方式和自动方式。每日子夜时分设置好后机器可自动进行总结。周总结、月总结采用轮转综合文件。总结方式也有手动和自动两种。数据仓库维护
18
系统查询分析得到的部分结果
19
系统查询分析得到的部分结果
20
小型超市数据仓库系统SMDW
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 货运配送与运输管理指南
- 企业文件归档与保管规定解读
- 2026年洛阳市涧西区街道办人员招聘考试模拟试题及答案解析
- 2026年大庆市萨尔图区网格员招聘考试备考试题及答案解析
- 2026年成都市成华区街道办人员招聘考试备考试题及答案解析
- 2025年辽宁省沈阳市街道办人员招聘考试试题及答案解析
- 2026年上海市浦东新区幼儿园教师招聘笔试备考题库及答案解析
- 2026年乌鲁木齐市新市区街道办人员招聘考试参考试题及答案解析
- 2026年甘肃省平凉市幼儿园教师招聘笔试参考试题及答案解析
- 2026一年级下《找规律》易错题解析
- 机加工产品过程审核表
- 禁止电动自行车违规停放、充电行为的承诺书
- QB-T1022-2021制浆造纸企业综合能耗计算细则
- 医院科研诚信课件
- 《药物化学》课件-苯二氮䓬类药物
- 《精神病学》人卫-第一章-绪论
- 工程伦理 课件全套 李正风 第1-9章 工程与伦理、如何理解伦理- 全球化视野下的工程伦理
- 生物安全标准操作规程
- 石油产品库仑氯分析仪校准规范
- 食品安全管理制度目录
- 高中生入团申请书800字
评论
0/150
提交评论