版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 构建基于FoodMart数据库的福马特商业智能系统。按照学习理论,“大处着眼,小处着手”是快速学习的好方法,它既能把握全局,又能掌握细节 内容安排上属于实践中的“务实”,理论上的“务虚”,只着眼于操作过程而忽略其中的深奥理论,目的在于明确一个商业智能应用的全貌 基于FoodMart数据库的福马特商业智能系统 FoodMart数据据库是SQLServer以前版版本所带带的示例例数据库库,它模模拟了一一家大型型的食品品连锁店店的经营营业务所所产生的的数据。其商业数数据保存存在一个个数据库库中,其其中包括括了客户户管理数数据、销销售数据据、分销销数据和和库存数数据等。随着业业务量的的增加,这个食食
2、品连锁锁店的老老板迫切切需要多多方位地地掌握其其经营状状况,而而传统的的报表形形式和数数据处理理方式已已经不能能满足这这一要求求,因此此在保留留历史数数据的基基础上构构建商业业智能应应用已经经迫在眉眉睫。下下面就描描述满足足这一商商务需求求的技术术实现过过程。FoodMart数据据库涉及及到公司司经营的的各个方方面,包包括产品品、库存存、人事事、客户户和销售售等。一一个真正正的商业业智能应应用应该该对这些些业务需需求进行行全面地地考虑。本章截截取这些些需求中中的销售售部分构构建商业业智能打开配套套文件中中附带的的foodmart.mdf文件,可以看看到如图图2-1所示的的表人事管理理中的员员工
3、信息息存储在在employee表表中员工所属属部门信信息存储储在department表表中职务信息息则存储储在position表中库存管理理业务中中的仓库库类型存存储在warehouse_class表表中具体的仓仓库存储储在warehouse中。2.1.2设设计数数据仓库库逻辑模模型福马特市市场部的的商务需需求是要要对1998年年进行的的所有销销售业务务数据进进行多角角度分析析,以便便市场分分析人员员能在查查询数据据库时获获取快速速的响应应,高层层管理人人员也能能从总体体上把握握影响本本年度销销售的因因素。这这需要利利用存储储在公司司业务数数据库中中的数据据,建立立数据仓仓库,进进而创建建可用
4、于于分析的的多维数数据结构构。如前所述述,这里里只着眼眼于销售售方面的的数据,因而把把与销售售相关的的表提炼炼出来进进行分析析。在foodmart数据据库中,销售业业务的数数据和时时间、促促销手段段、产品品和店铺铺等都有有关系,它们的的关系体体现在表表与表之之间的逻逻辑关系系上。要从业务务数据出出发设计计数据仓仓库的结结构,必必须明确确业务数数据本身身的结构构,而业业务数据据的关系系一般是是基于关关系数据据库设计计的范式式。数据据仓库中中表的关关系不受受关系数数据库设设计范式式的约束束,但也也要遵循循一定的的结构规规范,如如星形结结构和雪雪花形结结构即是是这种类类型的规规范。同同时这也也是数据
5、据仓库逻逻辑结构构的两种种类型。这里希望望用雪花花形结构构来构建建福马特特商店的的销售数数据仓库库,逻辑辑结构设设计图如如图2-2所示示销售数据据仓库雪雪花形结结构设计计图在数据仓仓库的逻逻辑结构构中,数数据表可可以划分分为两类类:一类类是事实实数据表表(简称称为“事事实表”),用用来存储储数据仓仓库中的的实际数数据,如如这里存存储1998年年销售数数据的sales_fact_1998表表即为事事实表;另一类是是维度数数据表(简称为为“维度度表”),用来来存储数数据仓库库中的维维度数据据,如这这里的关关于时间间、促销销手段和和产品等等分析要要素的表表均为维维度表。注意,在在本例中中设计的的维度
6、表表和事实实表与原原始数据据中的表表名及结结构都一一致,这这主要是是由原始始数据的的特点和和本章作作为入门门章节的的定位决决定的。在实际际设计的的时候,通常需需要根据据需求情情况重新新建立与与原始数数据不同同的表结结构。这这主要是是由于传传统业务务的数据据库是用用来进行行事务处处理的(即OLTP),而数数据仓库库则是用用来进行行分析处处理的(即OLAP),用途途的不同同决定了了其结构构的不同同。这一一点在以以后复杂杂的数据据仓库设设计中会会通过示示例体现现出来。2.1.3创创建foodmartsaleDW数据据仓库数据仓库库也是一一种数据据库,其其管理同同样是通通过数据据库管理理系统(DBMS
7、)来来进行的的。因此此数据仓仓库可以以像普通通数据库库一样进进行创建建、修改改和删除除。当数数据仓库库的逻辑辑结构设设计完后后,就可可以创建建物理数数据仓库库了。这时可以以在SQLServerManagementStudio中中按照一一般的建建立数据据库的方方法建立立一个名名为“foodmartsaleDW”的的数据库库,然后后把这里里设计的的表创建建好,数数据类型型依据原原始数据据库中的的各个表表和字段段的数据据类型设设置但由于这这里数据据仓库的的表结构构与原始始数据库库中的表表结构基基本一致致,因此此,创建建foodmartsaleDW数数据仓库库的物理理结构过过程也可可以在ETL阶阶段完
8、成成2.2设设计计和使用用ETL这里的任任务就是是要把数数据从其其他类型型数据库库或其他他类型数数据载体体中装载载到foodmartsaleDW数据仓仓库中。需要使使用到SQLServer Integration Services服务,即SSIS(1)打打开Business IntelligenceDevelopmentStudio,选择【文件】【新新建】【项目目】命令令,弹出出“新建建项目”对话框框,展开开“商业业智能项项目”,在“模模板”窗窗格中,单击“IntegrationServices项项目”,把项目目命名为为“foodmartsaleETL”,如图图2-3所示。这时会在在BIStu
9、dio环境中中打开用用于设计计SSIS的各各种工具具和窗口口,数据据提取、转换和和加载的的操作都都在这个个界面下下进行。(2)选选择【项项目】【SSIS导导入和导导出向导导】命令令,这时时会弹出出SSIS导入入和导出出向导的的欢迎界界面,单单击【下下一步】按钮。(3)在在“选择择数据源源”窗口口中的“数据源源”下拉拉列表框框中选择择Access数据源源选项,如图2-4所所示。然然后在路路径选择择中选择择此项目目文件夹夹中的foodmart2000.mdb文件件。2-7这时会让让用户选选择源表表和源视视图,如如图2-7所示示。按照照前面对对数据仓仓库的设设计,这这里选择择原始表表中的time_b
10、y_day、promotion、product、product_class、customer、store和sales_fact_1998表作作为需要要输入的的表。这里对原原始表中中需要导导入到数数据仓库库的数据据有很强强的可定定制性,对这些些已经选选择的表表中的字字段还可可以进行行筛选和和改变,对不需需要的字字段进行行去除操操作,这这就是所所谓的数数据清洗洗。当然然也可以以选择其其他的表表一起导导入数据据仓库中中。可以以看到,不一定定所有的的业务数数据库中中的数据据都必须须体现在在数据仓仓库中,数据仓仓库中的的数据也也有可能能是经过过业务数数据库中中的数据据运算而而得到的的,这都都取决于于具体
11、商商务活动动的需求求。在图2-7的界界面中,还可以以对数据据导入的的目标进进行定制制,可以以对映射射方式进进行编辑辑,甚至至可以自自己写“CREATE TABLE”语句句作为复复制的目目标表。这些改改变都可可以体现现在数据据仓库的的物理结结构中。这里不对对映射及及其目标标进行变变更,保保持默认认的状态态,使生生成的数数据仓库库的物理理模型完完全符合合前面对对数据仓仓库的逻逻辑模型型的设计计。(7)以以上操作作完成后后,单击击【下一一步】按按钮,系系统将会会把前面面的操作作列表并并要求用用户确认认,并提提示将会会把包以以“Package1.dtsx”作为文文件名保保存在项项目文件件夹下面面,而且
12、且不会立立即执行行。确认认无误后后单击【完成】按钮。(8)在在“解决决方案资资源管理理器”中中展开“SSIS包”文件夹夹,在Package1.dtsx上单击击鼠标右右键,在在弹出的的快捷菜菜单中选选择【设设为启动动对象】命令,如图2-8所所示。(9)单单击工具具条上的的运行行按钮运运行这个个工程,可以发发现在SSIS设计界界面的“控制流流”和“数据流流”等选选项卡内内都有对对象在活活动,这这是系统统正在把把数据从从foodmart2000.mdb数数据库中中按照前前面所确确定的规规则装载载入foodmartsaleDW数据仓仓库中。新建的数数据仓库库中的表表需要设设置必要要的主键键及外键键,否
13、则则无法建建立多维维数据集集SSIS的进一一步使用用请参照照朱德利利书第四四章案例见4.32.3创创建建OLAP数据据立方设计好了了结构良良好的数数据仓库库,并且且将需要要分析的的业务数数据装载载到了数数据仓库库中之后后,就为为满足商商务决策策的全方方位需求求打下了了根基,以后的的操作都都是基于于这些拥拥有数据据的数据据仓库进进行的。但是,对数据据的多维维分析却却并不是是主要针针对数据据仓库,而是针针对从数数据仓库库中提取取的子集集,如数数据集市市和多维维数据集集(也称称为数据据立方)。因此此通常还还需要在在具体分分析数据据之前创创建数据据立方。数据立方方的创建建和管理理需要用用到SQLSer
14、ver2005中BusinessIntelligenceDevelopmentStudio的Analysis Services组件,即SSAS。这里将创创建用于于福马特特商店销销售分析析的数据据立方,首先要要创建一一个SSAS的的项目。打开Business IntelligenceDevelopmentStudio,选择【文件】【新新建】【项目目】命令令,或按按【Ctrl+Shift+N】组组合键以以显示“新建项项目”对对话框。在“新新建项目目”对话话框中,从“项项目类型型”选项项组中选选择“商商业智能能项目”。从“Visual Studio已安安装的模模板”选选项组中中选择“Analysis
15、Services项项目”。在“名称”文本框框中输入入“foodmartsaleAS”作为为项目名名称,如如图2-10所所示。单单击【确确定】按按钮进入入SSAS的工工作界面面。建立foodmartsaleAS项目打开“解解决方案案资源管管理器”,可以以看到数数据源、数据源源视图、多维数数据集、维度和和挖掘结结构等8个文件件夹对象象,建立立和管理理数据立立方也是是主要针针对这8个对象象进行的的。下面面介绍创创建数据据立方的的步骤2.3.1定定义数数据源这是创建建数据立立方的第第1步。在“解解决方案案资源管管理器”中的“数据源源”文件件夹上单单击鼠标标右键,在弹出出的快捷捷菜单中中选择【新建数数据
16、源】命令,如图2-11所示。新建数据据源在弹出的的“选择择如何定定义连接接”窗口口中选择择“基于于现有连连接或新新连接创创建数据据源”单单选按钮钮,在“数据连连接”列列表框中中选择foodmartsaleDW数据据源,如如果没有有此连接接,可以以单击【新建】按钮,定义指指向foodmartsaleDW 数据据仓库的的连接。设置完完成后的的页面如如图2-12所所示。由由于向导导下面的的操作是是没有必必要的,所以这这里可以以直接单单击【完完成】按按钮结束束数据源源向导。定义数据据连接2.3.2定定义数数据源视视图数据源提提供与数数据库的的简单连连接,但但更多高高级功能能,如缓缓存元数数据、添添加关
17、系系、创建建计算和和设置逻逻辑键等等还需要要使用数数据源视视图来完完成。为为了对多多维数据据集进行行这些高高级操作作,这一一步定义义数据源源视图。可以在“数据源源视图”文件夹夹对象上上单击鼠鼠标右键键,在弹弹出的快快捷菜单单中选择择【新建建数据源源视图】命令,然后在在弹出的的“数据据源视图图向导”窗口中中选择foodmartsaleDW选项项作为关关系数据据源,单单击【下下一步】按钮。这时会会弹出如如图2-13所所示的“名称匹匹配”窗窗口,其其原因是是在前面面SSIS的数数据装载载操作中中没有为为数据仓仓库中的的表设置置主键及及其关系系,SSAS试试图在匹匹配的列列上创建建逻辑关关系,可可以选
18、择择“与主主键同名名”单选选按钮,单击【下一步步】按钮钮继续设置名称称匹配这时进入入“选择择表和视视图”窗窗口,如如图2-14所所示。可可以从选选定的数数据源提提供的对对象列表表中选择择表和视视图。这这里主要要的商务务需求是是对销售售数据进进行分析析,所以以可以把把相关的的数据表表都选入入数据源源视图,对数据据源中与与分析需需求关联联不大的的要素也也可以不不选入此此分析视视图,例例如此处处的region表可可以不用用选入数数据源视视图。以上操作作完成后后,单击击【下一一步】按按钮,为为此数据据源视图图命名为为Vfoodmartsale,再再单击【完成】按钮结结束此向向导选择表和和视图同样也是是
19、由于数数据源中中的表没没有设置置主键的的原因,现在打打开的数数据源视视图上的的表都是是独立的的,相互互之间没没有关系系,还需需要我们们设置各各个表的的主键及及其关系系才能成成为可用用的视图图。一般来说说,事实实表是没没有主键键的,而而维度表表都有主主键,且且每一个个维度表表的主键键都是事事实表的的外键,因而,需要为为每一个个维度表表设置主主键,如如图2-15所所示,在在维度表表中选择择应该为为主键的的字段,然后单单击鼠标标右键,在弹出出的快捷捷菜单中中选择【设置逻逻辑主键键】命令令,即可可设置维维度表的的主键。设置维度度表的主主键对每一个个维度表表设置好好主键后后,应该该设置维维度表和和事实表
20、表之间的的关系,方法是是把事实实表中的的外键作作为源,拖动到到维度表表中的相相关字段段,这时时会弹出出“创建建关系”窗口,如图2-16所示。需要注注意的是是一定要要把外键键表作为为源,主主键表作作为目标标,如果果方向错错了,可可以单击击图2-16的的【反向向】按钮钮以保证证其关系系符合业业务数据据中的逻逻辑关系系。创建关系系”对话话框按照以上上的步骤骤,设置置好维度度表和事事实表之之间的关关系后,数据源源视图将将会如图图2-17所示示设置好表表间关系系后的数数据源视视图2.3.3生生成多多维数据据集这一步在在上面创创建的数数据源视视图的基基础上生生成多维维数据集集,方法法如下。(1)在在“解决
21、决方案资资源管理理器”中中用鼠标标右键单单击“多多维数据据集”文文件夹对对象,在在弹出的的快捷菜菜单中选选择【新新建多维维数据集集】命令令。(2)在在弹出的的“多维维数据集集向导”欢迎界界面中单单击【下下一步】按钮进进入“选选择生成成方法”窗口,如图2-18所示。在此窗窗口中选选择“使使用数据据源生成成多维数数据集”单选按按钮,并并且确认认选中了了“自动动生成”复选框框,并在在下拉列列表框中中选择“创建属属性和层层次结构构”选项项,以便便向导能能为维度度表中的的大多数数列创建建属性,并尝试试建立包包含多级级的层次次结构。“选择生生成方法法”窗口口(3)单单击【下下一步】按钮,选择前前面创建建的
22、数据据源视图图来为多多维数据据集提供供数据。再单击击【下一一步】按按钮,向向导将扫扫描关系系架构,以识别别事实表表和维度度表。识识别完成成后,单单击【下下一步】按钮将将会弹出出如图2-19所示的的“标识识事实数数据表和和维度表表”窗口口。选择择“time_by_day”作为为时间维维度表,并且按按照图中中所示来来分别设设置各表表为事实实表或是是维度表表。设置置好后单单击【下下一步】按钮继继续。标识事实实数据表表和维度度表(4)由由于上一一步选择择了“time_by_day”作作为时间间维度表表,这一一步需要要设置时时间维度度的层次次结构。在所有有维度的的层次结结构中,只有时时间维度度最为特特殊
23、。其其他维度度系统可可以根据据数据之之间的关关系检测测其层次次结构,而时间间维度则则需要指指定其时时间上的的层次。如图2-20所示,依据时时间表中中的具体体情况,为年月月日等时时间属性性指定时时间表列列。设置置好后单单击【下下一步】按钮继继续。指定时间间维度层层次结构构(5)这这时系统统将会让让用户选选择度量量值,如如图2-21所所示。度度量是来来源于事事实表中中的数据据,在图图中选择择“Store Sales”、“StoreCost”和和“UnitSales”为度量量。单击击【下一一步】按按钮继续续。选择度量量值(6)这这时系统统将会依依据前面面对维度度表和事事实表的的设置来来检测层层次结构构。如果果前面的的设置都都是正确确的,则则会成功功检测其其层次结结构,检检测完毕毕,单击击【下一一步】按按钮继续续。(7)由由于前面面系统自自动检测测了维度度之间的的层次关关系,因因此,产产生了一一些新的的维度,这一步步向导将将提供一一个窗口口来查看看新建维维度的结结构并根根据需要要进行更更改。此此例中的的新建维维度结构构关系如如图2-22所所示。可可见,由由程序自自动分析析出来的的层次结结构和用用户自己己设置的的时间层层次结构构都是和和业务数数据中的的逻辑结结构相符符合的。如果不不符合,则可以以在这一一步进行行修改。设置完完成后单单击【下下一步】按钮,为多维维数据集集指定一一个名称
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【文档】应急管理部18号令《安全生产违法行为行政处罚办法》重点解读
- 2024-2025学年反射疗法师3级经典例题重点附答案详解
- 证据支持下的护理实践
- 紧急项目进度通报回复函7篇范本
- 2024-2025学年公务员(省考)考前冲刺试卷(考点梳理)附答案详解
- 2024-2025学年云南交通职业技术学院电视播音主持期末考试考前冲刺试卷及参考答案详解(达标题)
- 2024-2025学年度执业兽医试题(夺分金卷)附答案详解
- 2024-2025学年度专升本试卷带答案详解(达标题)
- 2024-2025学年度收银审核员模拟试题【有一套】附答案详解
- 2024-2025学年度烟台汽车工程职业学院单招数学题库试题附参考答案详解【巩固】
- 2026年宁夏葡萄酒与防沙治沙职业技术学院自主公开招聘工作人员考试参考试题及答案解析
- 推动职业教育国际化-交流协会的探索与实践
- 2026中央台办所属事业单位招聘10人笔试备考试题及答案解析
- 2025年“安全生产月”《安全知识》培训考试题库及答案
- 2026浙江台州市港航事业发展中心招聘2人考试备考试题及答案解析
- 腹膜透析护理实践指南(2025年版)
- GB/T 1535-2026大豆油
- 2026年临汾职业技术学院单招职业倾向性考试题库含答案详解(完整版)
- 2026校招:远大物产集团试题及答案
- 康复中心考核制度
- 点金手丰年课件在线看
评论
0/150
提交评论