已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
J I A N G S U U N I V E R S I T Y 本本 科科 毕毕 业业 论论 文文 联机分析在个人财务数据库方面的分析和应用联机分析在个人财务数据库方面的分析和应用 Analysis and Application of OLAP in Personal Financial Database 专业名称 计算机科学与技术 班 级 02 级本科 3 班 学生姓名 徐 昌 吉 指导教师姓名 王月敏 朱玉全 指导教师职称 2006 年 4 月 2 联机分析在个人财务数据库方面的分析和应用联机分析在个人财务数据库方面的分析和应用 专业班级 计算机 3 班 学生姓名 徐昌吉 指导教师 王月敏 朱玉全 职称 系主任 教授 摘要摘要 联机事务处理 OLTP 系统已被广泛用于处理企业的日常业务 如果加以保留 随着时间的推移 OLTP 系统可以累积大量的历史数据 有效组织和存储这类海量历史 数据 提供分析和决策支持能力 成为数据仓库 联机分析处理 OLAP 的任务 本文首先讨论了 OLAP 的概念和特点 数据仓库的设计方法和存储结构 数据清理 技术 并以某人 2004 年的消费为背景实际设计和建立了个人财务数据仓库 通过 OLAP 或通过本系统的实施 可以回答某些问题 如 每个人每天都在进行着或多或少 的消费活动 但却很少人关注自己的消费是否科学合理 总到月末的时候才产生疑惑 我的钱都花哪去了 这样消费是否科学合理呢 在设计上 个人财务数据仓库以单价和数量为度量 以日期 温度层 地点分布 为主要的维建立数据立方体 采用了流行的星形结构 实现平台采用了 SQL Server2000 数据库管理系统 数据清理采用了手工 SQL 命令 程序相结合的方式 从原始个人财务数据库到财务分析数据仓库的数据加载使用了数据转换服务 DTS 基 于财务分析数据仓库的 OLAP 使用了 Analysis Manager 以及分析可视化使用了 Excel 2003 关键词 数据挖掘 维 度量 温度层 地区分布 II Analysis and Application of OLAP in Personal Financial Database Abstract OLTP systems have been widely used in the daily operations of processing enterprises If it was retained with the passage of time OLTP system can accumulate considerable amount of historical data To effectively organize store such historical data to provide analysis and decision support capabilities is the main mission to a data warehouse and OLAP This paper first discussed the concept and features of OLAP data warehouse design methods and storage structures and data clean up technologies Then take the consumption of a person in 2004 as a background to design and build a personal financial data warehouse It can answer the certain questions through the OLAP or by the system implementation such as the following questions Every person has his own consumption everyday but very few people are concerning whether their own consumption is scientific and rational and doubts always arose at the end of the mouth How I spend my money Is this consumption scientific and rational In the design personal financial data warehouse which is introduced by the star shape structure take the price and quantity for measurement take the date temperature layers and the main venue distribution for the data cube The achieve platform uses SQL Server2000 database management system while the data cleaning uses the combination of handwork SQL orders and procedures From the original database to the financial analysis of personal financial data warehouse is using data conversion services DTS OLAP which is based on financial analysis data warehouse is using Analysis Manager and visualization analysis is using Excel 2003 Key words Data mining Dimension Measure Temperature layer The region distribute III 目目 录录 引 言 2 第一章 数据挖掘概述 3 1 1 什么是数据挖掘 3 1 2 如何进行数据挖掘 3 1 2 1 定义商业问题 3 1 2 2 建立数据挖掘库 4 1 2 3 分析数据 4 1 2 4 准备数据 4 1 2 5 建立模型 4 1 2 6 评价模型 5 1 2 7 实施 5 第二章 系统分析 5 2 1 定义问题 5 2 2 实现工具 6 2 3 实现功能 6 第三章 信息分析准备 6 3 1 个人财务 OLAP 构建分析 6 3 2 建立财务分析数据库 7 3 3 设计财务分析的星型模型 7 3 4 建立 OLAP 财务分析的 DTS 包 9 3 4 1 创建连接 9 3 4 2 建立 Load data to 日期 的工作流 10 3 4 3 建立 Load data 商品 的工作 流 14 IV 3 4 4 建立 Load data to 支出 的工作流 15 3 4 5 使用 SQL Script Task 执行 SQL 任务 16 3 4 6 建立工作流的优先顺序 17 3 5 设定数据库与数据来源 19 3 6 建立消费分析多维数据集 19 3 6 1 建立对维数据集度量值 19 3 6 2 建立 季月日 维 20 3 6 3 建立 气温分布 维 20 3 6 4 建立 商品类别 维 21 3 6 5 建立 地点分布 维 21 3 6 6 完成多维数据集向 导 22 3 6 7 使用存储设计向导处理多维数据 集 23 第四章 数据可视化分析 25 4 1 连接到分析服务器 25 4 2 制作本地多维数据集文件 27 4 3 制作数据分析图并作出分析或建议 27 4 3 1 气温影响消费分析图 27 2 4 3 2 地区消费类别分析图 28 结 论 30 致 谢 31 参考文献 32 引 言 在人类社会迈入 21 世纪的今天 信息技术的飞速发展和普及使得全社会对计算 机应用技术的需求日益增强 时至今日 计算机已经深入到人们日常生活 工作 学习 娱乐的各个方面 数据库系统经过数十年的发展 已经保存了大量的日常业 务数据 随着数据库和各类信息系统应用的不断深入 数据量的日益积累 每年都 要积累大量的数据 并呈增量发展趋势 大量信息是当今信息社会的特征 是我们 的宝贵财富 然而面对海量数据 我们往往无所适从 无法发现数据中存在的关系 和规则 无法根据现有的数据预测未来的发展趋势 未来学家奈斯比特 John Naisbitt 惊呼 人类正被信息淹没 却饥渴于知识 面临浩瀚无边的数据 人 们呼唤从数据的汪洋大海中去芜存精 去伪存真 而 从数据库中发现知识 KDD 及其核心技术 数据挖掘便应运而生了 近年来 数据挖掘引起了信息产业界的极大关注 其主要原因是存在大量数据 可以广泛使用 并且迫切需要将这些数据转换成有用的信息和知识 获取的信息和 知识可以广泛用于各种应用 包括商务管理 生产控制 市场分析 工程设计和科 学探索等 数据挖掘工具进行数据分析 可以发现重要的数据模式 对商务决策 知识库 科学和医学研究作出了巨大的贡献 3 4 第一章 数据挖掘概述 1 1 什么是数据挖掘 数据挖掘 顾名思义就是从大量的数据中挖掘出有用的信息 即从大量的 不完 全的 有噪声的 模糊的 随机的实际应用数据中发现隐含的 规律性的 人们事 先未知的 但又是潜在有用的并且最终可理解的信息和知识的非平凡过程 简单地 说 数据挖掘是从大量数据中提取或 挖掘 知识 1 2 如何进行数据挖掘 基本数据挖掘步骤 如图 1 包括 A 定义商业问题 B 建立数据挖掘模型 C 分析数据 D 准备数据 E 建立模型 F 评价模型 G 实施 图 1 数据挖掘步骤 虽然我们把各个步骤按顺序排列 但要注意数据挖掘过程并不是线性的 要取 得好的结果就要不断反复重复这些步骤 比如在 分析数据 时你可能觉得在 建 立数据挖掘数据库 时作的不够好 要往里面添加一些新的数据 1 2 1 定义商业问题 在开始知识发现之前最先的同时也是最重要的要求就是了解的你的数据和业务 问题 如果事先没有这种了解 没有任何算法 不管他有多么复杂玄妙 能够为你 提供有价值的结果 即使有也难以使人信赖他 缺少了这些背景知识 你就没办法 问题定义 建挖掘摸型 分析数据 准备数据 建立模型 评价模型 实施 5 明确定义要解决的问题 不能为挖掘准备数据 也很难正确的解释得到的结果 要 想充分发挥数据挖掘的价值 必须要对你的目标有一个清晰明确的定义 即决定到 底想干什么 比如你说你想提高直接邮件推销的用户回应时 你想做的可能是 提 高用户响应率 也可能是 提高一次用户回应的价值 要解决这两个问题而建立 的模型几乎是完全不同的 你必须做出决定 有效的问题定义还应该包含一个对你 的知识发现项目得到结果进行衡量的标准 当然还应该有整个项目预算和理性的解 释 1 2 2 建立数据挖掘库 连同下面的两个步骤 这三步构成了数据预处理的核心 这三步和在一起比其 他所有的步骤加在一起所花得时间和精力还多 一旦你从数据挖掘的结果中学到一 些什么之后 你很可能要修改数据以得到更好得结果 因此就需要把数据准备和数 据挖掘不断的反复进行 数据准备工作大概要花去整个数据挖掘项目的 50 90 的时 间和精力 1 2 3 分析数据 察看 描述型数据挖掘 以获得更详细的关于可视化 连结分析 及其他数据 分析方法 分析的目的是找到对预测输出影响最大的数据字段 和决定是否需要定 义导出字段 1 2 4 准备数据 这是建立模型之前的最后一步数据准备工作 可以把此步骤划分成 4 个部分 a 选择变量 b 选择记录 c 创建新变量 D 转换变量 1 2 5 建立模型 对建立模型来说要记住的最重要的事是它是一个反复的过程 你需要仔细考察 不同的模型以判断哪个模型对你的商业问题最有用 你在寻找好的模型的过程中学 到的的东西会启发你修改你的数据 甚至改变最初对问题的定义 6 一旦决定了预测的类型之后 分类还是回归 就需要为这个预测选择模型的类 型 可能是一棵决策树 神经网络 甚至传统的数学统计 选择什么样的模型决定 了你需对数据做哪些预处理工作 如神经网络需要做数据转换 有些数据挖掘工具 可能对输入数据的格式有特定的限制 等 一旦所有的数据准备好之后 就可以开 始建立你的模型了 1 2 6 评价模型 模型建立好之后 必须评价他的结果 解释他的价值 记住从测试集中得到的 准确率只对用于建立模型的数据有意义 在实际应用中 随着应用数据的不同 模 型的准确率肯定会变化 更重要的是 准确度自身并不一定是选择最好模型的正确 评价方法 你需要进一步了解错误的类型和由此带来的相关费用的多少 还有一点 无论我们用模拟的方法计算出来的模型的准确率有多高 都不能保证此模型在面对 现实世界中真实的数据时能取得好的效果 经验证有效的模型并不一定是正确的模 型 造成这一点的直接原因就是模型建立中隐含的各种假定 1 2 7 实施 模型建立并经验证之后 可以有两种主要的使用方法 第一种是提供给分析人 员做参考 由他通过察看和分析这个模型之后提出行动方案建议 比如可以把模型 检测到的聚集 模型中蕴含的规则 或表明模型效果的 ROI 图表拿给分析人员看 另一种是把此模型应用到不同的数据集上 模型可以用来标示一个事例的类别 给 一项申请打分等 还可以用模型在数据库中选择符合特定要求的记录 以用 OLAP 工 具做进一步的分析 第二章 系统分析 2 1 定义问题 在大学里生活了快四年了 遇到了各种各样的问题 甲同学一个月 400 元生活 费过得有滋有味 而乙同学一个月 800 元生活费仍堵不上他的开销 虽然这个答案 是显而易见的 但我仍想从客观数据中寻求一些结果 或者 从任何一个人的消费 7 记录信息里 寻找一些问题 这就是我想做的 从一个人的消费记录数据中 去分 析和发现 这个人在消费习惯 或延伸到生活习惯方面 有什么有趣的现象或问题 2 2 实现工具 根据我要做的内容 我将会用到三个软件 SQL Server 2000 全面扩展了 SQL Server 7 0 的性能 可靠性和易用性 使 它成为一个杰出的数据库平台 可用于大型联机事务处理 数据仓库以及电子商务 等 Analysis Service 我们可以用它来创建多维数据集 它还提供客户端的组件 数据透视表服务 让用户可以通过它来取还多维数据 Excel 2003 可以做多维的数据分析 它拥有连接到分析服务器的功能 让一般 非数据库专业的用户可以很容易上手来查询其所想要的多维数据 还可以将服务器 端多维数据集的数据分类之后存储在客户端的计算机上 待日后脱机时做分析 我将分别用他们来做财务分析数据库 财务分析多维数据集和数据分析可视化 查询客户端 2 3 实现功能 只要装有 Excel 2003 这个软件的计算机 都能脱离服务器对多维数据进行分析 研究 能对定义好的不同维度和度量进行组合 得出用户想要的数据显示 能对不同组合显示的数据可视化 给用户最直接的信息反映 第三章 信息分析准备 3 1 个人财务 OLAP 构建分析 使用个人财务数据库 在这个 OLAP 实践中 我以个人消费文本记录 2004 年整 为源数据 将其收 8 集整理成数字信息记录 个人财务数据库 个人财务数据库关系图如图 2 图 2 个人财务数据库关系图 这个个人财务数据库共有 3 个表 分别是日期信息表 商品信息表 支出信息 表 3 2 建立财务分析数据库 按如下操作建立财务分析数据库 1 在 开始 按钮菜单中 选择 程序 Microsoft SQL Server 企业管 理器 按扭 2 在 数据库 上单击鼠标右键 在快捷菜单中选择 新建数据库 命令 此时会出现 数据库属性 对话框 在 名称 文本框中输入财务分析 3 单击 确定 按钮 数据库建立完毕 3 3 设计财务分析的星型模型 设计一个多维模型的四大步骤 分别如下 1 定义 OLAP 的数据集市 包括使用星型模式或雪花模式 2 事实的选择 通过事实表的共有特性及四种常见样式来选择适当的事实种类 3 维的创建 需了解维的共同特性 维分层结构以及当维数据有变化时的解决方 式 4 聚合体的设计 聚合体为复杂的查询提供了一个预先计算好的汇总来提高分析 速度 9 OLAP 数据来源 个人财务数据库共有 3 个表 分别是日期信息表 商品信息表 支出信息表 由于个人财务中的消费时间是以支出信息表的日期为事实的时间 因 此产生个 支出 表 以日期为基础 通过 Transaction SQL 的日期函数产生以下 几个字段 季 月 星期等 表中两个外部键日期 记录号分别来自日期信息表中 的日期和商品信息表中的记录号 因此可以决定 支出 为事实表 日期 商 品 为两个维表 按如下操作建表 1 将财务分析资料夹展开 在 表 上单击鼠标右键 在快捷菜单中选择 新建 表 命令来建立新的表 2 建立支出事实表 如图 3 所示 图 3 支出表的结构 3 建立商品维表 字段都参照现有个人财务数据库的商品信息这个表来产生 4 建立日期维表 日期就是个人财务数据库中日期信息表中的日期 以它为基础 通过 Transaction SQL 的日期函数产生了以下三个字段 季 月 星期 温度可以 分成三大块 10 度以下 10 到 3 度 30 度以上 可通过 DTS 来转换 当 OLTP 转换 到 OLAP 时 由 DTS 的 ActiveX Script 来负责做建立分组的动作 如图 4 图 4 日期表的结构 5 接下来将二个维表 日期 商品与支出做关联 在 关系图 上单击鼠标右键 在快捷菜单中选择 新建数据库关系图 命令 6 在 创建数据库关系图向导 中选择要关联的表 将 可用的表 列表中的所 10 有表 通过单击 添加 按钮至 要添加到关系图中的表 列表中 然后单击 下一步 命 令 7 出现完成数据库关系图向导的画面 单击 完成 按钮 8 在关系图窗口中 单击在日期表的日期字段的位置 按住鼠标的左键不放 拖 拽到支出表的日期字段的位置 单击 确定 按钮表示完成支出表与日期表的关联 9 单击商品表的记录号字段的位置 按住鼠标的左键不放 拖拽到支出表的记录 号字段的位置 单击 确定 按钮表示完成商品表与支出表的关联 10 此时 星型结构的财务分析关联制作完毕 如图 5 所示 图 5 财务分析的星型结构 11 最后 单击工具条中的 保存 图标 输入数据库关系图的名称 财务关系 图 然后单击 确认 按钮 12 出现确定保存画面 单击 是 按钮 整个建立数据库关系图工作完成 3 4 建立 OLAP 财务分析 的 DTS 包 3 4 1 创建连接 1 展开 数据转换服务 在 本地包 上单击鼠标右键 然后在快捷菜单中选 取 新建包 命令 此时会显示建立 DTS 包的工具 2 将 连接 工具栏中的 Microsoft LOE Provider for SQL Server 图示拖拽到 工作区域的中央 一建立连接 3 这时会出现如图 6 所示的 连接属性 对话框 在 新建连接 文本框中键 入财务分析 服务器选取 Local 代表使用本地的 SQL Server 并选择 使用 Windows 身份验证 在 数据库 中选取数据库来源 财务分析 然后单击 确认 11 按钮 图 6 财务分析的连接属性 4 这时 工作区域已创建好一个连接 财务分析 这是目的数据库 也就是搜索 数据的数据集市 5 一般情况下 由于事实表有键值是依靠维表的 因此要先把维表的数据导入后 再处理事实表的数据导入 在这里 先为日期 商品二个维表数据来源创建连接 6 将 连接 工具栏中的 Microsoft LOE Provider for SQL Server 图示拖拽到 工作区域的中央 以创建连接 此时会显示 连接属性 对话框 在 新建连接 文本框中输入日期 Source 服务器 选择 Local 代表使用本地 SQL Server 并 选择 使用 Windows 身份验证 表示使用 Windows 登录帐号登录到 SQL Server 在 数据库 中选择数据库来源 个人财务 然后单击 确定 按钮 7 将 连接 工具栏中的 Microsoft LOE Provider for SQL Server 图示拖拽到 工作区域的中央 以创建连接 此时会显示 连接属性 对话框 在 新建连接 文本框中输入商品 Source 其他同上一步 3 4 2 建立 Load data to 日期 的工作流 建立 Load data to 日期 的工作流过程如下 1 单击 日期 source 连接以选取图示 按住 Ctrl 按钮键 然后单击财务分析 12 连接 此时应已选择两个图标 在财务分析连接上单击右键 在快捷菜单中选择 转 换数据任务 命令 2 此时 出现图 7 中的箭头 表示日期 source 是数据来源 而财务分析是数据 目的地 图 7 建立工作流 3 在箭头处单击鼠标右键 在弹出的快捷菜单中选择 属性 命令 4 此时出现如图 8 所示的 转换数据任务属性 对话框 在 源 选项卡的 描 述 文本框中输入 Load data to 日期 选择 SQL 查询 选项 并输入以下的 SQL 程序 SELECT DISTINCT 日期 AS 日期 DATEPART dw 日期 AS 星期 DATEPART mm 日期 AS 月 DATEPART qq 日期 AS 季 气温 AS 气温 气温 AS 温度层 天气 as 天气 FROM 日期信息表 13 图 8 源 选项卡 5 可以单击 预览 按钮预览结果 6 然后在 目的 选项卡中的 表名 下拉列表中选择选取 财务分析 dbo 日期 表示选取 财务分析 dbo 日期 作为目的数据表 7 在 转换 选项卡中 单击 全部删除 按钮 删除所有的转换 8 选择源表的日期及目的表的日期 单击 新建 按钮 在 创建新转换 中选择 Copy Column 然后单击 确定 按钮 表示是字段的一对一复制 9 依次类推 完成其他字段一对一的复制 除星期 温度层以外 10 如图 9 所示 选择源表的星期及目的表的星期 单击 新建 按钮 在 创建 新转换 中选择 ActiveX Script 表示要通过 ActiveX Script 的 VB Script 语法来 进行星期的转换工作 原始的星期日是 1 星期一是 2 依次类推 要转换成星期天 是 7 星期一是 1 14 图 9 脚本程序 11 此时出现 ActiveX 脚本转换属性 对话框 如图 24 所示 脚本区域为程序 区 在程序区域中输入以下的程序 Function Main DTSDestination 星期 DTSSource 星期 select case DTSDestination 星期 case 1 DTSDestination 星期 7 case 2 DTSDestination 星期 1 case 3 DTSDestination 星期 2 case 4 DTSDestination 星期 3 case 5 DTSDestination 星期 4 case 6 DTSDestination 星期 5 15 case 7 DTSDestination 星期 6 end select Main DTSTransformStat OK End Function 12 程序输入完毕后 单击 分析 按钮 测试你输入的程序是否有错误 13 这时可以单击 测试 按钮 测试结果数据是否正确 若无错误讯息就表示数 据正确 单击 确定 按钮后 你可以单击 查看结果 按钮来看看结果数据是否为你 的需求 14 单击 确定 按钮 表示 ActiveX Script 编辑完成 15 再选择 源 表的温度层及 目的 表的温度层 步骤同第十步 但输入程 序为 Function Main if DTSSource 温度层 10 then DTSDestination 温度层 10 度以下 elseif DTSSource 温度层 30 then DTSDestination 温度层 10 到 30 度 else DTSDestination 温度层 30 度以上 end if Main DTSTransformStat OK End Function 16 单击 确定 按钮 此时 Load data to 日期 的工作流大致完成 3 4 3 建立 Load data 商品 的工作流 建立 Load data 商品 的工作流的过程如下 1 单击商品 source 连接以选择图标 按住 Ctrl 按钮键 然后单击财务分析连 接 此时应已选择两个图标 在财务分析连接上单击鼠标右键 在弹出的快捷菜单 中选择 转换数据任务 命令 2 此时 出现的箭头 表示商品 source 是数据来源 而财务分析是数据目的地 16 3 在箭头处单击鼠标右键 在快捷菜单中选择 属性 命令 4 此时出现 转换数据任务属性 对话框 在 源 选项卡的 描述 文本框中 输入 Load data to 商品 选中 表 视图 选项 并选择 个人财务 dbo 商品信息表 作为来源数据表 5 然后在 目的 选项卡的 表名 下拉列表框中 选择 财务分析 dbo 商品 作为目的数据表 6 在 转换 选项卡中 单击 全部删除 按钮 清楚所有的转换 7 选中 源 表的记录号及 目的 表的记录号 单击 新建 按钮 在 创建新 转换 对话框中选取 Copy Column 然后单击 确定 按钮 表示是字段的一对一 复制 8 依次类推 完成其他字段一对一的复制 9 单击 确定 按钮 此时 Load data 商品 的工作流大致完成 3 4 4 建立 Load data to 支出 的工作流 建立 Load data to 支出 的工作流的过程如下 1 将窗口中 连接 工具栏上的 Microsoft OLE DB Provider for SQL Server 图标拖拽到工作区域的中央 以创建连接 显示 连接属性 对话框 在 新建连 接 文本框中输入支出 source 服务器 选择 Local 代表使用本地 SQL Server 并选择 使用 Windows 身份验证 选项 在 数据库 中选择数据库来源 个人财 务 作为默认的来源数据库 然后单击 确定 按钮 2 再将窗口中 连接 工具栏上的 Microsoft OLE DB Provider for SQL Server 图标拖拽到工作区域的中央 以创建连接 并选择财务分析 表示使用现有的财务 分析连接 作为目的数据库 单击 确定 按钮 3 单击支出 source 连接 按住 Ctrl 按钮键 然后单击财务分析连接 此时应 已选择两个图标 在财务分析连接上单击鼠标右键 在快捷菜单中选择 数据转换任 务 命令 表示支出 source 是数据来源 而财务分析是数据目的地 4 在箭头处单击鼠标右键 在快捷菜单中选择 属性 命令 5 此时出现 转换数据任务属性 对话框 在 源 选项卡中的 描述 文本框 输入 Load data to 支出 选择 表 视图 并选择 个人财务 dbo 支出信 17 息表 作为来源数据表 6 然后在 目的 选项卡的 表名 下拉列表框中 选择 财务分析 dbo 支出 作为目的数据表 7 在 转换 选项卡中 单击 全部删除 按钮 清楚所有的转换 8 选中 源 表的记录号及 目的 表的记录号 单击 新建 按钮 在 创建新 转换 对话框中选取 Copy Column 然后单击 确定 按钮 表示是字段的一对一 复制 9 依次类推 完成其他字段一对一的复制 10 单击 确定 按钮 此时 Load data 支出 的工作流大致完成 3 4 5 使用 SQL Script Task 执行 SQL 任务 由于 DTS 的包在执行过程中 数据是用追加方式来进行 因此 当你为 DTS 包 安排执行计划时 要先执行删除原有数据的操作 然后再追加数据 这样就可以避 免出现数据重复的情况 1 先将窗口任务工具栏的 执行 SQL 任务 图标拖拽到工作区域 如图 10 所示 图 10 建立 Execute SQL Task 2 在 常规 选项卡的 描述 文本框中输入 Delete 支出 Data 在 现有连接 中选择财务分析 并在 SQL 语句 文本框中输入以下 SQL 语句 如图 11 所示 然 后单击 确定 按钮 注意 一定要先删除支出 否则会违反关联性规则 delete from 支出 18 delete from 日期 delete from 商品 图 11 输入 SQL 语句 3 4 6 建立工作流的优先顺序 主要可分为三大部分 执行 SQL 任务删除现有的财务分析数据 将数据汇集到维表中 将数据汇集到事实表中 1 在 Load Data to 日期的箭头上单击鼠标右键在快捷菜单中选择 工作流属性 命令 2 出现 工作流属性 对话框 在 优先 选项卡中单击 新建 按钮 源步骤 选择 Delete 财务分析 Data 然后单击 确定 按钮 表示在成功执行 Delete 财务 分析 Data 后再执行 Load data to 日期 3 在 Load Data to 商品的箭头上单击鼠标右键在快捷菜单中选择 工作流属性 命令 4 此时出现 工作流属性 对话框 在 优先 选项卡中单击 新建 按钮 源 步骤 选择 Delete 财务分析 Data 然后单击 确定 按钮 表示在成功执行 Delete 财务分析 Data 后再执行 Load data to 商品 19 5 在 Load Data to 支出的箭头上单击鼠标右键在快捷菜单中选择 工作流属性 命令 6 此时出现如图 12 所示的 工作流属性 对话框 在 优先 选项卡中单击 新 建 按钮 源步骤 选择 Load data to 日期 然后单击 确定 按钮 再在 优先 选项卡中单击 新建 按钮 源步骤 选择 Load data to 商品 然后单击 确定 按钮 表示在成功执行 Load data to 日期和 Load data to 商品后再执行 Load data to 支出 图 12 流程控制图 7 至此 已完成所有的流程控制 选择菜单 包 执行 命令来执行这个 DTS 包 8 如图 13 表示整个 DTS 包执行都没问题 单击 确定 按钮 然后单击 完成 按 钮 对比一下数据数目是否相等 20 图 13 DTS 包执行完毕 9 最后一个步骤 那就是保存 DTS 包 选择菜单 包 保存 命令即可 3 5 设定数据库与数据来源 设定数据与数据库来源的过程如下 1 在 Analysis Manager 中展开分析服务器 2 在自己的服务器上单击鼠标右键 并在快捷菜单中选择 新建数据库 命令 3 在 数据库名称 文本框中输入财务分析 并在 描述 文本框中给出描述 然后单击 确定 按钮 4 此时 在 Analysis Manager 目录树区域中展开服务器 接着展开刚刚创建 的财务分析 5 在 数据源 上单击鼠标右键 在快捷菜单中选择 新数据源 命令 6 在 数据链接属性 窗口的 提供者 选项卡中 选择 Microsoft OLE provider for SQL Server 然后单击 下一步 按钮 7 在连接页面输入 SQL 服务器名称及用户名称与密码 然后选择财务分析数据 库 8 之后 单击 测试连接 按钮 查看连接是否正常 出现连接成功的画面 然后 单击 确定 按钮 9 单击 确定 按钮 表示整个数据来源创建完成 如图 14 所示 图 14 整个数据来源创建完成 21 3 6 建立消费分析多维数据集 3 6 1 建立对维数据集度量值 建立多维数据集度量值的过程如下 1 在 多维数据集 处单击鼠标右键 在快捷菜单中选择 新建多维数据集 向导 命令 2 出现欢迎画面 单击 下一步 按钮 3 出现 事实数据表 窗口 在 数据源和表 列表框中选择 支出 4 单击 下一步 按钮 出现 选择用于定义度量值的数字列 窗口 如图 38 所示 选择单价 数量为多维数据集度量值 之后再单击 下一步 按钮 3 6 2 建立 季月日 维 建立 季月日 维的过程如下 1 单击 新建维度 按钮 2 出现 维度向导 欢迎画面后 单击 下一步 按钮 在 选择维度的创建方式 窗口中 选择 星型架构 单个维度表 选项 之后单击 下一步 按钮 3 出现 选择维度表 窗口后 在 可用的表 列表框中选取日期 然后单击 下一步 按钮 4 此时出现 选择维度类型 的窗口 选择 标准维度 选项 然后单击 下一 步 按钮 5 在 选择维度的级别 的窗口中 选取 季 月 日期 然后单击 下一步 按 钮 6 如图 15 所示 此时出现完成维度向导的画面 在 维度名称 文本框中输入 季月日 然后单击 完成 按钮 表示季月日维已建立完毕 22 图 15 完成 季月日 维的建立 3 6 3 建立 气温分布 维 建立 气温分布 维的过程如下 1 单击 新建维度 按钮 2 出现 维度向导 欢迎画面后 单击 下一步 按钮 在 选择维度的创建方式 窗口中 选择 星型架构 单个维度表 选项 之后单击 下一步 按钮 3 出现 选择维度表 窗口后 在 可用的表 列表框中选取日期 然后单击 下一步 按钮 4 此时出现 选择维度类型 的窗口 选择 标准维度 选项 然后单击 下一 步 按钮 5 在 选择维度的级别 的窗口中 选取 温度层 气温 然后单击 下一步 按 钮 6 此时出现完成维度向导的画面 在 维度名称 文本框中输入 温度分布 然 后单击 完成 按钮 表示温度分布维已建立完毕 3 6 4 建立 商品类别 维 建立 商品类别 维的过程如下 1 单击 新建维度 按钮 2 出现 维度向导 欢迎画面后 单击 下一步 按钮 在 选择维度的创建方式 窗口中 选择 星型架构 单个维度表 选项 之后单击 下一步 按钮 23 3 出现 选择维度表 窗口后 在 可用的表 列表框中选取商品 然后单击 下一步 按钮 4 此时出现 选择维度类型 的窗口 选择 标准维度 选项 然后单击 下一 步 按钮 5 在 选择维度的级别 的窗口中 选取 商品类别 然后单击 下一步 按钮 6 此时出现完成维度向导的画面 在 维度名称 文本框中输入 商品类别 然 后单击 完成 按钮 表示商品类别维已建立完毕 3 6 5 建立 地点分布 维 建立 地点分布 维的过程如下 1 单击 新建维度 按钮 2 出现 维度向导 欢迎画面后 单击 下一步 按钮 在 选择维度的创建方式 窗口中 选择 星型架构 单个维度表 选项 之后单击 下一步 按钮 3 出现 选择维度表 窗口后 在 可用的表 列表框中选取商品 然后单击 下一步 按钮 4 此时出现 选择维度类型 的窗口 选择 标准维度 选项 然后单击 下一 步 按钮 5 在 选择维度的级别 的窗口中 选取 消费地点 所在地 然后单击 下一 步 按钮 6 此时出现完成维度向导的画面 在 维度名称 文本框中输入 地点分布 然 后单击 完成 按钮 表示地点分布维已建立完毕 3 6 6 完成多维数据集向导 完成多维数据集向导的过程如下 1 完成所有的维 然后单击 下一步 按钮 2 出现 完成多维数据集向导 画面 在 多维数据集名称 文本框中输入 消费分析 作为此多维数据集的名称 然后单击 完成 按钮 3 完成多维数据集向导后即进入多维数据集编辑器的画面 如图 16 所示 此时 右边窗口的环境为 架构 24 图 16 多维数据集编辑器 4 如果要观看多维数据 可以选择菜单上的 视图 数据 命令 如图 17 所示 25 图 17 查看多维数据 3 6 7 使用存储设计向导处理多维数据集 使用存储设计向导处理多维数据集的过程如下 1 选择菜单上的 工具 设计存储 命令 出现 存储设计向导 欢迎画面 单 击 下一步 按钮 2 选择多维数据集的存储方式 MOLAP ROLAP 或 HOLAP 在次先选 MOLAP 然 后电击 下一步 按钮 3 如图 18 所示的 设置聚合选项 画面 可以使你在存储空间与性能需求上取 得一个平衡点 一般而言 有所谓 80 20 的规则 20 的所有可能预算的聚合体会提 供 80 的性能增加 因此选择 性能提升达到 并输入 40 然后单击 开始 按钮 此时表示提供 80 的性能增加所需的聚合体共 11 个 且使用了不到 0 1MB 的空间 26 图 18 设置聚合选项 4 单击 下一步 按钮 出现 完成存储设计向导 画面 选择 立即处理 选 项 然后单击 完成 按钮 表示进行多维数据集的处理工作 5 开始处理多维数据集 并将数据及聚合体存储在多维数据集中 如图 19 所示 完成后单击 关闭 按钮 图 19 多维数据集处理完成 6 回到 Analysis Manager 窗口 可查看消费分析的多维数据集 27 第四章 数据可视化分析 本章将用 Excel 2003 来作为分析服务器前端分析工具 分析数据 制作工作表 图表及脱机多维数据集文件 4 1 连接到分析服务器 1 启动 Excel 2003 应用程序 2 在菜单上选择 数据 数据透视表和图表报告 命令 打开 数据透视表和数 据透视表视图向导 3 在 请指定待分析的数据源类型 中选择 外部数据源 在 所需创建的 报表类型 中选择 数据透视表 4 单击 下一步 按钮 5 单击 获取数据 按钮 6 在 选择数据源 对话框中 选取 OLAP 多维数据集 选项卡 选择 新数据 源 7 单击 确定 按钮 8 在 创建新数据源 对话框中 在 请输入数据源名称 中输入个人财务 Cube 为您要访问的数据库选定一个 OLAP 供应者 中选取 Microsoft OLE DB Provider for OLAP Services 9 单击 连接 按钮 10 在 Multi Dimensional Connection 对话框中 在 Choose the location of the multidimensional data source that you want to use 下选取 OLAP Server 输入服务器计算机名 11 单击 Next 按钮 12 在 Database 列表中选取 财务分析 13 单击 Finish 按钮 14 在 创建新数据源 对话框中 在 选定包含所需数据的多维数据集 中选 取 财务分析 如图 20 说示 28 图 20 选择欲分析的多维数据集 15 单击 确定 按钮 16 在 选择数据源 对话框中 选取 个人财务 cube 选择 确定 按钮 17 单击 下一步 按钮 18 在 数据透视表显示的位置 中 选择 现有工作表 选项 19 单击 完成 按钮 显示如图 21 图 21 数据透视表 20 可以用鼠标左键 将维及度量拖拽到工作表中的适当位置 在此将 温度层 和 季月日期 分别拉到 X Y 轴 将 单价 拉到中间区域 则产生图 22 所示结 果 29 图 22 时间气温消费表 4 2 制作本地多维数据集文件 制作一个本地多维数据集文件 以便日后脱机时分析用 1 在 数据透视表 工具条上单击 数据透视表 脱机 OLAP 命令 2 在 脱机 OLAP 设置 窗口单击 创建本地数据文件 3 单击 下一步 按钮 4 就会列出所有维 选取所有的维 单击 下一步 按钮 5 单击 下一步 按钮 输入文件名称 消费分析 单击 完成 按钮 之后产生一 个本地多维数据集文件 回到 脱机 OLAP 设置 单击 确定 按钮 4 3 制作数据分析图并且作出分析或建议 本小节将这章所做结果用图表的方式展现出来 并加以分析研究 4 3 1 气温影响消费分析图 1 在 4 1 所得表 数据透视表 工具条上单击图表向导图标 2 出现 图表类型 窗口 点击 标准类型 折线图 命令 单击 完成 按钮 出现如图 23 所示 3 分析 从上图得知在 1 到 4 月 红色折线代表温度 10 度以下的日期 平均消 费的水平要高于蓝色折线代表温度 10 到 30 度的日期的平均消费 从上图可明显看 出 30 图 23 气温影响消费分析图 这位同学的消费情况 随着温度的降低 支出反而增加 随着温度的提高 支出慢 慢减少 保持某一水平状态 4 3 2 地区消费类别分析图 1 将 商品类别 和 所在地 分别拉到 X Y 轴 将 单价 拉到中间区域 得到 地区消费类别表 2 在所得表 数据透视表 工具条上单击图表向导图标 3 出现 图表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 莆田市人民医院脊髓血管造影检查技术准入考核
- 移动代办活动方案
- 窖藏酒认购活动方案
- 礼物打卡活动方案
- 科普巡展活动策划方案
- 科技公司文化活动方案
- 窗饰生产批发活动方案
- 社区领导班子活动方案
- 秋收篮球活动方案
- 社区礼仪活动方案
- 2025年高等教育自学考试全国统一命题考试税法试卷含解析及答案
- 花卉工考试题及答案
- Unit2Period7ReadingforWriting课件-仁爱科普版初中英语八年级上册
- 学困生学法指导课件
- DB42-T 2189-2024 小流域水土保持综合治理项目实施方案编制技术规范
- 心脑血管疾病讲座课件
- 《大数据金融》教学大纲(第六学期)附课程考核标准
- 2022年人教版三年级上册语文阅读理解难点知识习题及答案
- 磷石膏堆场项目库区工程施工组织设计(171页)
- 军队部队模板ppt课件模板
- 不同截面钢牛腿设计计算(excel)
评论
0/150
提交评论