




免费预览已结束,剩余19页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实验三实验三 设计并构造设计并构造AdventureWorksAdventureWorks数据仓库实例数据仓库实例 实验要求实验要求 在SQL Server 平台上 利用AdventureWorks数据库作为商业智能解决方案 的数据源 设计并构造数据仓库 建立OLAP和数据挖掘模型 并以输出报表的 形式满足决策支持的查询需求 实验内容实验内容 步骤步骤 1 1 需求分析 以决策者的视角分析和设计数据仓库的需求 步骤步骤 2 2 根据所设计的需求 确定本数据仓库的主题和主题与边界 步骤步骤 3 3 设计并构造逻辑模型 步骤步骤 4 4 进行数据转换和抽取 建立数据仓库 创建数据源 建立 OLAP 和挖掘模型 使用多维数据集进行分析 建立数据挖掘结构和数据挖掘模型 创建报表 实验平台实验平台 Win7Win7 操作系统 操作系统 SQLSQL ServerServer 20052005 实验过程实验过程 一 创建一 创建 Analysis Services 项目项目 1 打开 Business Intelligence Development Studio 2 在 文件 菜单上 指向 新建 然后选择 项目 3 确保已选中 模板 窗格中的 Analysis Services 项目 4 在 名称 框中 将新项目命名为 AdventureWorks 5 单击 确定 二 创建数据库和数据源二 创建数据库和数据源 1 运行 AdventureWorks sql server 2005 示例数据库 msi 然后用 SQL Server Management Studio 附加数据库 AdventureWorks Data mdf 1 运行 AdventureWorks sql server 2005 示例数据库 msi 2 用 SQL Server Management Studio 附加数据库 AdventureWorks Data mdf 2 在解决方案资源管理器中 右键单击 数据源 文件夹 然后选择 新建数据源 3 在 欢迎使用数据源向导 页面中 单击 下一步 按钮 4 在 选择如何定义连接 页上 单击 新建 向 Adventure Works 数据库中添加连接 5 在 连接管理器 的 提供程序 列表中 选择 本机 OLE DB SQL Native Client 6 在 服务器名称 列表中 键入或选择承载 AdventureWorks 的服务器的名称 7 在 登录到服务器 组中 选择身份验证方法 并输入凭据 8 在 选择或输入一个数据库名 列表中 选择 AdventureWorks 然后测试连接 若连 接成功 再单击 确定 按钮 9 单击 下一步 按钮进入向导的下一页 10 在 模拟信息 页中 选择 使用服务帐户 再单击 下一步 11 请注意 在 完成向导 页中 数据源名称默认为 Adventure Works 12 单击 完成 新的数据源 Adventure Works 将显示在解决方案资源管理器的 数据源 文件夹中 三 创建数据源视图三 创建数据源视图 1 在解决方案资源管理器中 右键单击 数据源视图 选择 新建数据源视图 系统 将打开数据源视图向导 2 在 欢迎使用数据源视图向导 页上 单击 下一步 3 在 选择数据源 页的 关系数据源 下 系统将默认选中您在上一个任务中创建的 Adventure Works DW 数据源 单击 下一步 若要创建新数据源 请单击 新建数据源 启动数据源向导 4 在 选择表和视图 页上 选择下列各表 然后单击右箭头键 将这些表包括在新数据 源视图中 5 单击 下一步 6 在 完成向导 页上 默认情况下 系统将数据源视图命名为 Adventure Works 单 击 完成 系统将打开数据源视图设计器 显示 Adventure Works 数据源视图 四 定义维度四 定义维度 1 在解决方案资源管理器中 右键单击 维度 然后单击 新建维度 2 在 欢迎使用维度向导 页上 单击 下一步 3 在 选择生成方法 页上 验证是否选择了 使用数据源生成维度 选项 然后单击 下一步 4 在 选择数据源视图 页上 验证是否选择了 Adventure Works 数据源视图 5 在 选择维度类型 列表中 选择 标准维度 6 在 选择主维度表 中 点击 下一步 7 在 选择维度属性 中 点击 下一步 8 在 指定维度类型 中 点击 下一步 9 在 定义父子关系 中 点击 下一步 10 检测层次结构 中 点击 下一步 11 点击 下一步 然后点击 完成 五 使用多维数据集进行分析五 使用多维数据集进行分析 1 在解决方案资源管理器中 右键单击 多维数据集 并选择 新建多维数据集 启动多 维数据集向导 2 在 欢迎使用多维数据集向导 页上 单击 下一步 3 在 选择生成方法 页上 确认已选中 使用数据源生成多维数据集 选项 然后单击 下一步 4 在 选择数据源视图 页上 点击 下一步 5 在 检测事实数据表和维度表 页上 点击 下一步 6 在 时间维度表 页上 如下所示 点击 下一步 7 在 查看共享维度 页上 点击 然后 下一步 8 在 选择度量值 页上 选择可用度量值 点击 下一步 9 在 检测层级结构 页上 查看结果 点击 下一步 10 在 查看新建维度 中 选择新建维度 然后点击 下一步 11 在 完成向导 页 多维数据集名称为 Adventure Works 在 预览 中 可以看到 度量值组 和 维度 12 点击 完成 13 在多维数据集设计器的工具栏上 将 缩放 级别更改为 50 以便更轻松地查看多 维数据集内的维度和事实数据表 注意 事实数据表是黄色的 维度表是蓝色的 14 在 文件 菜单上 单击 全部保存 六 创建用于个人客户方案的挖掘结构六 创建用于个人客户方案的挖掘结构 1 在解决方案资源管理器中 右键单击 挖掘结构 并选择 新建挖掘结构 启动数据挖 掘向导 2 在 欢迎使用数据挖掘向导 页上 单击 下一步 3 在 选择定义方法 页上 确保已选中 从现有关系数据库或数据仓库 再单击 下一 步 4 在 创建数据挖掘结构 页的 您要使用何种数据挖掘技术 下 选择 Microsoft 决 策树 5 单击 下一步 6 在 选择数据源视图 页上 请注意已默认选中 Adventure Works 在数据源视图中 单击 浏览 查看各表 然后单击 关闭 返回该向导 7 单击 下一步 8 在 指定表类型 页上 选中 vIndividualCustomer 表旁边 事例 列中的复选框 再单 击 下一步 9 在 指定定型数据 页上 确保已选中 CustomerID 列旁边 Key 列中的复选框 如果 数据源视图中的源表表示一个键 则数据挖掘向导将自动选择该列作为模型的键 10 选中 FirstName 和 LastName 列旁边的 输入 和 可预测 11 单击 建议 打开 提供相关列建议 对话框 只要选中至少一个可预测属性 即可启用 建议 按钮 提供相关列建议 对话框将列出 与可预测列关联最密切的列 并按照与可预测属性的相互关系对属性进行排序 值大于 0 05 的列将被自动选中 以包括在模型中 12 阅读建议 然后单击 取消 忽略建议并保留向导设置的原始值 15 选中以下各列旁边的 输入 复选框 StateProvinceName MiddleName CountryRegionName 16 单击 下一步 17 在 指定列的内容和数据类型 页上 单击 检测 以运行对数值数据进行取样并确 定数值列是否包含连续或离散值的算法 例如 某列可包含薪金信息 用以作为连续的实 际薪金值 也可包含整数 用以表示离散的编码薪金范围 例如 1 25 000 2 从 25 000 到 50 000 18 单击 检测 后 请查看 内容类型 和 数据类型 列中的各项 如有必要 请进 行更改 以确保设置与下表所示一致 通常 向导会检测数值 并分配相应的数值数据类型 但有些情况下 您可能想要将数值 作为文本处理 19 单击 下一步 20 在 完成向导 页上的 挖掘结构名称 中 键入 Individual Customer 21 在 挖掘模型名称 中 键入 TM Decision Tree 22 选中 允许钻取 复选框 23 单击 完成 七 挖掘模型和挖掘结构如下图 七 挖掘模型和挖掘结构如下图 八 创建查询八 创建查询 8 1 创建预测查询的第一步是选择挖掘模型和输入表 1 在数据挖掘设计器 挖掘模型预测 选项卡的 挖掘模型 框中 单击 选择模型 系统将打开 选择挖掘模型 对话框 2 在整个树中导航到 个人客户 结构 展开该结构并选择 TM Decision Tree 再单击 确定 3 在 选择输入表 框中 单击 选择事例表 系统将打开 选择表 对话框 4 在 数据源 中 选择 Adventure Works 5 在 表 视图名称 中 选择 Department HumanResources 表 再单击 确定 选择输入表之后 预测查询生成器便会根据各列的名称在挖掘模型和输入表之间创建默认 映射 8 2 生成预测查询 1 在 挖掘模型预测 选项卡上的网格内的 源 列中 单击第一个空行中的单元格 然 后选择 Department 2 在 Department 行的 字段 列中 选择 DepartmentID 3 在 源 列中 单击下一个空行 然后选择 TM Decision Tree 4 在 TM Decision Tree 行的 字段 列中 选择 First Name 这将会输出 Microsoft 决策树模型中作为预测目标的列 5 在 源 列下 单击下一个空行 然后选择 预测函数 6 在 预测函数 行的 字段 列中 选择 PredictProbability 预测函数提供有关模型如何进行预测的信息 PredictProbability 函数提供有关正确预测的 概率信息 您可以在 条件 参数 列中指定预测函数的参数 7 在 PredictProbability 行的 条件 参数 列中 键入 TM Decision Tree Bike Buyer 这将指定 PredictProbability 函数的目标列 有关函数的详细信息 请参阅数据挖掘扩展插 件 DMX 函数参考 8 3 查看结果 1 通过单击 切换到查询设计视图 切换到查询结果视图 按钮 即工具栏上的第一个按钮 旁边的箭头并选择 查询 可以运行查询 2 通过点击 单独查询 结果如下 总结总结 通过本次实验 我对 SQL Server 有了更深的了解 知道 SQL Server 不等于 SQL Server Management Studio 还有 SQL Server Business Intelligence Development Studio 和其他一些 模块 在这次实验中 遇到了一些困难 1 SQL Server 2000 和 SQL Server 2005 有一些不同 利用 SQL Server 2000 中的 Analysis service 做完实验二后发现实验三不知道怎么做了 左 右通过查找一些资料才解决问题 2 在新建数据源时 在 连接管理器 页上 测试连接 一直失败 不知道是什么原因 老师给的 AdventureWorks sql se
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数字孪生在城市交通拥堵治理中的交通流量预测与应用报告
- 2025年农业保险产品创新与服务优化对农业保险行业可持续发展的贡献报告
- 2025年城市轨道交通智慧运维系统与智能设备故障预测模型研究报告
- 2025年新型建筑保温材料在建筑节能产业市场拓展中的应用报告
- 自考专业(建筑工程)题库检测试题打印含完整答案详解【名师系列】
- 中级银行从业资格之中级银行业法律法规与综合能力综合提升练习试题附完整答案详解(考点梳理)
- 中级银行从业资格之中级银行业法律法规与综合能力综合检测题型汇编附参考答案详解(研优卷)
- 自考专业(计算机网络)能力提升B卷题库及参考答案详解(典型题)
- 物流绿色低碳智能配送解决方案
- 环保公司固定资产管理规定
- 2025年财政管理知识竞赛题库及答案
- 满意度调查测评方案
- 区域产业协同发展面试题
- 当归种植培训课件
- 三年(2023-2025)中考语文真题分类汇编(全国)专题22 议论文阅读(解析版)
- 学习2025年初中初三开学第一课专题
- 2025年浙江省教师招聘考试(语文)历年参考题库含答案详解(5卷)
- 医学类案例教学法
- 2025巡护员考试题库及答案
- 2025文化和旅游部直属事业单位招聘社会人员29人模拟试卷附答案详解
- 产前准备课件
评论
0/150
提交评论