数据挖掘.doc_第1页
数据挖掘.doc_第2页
数据挖掘.doc_第3页
数据挖掘.doc_第4页
数据挖掘.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验1 建立多维数据模型实验目的: 从示例数据库中导出数据,建立并部署“销售分析”多维数据集,实现对公司的销售状况做分析研究。实验内容:1. 创建一个新的数据仓库分析项目。2. 定义数据源。3. 定义数据源视图。4. 定义多维数据集。5. 部署“销售分析示例”项目。6. 浏览已部署的多维数据集。7. 提高多维数据集的可用性和易用性。实验步骤:1. 创建一个新的数据仓库分析项目。打开Visual Studio 2005新建项目,选择Analysis Services 项目,并将项目名称更改为“销售分析示例”。具体操作路径:选择“开始”-“所有程序”-Microsoft SQL Server 2005命令,再单击SQL Server Business Intelligence Development Studio,将打开Microsoft Visual Studio 2005开发环境。2. 定义数据源。在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。启动新建数据源向导,单击“新建”按钮。出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLE DBMicrosoft OLE DB Provider for SQL Server”选项。选择数据源帐号为“使用服务帐号”并命名数据源为“销售分析数据源”。3. 定义数据源视图。选择“数据源视图”文件夹,新建一个数据源视图。数据源选择上一步新建的“销售分析数据源”。在“可用对象”列表框中,选择下列表。Dim Customer(客户维表)。Dim Geography(地理维表)。Dim Product(产品维表)。Dim Time(时间维表)。FactInternet Sales(网上销售事实表)。在定义好的数据源视图中可以修改表的默认名称,让视图更易理解。4. 定义多维数据集。右键单击“多维数据集”,从弹出的快捷菜单中选择“新建多维数据集”命令;已选中“使用数据源生成多维数据集”选项和“自动生成”选项;在“时间维度表”下拉列表中选择“时间”别名。下一步设置时间维,将时间属性名称映射到已指定为“时间”维度的维度表中的相应列。选择事实表的度量值(去掉不是度量值的列),可以对度量值重新命名。设置和效验维度的属性及层次结构,在“查看新建维度”页上,通过展开树控件显示该向导检测到的三个维度的层次结构和属性,查看其中每个维度的维度层次结构(可根据需要去掉部分维度属性)。在维度设计器的“维度结构”选项卡上,可以添加、删除和编辑层次结构,级别和属性。5. 部署“销售分析示例”项目。部署配置。在解决方案资源管理器中,右键单击根结点“销售分析示例”项目,从弹出的快捷菜单中选择“属性”命令。在弹出的对话框中更改“数据库”对应值为Analysis Services。部署项目。在解决方案资源管理器中,右键单击“销售分析示例”项目,从弹出的快捷菜单中选择“部署”命令,或者在菜单栏中选择“生成”菜单,单击“部署 销售分析示例”。6. 浏览已部署的多维数据集。部署完成后,就可以根据需要浏览多维数据集中的实际数据了。7. 提高多维数据集的可用性和易用性。l 修改度量值的有关属性。l 修改维度的层次结构和有关属性。l 增加维度属性。l 将命名计算列作为维度的成员名称。l 重新部署并查看更改。l 灵活快速的导出各类统计报表。实验2 关联规则应用实验目的:掌握在SQL Server 2005中实现关联规则的挖掘。实验内容:1. 创建Analysis Services项目。2. 创建数据源。3. 创建数据源视图。4. 创建关联挖掘结构。5. 设置关联规则挖掘的参数。6. 建立关联规则挖掘模型。7. 查看挖掘结果。实验步骤:1. 创建Analysis Services项目。打开Visual Studio 2005新建项目,选择新建Analysis Services 项目,并将项目名称更改为“Adventure Works”。2. 创建数据源。在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。启动新建数据源向导,单击“新建”按钮。出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLE DBMicrosoft OLE DB Provider for SQL Server”选项。选择数据源帐号为“使用服务帐号”并命名数据源为“Adventure Works DW”。3. 创建数据源视图。在解决方案资源管理器中,右击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令。系统将打开数据源视图向导。在“选择数据源”页的“关系数据源”下,默认选中在上一步中创建的Adventure Works DW数据源。单击“下一步”按钮,在“选择表和视图”页上选择下列各表,然后单击右箭头键,将vAssocSeqLineItems和vAssocSeqOrders包括在新数据源视图中,单击“下一步”按钮。在“完成向导”页上,默认情况下,系统将数据源视图命名为Adventure Works DW。单击“完成”按钮。4. 创建关联挖掘结构。在解决方案资源管理器中,右键单击“挖掘结构”,从弹出的快捷菜单中选择“新建挖掘结构”命令。在“选择定义方法”页中,确保已选中“从现有关系数据库或数据仓库”选项,再单击“下一步”按钮。在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术?”列表框中选中“Microsoft 关联规则”选项,再单击“下一步”按钮。“选择数据源视图”页随即显示。默认情况下,“可用数据源视图”下的Adventure Works DW为选中状态。单击“下一步”按钮,在“指定表类型”页上选中vAssocSeqOrder 表右边的“事例”复选框,选中vAssocSeqLineItems表右边的“嵌套”复选框。单击“下一步”按钮,在“指定定型数据”页上依次清除CustomerKey右边的“键”复选框和LineNumber右边的“键”和“输入”复选框。选中Model列右边的“键”和“可预测”复选框。然后,系统也将自动选中“输入”复选框。单击“下一步”按钮,在“指定列的内容和数据类型”页上单击“下一步”按钮。在“完成向导”页的“挖掘结构名称”中输入Association。在“挖掘模型名称”中输入Association,再单击“完成”按钮。5. 设置关联规则挖掘的参数。打开“算法参数”对话框,在“算法参数”对话框的“值”列中设置一下参数。MINIMUN_SUPPORT=0.01MINIMUN_PROBABILITY=0.1然后单击“确定”按钮。6. 建立关联规则挖掘模型。选择“挖掘模型”菜单的“处理挖掘结构和所有模型”选项,系统将打开“处理挖掘结构-Association”对话框。单击“运行”按钮,系统将打开“处理进度”对话框,以显示有关模型处理的信息。7. 查看挖掘结果。处理完成之后,选择“挖掘模型查看器”,第一个页面是挖掘到的频繁集,第二个页面则是查看挖掘出来的规则。实验3 决策树应用实验目的:掌握在SQL Server 2005中决策树方法的使用。实验内容:1. 创建Analysis Services 项目。2. 创建数据源。3. 创建数据视图。4. 创建决策树挖掘结构。5. 设置决策树挖掘结构的相关参数。6. 建立决策树挖掘模型。7. 查看挖掘结果。实验步骤:1. 创建Analysis Services 项目。打开Visual Studio 2005新建项目,选择新建Analysis Services 项目,并将项目名称更改为“决策树”。2. 创建数据源。在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。启动新建数据源向导,单击“新建”按钮。出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLE DBMicrosoft OLE DB Provider for SQL Server”选项。选择数据源帐号为“使用服务帐号”并命名数据源为“决策树”。3. 创建数据源视图。在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。在“选择数据源”页中再次单击“下一步”按钮。在“选择表和视图”页上,选择dbo.vTargetMail视图,然后右击,将它包括在新数据源视图中。4. 创建决策树挖掘结构。在解决方案资源管理器中,右击单击“挖掘结构”,然后选择“新建挖掘结构”,系统打开数据挖掘向导。在“欢迎使用数据挖掘向导”页上,单击“下一步”按钮。在“选择定义方法”页上,从在“从现有关系数据库或数据仓库”,再单击“下一步”按钮。在选择“数据挖掘技术”页的“您要使用何种数据挖掘技术?”下拉列表中选择“Microsoft 决策树”选项。单击“下一步”按钮,默认选中Adventure Works DW。单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选中vTargetMail右边“事例”列中的复选框。单击“下一步”,出现“指定定型数据”页。确保已选中CustomerKey列右边“键”列中的复选框,选中类别属性BikeBuyer列右边的“输入”和“可预测”复选框,并且从属性列表中选择16个描述属性,选中相应的“输入”复选框。单击“下一步”按钮,在随后的“指定列的内容和数据类型”页上,单击“下一步”按钮,出现“完成向导”页。在“挖掘结构名称”文本框中输入Decision Tree,在“挖掘模型名称”文本框中输入Decision Tree,之后单击“完成”按钮。由此决策树挖掘结构创建完成,系统将打开挖掘结构设计器,显示Adventure Works DW挖掘结构视图。5. 设置决策树挖掘结构的相关参数。6. 建立决策树挖掘模型。选择“挖掘模型查看器”选项卡,程序问是否建立部署项目,选择“是”,在接下来的“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”窗口。处理进度完成之后,单击“关闭”按钮,建模完成。7. 查看挖掘结果。再次选择“挖掘模型查看器”选项卡,由vTargetMail数据集生成的决策树。实验4 K-means应用实验目的:掌握在SQL Server 2005中的K-means应用。实验内容:1. 创建Analysis Services 项目。2. 创建数据源。3. 创建数据源视图。4. 创建k-means挖掘结构。5. 设置k-means挖掘结构的相关参数。6. 建立k-means挖掘模型。实验步骤:1. 创建Analysis Services 项目。打开Visual Studio 2005新建项目,选择新建Analysis Services 项目,并将项目名称更改为“K-means”。2. 创建数据源。在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。启动新建数据源向导,单击“新建”按钮。出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLE DBMicrosoft OLE DB Provider for SQL Server”选项。选择数据源帐号为“使用服务帐号”并命名数据源为“k-means”。3. 创建数据源视图。在解决方案资源管理器中,右键单击“数据源视图”,从弹出的快捷菜单中选择“新建数据源视图”命令,系统将打开数据源视图向导。在“欢迎使用数据源视图向导”页上,单击“下一步”按钮。在“选择数据源”页中再次单击“下一步”按钮。在“选择表和视图”页上,选择dbo.vTargetMail视图,然后右击,将它包括在新数据源视图中。4. 创建k-means挖掘结构。在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。在“欢迎使用数据挖掘向导”页上,单击“下一步”按钮。在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,再单击“下一步”按钮。在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术”下拉列表中选择“Microsoft 聚类分析”选项。单击“下一步”按钮,在随后出现的“选择数据源视图”页上,选中默认的Adventure Works DW。单击“选择数据源视图”页上的“下一步”按钮,在“指定表类型”页上,选中TargetMail表右边“事例”列中的复选框,单击“下一步”按钮。在随后“指定定型数据”页,确保已选中CustomerKey列右边的“键”列中的复选框,并且从属性列表中描述16个描述属性,并且选中相应的“输入”复选框。在“指定列的内容和数据类型”页上,单击“下一步”按钮,出现“完成向导”页。在“挖掘结构名称”文本框中输入Cluster,在“挖掘模型名称”文本框中输入Cluster,之后单击“完成”按钮。由此k-means挖掘结构创建完成。5. 设置k-means挖掘结构的相关参数。在“挖掘模型”选项卡上单击鼠标右键,从弹出的快捷菜单中选择“设置算法参数”命令,系统将打开“算法参数”对话框。可以为要更改的算法设置新值。6. 建立k-means挖掘模型。选择“挖掘模型查看器”选项卡,建立部署项目。在“处理挖掘模型”页上,单击“运行”按钮,出现“处理进度”页。处理进度完成之后,单击“关闭”按钮,建模完成。7. 查看挖掘结构。再次选择“挖掘模型查看器”选项卡,由TargetMail数据集得到的k-means聚类结果。实验5 贝叶斯网络应用实验目的:掌握利用SQL Server 2005中的贝叶斯网络解决一个简单的预测和诊断问题。实验内容:1. 在SQL Server 2005中创建一个新的数据库BayesDatabase。2. 创建一个新的数据表Table_2。3. 向数据表Table_2中输入数据。4. 创建新的商业智能项目BayesProject。5. 建立BayesA中的数据连接,连接到数据库BayesDatabase。6. 建立BayesA中的数据源视图,在建立视图的过程中选择数据库中的表格Table_2。7. 创建挖掘结构。8. 预测和诊断。实验步骤:1. 在SQL Server 2005中创建一个新的数据库BayesDatabase。2. 创建一个新的数据表Table_2。3. 向数据表Table_2中输入数据。4. 创建新的商业智能项目BayesProject。打开Visual Studio 2005新建项目,选择新建Analysis Services 项目,并将项目名称更改为“BayesProject”。5. 建立BayesA中的数据连接,连接到数据库BayesDatabase。在“数据源”文件夹上右击,在弹出的快捷菜单中选择“新建数据源”命令。启动新建数据源向导,单击“新建”按钮。出现“连接管理器”对话框,在“提供程序”下拉列表框中确保已选中“本机OLE DBMicrosoft OLE DB Provider for SQL Server”选项。选择数据源帐号为“使用服务帐号”并命名数据源为“BayesProject”。6. 建立BayesA中的数据源视图,在建立视图的过程中选择数据库中的表格Table_2。7. 创建挖掘结构。在解决方案资源管理器中,右键单击“挖掘结构”,在弹出的菜单中选择“新建挖掘结构”命令,系统将打开数据挖掘向导。在“欢迎使用数据挖掘向导”页上,单击“下一步”按钮。在“选择定义方法”页上,确认已选中“从现有关系数据库或数据仓库”,再单击“下一步”按钮。在“选择数据挖掘技术”页的“您要使用何种数据挖掘技术”下拉列表中选择“Microsoft Nave Bayes”选项。在“指定定型数据”页中,设定表Table_2中列A为“输入”和“可预测”,列B为“输入”和“可预测”,列C为“输入”和“可预测”,列mark为“键”。8. 预测和诊断。选择“挖掘模型预测”选项卡,进入预测的界面。然后选择Table_2为事例表,随后单击工具条上的“单独查询”按钮,得到输入界面。将各个值输入,单击“切换到查询结构视图”,得到预测结果。在输入数据完成并选择了预测变量之后,单击“切换到查询结果视图”得到诊断结果。实验6 神经网络应用实验目的:掌握利用SQL Server 2005中的数据挖掘功能,进行神经网络的训练和预测。实验内容:1. 创建示例数据库。2. 创建新项目。3. 创建数据连接。4. 建立数据源视图。5. 建立挖掘结构。6. 部署项目。7. 进行数据预测。实验步骤:1. 创建示例数据库。首先新建

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论