数据仓库与数据挖掘课程设计报告模板.doc_第1页
数据仓库与数据挖掘课程设计报告模板.doc_第2页
数据仓库与数据挖掘课程设计报告模板.doc_第3页
数据仓库与数据挖掘课程设计报告模板.doc_第4页
数据仓库与数据挖掘课程设计报告模板.doc_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

江西理工大学应用科学学院数据仓库与数据挖掘课程设计报告题目: 某超市数据集的OLAP分析及数据挖掘 系别: 班级: 姓名: 二一二年六月目 录一、建立数据仓库数据库结构和设置数据源11. 任务描述22. 建立数据仓库数据库3. 设置数据源二、销售数据OLAP分析1. 任务描述2. 设计星型架构多维数据集(Sales)3. 设计存储和数据集处理4. OLAP分析三、人力资源数据OLAP分析1. 任务描述2. 设计父子维度的多维数据集(HR)3. 修改多维数据集(HR)的结构4. 设计存储和数据集处理5. OLAP分析四、数据仓库及多维数据集其它操作1. 任务描述2. 设置数据仓库及多维数据集角色及权限3. 查看元数据4. 创建对策5. 钻取6. 建立远程 Internet 连接五、数据仓库高级操作1. 任务描述2. 创建分区3. 创建虚拟多维数据集4. DTS调度多维数据集处理5. 备份/还原数据仓库 六、数据挖掘1. 任务描述2. 创建揭示客户模式的决策树挖掘模型 3. 决策树挖掘结果分析4. 创建聚类挖掘模型5. 聚类挖掘结果分析6. 创建基于关系数据表的决策树挖掘模型7. 浏览“相关性网络”视图一、建立数据仓库数据库结构和设置数据源1、任务描述数据仓库数据库是将要在其中存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构。然后跟预先设置好的ODBC数据源建立连接。2、建立数据仓库数据库(1) 展开树视图的Analysis Servers; (2) 单击服务器名或右击选择连接,与Analysis Servers建立连接; (3) 右击服务器名,然后单击“新建数据库”命令; (4) 在“数据库”对话框中输入数据库名“教程DW”,单击;3、设置数据源(5) 展开刚创建的“教程DW”数据库,可看到如下项目:数据源、多维数据集、共享维度、挖掘模型、数据库角色(6) 右击“教程DW”数据库下的“数据源”文件夹,然后单击“新数据源”命令; (7) 在“数据链接属性”对话框中,单击“提供程序”选项卡,选择“Microsoft OLE DB Provider for ODBC Drivers”;(8) 单击“连接”选项卡,选择建好的ODBC数据源“FoodMart 2000”;(9) 单击按钮关闭“数据链接属性”对话框图表 1 连接数据源二、销售数据OLAP分析1. 任务描述以多维方式建立数据模型可简化联机业务分析,提高查询性能。通过创建多维数据集,Analysis Manager 可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。2. 设计星型架构多维数据集(Sales)星型架构的多维数据集由一个事实数据表和链接到该事实数据表的多个维度表组成。下面针对FoodMart超市1998年的销售业务数据,建立一个多维数据集,以便按产品和顾客2个主题展开分析。具体操作如下:(1)展开树窗格的“教程DW”,右击“多维数据集”,选择“新建多维数据集”“向导”菜单命令,打开如下“多维数据集向导”对话框。(2)向多维数据集添加度量值(事实) :(3)单击,在“从数据源中选择事实数据表”步骤中,展开“FoodMart”数据源,然后单击“sales_fact_1998”; (4)单击,设置多维数据集的度量值列: store_sales、store_cost、unit_sales;(5)单击,建立维度表。单击,打开“维度向导”对话框;1) 向多维数据集添加时间维:(1)选择维度类型为“星型架构:单个维度表”;(2)单击,选择维度表“time_by_day”;(3)单击,选择维度类型为“时间维度”;(4)单击,选择时间级别为“年、季度、月”;(5)单击,单击,输入时间维名称: Time,并设为“共享”方式,单击,OK!2) 向多维数据集添加产品维:(1)再次单击,打开“维度向导”对话框;(2)选择创建维度的方式为“雪花架构:多个相关维度表”; (3)单击,选择维度表“Product”和“product_class”;(4)单击,查看连接方式,在这里可删除不要的连接,添加需要的连接;(5)单击,依次选择product_category、product_subcategory和brand_name三个维度级别;(6)单击,指定成员键列步骤中,不需改变主键列;(7)单击,在“高级选项”步骤中,根据需要选择;(8)单击,输入产品维名称: Product,并设为“共享”方式,单击,OK!3) 向多维数据集添加客户维度:(1)再次单击,打开“维度向导”对话框;(2)选择创建维度的方式为“星型架构:单个维度表”; (3)单击,选择维度表“Customer”;(4)单击,选择维度类型为“标准维度”;(5)单击,依次选择Country、State_Province、City和lname四个维度级别;(6)单击,指定成员键列步骤中,不需改变主键列;(7)单击,在“高级选项”步骤中,根据需要选择;(8)单击,输入客户维名称: Customer,并设为“共享”方式,单击,OK!4) 生成多维数据集:(1)回到多维数据集向导对话框,这里已到了新建的4个维度;(2)单击,在“是否计算事实数据表行数提问时,单击,开始计算。 (3)计算完成后,命名多维数据集为:Sales,单击,OK!(4)关闭向导,随之启动多维数据集编辑器,其中可看到刚刚创建的多维数据集。单击蓝色或黄色的标题栏,对表进行排列,使其符合下图所示的样子图表 2 “Sales多维数据集编辑器”窗口3. 设计存储和数据集处理:设计好 Sales 多维数据集的结构之后,需要选择数据的存储模式(MOLAP、ROLAP或HOLAP),并指定要存储的预先计算好的值的数量,然后用数据填充多维数据集。本例选择MOLAP作为存储模式,创建Sales多维数据集的聚合设计,然后从ODBC源中装载数据并按照聚合设计中的定义计算汇总值。(1)展开树窗格,右击“Sales”多维数据集,选择“设计存储”菜单命令,弹出“存储设计向导”对话框;也可在多维数据集编辑窗口中选择“工具|设计存储”菜单命令,打开“存储设计向导”对话框; (2)单击,然后选择“MOLAP”作为数据存储类型 ;(3)单击,设置聚合选项为“性能提升达到”,并输入“40”作为指定百分比,以此优化能力平衡查询性能和存储空间大小。(4)单击,完成后可看到“性能与大小”图,从中可看出增加性能提升对使用额外磁盘空间的需求。(5)单击,选择“立即处理”,并单击,系统开始进行数据处理,处理聚合一般要花费较长一些时间。(6)处理完成后点击,回到Analysis Manager窗口。(7)接下来就可浏览多维数据集的数据了。 4. OLAP分析:联机分析处理(OLAP)是使用多维数据表达式(称为多维数据集)提供对数据仓库数据进行快速访问的常用方法。多维数据集为维度表中的数据和数据仓库中的事实数据表建立模型,并为客户端应用程序提供完善的查询和分析功能。图表 3 OLAP分析图三、人力资源数据OLAP分析1. 任务描述:建立一个人力资源(HR)多维数据集,以进行雇员工资分析。先把Employee维度创建为父子维度,然后使用该维度以及常规维度来生成HR多维数据集2. 设计父子维度的多维数据集(HR):(1) 展开“教程DW”,右击“共享维度”,选择“新建维度|向导”菜单命令,打开“新建维度向导”对话框。(2) 单击,选择维度结构为“父子:单个维度表中相关的两列”;(3) 单击,选择维度表 employee;(4) 单击,选择employee_id为成员键,选择supervisor_id为父键列,选择full_name为成员名。(5) 单击,直到最后一步,输入维度名称: employee;(6) 单击,回到维度编辑器。OK!3. 修改多维数据集(HR)的结构(1) 展开“教程DW”,右击“多维数据集”,选择“新建多维数据集|向导”菜单命令,打开多维数据集向导对话框。(2) 点击,选择salary(工资)作事实数据表;(3) 点击,选择salary_paid、vacation_used为度量值列;(4) 点击,选择Employee(雇员)、Store(商店)、Time(时间)作维度;(5) 点击,在提示是否计算事实数据表行数时选“是”。最后输入人力资源多维数据集的名称NR,点击,OK!(6) 回到编辑器窗口,手工建立time_by_day表到salary表的联接,再建立 store表到employee表中的联接,删除多余的联接。最后如下图所示。4. 设计存储和数据集处理设计好 Sales 多维数据集的结构之后,需要选择数据的存储模式(MOLAP、ROLAP或HOLAP),并指定要存储的预先计算好的值的数量,然后用数据填充多维数据集。本例选择MOLAP作为存储模式,创建Sales多维数据集的聚合设计,然后从ODBC源中装载数据并按照聚合设计中的定义计算汇总值。(1)展开树窗格,右击“Sales”多维数据集,选择“设计存储”菜单命令,弹出“存储设计向导”对话框;也可在多维数据集编辑窗口中选择“工具|设计存储”菜单命令,打开“存储设计向导”对话框; (2)单击,然后选择“MOLAP”作为数据存储类型 ;(3)单击,设置聚合选项为“性能提升达到”,并输入“40”作为指定百分比,以此优化能力平衡查询性能和存储空间大小。(4)单击,完成后可看到“性能与大小”图,从中可看出增加性能提升对使用额外磁盘空间的需求。图表 4 性能与大小(5)单击,选择“立即处理”,并单击,系统开始进行数据处理,处理聚合一般要花费较长一些时间。(6)处理完成后点击,回到Analysis Manager窗口。(7)接下来就可浏览多维数据集的数据了。 5. OLAP分析联机分析处理(OLAP)是使用多维数据表达式(称为多维数据集)提供对数据仓库数据进行快速访问的常用方法。多维数据集为维度表中的数据和数据仓库中的事实数据表建立模型,并为客户端应用程序提供完善的查询和分析功能。四、数据仓库及多维数据集其它操作1 任务描述多维数据集角色用于定义可以访问和查询多维数据集的用户或组,指出其可以访问的对象,以及对这些对象的访问类型。角色是保护多维数据集内对象和数据安全的主要方法,可以在多维数据集的不同粒度级别上设置安全性。要定义安全性必须先创建角色,然后向这些角色授予权限。 我们要创建Sales和HR角色分别用于访问多维数据集Sales和HR。Management角色用于管理整个数据仓库。 2 设置数据仓库及多维数据集角色及权限多维数据集角色用于定义可以访问和查询多维数据集的用户或组,指出其可以访问的对象,以及对这些对象的访问类型。角色是保护多维数据集内对象和数据安全的主要方法,可以在多维数据集的不同粒度级别上设置安全性。要定义安全性必须先创建角色,然后向这些角色授予权限。本例中,我们要创建Sales和HR角色分别用于访问多维数据集Sales和HR。Management角色用于管理整个数据仓库。 具体操作如下:2.1 创建多维数据集角色:(1) 展开“多维数据集”文件夹,右击“Sales”多维数据集,并选择“管理角色”命令,打开“多维数据集角色管理器”;(2) 目前还没角色显示在角色列表中。点击,打开新建角色对话框,并输入角色名:Marketing,表示市场部;(3) 在“成员资格”选项卡中单击按钮,接着在“添加用户和组”对话框中,添加该角色的网络用户名(如hzm),单击回到新建对话框框框;(4) 其它选项可暂不设定,直接点,回到角色管理器窗口,角色Marketing就已在列表中了。在这里可以看到各个角色的权限,也可修改它们的权限。(5) 角色管理器。然后用同样的方法创建多维数据集HR的角色HR。2.2 创建数据库角色:数据库角色是可在数据库范围内使用的角色,可指派给该数据库的一个或多个多维数据集。本例中我们可以为经理创建一个数据库角色,然后将其指派到Sales和HR两个多维数据集。具体操作如下:(1) 在“教程DW”数据库下右击“数据库角色”,然后选择“管理角色”命令,打开“数据库角色管理器”窗口;(2) 这里显示了“教程DW”数据库中现有角色的列表(包括刚建的Marketing和HR多维数据集角色);(3) 单击,在弹出的对话框中输入角色名:Management,然后为该角色添加用户或组(如admin),并勾选多维数据集Sales和HR。最后点击退出3 查看元数据(1) 元数据是关于数据属性和数据结构的信息,此信息显示在 Analysis Manager 右窗格中。(2) 查看多维数据集的元数据:展开“多维数据集”文件夹,单击某多维数据集,再单击右窗格的“元数据”;(3) 查看维度的元数据:展开“共享维度”文件夹,单击一个维度,再单击右窗格的“元数据”。 4 创建对策对策是指由最终用户启动的、在所选多维数据集或其某部分上执行的操作。 Analysis Services管理员可以定义以下几种类型的对策:命令行、URL、OLE DB语句或多维表达式 (MDX) 语句。 本例假设市场部想要针对上一节中创建的Sales多维数据集,能在分析过程的某一点跳转到Internet,以便能够搜索并找到关于某个特定客户的信息。操作步骤如下:(1)展开“教程DW”数据库,右击“Sales”多维数据集,然后选择“编辑”命令,打开多维数据集编辑器;(2)右击“对策”文件夹,然后选择“新建对策”命令,启动对策向导,点击; (3)在“目标”框中选择“此多维数据集中的某一维度”,并单击“Customer”,点击 ;(4)保持“对策类型”列表不变,继续单击;(5)在“定义对策语法”步骤中键入:“/results.asp?q=” + C,意思是“通过浏览器调用MSN 搜索引擎搜索Customer维度中的当前客户的信息。图表 5 对策语法图(6)继续单击,输入对策名称:Customer Info,点击完成。OK!5 钻取本例假设市场部希望对商店和客户按从上到下进行分析,最终深化到关系数据库中的事务级别。为此,我们要在 Sales 多维数据集内启用钻取,然后浏览数据并深化到事务。具体操作如下:(1)展开“教程DW”数据库,右击“Sales”多维数据集并选择“编辑”命令,打开多维数据集编辑器;(2)单击“工具|钻取选项”菜单命令,打开“钻取选项”对话框;(3)选择“启用钻取”复选框,并单击以选中所有列,然后单击,关闭对话框; (4)接下来为不同的角色分配钻取权限。(5)右击“Sales”多维数据集,并选择“管理角色”命令,打开角色管理器;(6)单击前面创建的“Management”角色,然后在“钻取”列中单击 按钮,打开角色权限设置对话框;(7)选中“允许钻取”复选框,然后单击返回角色管理器; 这时可看到“Management”角色已获得钻取权。(8)关闭角色管理器,回到分析管理器,右击“Sales”多维数据集,并选择“浏览数据”命令,打开数据浏览器; (9)双击展开统计列以显示不同级别的聚集数据。右击某数据(如USACABerkeley的销售额)并选择“钻取”命令,稍等将打开明细数据查看窗口,显示原始数据源中的明细数据。图表 6 钻取6 建立远程 Internet 连接SQL Server Analysis Services 能让用户借助客户端工具,通过Internet连接访问分析服务器数据库和多维数据集。本示例介绍通过 HTTP 从 Excel 连接到分析服务器并访问多维数据集的操作。具体步骤如下:(1)准备:在分析服务器上安装Web服务(如IIS),从分析服务器的bin文件夹中复制Msolap.asp文件到默认站点文件夹(C:Inetpubwwwroot)中;(2)启动客户端 Excel,选择“数据|数据透视表和数据透视图报表”菜单命令; (3)在向导第1步中选择“外部数据源”,然后单击; (4)在向导的第2步,单击,打开“选择数据源”对话框,然后选择“OLAP多维数据集”选项卡,并选中“”,然后单击;(5)在接下来的对话框中,输入数据源名称:RemoteSales,在驱动程序列表中选择“Microsoft OLE DB Provider for OLAP Services 8.0”,然后单击;(6)在接下来的对话框中,选中“分析服务器”并输入URL(如 http:/Localhost,然后单击;(7)从连接到的远程分析服务器上选择数据库列表(如教程DW),然后单击,回到上级对话框; (8)选定包含所需数据的多维数据集(如Sales),然后单击,最后一步点击,回到Excel工作表;(9)接下来就可以在客户端电子表格中执行OLAP了。五、数据仓库高级操作1. 任务描述多维数据集的数据可以存储在一个或多个分区上,在创建多维数据集时系统会自动为其分配一个默认分区。合理地将一个逻辑多维数据集划分为多个单独的物理分区,常常可以改进查询的性能,但不正确地分区也可能导致错误。2. 创建分区多维数据集的数据可以存储在一个或多个分区上,在创建多维数据集时系统会自动为其分配一个默认分区。合理地将一个逻辑多维数据集划分为多个单独的物理分区,常常可以改进查询的性能,但不正确地分区也可能导致错误。 为多维数据集创建分区的步骤如下:(1)展开“Sales”多维数据集,右击“分区”文件夹,然后选择“新建分区”命令,打开分区向导,单击; (2)在“指定数据源和事实数据表”步骤中,单击,然后选择“FoodMard”数据源的sales_fact_1997表,然后单击; (3)继续单击,在“选择数据切片(可选)”步骤中,选择“Time”维度,展(4)开“所有Time”级别并选择1997,继续单击; (5)在“指定分区类型”步骤中,选择“本地”并单击; (6)输入分区名称:Sales 97,并选择“从现有的分区(Sales)中复制聚合设计”和“完成时处理分区”,最后单击;图表 7 分区(7)处理完成后单击,97年多维数据集将位于另一个名为Sales 97的分区上了。将来99、2000、的数据也可分别存储在不同的分区上,这样既便于管理,也可提高查询的效率,特别对大型数据集,效果更加明显。3. 创建虚拟多维数据集虚拟维度是基于物理维度内容的逻辑维度。这些内容可以是物理维度中的现有成员属性,也可以是物理维度的表中的列。使用虚拟维度可基于成员属性对多维数据集数据进行分析。其优点是不占用磁盘空间或处理时间。下面创建一个带有Yearly Income(年收入)成员属性的虚拟维度,然后将这个新创建的维度添加到Sales多维数据集中。操作步骤如下: (1) 右击“共享维度”文件夹,选择“新建维度|向导”菜单命令; (2) 单击,选择“虚拟维度:另一个维度的成员属性”,再单击; (3) 在“选择带有成员属性的维度”步骤中,单击“Customer”维度,再单击 ;在“选择虚拟维度的级别”步骤中,添加“Lname.Yearly Income”成员属性后再单击,在“高级选项”步骤中直接单击;(4) 在“完成”步骤中,输入维度名称 “Yearly Income”; (5) 单击。关闭向导。新建的虚拟维度“Yearly Income”已在共享维度列表中了。接下来就可向现有多维数据集添加虚拟维度了。4. DTS调度多维数据集处理本例为Sales、HR和Expense Budget三多维数据集创建自动化过程,确保在每天早上3点钟从OLTP和 ERP导入前一天的新增业务数据。处理完成后再给管理员和关键用户发送电子邮件通知他们处理任务已顺利完成。具体操作如下:(1)选择“开始|程序|Microsoft SQL Server|企业管理器”菜单命令,启动SQL Server企业管理器;(2)逐级展开,直到看到“数据转换服务”文件夹下的“本地包”,右击“本地包”并选择“新建包”命令,打开DTS包窗口,接下来为2个多维数据集定义处理任务;(3)点击DTS包窗口的左窗格中的“Analysis Services处理任务”图标,并将其拖动到空白窗格中,弹出“Analysis Services 处理任务”对话框; (4)在对话框中,给第1个任务输入名称为Sales,并输入相应的描述,如Sales任务;展开树窗格的“教程DW”数据仓库,单击“Sales”多维数据集,然后在右窗格选择处(5)理选项,选择“完整处理”;(6)同样的方法为“HR”多维数据集创建另1个处理任务:HR任务;(7)接下来指定任务执行的顺序:按住键,依次选择Sales任务和HR任务,然后选择“工作流|完成时”菜单命令;(8)将左窗格中的“发送电子邮件”图标拖至右窗格中,弹出“发送邮件任务属性”对话框,设置好相关参数后点,然后设置其处理顺序。最后以“Cubes处理”为名保存该包。(9)回到企业管理器窗口,刚创建的包位于“本地包”文件夹中,接下来要为该包设置执行时间;(10)右击“Cube处理”包,选择“调度包”命令,弹出“作业调度”对话框;在“每月”频率下,设置“第末一天,每1个月”,在“每日频率”下设置:“一次发生于:3:00:00AM”,单击;(11)至此,多维数据集定期处理任务已定制完成,可以退出企业管理器了。OK!5. 备份/还原数据仓库5.1 以下3种情况可能需要对数据仓库进行存档:5.1.1创建数据仓库的压缩备份;(1)数据仓库不再用于日常分析了,先存档后删除,以后需要时还可还原;(2)将数据仓库从一台服务器复制到另一台服务器。5.1.2具体操作如下:(1)在Analysis Manager树窗格中右击“教程DW”,然后单击“将数据库存档”命令,打开存档对话框;(2)输入存档文件(.cab)保存位置及文件名,如d:Program FilesMicrosoft Analysis ServicesSamples教程.cab,最后点击。OK!图表 8 备份 5.2删除/还原数据仓库(1)在要删除的数据仓库(如“教程DW”)上右击,然后选择“删除”命令,提示确认时点击,该数据仓库将被删除。删除数据仓库之前最好先存档!(2)利用数据仓库的存档CAB文件可将其还原到任一台分析服务器上。具体操作如下:右击Analysis Manager 的服务器名,然后选择“还原数据库”,在接下来的对话框中选择存档文件,最后点击,稍等,存档的数据仓库就会被还原。 六、数据挖掘1. 任务描述将通过实例介绍如何创建用于揭示客户模式的数据挖掘模型。 这里将创建一个数据挖掘模型以训练销售数据,并使用“Microsoft决策树”算法在客户群中找出会员卡选择模式。 将需要挖掘的维度设置为客户,将Member_Card属性设置为挖掘算法识别模式的参考信息。然后从人口统计特征列表中确定模式:婚姻状况、年收入、在家子女数和教育程度。下一步需要训练模型,以便能够浏览树视图并从中读取模式。市场部将根据这些模式设计新的会员卡,实际上就是对会员卡重新分类2. 创建揭示客户模式的决策树挖掘模型(1)展开“多维数据集”文件夹,右击“Sales”多维数据集,然后选择“新建挖掘模型”命令,打开挖掘模型向导;(2)在“选择数据挖掘技术”步骤中,选择“Microsoft决策树”,然后单击;(3)在“选择事例”步骤中,选择维度为Customer, 级别选择Lname,然后单击;(4)在“选择被预测实体”步骤中,选择“事例级别的成员属性”,并选择“Member Card”,继续单击;(5)在“选择训练数据”步骤中,取消Customer维度的Country、State Province和City聚集成员前的勾,继续单击;图表 9 勾选成员(6)接下来输入新维度名“Customer Patterns”, “虚拟多维数据集名“Trained Cube”,继续单击;(7)在最后的步骤输入模型名“Customer patterns discovery”,并选择“保存并开始处理”,然后单击;图表 10 模型向导(8)处理完成后,单击,然后“OLAP挖掘模型编辑器”将打开,最大化 编辑器窗口,右窗格中就能看到生成的决策树。右窗格分为4个区域,分别以不同的方式显示挖掘结果。 3. 决策树挖掘结果分析(1)在“内容详情”窗格的决策树区域中,颜色深浅代表“事例”的密度点击某节点能从“特性”框查看其出现的事例数,从这里还看到不同类型客户选择金、银、铜及普通卡的比例(偏好)情况。(2)树的第一个级别“yearly income”,说明该属性的重要性最高(信息增益率最大),其中年收入为35万的人最多。 (3)在右下角设置“树颜色基于:Golden”,则可方便地看出偏好选择金卡的客户群为:年收入15万以上的已婚簇。从特性框中可以看出其购买金卡的概率达到45.09%,另外还有47.4%购买了银卡。再往下展开决策树可以看到,购买金卡的主要为已婚簇,未婚簇则购买银卡为主。(4)同样也可以查看其它卡的客户类型及分布情况。 市场部可以根据上述决策树挖掘结果来确定最可能选择某种类型卡的客户的特征。根据这些特征(年收入、子女数、婚姻状况等),可以重新定义会员卡服务和方案,以便更好地针对其客户。 4. 创建聚类挖掘模型目标:通过创建聚类挖掘模型将客户群划分为不同的逻辑簇。操作步骤如下:(1)右击“Sales”多维数据集,然后选择“新建挖掘模型”命令,打开新建挖掘模型向导;(2)在“选择数据挖掘技术”步骤中,选择“Microsoft聚集”,单击;在“选择事例”步骤中,选择维度“Customer”,级别为“Lname”,单击;(3)在“选择训练数据”步聚中,清除“Customer”维度的Country、State Province和City复选框(因为没有必要使用汇总级别划分客户群),然后在“度量值”维度中选择“Store Sales”,单击;(4)输入挖掘模型的名称“Customer segmentation”,选中“保存,但现在不处理”,然后单击。 5. 聚类挖掘结果分析通过分析,市场部可以知道:Cluster1主要由中等收入的客户构成,而且全部为单身,每年在FoodMart商店平均花费72.42美元,由此可进一步采取有针对的营销策略。同样可找出Cluster2和Cluster3中的客户特征。6. 创建基于关系数据表的决策树挖掘模型通过建立基于关系数据表的挖掘模型,可以挖掘出更详细的信息。具体操作如下:(1)右击“挖掘模型”文件夹,然后选择“新建挖掘模型”命令,打开挖掘模型向导;(2)单击,在“选择源类型”步骤中,单击“关系数据”,继续单击;(3)在“选择事例表”步骤中,单击“单个表包含数据”并选择“Customer”,然后单击;(4)选择挖掘技术为“Microsoft 决策树”,继续;(5)选择“事例键列”为“customer_id”,继续;7. 浏览“相关性网络”视图相关性网络是Microsoft决策树另一视图模型,是对树浏览器的补充。树浏览器可以使观察者的注意力集中在单个特性的详细关系上,而相关性网络则显示所有特性的高级关系,给出数据中相关性的俯视图。图表 11 相关性浏览视图江西理工大学应用科学学院经管系数据仓库与数据挖掘课程设计(论文)指导教师评分表班级:姓名:学号:课程设计题目: 基于Foodmart超市数据集的OLAP分析及数据挖掘 评分内容比例滿 分 标 准得 分1、课程设计态度30%(1) 课程设计过程的态度(2) 考勤制度执行情况(3) 独立完成工作情况2、设计内容40%(1) 任务完成情况(2) 多维数据集结构设计合理(3) OLAP分析到位、全面(4) 数据挖掘模型合理(5) 数据挖掘分析到位、全面3、论文质量20%(1) 设计报告字数及内容(2) 设计报告结构、层次(3) 排版情况4、答辩情况10%(1) 演示过程的流畅性(2) 对设计结果的分析(3) 对相关知识点的掌握总 评 指导老师签名: 年 月 日28参考:毕业论文(设计)工作记录及成绩评定册题 目: 学生姓名: 学 号: 专 业: 班 级: 指 导 教 师: 职称: 助理指导教师: 职称: 年 月 日实验中心制使 用 说 明一、此册中各项内容为对学生毕业论文(设计)的工作和成绩评定记录,请各环节记录人用黑色或蓝色钢笔(签字笔)认真填写(建议填写前先写出相应草稿,以避免填错),并妥善保存。二、此册于学院组织对各专业题目审查完成后,各教研室汇编选题指南,经学生自由选题后,由实验中心组织发给学生。三、学生如实填好本册封面上的各项内容和选题审批表的相应内容,经指导教师和学院领导小组批准后,交指导教师;指导老师填好毕业论文(设计)任务书的各项内容,经教研室审核后交学生签名确认其毕业论文(设计)工作任务。四、学生在指导老师的指导下填好毕业论文(设计)开题报告各项内容,由指导教师和教研室审核通过后,确定其开题,并将此册交指导老师保存。五、指导老师原则上每周至少保证一次对学生的指导,如实按时填好毕业论文(设计)指导教师工作记录,并请学生签字确认。六、中期检查时,指导老师将此册交学生填写前期工作小结,指导教师对其任务完成情况进行评价,学院中期检查领导小组对师生中期工作进行核查,并对未完成者提出整改意见,后将此册交指导老师保存。七、毕业论文(设计)定稿后,根据学院工作安排,学生把论文(打印件)交指导老师评阅。指导老师应认真按毕业论文(设计)指导教师成绩评审表对学生的论文进行评审并写出评语,然后把论文和此册一同交教研室。八、教研室将学生的论文和此册分别交两位评阅人评阅后交回教研室保存。九、学院答辩委员会审核学生答辩资格,确定答辩学生名单,把具有答辩资格学生的论文连同此册交各答辩小组。十、学生答辩后由答辩小组记录人填好毕业论文(设计)答辩记录表中各项内容,然后把学生的论文和此册一同交所在答辩小组,答辩小组对其答辩进行评审并填写评语后交教研室。十一、学院答辩委员会进行成绩总评定,填好毕业论文(设计)成绩评定表中各项内容,然后把论文(印刷版和电子版(另传)和此册等资料装入专用档案袋中,教教研室后由实验中心统一保存。目 录1毕业论文(设计)选题审批表2. 毕业论文(设计)任务书3毕业论文(设计)开题报告4. 学生毕业论文(设计)题目更改申请表5毕业论文(设计)指导老师工作记录6毕业论文(设计)中期检查记录7毕业论文(设计)指导教师成绩评审表8毕业论文(设计)评阅人成绩评审表9. 毕业论文(设计)答辩申请表10毕业论文(设计)答辩记录表11毕业论文(设计)答辩成绩评审表12毕业论文(设计)成绩评定表毕业设计(论文)选题审批表题目名称 基于单片机的超声波测距题目性质工程设计理论研究实验研究计算机软件综合论文其它题目来源科研题目 生产现场教学 其它自拟题目选题理由:由于超声波指向性强,能量消耗缓慢,在介质中传播的距离较远,因而超声波经常用于距离的测量。利用超声波检测距离,设计比较方便,计算处理也较简单,精度也能达到使用要求,超声波测距应用于各种工业领域,如工业自动控制,建筑工程测量和机器人视觉识别等方面。超声波作为一种检测技术,采用的是非接触式测量,由于它具有不受外界因素影响,对环境有一定的适应能力,且操作简单、测量精度高等优点而被广泛应用。这些特点可使测量仪器不受被测介质的影响,大大解决了传统测量仪器存在的问题,比如,在粉尘多情况下对人引起的身体接触伤害,腐蚀性质的被测物对测量仪器腐蚀,触电接触不良造成的误测等。此外该技术对被测元件无磨损,使测量仪器牢固耐用,使用寿命加长,而且还降低了能量耗损,节省人力和劳动的强度。因此,利用超声波检测既迅速、方便、计算简单,又易于实时控制,在测量精度方面能达到工业实用的要求。 指导教师意见: 签名: 年 月 日院(系)领导小组意见: 签名: 年 月 日注:此表由学生填写毕业论文(设计)任务书1、毕业论文(设计)应达到的目的:(1)能对学生在学期间所学知识的检验与总结,培养和提高学生独立分析问题和解决问题的能力,使学生受到科学研究、工程设计和撰写技术报告等方面的基本训练。(2)提高学生对工作认真负责、一丝不苟,对事物能潜心观察、用于开拓、用于实践的基本素质;(3)培养学生综合运用所学知识,结合实际独立完成课题的工作能力。(4)对学生的知识面、掌握知识的深度、运用理论结合实际去处理问题的能力、实践能力、计算机运用水平、书面及口头表达能力进行考核。2、毕业论文(设计)的内容和要求(包括原始数据、技术要求、工作要求等):以单片机为核心设计了基于激光测距的防撞预警系统,采用TDC-GP2芯片作为激光飞行计时单元,给出激光发射及回波接收放大电路,基于模块化思想设计、完成系统软件设计流程;最后通过实验测试,系统要能很好测出前方车辆距离及运行状态,并能及时发出报警,利用Matlab对其测试结果进行验证,修正。3、对毕业论文(设计)成果的要求包括图表、实物等硬件要求:设计完成后,要提供电路图,实验电路版,控制原始程序,实验要保存大量的原始数据。完成设计论文。4、毕业论文(设计)工作进度计划:序号论文(设计)工作进度日期(起止周数)1根据所出题目,结合自身所学知识,选择合适课题,确定毕业设计论文题目。13-14-1第16周止2根据所定题目,全面搜集素材,列出各种设计方案,并一一比较,选择出最好的设计方案。13-14-1第18周止3联系指导老师,将自己的设计方案与老师沟通、交流,得到指导老师的认同与指点,开始设计。13-14-1第19周止4根据方案,确定所要用的器材。设计总体框架结构,分出各大的模块,并将其展开,以得到比较细的设计模式。13-14-2第1周止5 根据所列框图,结合自己所学知识,开始各分支电路模块的设计。13-14-2第2周止6完成初稿,将所做的模块给指导老师查阅,看是否有不当之处,再进行改进。并将大电路的设计方案告之老师,得到老师更好的建议。13-14-2第3周止7大胆进行设计,将每一个小的电路,大的模块,都精心设计好,完成整个硬件和软件部分的设计过程。13-14-2第6周止8将所有设计整理结合,形成设计论文,交与指导老师检查,并经老师指点,做进一步的改进工作。13-14-2第7周止9改进毕业设计论文,得到自己及老师认为满意的论文。13-14-2第10周止指导教师日期年 月 日教研室审查意见:签字: 年 月 日学院负责人意见:签字: 年 月 日学生签字: 接受任务时间: 年 月 日注:任务书由指导教师填写。 毕业论文(设计)开题报告题目基于单片机的超声波测距1、本课题的研究意义,国内外研究现状、水平和发展趋势 近年来,随着电子测量技术的发展,运用超声波作出精确测量已成可能。随着经济发展,电子测量技术应用越来越广泛,而超声波测量精确高,成本低,性能稳定则备受青睐。超声波是指频率在20kHz以上的声波,它属于机械波的范畴。超声波也遵循一般机械波在弹性介质中的传播规律,如在介质的分界面处发生反射和折射现象,在进入介质后被介质吸收而发生衰减等。正是因为具有这些性质,使得超声波可以用于距离的测量中。随着科技水平的不断提高,超声波测距技术被广泛应用于人们日常工作和生活之中。一般的超声波测距仪可用于固定物位或液位的测量,适用于建筑物内部、液位高度的测量等。 随着科学技术的快速发展,超声波将在测距仪中的应用越来越广。但就目前技术水平来说,人们可以具体利用的测距技术还十分有限,因此,这是一个正在蓬勃发展而又有无限前景的技术及产业领域。展望未来,超声波测距仪作为一种新型的非常重要有用的工具在各方面都将有很大的发展空间,它将朝着更加高定位高精度的方向发展,以满足日益发展的社会需求,如声纳的发展趋势基本为:研制具有更高定位精度的被动测距声纳,以满足水中武器实施全隐蔽攻击的需要;继续发展采用低频线谱检测的潜艇拖曳线列阵声纳,实现超远程的被动探测和识别;研制更适合于浅海工作的潜

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论