




已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库与数据挖掘实验指导书前言数据仓库与数据挖掘技术课程在计算机数据管理、维护中有着相当重要的作用。数据仓库系统在企业信息管理系统中应用非常广泛,数据挖掘技术对数据仓库的管理及维护、完善数据仓库、发挥数据仓库的作用有着非常大的作用。本课程主要内容为:数据仓库的概念与体系结构,数据仓库数据处理过程,数据仓库系统的设计与开发,各种数据挖掘技术(关联规则,数据分类,数据类聚,贝叶斯网络,粗糙集,神经网络,遗传算法,统计分析,文本与Web挖掘)及其应用。本课程既有理论也有实践,实践环节主要是基于SQL Server 2005示例数据仓库环境下进行各种数据挖掘技术的实验。为使学生能在SQL Server 2005示例数据仓库环境下进行各种数据挖掘技术的实验,首先必须创建一个SQL Server 2005示例数据仓库环境,但考虑到学院实验室管理要求和培养学生的独立动手能力,因此第一个实验(实验一:SQL Server 2005示例数据仓库环境的配置,综合性实验)分两方面进行,一方面由实验室对SQL Server 2005示例数据仓库环境的配置完成,提供给学生进行数据挖掘实验,另一方面,学生可利用自己的计算机环境进行课外实验,交实验报告,其他实验可根据课程内容及课时安排在实验指导教师的指导下在实验室完成。目录 1、实验一:SQL Server 2005示例数据仓库环境的配置页码2、实验二:使用SQL Server 2005建立多维数据模型页码3、实验三:SQL Server 2005中的关联规则应用页码4、实验四:SQL Server 2005中的决策树应用页码5、实验五:SQL Server 2005中的k-means应用页码6、实验六:SQL Server 2005中的贝叶斯网络应用页码7、实验七:SQL Server 2005中的神经网络应用页码8、实验八:SQL Server 2005中的线性回归应用页码9、实验九:SQL Server 2005中的Logistic回归应用页码10、实验报告基本内容要求页码实验一:SQL Server 2005示例数据仓库环境的配置实验学时:2实验类型:综合实验要求:必修一、实验目的通过本实验的学习,使学生掌握配置SQL Server 2005示例数据仓库环境的知识,训练其独立配置数据仓库环境的技能,为今后继续配置数据仓库环境的学习奠定基础。 二、实验内容安装SQL Server 2005,并在安装过程中进行示例数据库安装配置,由于本实验为综合性实验,实验中涉及到计算机系统(硬件、软件)环境要求,涉及软件系统安装知识,涉及到软件系统安装配置正确与否进行检验的知识。三、实验原理、方法和手段通用微型计算机环境及Windows操作系统环境下系统软件的安装与配置。四、实验组织运行要求根据本实验的特点、要求和具体条件,采用“以学生自主训练为主的开放模式组织教学”。五、实验条件见Microft SQL Server 2005简体中文企业版系统光盘提供的“SQL Server 2005安装要求”。六、实验步骤参照Microft SQL Server 2005简体中文企业版系统光盘提供的“SQL Server 2005安装说明”及教材数据仓库与数据挖掘P72-P74的内容。七、思考题1、为什么要配置示例数据库?2、如何验证配置示例数据库的正确性?八、实验报告1实验要求:仔细阅读Microft SQL Server 2005简体中文企业版系统光盘提供的“SQL Server 2005安装说明”、“SQL Server 2005安装要求”及教材P72-P74的内容2、实验目的、实验内容、实验原理按本实验指导的内容填写3、实验仪器:按实验计算机的硬件配置参数填写4、实验步骤:按教材P72-P74中(1)、(2)、(3)填写5、实验数据:无6、实验总结:回答思考题以及本次实验的心得九、其它说明实验二:使用SQL Server 2005建立多维数据模型实验学时:2实验类型:验证实验要求:必修一、实验目的通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下建立多维数据模型过程的知识,训练其把教材上的内容应用到实际中的技能,为今后继续数据挖掘技术的学习奠定基础。 二、实验内容在SQL Server 2005示例数据仓库环境下建立多维数据模型。三、实验原理、方法和手段数据仓库环境下多维数据模型建立的方法。四、实验组织运行要求根据本实验的特点、要求和具体条件,采用“集中授课形式”。五、实验条件SQL Server 2005示例数据仓库环境。六、实验步骤参照教材数据仓库与数据挖掘P75-P87的内容。七、思考题1、度量值的不同对多维数据集的结构有何影响?2、维度的层次结构和有关属性对提高多维数据集的可用性和易用性有何意义?八、实验报告1实验要求:预习教材P75-P87的内容2、实验目的、实验内容、实验原理按本实验指导的内容填写3、实验仪器:按实验计算机的硬件配置参数填写4、实验步骤:按教材P75-P87的1-7填写5、实验数据:各实验步骤中的维度、层次等具体数据6、实验总结:回答思考题以及本次实验的心得九、其它说明实验三:SQL Server 2005中关联规则的应用实验学时:2实验类型:验证实验要求:必修一、实验目的通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下关联规则的应用的知识,训练其把教材上的内容应用到实际中的技能,为今后继续关联规则知识的学习奠定基础。 二、实验内容在SQL Server 2005示例数据仓库环境下关联规则的应用。三、实验原理、方法和手段关联规则,项目与项集,关联规则的支持度与最小支持度,关联规则的可信度与最小可信度。四、实验组织运行要求根据本实验的特点、要求和具体条件,采用“集中授课形式”。五、实验条件SQL Server 2005示例数据仓库环境。六、实验步骤参照教材数据仓库与数据挖掘P99-P105的内容。七、思考题1、MINIMUM_SUPPORT的取值不同对关联规则的挖掘结果有何影响?2、MINIMUM_PROBABILITY的取值不同对关联规则的挖掘结果有何影响?八、实验报告1实验要求:预习教材P99-P105的内容2、实验目的、实验内容、实验原理按本实验指导的内容填写3、实验仪器:按实验计算机的硬件配置参数填写4、实验步骤:按教材P99-P105的1-7填写5、实验数据:实验步骤5中的具体数据,至少2组6、实验总结:回答思考题以及本次实验的心得九、其它说明实验四:SQL Server 2005中决策树的应用实验学时:2实验类型:验证实验要求:必修一、实验目的通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下决策树的应用的知识,训练其把教材上的内容应用到实际中的技能,为今后继续决策树挖掘技术知识的学习奠定基础。 二、实验内容在SQL Server 2005示例数据仓库环境下决策树的应用。三、实验原理、方法和手段精确度,查全率和查准率,信息增益,信息增益比。四、实验组织运行要求根据本实验的特点、要求和具体条件,采用“集中授课形式”。五、实验条件SQL Server 2005示例数据仓库环境。六、实验步骤参照教材数据仓库与数据挖掘P118-P123的内容。七、思考题1、MINIMUM_SUPPORT的取值不同对决策树的挖掘结果有何影响?2、SCORE_METHOD的取值不同对决策树的挖掘结果有何影响?八、实验报告1实验要求:预习教材P118-P123的内容2、实验目的、实验内容、实验原理按本实验指导的内容填写3、实验仪器:按实验计算机的硬件配置参数填写4、实验步骤:按教材P118-P123的(1)-(7)填写5、实验数据:实验步骤5中的具体数据,根据思考题的取值要求选取数据,至少2组6、实验总结:回答思考题以及本次实验的心得九、其它说明实验五:SQL Server 2005中的k-means应用实验学时:2实验类型:验证实验要求:必修一、实验目的通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下k-means的应用的知识,训练其把教材上的内容应用到实际中的技能,为今后继续聚类知识的学习奠定基础。 二、实验内容在SQL Server 2005示例数据仓库环境下k-means的应用。三、实验原理、方法和手段相似度计算方法、k-means思想。四、实验组织运行要求根据本实验的特点、要求和具体条件,采用“集中授课形式”。五、实验条件SQL Server 2005示例数据仓库环境。六、实验步骤参照教材数据仓库与数据挖掘P139-P143的内容。七、思考题1、CLUSTER_COUNT的取值不同对决策树的挖掘结果有何影响?八、实验报告1实验要求:预习教材P139-P143的内容2、实验目的、实验内容、实验原理按本实验指导的内容填写3、实验仪器:按实验计算机的硬件配置参数填写4、实验步骤:按教材P139-P143的(1)-(7)填写5、实验数据:实验步骤5中的具体数据,根据思考题的取值要求选取数据,至少1组6、实验总结:回答思考题以及本次实验的心得九、其它说明实验六:SQL Server 2005中的贝叶斯网络应用实验学时:2实验类型:验证实验要求:必修一、实验目的通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下贝叶斯网络的应用知识,训练其把教材上的内容应用到实际中的技能,为今后继续贝叶斯网络知识的学习奠定基础。 二、实验内容在SQL Server 2005示例数据仓库环境下贝叶斯网络的应用。三、实验原理、方法和手段 先验概率、后验概率、条件概率、全概率公式、贝叶斯公示四、实验组织运行要求根据本实验的特点、要求和具体条件,采用“集中授课形式”。五、实验条件SQL Server 2005示例数据仓库环境。六、实验步骤参照教材数据仓库与数据挖掘P160-P165的内容。七、思考题八、实验报告1实验要求:预习教材P160-P165的内容2、实验目的、实验内容、实验原理按本实验指导的内容填写3、实验仪器:按实验计算机的硬件配置参数填写4、实验步骤:按教材P160-P165的(1)-(8)填写5、实验数据:实验步骤5中的具体数据6、实验总结:本次实验的心得九、其它说明实验七:SQL Server 2005中的神经网络应用实验学时:2实验类型:验证实验要求:必修一、实验目的通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下神经网络的应用的知识,训练其把教材上的内容应用到实际中的技能,为今后继续神经网络知识的学习奠定基础。 二、实验内容在SQL Server 2005示例数据仓库环境下神经网络的应用。三、实验原理、方法和手段神经元模型、BP算法。四、实验组织运行要求根据本实验的特点、要求和具体条件,采用“集中授课形式”。五、实验条件SQL Server 2005示例数据仓库环境。六、实验步骤参照教材数据仓库与数据挖掘P189-P195的内容。七、思考题八、实验报告1实验要求:预习教材P189-P195的内容2、实验目的、实验内容、实验原理按本实验指导的内容填写3、实验仪器:按实验计算机的硬件配置参数填写4、实验步骤:按教材P189-P195的(1)-(5)填写5、实验数据:实验步骤5中的具体数据6、实验总结:本次实验的心得九、其它说明实验八:SQL Server 2005中的线性回归应用实验学时:2实验类型:验证实验要求:必修一、实验目的通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下线性回归的应用的知识,训练其把教材上的内容应用到实际中的技能,为今后继续线性回归知识的学习奠定基础。 二、实验内容在SQL Server 2005示例数据仓库环境下线性回归的应用。三、实验原理、方法和手段线性回归的参数估计、判定系数、回归系数的检验。四、实验组织运行要求根据本实验的特点、要求和具体条件,采用“集中授课形式”。五、实验条件SQL Server 2005示例数据仓库环境。六、实验步骤参照教材数据仓库与数据挖掘P215-P220的内容。七、思考题八、实验报告1实验要求:预习教材P215-P220的内容2、实验目的、实验内容、实验原理按本实验指导的内容填写3、实验仪器:按实验计算机的硬件配置参数填写4、实验步骤:按教材P215-P220的(1)-(7)填写5、实验数据:实验步骤5中的具体数据6、实验总结:本次实验的心得九、其它说明实验九:SQL Server 2005中的Logistic回归应用实验学时:2实验类型:验证实验要求:必修一、实验目的通过本实验的学习,使学生掌握在SQL Server 2005示例数据仓库环境下Logistic回归的应用知识,训练其把教材上的内容应用到实际中的技能,为今后继续Logistic回归知识的学习奠定基础。 二、实验内容在SQL Server 2005示例数据仓库环境下Logistic回归的应用。三、实验原理、方法和手段Logistic回归的参数估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-河南-河南无损探伤工一级(高级技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-河南-河南土建施工人员二级(技师)历年参考题库含答案解析
- 2024版合同协议内容变更协议
- 2025年事业单位工勤技能-河北-河北家禽饲养员五级(初级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-河北-河北公路养护工四级(中级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江西-江西水工监测工五级(初级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏汽车修理工(技师/高级技师)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏医技工三级(高级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-新疆-新疆热力运行工五级(初级工)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-广西-广西客房服务员一级(高级技师)历年参考题库典型考点含答案解析
- 创伤性血气胸的急救与护理
- 2025关于医疗平台与医疗机构合作合同模板
- 福州工会考试试题及答案
- 学校后勤工作管理培训
- 胰腺炎的营养治疗与护理
- 教师校园安全培训课件
- 头皮健康与头发生长关系的研究
- 财务结账相关管理制度
- 叉车维修方案(3篇)
- 口腔科护士正确吸唾操作规范
- 中学升旗管理制度
评论
0/150
提交评论