




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
决策支持与商务智能课程实验指导书实验学时:课内实验16学时、课外实践0学时实验类型:综合性实验要求:必修适用对象:信息管理与信息系统、计算机科学与技术、软件工程实验一:熟悉Python语法和掌握数据特征及相似性度量方法,2学时一、实验目的1. 熟悉Python基本语法和常用函数;2. 熟悉Numpy、Scipy、Matplotlib、Pandas等常用技术包;3. 学会使用WinPython开发平台;4. 熟练掌握数据统计特征的分析方法,五树概况,中位数、均值、众数等。5. 熟练使用常用数据相似性度量方法,例如,曼哈顿距离、欧式距离、闵考斯福基距离、余弦等。二、实验内容1. 数据统计特征的分析方法,五树概况,中位数、均值、众数等。2. 数据之间相似性度量方法,包括曼哈顿距离、欧式距离、闵考斯福基距离、余弦。三、实验原理、方法和手段1. 实验原理:l WinPython开发平台是目前Python源程序开发中比较重要的工具,使用它基本上可以完成数据分析所有的操作,如关联规则分析、分类分析、聚类分析等。l 数据统计特征是数据分析的基础。l 数据之间的相似性是许多数据分析任务常用的技巧,如聚类分析中簇之间聚类的度量。2. 方法与手段:先由教师讲解并演示,然后学生根据实验报告进行实验。四、实验环境、条件若干台装有WinPython开发平台的计算机。五、实验组织运行要求本实验是演示性+综合性实验,采用集中授课形式组织教学,先由教师讲解并演示,然后学生根据实验报告进行实验。六、实验步骤1. 随机生成长度为奇数或者偶数长度的整数序列,编程求出五数概况、中位数、均值、众数;2. 给定my_list1 = 5, 0, 3, 0, 2, 0, 0, 2, 0, 0,my_list2 = 3, 0, 2, 0, 1, 1, 0, 1, 0, 1,分别利用哈顿距离、欧式距离、闵考斯福基距离、余弦计算二者之间的相似性。七、实验报告河南财经政法大学计算机与信息工程学院实验报告实验项目名称熟悉Python语法和掌握数据特征及相似性度量方法 课程名称 决策支持与商务智能 成绩评定 实验类型:验证型综合型设计型 实验日期 指导教师 学生姓名 学号 专业班级 一、实验项目训练方案小组合作:是 否小组成员:实验目的:1. 熟悉Python基本语法和常用函数;2. 熟悉Numpy、Scipy、Matplotlib、Pandas等常用技术包;3. 学会使用WinPython开发平台;4. 熟练掌握数据统计特征的分析方法,五树概况,中位数、均值、众数等;5. 熟练使用常用数据相似性度量方法,例如,曼哈顿距离、欧式距离、闵考斯福基距离、余弦等。实验场地及仪器、设备和材料:若干台装有WinPython开发平台的计算机。实验训练内容(包括实验原理和操作步骤):1. 实验原理:WinPython开发平台是目前Python源程序开发中比较重要的工具,使用它基本上可以完成数据分析所有的操作,如关联规则分析、分类分析、聚类分析等;数据统计特征是数据分析的基础;数据之间的相似性是许多数据分析任务常用的技巧,如聚类分析中簇之间聚类的度量。数据统计特征的分析方法,五树概况,中位数、均值、众数等;数据之间相似性度量方法,包括曼哈顿距离、欧式距离、闵考斯福基距离、余弦2. 实验步骤:(1)随机生成长度为奇数或者偶数长度的整数序列,编程求出五数概况、中位数、均值、众数;(2)给定my_list1 = 5, 0, 3, 0, 2, 0, 0, 2, 0, 0,my_list2 = 3, 0, 2, 0, 1, 1, 0, 1, 0, 1,分别利用哈顿距离、欧式距离、闵考斯福基距离、余弦计算二者之间的相似性。二、实验总结与评价实验总结(包括实验数据分析、实验结果、实验过程中出现的问题及解决方法等):(如留存空白不足,可附A4纸)对实验的自我评价:指导教师评语:实验成绩评定: 指导教师(签名): 日期: 年 月 日实验二:频繁模式与关联规则挖掘,6学时一、实验目的1. 了解关联规则、频繁模式、支持度、可信度的基本原理和计算方法;2. 熟练掌握频繁模式挖掘算法;3. 熟练使用Python编写APRIORI、FP-Growth以及基于APRIORI的提升算法;4. 学会利用频繁模式生成关联规则。二、实验内容1. 频繁模式挖掘算法APRIORI及其提升算法的实现。三、实验原理、方法和手段1. 实验原理:利用候选集之间的连接与剪枝操作生成频繁模式、利用抽样与散列技术提升挖掘效率。2. 方法与手段:先由教师讲解并演示,然后学生根据实验报告进行实验。四、实验环境、条件若干台装有WinPython开发平台的计算机。五、实验组织运行要求本实验是综合性实验,采用集中授课形式组织教学,先由教师讲解并演示,然后学生根据实验报告进行实验。六、实验步骤1. 给定亚马逊销售数据集retail.txt,最小支持度参数min_sup=0.5,最小可信度min_con=0.5。2. 利用APRIORI算法寻找retail数据集中所有的频繁模式,寻找出top-100的频繁模式。根据得到的频繁模式寻找出所有满足条件的关联规则。3. 利用抽样技术来提高APRIORI算法的效率,减少数据库的扫描遍数。具体操作要求:选取retail数据集中的一个样本,使用Apriori 算法在样本中挖掘频繁模式。扫描一次数据库, 验证在样本中发现的频繁模式。4. 利用散列技术提高APRIORI算法的效率,进而压缩存储空间。散列项集到对应的桶中,一个其hash桶的计数小于阈值的k-itemset不可能是频繁的。具体操作要求:首先利用APRIORI算法生成频繁1-项集,基于频繁1-项集产生候选2-项集。然后,设计合理的hash函数(或者直接利用MD5实现hash效果),把候选2-项集压缩到相应的hash桶中。再根据min-sup=0.5寻找频繁2-项集。根据上述过程,寻找出所有频繁项集和关联规则。七、实验报告河南财经政法大学计算机与信息工程学院实验报告实验项目名称 频繁模式与关联规则挖掘 课程名称 决策支持与商务智能 成绩评定 实验类型:验证型综合型设计型 实验日期 指导教师 学生姓名 学号 专业班级 一、实验项目训练方案小组合作:是 否小组成员:实验目的:1. 了解关联规则、频繁模式、支持度、可信度的基本原理和计算方法;2. 熟练掌握频繁模式挖掘算法;3. 熟练使用Python编写APRIORI、FP-Growth以及基于APRIORI的提升算法;4. 学会利用频繁模式生成关联规则。实验场地及仪器、设备和材料:若干台装有WinPython开发平台的计算机。实验训练内容(包括实验原理和操作步骤):1. 实验原理:利用候选集之间的连接与剪枝操作生成频繁模式、利用抽样与散列技术提升挖掘效率。2. 实验步骤(1)给定亚马逊销售数据集retail.txt,最小支持度参数min_sup=0.5,最小可信度min_con=0.5;(2)利用APRIORI算法寻找retail数据集中所有的频繁模式,寻找出top-100的频繁模式。根据得到的频繁模式寻找出所有满足条件的关联规则,给出相应的核心代码和实验结果截屏;(3)利用抽样技术来提高APRIORI算法的效率,减少数据库的扫描遍数。具体操作要求:选取retail数据集中的一个样本,使用Apriori 算法在样本中挖掘频繁模式。扫描一次数据库,验证在样本中发现的频繁模式,给出相应的核心代码和实验结果截屏;(4)利用散列技术提高APRIORI算法的效率,进而压缩存储空间。散列项集到对应的桶中,一个其hash桶的计数小于阈值的k-itemset不可能是频繁的。具体操作要求:首先利用APRIORI算法生成频繁1-项集,基于频繁1-项集产生候选2-项集。然后,设计合理的hash函数(或者直接利用MD5实现hash效果),把候选2-项集压缩到相应的hash桶中。再根据min-sup=0.5寻找频繁2-项集。根据上述过程,寻找出所有频繁项集和关联规则,给出相应的核心代码和实验结果截屏。二、实验总结与评价实验总结(包括实验数据分析、实验结果、实验过程中出现的问题及解决方法等):(如留存空白不足,可附A4纸)对实验的自我评价:指导教师评语:实验成绩评定: 指导教师(签名): 日期: 年 月 日实验三:分类算法实现,4学时一、实验目的1. 了解ID3、C4.5、朴实贝叶斯、SVM等常用分类算法的核心思想;2. 熟练掌握ID3、C4.5以及算法朴实贝叶斯分类算法;3. 熟练掌握sklearn工具包的应用技巧4. 熟练使用Python编写ID3与朴实贝叶斯分类算法;二、实验内容1. ID3与朴实贝叶斯分类算法的实现。三、实验原理、方法和手段1. 实验原理:利用信息论中的信息熵、信息增益、信息增益率来度量ID3算法的分割结点;利用贝叶斯定理实现朴实贝叶斯分类算法中类别的判断。2. 方法与手段:先由教师讲解并演示,然后学生根据实验报告进行实验。四、实验环境、条件若干台装有WinPython开发平台的计算机。五、实验组织运行要求本实验是综合性实验,采用集中授课形式组织教学,先由教师讲解并演示,然后学生根据实验报告进行实验。六、实验步骤1. 给定一个训练集Training-data.txt,构建ID3(构建决策树时,采用信息增益分裂相应结点)和朴实贝叶斯分类器,并对如下测试用例作出推断:(1)X1 = (age =30, Income = medium, Student = yes, Credit_rating = Fair)(2)X2 = (30= age 40, Income = medium, Student = no, Credit_rating = Fair)2. 给出相应的核心代码和实验结果截屏。七、实验报告河南财经政法大学计算机与信息工程学院实验报告实验项目名称 分类算法实现 课程名称 决策支持与商务智能 成绩评定 实验类型:验证型综合型设计型 实验日期 指导教师 学生姓名 学号 专业班级 一、实验项目训练方案小组合作:是 否小组成员:实验目的:1. 了解ID3、C4.5、朴实贝叶斯、SVM等常用分类算法的核心思想;2. 熟练掌握ID3、C4.5以及算法朴实贝叶斯分类算法;3. 熟练掌握sklearn工具包的应用技巧4. 熟练使用Python编写ID3与朴实贝叶斯分类算法;实验场地及仪器、设备和材料:若干台装有WinPython开发平台的计算机。实验训练内容(包括实验原理和操作步骤):1. 实验原理:利用信息论中的信息熵、信息增益、信息增益率来度量ID3算法的分割结点;利用贝叶斯定理实现朴实贝叶斯分类算法中类别的判断。2. 实验步骤(1)给定一个训练集Training-data.txt,构建ID3(构建决策树时,采用信息增益分裂相应结点)和朴实贝叶斯分类器,并对如下测试用例作出推断:(1)X1 = (age =30, Income = medium, Student = yes, Credit_rating = Fair)(2)X2 = (30= age 40, Income = medium, Student = no, Credit_rating = Fair);(2)给出相应的核心代码和实验结果截屏。二、实验总结与评价实验总结(包括实验数据分析、实验结果、实验过程中出现的问题及解决方法等):(如留存空白不足,可附A4纸)对实验的自我评价:指导教师评语:实验成绩评定: 指导教师(签名): 日期: 年 月 日实验四:聚类算法实现,4学时一、实验目的1. 了解k-均值、k-中心点、DBSCAN、层次聚类算法的核心思想;2. 熟练掌握k-均值、k-中心点聚类算法;3. 熟练掌握sklearn工具包的应用技巧4. 熟练使用Python编写k-均值、k-中心点聚类算法;二、实验内容1. k-均值、k-中心点聚类算法的实现。三、实验原理、方法和手段1. 实验原理:利用数据之间的相似性度量方法,如曼哈顿距离、欧式距离、闵考斯福基距离、余弦等,来度量划分不同数据点;利用误差平方和度量每次聚类的质量。2. 方法与手段:先由教师讲解并演示,然后学生根据实验报告进行实验。四、实验环境、条件若干台装有WinPython开发平台的计算机。五、实验组织运行要求本实验是综合性实验,采用集中授课形式组织教学,先由教师讲解并演示,然后学生根据实验报告进行实验。六、实验步骤1. 利用python写出一个二维数据模拟器,例如生成500个点。利用k-均值和k-中心点聚类技术对这500个点进行聚类分析。k=4。2. 给出相应的核心代码和实验结果截屏。七、实验报告河南财经政法大学计算机与信息工程学院实验报告实验项目名称 聚类算法实现 课程名称 决策支持与商务智能 成绩评定 实验类型:验证型综合型设计型 实验日期 指导教师 学生姓名 学号 专业班级 一、实验项目训练方案小组合作:是 否小组成员:实验目的:1. 了解k-均值、k-中心点、DBSCAN、层次聚类算法的核心思想;2. 熟练掌握k-均值、k-中心点聚类算法;3. 熟练掌握sklearn工具包的应用技巧4. 熟练使用Python编写k-均值、k-中心点聚类算法;实验场地及仪器、设备和材料:若干台装有WinPython开发平台的计算机。实验训
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025内蒙古国贸集团有限公司市场化选聘总经理1人笔试题库历年考点版附带答案详解
- 2025中国电气装备总部及所属企业社会招聘58人笔试题库历年考点版附带答案详解
- 2025年教育培训行业教育培训模式与在线教育研究报告
- 2025年制药行业数字化医疗服务创新研究报告
- 2025年零售行业数字化营销策略研究报告
- 2025年儿科传染病防控知识考试模拟试卷答案及解析
- 2025年医美行业全球市场发展趋势研究报告
- 2025年二次元产业行业发展状态与内容创作研究报告
- 2025年医疗器械行业远程医疗设备技术创新研究报告
- 2025年音乐产业行业音乐内容与IP运营研究报告
- 结缔组织教学课件
- 2023年6月新高考天津卷英语试题真题及答案解析(精校打印版)
- 兽医未来职业规划
- 余华读书分享+名著导读《我们生活在巨大的差距里》
- 消毒供应中心工作人员 职业安全和防护
- 2023-2024 学年度第一学期第一次月考七年级数学试题
- 中级化学检验工理论考试题库
- 幼儿园红色小故事PPT:抗日小英雄王二小的故事
- YD-T 3775-2020 大数据 分布式事务数据库技术要求与测试方法
- 大学生心理健康教育(第二版)PPT全套完整教学课件
- 2023年高考英语总复习高中英语常用一百组固定搭配
评论
0/150
提交评论