版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、商业智能与数据挖掘课程教学大纲课程代码:ELBU2025课程性质:跨专业选修课授课对象:工商管理、电子商务、市场营销、经济、会计等专业开课学期:秋总 学时:36学时学 分:2学分讲课学时:18学时实验学时:0学时 实践学时:18学时指定教材:课程讲义参考书目:Carlo Vercellis, Business Intelligence: Data Mining and Optimization for Decision Making, Wiley, 2009Johannes Lcdoltcr, Data Mining and Business Analytics with R, Wiley,
2、2013Michael J. Crawley, The R Book (2nd Edition), Wiley, 2013杰弗里D.坎姆(Jeffrey D. Camm)等著,商业数据分析,耿修林,宋哲译,机 械工业出版社,2017约翰尼斯莱道尔特(JohannesLedolter)著,数据挖掘与商务分析:R语言,宋涛 等译,机械工业出版社,2016 教学目的:企业信息化经历几十年的发展,已经由最初的提高效率逐渐向改善业务决策质量的智 能商务发展。大数据的热潮更是推波助澜,引领商业智能与数据挖掘向纵深方向前进。本课 程力图权衡理论与实践,依托R语言来完成商业智能与数据挖掘的实践分析任务,定位于
3、对 商业分析方法感兴趣的高年级学术。主要教学目标包括:1. 介绍商业智能与数据挖掘的方法论和相关概念;2. 掌握数据挖掘的实践操作(基于R语言);3. 理解商业智能和数据挖掘的在运营管理和决策支持中的应用。第九章聚类课时:1周,共2课时教学内容第一节聚类模型一、基本概念二、聚类方法的类型划分聚类方法层次聚类方法基于密度的方法基于网格的方法三、相似度(或距离)测量数值属性的相似度测量二元属性得相似度测量第二节划分聚类方法一、K均值聚类(K-means)第三节层级聚类方法一、凝聚方法二、分裂方法三、相似度(或距离)测量最短距离法最长距离法平均连接法质心连接法Ward距离法实践内容第五节R语言中的聚
4、类算法、划分聚类方法:K-nieans二、层次聚类方法凝聚方法分裂方法要点:熟悉藁类的目标,结合例题帮助学生掌握常用算法注意:对于学生遇到的问题随时讲解思考题:1. 分类和聚类的主要区别是什么?2. 聚类模型如何评估?3. 常用的聚类算法有哪些?第十章关联规则课时:1周,共2课时教学内容第一节关联规则挖掘一、基本概念目的与应用二、关联规则的结构支持度置信度提升度三、关联规则的过滤第二节Apriori算法、基本思想二、频繁项集的识别实践内容第三节R语言中的关联算法、Apriori算法要点:熟悉关联规则挖掘的目标,结合例题帮助学生掌握常用算法注意:对于学生遇到的问题随时讲解思考题:1. 如何计算关
5、联规则的支持度、置信度和提升度?2. 如何过滤关联规则?3. 如何通过Apriori算法识别频繁项集?第十一章文本挖掘课时:1周,共2课时教学内容第一节文本挖掘一、基本概念 目的与应用二、自然语言处理三、文本挖掘的基本步骤步骤I:建立语料库(Corpus) 步骤2:创建词项-文档矩阵 步骤3:提取知识第二节情感分析一、基本概念 目的与应用二、情感分析的基本步骤步骤1:情感检测步骤2: N-P极性识别步骤3:目标识别 步骤4:收集和聚合三、常用文本挖掘与情感分析的软件与工具 实践内容第三节R语言中的文本挖掘一、情感分析要点:熟悉文本挖掘的目标,结合例题帮助学生掌握常用算法注意:对于学生遇到的问题
6、随时讲解 思考题:1. 文本分析的基本步骤有哪些?2. 情感分析的基本步骤有哪些?第十二章Web挖掘课时:1周,共2课时教学内容第一节Web挖掘一、基本概念目的与应用二、Web挖掘的分类Web内容挖掘Web结构挖掘Web使用模式挖掘三、Web分析度量第二节社交分析一、社交网络分析目的与应用社交网络的构成要素社交网络图社交网络分析度量二、社交媒体分析目的与应用三、多模式情感分析实践内容第三节R语言中的Web挖掘一、社交网络分析网络构建网络可视化网络分析度量要点:熟悉Web挖掘的目标,结合例题帮助学生掌握基本操作注意:对于学生遇到的问题随时讲解思考题:1. Web挖掘可以分为哪几大类?2. 社交网
7、络的分析度量有哪些?第十三章最优化问题 课时:1周,共2课时教学内容第一节最优化问题一、基本概念二、规范性/指导性分析三、约束条件与目标函数第二节线性优化模型一、建立最优化模型的基本步骤二、极大值问题三、极小值问题四、线性规划的几种特殊情况多个最优解无可行解无界问题五、敏感性分析第三节整数线性优化模型一、纯整数线性规划二、混合整数线性规划三、0-1整数线性规划实践内容第四节R语言中的最优化求解一、线性优化二、整数线性优化要点:熟悉最优化求解的基本步骤,结合例题帮助学生掌握常用函数注意:对于学生遇到的问题随时讲解思考题:1. 建立线性优化模型的基本步骤有哪些?2. 线性优化中的敏感性分析是什么?
8、考核方式:成绩包括四个部分,平时成绩10%,实践作业20%,小组项目20%,期末考试成绩50%。具 体内容如下:1. 平时成绩包括出勤,课堂表现,讨论和活动参与等,占总成绩10%;2. 实践作业考察学生是否可以运用R语言解决数据挖掘的实践问题,共两次作业,占总成绩20%;3. 小组项目小组项目成绩的评估主要依据书面报告内容以及课堂演讲表现,占总成绩20%; 具体要求:34人一组,课题自选;a)备选课题1:深入分析商业智能和数据挖掘在特定行业中(例如医疗健康、共享经济等)的应用现状、典型企业案例,并探索其发展趋势、亟需解决的问题,以及管理启示b)备选课题2:根据数据库或者大数据开放平台获取的数据
9、,应用课堂中所学的数据挖掘方法,提出并 解决实际问题,总结管理启示4. 期末考试形式为闭卷考试,包括单选题、概念简答题和应用题,考察学生对重要知识点的理解与 应用,占总成绩50%。第一章商业智能概论课时:1周,共2课时教学内容第一节商业智能简介一、课程简介介绍课程主要内容,授课方式,课程安排,学习目标,考核方式及注意事项二、商业智能的基本概念商业智能的定义商业智能的简史商业智能行业动态商业智能的架构商业智能系统的组成部分 商业智能与企业决策三、商业智能与道德第二节R语言简介一、Ri吾言概述二、R语言的运行环境三、R语言的帮助实践内容第三节R语言入门一、R的下载和安装二、R的运行三、RStudi
10、o软件熟悉四、R语言软件包的获取、安装及加载要点:熟悉软件基本规则,掌握基本操作注意:对于学生遇到的问题随时讲解思考题:1. 商业智能的目标是什么?2. 商业智能系统的组成部分有哪些?3. R语言的特点有哪些?第二章R语言基础课时:2周,共4课时教学内容第一节R语言介绍一、命令行/语句二、R函数三、R语言的帮助四、R软件包第二节R语言基本操作一、运算符二、变量第三节数据结构一、数据类型数值型、整数型、逻辑型、复数型、字符型二、数据结构向量、矩阵、列表、数据框、数组、因子第四节数据读写一、工作目录二、读取数据三、写入数据实践内容第五节R语言基础练习一、运算数学运算、逻辑运算、函数运算二、向量创建
11、向量、访问向量元素、向量运算三、矩阵创建矩阵、访问矩阵元素、矩阵运算四、列表创建列表、访问列表元素五、数据框创建数据框、提取数据、添加列、添加行六、数组创建数组、访问数组元素七、因子创建因子八、工作目录获得当前工作目录、重设工作目录九、读取数据读取CSV数据,读取文本数据,读取Web数据,读取Excel文件 十、写入数据写入CSV文件、写入文本文件、写入Excel文件思考题:1. R语言中数据类型有哪些?2. R语言中数据结构有哪些?第三章数据准备课时:1周,共2课时教学内容第一节数据及模型一、数据的概念二、模型概念三、模型建构四、模型分类描述性分析模型、预测性分析模型、规范性分析模型第二节数
12、据准备一、数据整合子任务:收集数据、选择数据、集成数据二、数据清洗子任务:处理缺失值、减少数据噪声、消除不一致性三、数据变换子任务:标准化数据、离散化数据、构建新属性四、数据约简子任务:减少属性数量、减少记录数量、平衡倾斜数据实践内容第三节R语言中的数据预处理一、数据整合合并数据框、数据选择、数据排序二、数据清洗检查是否存在缺失值、删除含缺失值的记录、添加新属性、添加标准分数三、数据变换四、数据约简主成分分析五、数据预处理中的常用函数要点:熟悉数据准备的目标及步骤,掌握基本操作注意:对于学生遇到的问题随时讲解思考题:1. 商业智能数量解析囊括了哪三大类模型?2. 数据准备的步骤有哪些?第四章数
13、据探索课时:1周,共2课时教学内容第一节数据探索的基本概念一、数据探索三个阶段:单变量分析、双变量分析和多变量分析二、数据可视化 可视化工具、应用第二节单变量分析一、分类变量统计量、可视化分析工具二、数值变量统计量、可视化分析工具第三节双变量分析一、分类变量和分类变量二、数值变量和数值变量三、数值变量和分类变量第四节多变量分析一、统计分析二、可视化分析实践内容第五节R语言中的数据探索一、R语言绘图基础绘图参数符号、线条与颜色标题、坐标轴与图例图形的组合二、单变量分析统计描述条形图/柱状图、直方图、箱线图三、双变量分析分类变量和分类变量:交叉表、堆积条形图、簇状条形图数值变量和数值变量:协方差、
14、相关系数、散点图数值变量和分类变量:箱线图四、多变量分析协方差矩阵、相关矩阵、散点图矩阵要点:熟悉数据探索的目标及步骤,结合例题帮助学生掌握基本操作注意:对于学生遇到的问题随时讲解思考题:1. 数据探索的三个阶段分别是什么?2. 数据可视化的目的是什么?第五章统计推断课时:1周,共2课时教学内容第一节统计推断的基本概念一、估计问题点估计区间估计二、假设检验第二节参数估计一、基本概念估计、估计量、估计值二、点估计均值估计、方差估计三、区间估计置信水平、置信区间第三节假设检验、基本概念原假设、备择假设、假设检验的基本步骤、潜在错误二、单样本假设检验三、双样本假设检验四、方差分析实践内容第四节R语言
15、中的参数估计一、点估计样本平均值、样本标准差、样本比例二、区间估计均值的区间估计、比例的区间估计第五节R语言中的假设检验一、单样本假设检验单样本检验函数二、双样本假设检验双样本检验函数三、方差分析第六节R语言中的概率分布一、概率分布的相关函数二、正态分布三、J分布要点:熟悉统计推断的目标及步骤,结合例题帮助学生掌握基本操作注意:对于学生遇到的问题随时讲解思考题:1. 统计推断的问题可以分为哪两大类?2. 参数估计的两种基本形式分别是什么?3. 假设检验的结论可能存在哪些潜在错误?第六章回归分析课时:1周,共2课时教学内容第一节线性回归的基本概念一、回归模型和回归方程二、估计的回归方程三、最小二
16、乘法四、简单线性回归模型的拟合效果第二节 多元回归模型一、多元回归模型和多元回归方程二、估计的多元回归方程第三节回归推断分析一、统计推断二、推断分析的必要条件三、总体回归关系检验四、回归参数检验五、不显著自变量处理六、多重公线性影响、方差膨胀因子、补救措施第四节分类自变量一、虚拟变量二、多个类别变量的处理第五节非线性回归模型一、多项式回归二、交互作用实践内容第六节R语言中的回归分析一、简单线性回归相关函数、获取拟合效果、回归诊断分析二、多元回归三、分类自变量四、交互作用要点:熟悉回归分析的基本步骤,结合例题帮助学生掌握基本操作注意:对于学生遇到的问题随时讲解思考题:1. 多元回归中如何处理不显
17、著的自变昂:?如何评估拟合效果?2. 多重共线性可能带来什么样的影响?补救措施有哪些?第七章时间序列分析与预测 课时:1周,共2课时教学内容第一节时间序列的基本概念一、时间序列的定义二、时间序列的类型三、时间序列的构成要素四、简单线性回归模型的拟合效果第二节时间序列的预测模型一、对时间序列建模二、预测模型的评估预测误差、预测精度第三节时间序列预测分析方法一、移动平均法二、指数平滑法三、双重指数平滑法四、三重指数平滑法第四节回归预测分析一、线性趋势回归分析二、带有季节性效应的回归分析三、因果关系的回归分析实践内容第五节R语言中的时间序列分析一、时间序列数据创建时间序列对象绘制折线图分解时间序列构成要素二、移动平均法三、指数平滑法四、多元回归要点:熟悉时间序列分析的基本步骤,结合例题帮助学生掌握基本操作 注意:对于学生遇到的问题随时讲解思考题:1. 时间序列的构成要素有哪些?2. 如何评估预测模型?3. 如何选择合适的预测模型?第八章分类课时:2周,共4课时教学内容第一节数据挖掘的基本概念一、数据挖掘的内涵与基本步骤二、数据挖掘中的三大类数据集三、监督学习四、无监督学习第二节分类模型一、基本概念二、分类模型的构建三、分类模型的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国铁路青藏集团有限公司2026年招聘全日制普通高校大专(高职)毕业生备考题库(二)及一套完整答案详解
- 2026年嵩山少林武术职业学院单招职业技能测试题库带答案详解(研优卷)
- 2026年广西信息职业技术学院单招职业技能测试题库附参考答案详解(培优)
- 2026年广东茂名农林科技职业学院单招职业技能测试题库附答案详解
- 2026年广东金融学院单招职业技能测试题库及答案详解(名师系列)
- 2025年武汉科技大学附属老年病医院招聘30人备考题库及答案详解(考点梳理)
- 2026年广东省阳江市单招职业倾向性测试题库含答案详解(突破训练)
- 杭州市钱塘高级中学2026年度教师招聘备考题库及答案详解(新)
- 2026年广东金融学院单招职业适应性测试题库带答案详解(a卷)
- 2026年平顶山工业职业技术学院单招职业倾向性考试题库附参考答案详解(黄金题型)
- 富士康IE学院工业工程教材课件
- GB/T 7025.1-2023电梯主参数及轿厢、井道、机房的型式与尺寸第1部分:Ⅰ、Ⅱ、Ⅲ、Ⅵ类电梯
- 《归园田居》其一
- 冷冻电镜在生物医学中的应用
- 《森林培育学》第二章 森林立地
- 陕县赵里河铝土矿矿产资源开采与生态修复方案
- 四川大学化工复试资料 四川大学化工原理(I)教学大纲
- GB/T 8464-2023铁制、铜制和不锈钢制螺纹连接阀门
- 群文阅读:《祖国啊-我亲爱的祖国》《梅岭三章》《短诗五首》《海燕》(课件)-九年级语文下册(部编版)
- 高中物理 奥赛培训力学
- GB/T 2504-1989船用铸钢法兰(四进位)
评论
0/150
提交评论