《机器学习应用技术》课程标准_第1页
《机器学习应用技术》课程标准_第2页
《机器学习应用技术》课程标准_第3页
《机器学习应用技术》课程标准_第4页
《机器学习应用技术》课程标准_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《机器学习应用技术》课程标准课程名称:《机器学习应用技术》课程代码:013243课程学分:2学分 课程学时:32学时 课程类型:专业核心课授课对象:所属专业:大数据工程技术归口教研室:大数据教研室一、课程定位《机器学习应用技术》是大数据工程技术专业的核心课,服务于人工智能开发与测试工程师“机器学习模型搭建、应用机器学习模型进行对象分类与回归”这两项典型工作任务。本课程主要讲授数据导入与预处理、可视化分析、算法选择与创建模型、模型优化与部署等内容。本课程以两类、共6个实际案例组织课程的主要内容,开展案例式教学,培养学生使用Python语言搭建完整机器学习工程项目的能力。《机器学习应用技术》作为专业核心课,对于学生专业能力的培养起着关键的作用,其前修课程有《人工智能基础》、《Python语言程序设计》、《Python数据采集与分析》等,后修课程有《深度学习框架应用》等。二、课程目标学生学完《机器学习应用技术》课程后,应能根据具体问题或数据集,选择合适的机器学习算法,利用Python编程语言搭建完整的机器学习项目,实现对象的分类识别或从数据中回归出一定的规律,从而解决实际问题,创造价值。具体应达到以下目标:1.树立精益求精的工匠精神,养成诚信敬业、认真负责、严谨规范的态度。2.培育科技人文素养,探寻科技的文化根基,提升文化自信。3.形成理性客观、实事求是、不懈探索的科学素养,以科学的态度面对问题、分析问题、处理问题。4.传承军工精神,树立吃苦耐劳的劳动精神,养成团结协作、顾全大局的集体意识。5.提升遵守国家法律法规的意识,尊重知识产权的观念。6.提升遵循国家及行业规范的意识,确保工作质量。7.能根据开源协议要求,依法依规使用开源资源,尊重原创知识产权。8.根据职业发展需求,能够自行检索搜集人工智能、互联网及相关软件和信息技术服务业等行业的发展情况、前沿技术,持续更新自己的知识储备。9.根据运维人员、数据分析和软件开发等不同岗位的要求,能够建立和丰富自己的知识体系、技能体系。10.根据开发要求,能搭建机器学习项目Python语言开发环境,能够采用合适的方法将数据集导入到项目代码中,采用合适的方法对数据进行预处理,剔除其中的问题。11.能够对数据进行可视化分析,根据需要绘制各种图表,能从图表中发现数据的分布规律。能将结果进行可视化展示,以辅助团队成员及客户的理解。12.根据任务要求,能够利用常用的交叉验证方法小心细致地对算法进行交叉验证,以确定算法的性能,筛选最优算法,辅助提升最终效果。13.能够选择合适的算法创建机器学习模型,并根据数据量的情况,对模型进行充分的训练。使用训练好的模型解决实际问题,并能采用合适的方式对模型的最终效果进行定量评估,给出明确的评估结果。14.能根据任务需求对模型进行优化,使用算法调参流程对算法进行调参。15.根据需求,能够以合适的方式部署最终的模型,能够实施序列化与反序列化,确保开发成果顺利投产、客户满意。三、课程结构工作内容职业能力分析支撑能力的知识技能1.初识机器学习1.能描述机器学习的含义,建立机器学习的基本概念;2.能依据机器学习生态圈说明搭建完整的机器学习开发环境;3.能列举常用机器学习算法与案例。1.机器学习的概念;2.机器学习常用术语;3.分类与回归的区别;4.Python机器学习开发环境搭建方法;5.机器学习常用算法与常见案例;2.鸢尾花分类1.能概述k近邻算法的原理与处理要点;2.能描述鸢尾花数据集的特点及分类要求;3.能编写Python代码,用k近邻算法实现鸢尾花分类。1.k近邻算法的基本原理;2.k值的选取方法;3.邻居距离的度量方法;4.分类决策的制定方法;5.鸢尾花数据集特点;6.用k近邻算法实现鸢尾花分类的Python代码设计。3.垃圾文本预测1.能理解贝叶斯算法的历史渊源与问题;2.理解朴素贝叶斯算法的含义;3.理解TF-IDF算法在文本分类上的应用方法;4.能编写Python代码,用贝叶斯算法实现垃圾短信预测。1.贝叶斯算法的历史渊源及特点;2.朴素贝叶斯算法的原理;3.TF-IDF算法在文本分类上的应用;4.用贝叶斯算法实现垃圾文本预测的Python代码设计。4.红酒分类1.能简述决策树算法的原理与构建方法2.能说出红酒数据集的特点;3.能编写Python代码,用决策树算法实现红酒分类。1.决策树的基本原理;2.决策树与信息熵;3.决策树的构建方法-ID3与CART;4.红酒数据集的特点;5.用决策树模型实现红酒分类的Python代码设计。5.糖尿病诊断1.能说出逻辑回归算法原理的要点;2.能用3种方法导入糖尿病数据集;3.能编写Python代码,用逻辑回归算法实现糖尿病诊断。1.逻辑回归算法;2.糖尿病数据集特点;3.用逻辑回归算法实现糖尿病诊断的Python代码设计。6.房屋售价预测1.能说出多元线性回归的原理;2.能概述梯度下降法的要点;3.能编写Python代码,用多元线性回归算法预测波士顿房价。1.多元线性回归;2.梯度下降法;3.房屋售价数据集;4.用多元线性回归模型预测房屋售价的Python代码设计。7.模型的保存与使用1.能依据序列化与反序列化的方法对最终的模型实施保存与使用。1.序列化与反序列化的概念;2.通过pickle实现序列化与反序列化的程序;3.通过joblib实现序列化与反序列化的程序;四、课程内容《机器学习应用技术》课程共计32学时,按照任务难度由简单到复杂分为初识机器学习、鸢尾花分类、垃圾短信预测、红酒分类、糖尿病诊断、房屋售价预测、模型的保存与使用共7个学习任务。以案例为主开展案例式教学,每个案例都是来源于真实的机器学习项目,直接面向工程开发。每个学习任务按照工作内容分为若干子任务,每个子任务承载一定学习内容,对知识点、技能点明确了产出标准,具体如下表:任务子任务学习内容产出标准学时1初识机器学习1.机器学习基本概念1.机器学习的概念;2.机器学习常用术语;3.分类与回归的概念;1.能准确说出机器学习的含义;2.能识记机器学习的常用术语;3.能正确区分分类问题与回归问题。52.Python机器学习生态圈1.Python机器学习生态圈简介;2.机器学习开发环境搭建;1.能说出机器学习生态圈扩展库的主要功能;2.能用pip命令或conda命令安装机器学习用到的第三方库。3.机器学习常用算法与案例概述1.常用机器学习算法;2.常用的机器学习案例;1.能识记机器学习常用算法;2.能说出常用的机器学习案例。2鸢尾花分类1.k近邻算法原理1.k近邻算法基本原理;2.k值的选取;3.邻居距离的度量;4.分类决策的制定;1.能说出k近邻的分类原理;2.能自行调整k近邻的k值参数;3.能指出不少于3种距离度量方法;4.能指出k近邻做分类的具体策略;62.鸢尾花分类问题1.鸢尾花数据集及其分类1.能依据链接下载鸢尾花数据集;2.能说出鸢尾花的特征和3种类别;3.用k近邻算法实现鸢尾花分类1.数据导入与分析;2.数据可视化;3.创建k近邻模型进行分类;1.能导入鸢尾花数据集并编程分析;2.能根据需要绘制各类图表;3.能创建k近邻模型并进行分类,并依据计算结果定量分析模型的分类性能;3垃圾文本预测1.贝叶斯算法简介1.贝叶斯算法的历史渊源;2.重温贝叶斯定理;3.朴素贝叶斯算法简介;1.能概述贝叶斯算法的历史渊源;2.能描述贝叶斯公式的推导过程;3.能指出朴素贝叶斯算法的“朴素”之处;62.垃圾短信预测问题1.垃圾文本预测案例;1.能说出spam和ham所代表的含义;2.能自行搜索下载垃圾文本数据集;3.用贝叶斯算法实现垃圾短信预测1.数据导入与分析;2.文本分类与TF-IDF算法;3.创建贝叶斯模型进行垃圾文本预测;1.能导入垃圾文本数据集并编程分析;2.能用TF-IDF算法对垃圾文本数据集进行预处理,提取其关键词;3.能使用多项式朴素贝叶斯算法创建模型实施预测,分析性能。4红酒分类1.决策树算法介绍1.决策树的原理初探;2.决策树与信息熵;3.决策树构建方法-ID3、CART算法;1.能描述决策树相关的概念;2.能解释决策树的原理要点;3.能指出信息熵与决策树的关系;4.能说出ID3与CART算法的步骤;62.红酒分类问题1.红酒数据分类问题;1.能指出红酒数据集的样本数、红酒类别、特征个数等要点;3.用决策树模型实现红酒分类1.数据导入与分析;2.创建决策树模型并训练;3.决策树模型可视化;1.能通过scikit-learn的接口函数导入数据集并进行必要的分析;2.能用CART算法构建决策树模型并对红酒进行分类;3.能将创建的决策树模型画成图形;5糖尿病诊断1.逻辑回归算法1.逻辑回归算法介绍;1.能指出逻辑回归算法的作用;2.能写出逻辑回归算法的目标函数;32.糖尿病诊断问题1.糖尿病数据集及诊断任务;1.能自行搜索下载数据集并描述诊断要求;3.用逻辑回归算法实现糖尿病诊断1.数据导入与分析;2.创建逻辑回归模型并预测病例;1.能使用read_csv()函数导入糖尿病数据集并分析数据;2.能使用scikit-learn自带的逻辑回归算法类创建模型并进行预测。6房屋售价预测1.多元线性回归1.多元线性回归概述;2.梯度下降方简介;1.能说出多元线性回归的含义;2.能写出多元线性回归的目标函数;3.能说出梯度下降算法的含义。52.房屋售价预测问题1.房屋售价数据集及预测任务;1.能说出房屋售价数据集的主要情况;2.能说出预测任务;3.用多元线性回归算法预测房屋售价1.获取房屋售价数据集;2.数据正态化;3.模型实现与效果预测;4.测试结果可视化;1.能自行下载房屋售价数据集;2.能对导入的数据实施正态化处理;3.能创建多元线性回归模型并预测;4.能将测试结果画成图形,分析模型的预测效果;7模型的保存与使用1.序列化与反序列化1.通过pickle实现序列化与反序列化;2.通过joblib实现序列化与反序列化;1.能通过pickle实现序列化与反序列化,实现模型的保存与使用;2.能通过joblib实现序列化与反序列化,实现模型的保存与使用;1五、课程考核本课程考核类型为考试课,采用“40%过程考核+60%期末考试”的方式,授课在实训室进行,采用边讲边练的方式进行,使学生在听理论知识的同时动手练习,通过实践加深对课本知识的理解和记忆。过程得分由学生的日常考勤、课堂表现、作业完成情况综合打分;期末考试采用上机实际动手编程的方式进行,考察学生动手编程搭建机器学习项目的能力,由任课教师按照学生答题情况评分。具体分值如下:课程名称机器学习应用技术考核性质II类考核方法项目名称分值得分过程考核理论知识和专门技能日常考勤+课堂表现5学习情景1-初识机器学习4学习情景2-鸢尾花分类7学习情景3-垃圾文本预测7学习情景4-红酒分类7学习情景5-糖尿病诊断4学习情景7-房屋售价预测4学习情景8-模型的保存与使用2期末考评知识能力考核1、理解问题背景;2、能够根据需要理解数据的各种特性,绘制各个图表;3、掌握常见的分类算法和回归算法的使用;4、掌握算法比较、评估的步骤;5、掌握数据分离的方法;6、掌握交叉验证方法。7、掌握模型的创建与训练方法;60职业素养考核要求根据问题搭建机器学习项目,完成模型的创建、训练、实施预测等任务。合计100六、教学建议1.教材资源(1)魏贞原.机器学习Python实践[M].北京:电子工业出版社,2018.2.师资队伍教学团队由在校教师与企业导师共同组成,年龄结构与职

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论