版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器学习课程教学大纲课程代码:课程名称:机器学习/MachineLearning开课学期:4学分/学时:3/48(理论:40,实验:8)课程类别:必修课/专业核心课适用专业/开课对象:数据科学与大数据技术/二年级本科生先修课程/后修课程:Python语言基础、最优化方法/深度学习开课单位:人工智能与信息工程学院团队负责人:郭羽含审核人:郭羽含执笔人:郭羽含审批人:云本胜一、课程简介(包含课程性质、目的和任务)(500字左右)本课程作为专业核心课程,采用“基础—工具—算法—应用”四阶递进式教学设计,系统覆盖从Python编程基础、数据结构、函数模块、科学计算库(NumPy/Pandas/Matplotlib),到机器学习全流程(回归、分类、聚类、降维、集成、神经网络、评估、综合案例)的完整知识体系。课程强调“零基础可学、全流程贯通、真场景落地”:前4章夯实编程与数据处理能力,使学生具备独立完成数据加载、清洗、可视化与特征工程的能力;第5章起系统讲授机器学习核心算法原理、Scikit-learn/TensorFlow工程实现及调优方法;最终通过医学图像分割综合项目,训练学生端到端解决复杂数据问题的能力。课程融入数据伦理、国产技术应用、开源协作等思政元素,重点支持以下毕业要求指标点:2.3能够通过文献检索、资料查询等基本方法以及网络等现代信息技术获得可用的知识、技术或方法,辅助进行问题的识别、分析与表达。3.1能够设计工程问题的解决方案,包括满足特定需求的数据采集、存储、分析、挖掘、计算方法、系统设计、实现、测试与验证等。4.2能够基于工作原理,进行复杂工程问题的研究,就综合性的功能或问题设计相关的实验方案,对结果进行分析,并通过信息综合得到合理有效的结论。5.1能够针对工程问题,为构建复杂工程问题的预测与模拟环境选择和使用合适的现代工程工具和信息技术工具。5.2能够针对工程问题,选择和使用合适的现代工程工具和信息技术工具。5.3能够对相应的现代工程工具和信息技术工具进行评价并理解其局限性。7.2能够理解并践行相关工程伦理、职业道德、法律和规范,能够在工程实践中承担质量、安全、服务等方面的社会责任。8.2具备良好的团队意识、团队合作与沟通、团队协调或组织能力,能够在多学科背景下的项目组织中根据需要承担成员或负责人的角色。9.1具备沟通交流的基本技巧与能力,良好的口头与书面表达能力,有效表达自己思想与意愿的能力,倾听与理解他人需求和意愿的能力,适应工作与人际环境变化的能力。9.2能够依照相关的工程标准或行业规范,进行相关技术文档的撰写与交流表达。1.课程教学目标课程目标1:掌握Python编程基础、核心数据结构、函数模块化设计及NumPy/Pandas/Matplotlib数据科学工具链的使用方法。课程目标2:掌握机器学习基础理论及主流算法(回归、分类、聚类、降维、集成、神经网络)的核心原理与工程实现。课程目标3:能够独立完成从数据预处理到模型训练、评估、调优、部署的完整机器学习流程,并应用于真实场景。课程目标4:强化数据隐私、算法公平性与技术伦理意识,理解国产AI生态现状,践行“技术向善、科技报国”理念。2.课程目标与毕业要求的关系本课程的学习目标与毕业要求关系矩阵如下表1所示,课程目标能有效支持相应毕业要求指标点的达成。表1课程目标与毕业要求关联矩阵序号毕业要求指标点课程目标12.3课程目标1、223.1课程目标1、234.2课程目标245.1课程目标255.2课程目标165.3课程目标177.2课程目标488.2课程目标399.1课程目标3109.2课程目标3教学内容与基本要求(一)Python语言基础(2学时)教学内容:介绍Python语言的基本特点与发展背景;讲解Python开发环境(如Anaconda、PyCharm、JupyterNotebook)的搭建与配置;系统讲授程序基本编写方法,包括标识符与变量命名规则、基本数据类型(整型、浮点型、字符串、布尔型)、运算符与表达式;详细解析程序三大结构——顺序结构、分支结构(if/elif/else)、循环结构(for/while);通过简单案例(如成绩判定、九九乘法表)进行编程实践。教学重点与难点:变量作用域与数据类型转换;分支与循环嵌套逻辑的构建;开发环境配置常见问题的排查。教学方法:理论讲授、代码演示、课堂即时编程练习。学习要求:能够独立搭建Python开发环境,熟练编写包含顺序、分支、循环结构的完整程序,并理解基本语法规范。(二)基础数据结构(2学时)教学内容:系统讲解Python核心内置数据结构——列表(list)、元组(tuple)、字典(dict)的基本操作与常用函数;重点介绍列表的增删改查、切片选取、排序与遍历;对比元组与列表的异同及相互转换;深入讲解字典的键值对操作、嵌套结构(如字典中包含列表、列表中包含字典)及遍历方式;通过案例(如学生成绩管理、商品信息存储)强化数据组织能力。教学重点与难点:列表与字典的嵌套结构处理;可变与不可变对象的理解;高效数据选取与更新策略。教学方法:案例驱动、交互式编程、小组讨论。学习要求:能够灵活选用合适的数据结构组织复杂数据,熟练完成数据的创建、查询、修改与嵌套操作。(三)函数与模块(2学时)教学内容:讲授函数的定义、调用、参数传递(位置参数、关键字参数、默认参数、可变参数)与返回值机制;介绍两类特殊函数——匿名函数(lambda)与递归函数(如阶乘、斐波那契);讲解常用内置函数(如map、filter、reduce、zip)及字符串处理函数;系统介绍Python模块与包的概念,演示标准库(如os、math、random、datetime)的导入与使用方法。教学重点与难点:参数传递机制(引用vs值);递归函数的终止条件设计;模块化编程思想的建立。教学方法:讲授+编程实践+代码重构练习。学习要求:能够编写结构清晰、功能复用的函数,熟练导入并使用常用标准库,具备初步的模块化程序设计能力。(四)数据科学库(6学时)教学内容:系统讲授数据科学三大核心库:NumPy:数组创建、索引、切片、广播机制、数学运算(如统计、线性代数);Matplotlib:基本绘图流程、图表属性设置(标题、标签、图例)、绘制折线图、散点图、柱状图、直方图等常用图表及子图布局;Pandas:核心数据结构(Series与DataFrame)、数据读取(CSV/Excel)、缺失值处理、数据筛选、分组聚合、数据合并等常用操作。通过案例(如销售数据分析、人口统计可视化)进行综合演练。教学重点与难点:Pandas的索引与多级索引操作;NumPy向量化运算效率优势;Matplotlib图表的精细控制。教学方法:演示教学、实验操作、数据探索任务。学习要求:能够使用NumPy、Pandas完成结构化数据的加载、清洗与变换,并利用Matplotlib生成清晰、专业的可视化图表。(五)机器学习概述(2学时)教学内容:阐述机器学习的定义、发展历程及在图像识别、推荐系统、自然语言处理等领域的应用;介绍基本术语(特征、标签、训练集、测试集、过拟合等);梳理监督学习、无监督学习的基本类型;讲解机器学习一般流程(数据获取→预处理→模型训练→评估→部署);演示Scikit-learn库的安装、内置数据集加载、模型训练、预测、评估及模型保存与加载方法。教学重点与难点:区分训练集与测试集的作用;理解模型泛化能力的基本概念;Scikit-learn编程范式(fit/predict/score)。教学方法:理论讲授、案例演示。学习要求:掌握机器学习的基本框架与术语,能使用Scikit-learn完成第一个端到端的机器学习任务。(六)回归分析(4学时)教学内容:讲解回归分析基本原理;深入解析多元线性回归的最小二乘法求解;系统介绍正则化回归方法——岭回归(L2正则)、Lasso回归(L1正则)、ElasticNet(L1+L2混合)的数学原理与几何解释;通过Scikit-learn实现各类回归模型,分析超参数(如alpha、l1_ratio)对模型复杂度与性能的影响。教学重点与难点:正则化对模型泛化能力的提升机制;L1与L2正则的稀疏性差异;多重共线性问题的缓解。教学方法:理论推导+编程实践+参数影响可视化。学习要求:掌握各类线性回归模型的适用场景,能独立完成回归任务的建模、调参与结果解释。(七)分类算法(10学时)教学内容:系统讲解主流分类算法:k近邻算法:距离度量(欧氏、曼哈顿)、k值选择、实现及参数(weights、algorithm);逻辑回归:Sigmoid函数、极大似然估计、决策边界;朴素贝叶斯:贝叶斯定理、条件独立假设、高斯/多项式模型;决策树与CART:信息增益、基尼系数、预剪枝与后剪枝;支持向量机:最大间隔分类、软间隔、核函数(线性、RBF)原理与参数(C、gamma)。所有算法均结合Scikit-learn进行实现与对比。教学重点与难点:SVM核技巧的理解;决策树可解释性与过拟合控制;朴素贝叶斯假设的合理性分析。教学方法:理论讲解、可视化演示、分类任务实战。学习要求:理解各类分类算法的核心思想,能根据数据特性选择合适模型并完成性能评估。(八)聚类算法(4学时)教学内容:介绍聚类的基本思想与无监督学习特点;详细讲解k均值算法的迭代过程与初始中心选择问题;解析DBSCAN的密度连通性概念与参数(eps、min_samples)影响;介绍Agglomerative层次聚类的凝聚过程与距离度量(ward、complete);通过Scikit-learn实现聚类并使用轮廓系数等指标评估效果。教学重点与难点:DBSCAN对噪声点的处理;k均值对初始值敏感;聚类结果的业务解释。教学方法:案例教学、可视化聚类过程、实验操作。学习要求:能对无标签数据进行有效聚类,并评估聚类质量,理解不同算法的适用场景。(九)数据降维(2学时)教学内容:讲解降维的必要性与应用场景;深入剖析主成分分析(PCA)的方差最大化思想与实现;介绍线性判别分析(LDA)的有监督降维原理;简要介绍稀疏编码的基本思想;通过Scikit-learn实现PCA与LDA,并结合可视化展示降维效果。教学重点与难点:PCA主成分的物理意义;LDA与PCA的本质区别;降维后信息损失的权衡。教学方法:理论推导、降维可视化、案例分析。学习要求:掌握PCA与LDA的使用方法,能将降维技术应用于高维数据预处理。(十)集成学习(4学时)教学内容:介绍集成学习的基本理论(偏差-方差分解);详细讲解随机森林的Bagging思想与特征随机选择机制;解析投票法(硬投票/软投票)的集成策略;系统介绍提升法(Boosting)思想,涵盖AdaBoost与GBDT的迭代加权机制;通过Scikit-learn与XGBoost实现集成模型并进行参数调优。教学重点与难点:随机森林中n_estimators与max_features的影响;提升法的残差拟合机制;防止过拟合的策略。教学方法:理论讲授、模型对比实验、调参实践。学习要求:掌握主流集成方法的原理与实现,能构建高性能集成模型并解释其优势。(十一)神经网络(4学时)教学内容:从神经元模型出发,讲解感知机与单层感知机的局限性;系统介绍前馈神经网络(多层感知机)的结构、激活函数(Sigmoid、ReLU、Tanh)、前向传播与反向传播算法;简要介绍深度神经网络典型结构——卷积神经网络(CNN)、循环神经网络(RNN)、自编码器(AE)的基本思想与应用场景;通过TensorFlow或PyTorch实现简单MLP模型并训练。教学重点与难点:反向传播的链式求导;激活函数的选择对梯度的影响;学习率与网络深度的调优。教学方法:理论推导、框架演示、简单图像/表格数据训练。学习要求:理解神经网络基本工作原理,能使用主流深度学习框架搭建并训练简单网络。(十二)算法评估与验证(2学时)教学内容:讲解数据集划分方法(留出法、K折交叉验证、分层抽样);介绍分类(准确率、精确率、召回率、F1、AUC)、回归(MSE、MAE、R²)、聚类(轮廓系数、Calinski-Harabasz)等评估指标;系统讲解超参数调优技术——网格搜索(GridSearchCV)与随机搜索;介绍距离度量方法(欧氏、余弦、曼哈顿)在不同算法中的作用。教学重点与难点:评估指标的业务意义选择;交叉验证避免数据泄露;调优效率与效果的平衡。教学方法:案例研讨、自动化调参实践。学习要求:能设计科学的评估方案,独立完成模型性能分析与超参数优化。(十三)综合案例——医学图像分割(2学时)教学内容:以医学图像(如肺部CT切片)为对象,开展端到端项目实践:进行数据探索与可视化;完成图像预处理(归一化、尺寸调整、标注格式转换);选取并训练多种模型(如U-Net、SVM、聚类)进行分割;对比不同算法的分割精度、速度与鲁棒性;生成可视化结果并撰写技术报告。教学重点与难点:多模态数据预处理流程;模型选择与融合策略;技术文档的规范化撰写。教学方法:项目式学习、小组协作、成果汇报。学习要求:能够综合运用课程所学知识完成真实场景下的复杂机器学习任务,具备系统性解决问题的能力。三、课程思政目标、融入点、实施路径与预期成效本课程以“技术向善、责任担当、创新报国”为思政教育核心,将社会主义核心价值观与数据科学职业伦理深度融合,通过真实场景实践强化学生的家国情怀与科技使命感,培养兼具技术能力与社会责任感的新工科人才。表2课程思政目标、融入点及实施路径序号育德目标课程思政教育的融入点教育方法与实施途径教学成效1强化数据伦理与社会责任数据隐私保护与模型公平性验证案例教学:通过数据集分析,研讨隐私脱敏技术对模型精度的影响;实践教学:在实验报告中增设“伦理风险评估”章节,使用GDPR合规性检查工具学生提交的实验报告需包含数据使用合规性分析,通过伦理风险评估2培育技术创新与自主意识国产机器学习框架应用实践启发研讨:对比国内外框架在分类任务中的性能差异;信息化载体:国产框架部署案例,阅读《中国人工智能白皮书》技术选型需包含国产框架适配性分析,支持组选择国产工具链3塑造团队协作与工匠精神开源协作与代码质量管理实践教学:分组使用GitLab进行代码版本控制,实施代码质量检测;案例研讨:分析Apache开源社区协作规范代码仓库需通过质量检测,通过评分表量化成员协作效能4厚植科技报国与家国情怀国产技术突破案例案例教学:解析国产数据清洗与预测技术;实践任务:使用国产数据库完成项目数据存储研读至少1篇国产技术领域论文5践行职业规范与学术诚信技术报告引用规范与代码抄袭检测案例研讨:分析报告的引用规范;信息化工具:使用代码查重系统检测实验代码原创性实验代码查重率需低于15%,引用标注完整度达100%四、课外教学环节教学安排学生需在课外通过自主文献研读深化对机器学习经典算法数学原理的理解,结合主流数据科学平台完成代码实践任务,重点强化模型调优与性能分析能力;参与技术社区讨论以跟踪领域前沿动态,针对开放性问题设计数据分析方案并撰写可行性报告,所有代码需符合工程规范并附带技术文档注释,技术报告须体现业务价值提炼与创新思维,最终通过项目制学习形成从理论到实践的系统化能力迁移。重点支持课程目标2、3。五、考核内容、方式与课程目标的关联本课程的考核内容、考核方式与支撑课程目标的关系矩阵详见表4所示。表4课程目标与考核内容、考核方式的关联矩阵课程目标考核内容考核方式成绩比例及权重分布课程目标权重考核评估材料平时成绩(20%)实践成绩(20%)期末成绩(60%)1基础机器学习算法的原理阐述,使用工具完成算法的工程实现平时成绩、实践、期末考试20%20%10%0.16作业、过程记录、试卷等2基于理论知识进行算法选型,完成算法的逻辑推导、超参数调优及性能分析平时成绩、实践、期末考试40%30%40%0.37作业、过程记录、试卷等3复杂机器学习系统的构建流程与方法,结合真实场景案例,完成机器学习系统的设计与应用平时成绩、实践、期末考试30%40%40%0.37作业、过程记录、试卷等4掌握算法公平性相关理论知识,在实践中体现技术伦理意识平时成绩、实践10%10%10%0.1作业、过程记录等合计100%100%100%1计分制:百分制(√);五级分制();两级分制()考核方式:考试(√);考查()平时成绩占20%,主要包括:作业、考勤等,各占10%。评价标准(量规表5-1):实践/实验成绩占20%,主要考查课堂实践完成情况,采用实践成果完成度检查、过程记录等形式。评价标准(量规表5-2);期末考试成绩占60%,考试课采用闭卷形式。题型选择题、简答题、分析题、编程题等。表5-1平时成绩评分标准(量规表)课程目标考核内容与评价标准优秀良好中等及格不及格1全勤且课堂纪律无违规,积极参与互动缺勤1次或轻微违规,积极参与互动缺勤2次或轻微违规,但整体专注缺勤2次或多次违规,课上不专注缺勤3次及以上或严重违纪2作业或课外学习成果按时提交且逻辑清晰无错误延迟1天提交但内容完整,存在少量错误延迟2天提交但内容基本完整,存在部分错误延迟3天或内容不完整,存在明显错误未提交或内容存在大量明显错误表5-2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物标志物AI辅助发现的监管框架
- 生物打印技术在肝脏移植中的替代方案探索
- 银行金融行业岗位技能测评题库与答案解析
- 生存质量评估工具
- 生物制药研发员面试专业知识测试
- 证券从业资格考试科目重点突破与模拟测试含答案
- 建筑预算员工作手册及考核题目
- 年产xxx塑料水表项目可行性分析报告
- 预约员岗位面试题库含答案
- 程序员求职宝典常见面试题库与答题策略
- 电力工程技术档案管理制度
- 2025国考银行结构化面试题库及答案解析
- MCN机构与抖音达人签约协议范本7篇
- 光学镜片制作工基础考核试卷及答案
- 胶带生产线投资可行性研究报告
- 新劳动课程标准下的小学劳动教育课的探究
- 昆明巨大变化的概述
- DB37 T 4337-2021 岩溶区桩基施工技术规程
- 金螳螂家装工程管理制度
- 2025至2030冷链产业园区定位规划及招商策略咨询报告
- 牙本质龋个案护理
评论
0/150
提交评论