版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
XXX大学XXX专业课程教学大纲Python大数据分析与挖掘实战一、课程基本信息课程编号课程名称Python大数据分析与挖掘实战/BigDataAnalysisandMiningusingPython课程基本情况课程类型专业方向课程学分/学时5/80(其中:讲课学时:40实践学时:40)开课时间第3学期先修课程Python程序设计、高等数学、线性代数、机器学习适用专业XXX考核方式考查使用教材黄恒秋.Python大数据分析与挖掘实战(微课版)(第2版)[M].北京:人民邮电出版社.2025.06课程负责人开课学院二、课程简介大数据时代,数据成为决策最为重要的参考之一,大数据分析行业迈入了一个全新的阶段。通过学习本课程,使得学生掌握Python科学计算、数据处理、数据可视化、挖掘建模等基本技能,进一步地扩展应用到较为复杂大数据处理及挖掘分析任务上,最后是大模型的基本概念和应用场景案例。本课程从机器学习模型、集成学习模型,到深度学习模型,再到大模型,详细介绍了AI+大数据分析与挖掘应用的全流程知识、技能及实操案例,顺应时代的需求及前沿发展。三、课程目标(一)课程目标设置课程目标1:掌握Python科学计算、数据处理、特征选择、数据可视化、挖掘建模、大模型基础等基本知识,培养学生具有较好的数据敏感度、数据建模意识、规范的数据分析流程和AI+大数据应用等前沿内容。课程目标2:掌握大数据处理、挖掘分析、大模型应用等基本技能,以及典型大数据应用场景的建模分析流程和实现,学会AI大模型赋能大数据分析及应用,培养学生具备一定的行业应用背景及应用技能。课程目标3:具有大数据服务民生、治理、商务应用等理念,具备较好的数据完全、数据分析、科学公平决策意识,恪守职业规范与风险意识。(二)课程目标与毕业要求指标点的对应关系课程目标毕业要求毕业要求指标点支撑程度课程目标13毕业要求3:具有从事专业相关的项目工作所需的数学等基础知识;具有扎实的人工智能、大数据技术领域的基本理论和基本知识,熟练掌握大数据挖掘技术与应用、大数据分析技术、AI大数据应用项目开发、大模型技术、人工智能、可视化开发等专业知识。H课程目标24毕业要求4:具有基本的项目实施与管理知识,掌握大数据与人工智能的基本思维方法和研究方法,了解大数据技术和AI应用前景、以及相关行业最新进展与发展动态,具备从事大数据与AI应用系统设计及实现能力等方面知识的综合应用能力,以及相关的科研、设计、调试、维护运行和管理的能力,整合不同数据源,不同结构类型数据的能力和探索数据背后价值的能力、AI赋能各行各业的能力,不同结构类型数据的能力和探索数据背后价值的能力H课程目标32毕业要求2:具备较好的人文素养与情怀,具有人文社科、信息交流、法律与环境、社会与公共安全等知识,其中人文社科包括文学、外语、哲学、政治学、社会学、管理学、经济学、心理学等方面的常识或基本知识。M5毕业要求5:充分理解团队合作的重要性,具有一定的表达能力、独立工作能力、人际交往能力和团队合作能力以及一定的组织管理能力。M注:课程目标对毕业要求指标点的支撑强度分别用“H”(高)、“M”(中)、“L”(弱)表示。四、课程教学内容(一)课程教学内容与学时安排课程内容教学方法学时安排理论讲授实践教学第1章Python基础讲授法、实验教学法22第2章科学计算包Numpy讲授法、实验教学法22第3章数据处理包Pandas讲授法、实验教学法22第4章数据可视化包Matplotlib讲授法、实验教学法22第5章数据预处理与特征工程讲授法、实验教学法55第6章机器学习与实现讲授法、实验教学法55第7章集成学习与实现讲授法、实验教学法33第8章深度学习与实现讲授法、实验教学法44第9章基于财务与交易数据的量化投资分析讲授法、实验教学法22第10章众包任务定价优化方案讲授法、实验教学法22第11章地铁站点日客流量预测讲授法、实验教学法22第12章微博文本情感分析讲授法、实验教学法22第13章基于水色图像的水质评价讲授法、实验教学法22第14章大模型技术与应用案例讲授法、实验教学法55合计4040课程目标与教学内容的对应关系矩阵图章节课程目标1课程目标2课程目标3第1章Python基础HM第2章科学计算包NumpyHM第3章数据处理包PandasHM第4章数据可视化包MatplotlibHM第5章数据预处理与特征工程HH第6章机器学习与实现HM第7章集成学习与实现HM第8章深度学习与实现HM第9章基于财务与交易数据的量化投资分析HH第10章众包任务定价优化方案HH第11章地铁站点日客流量预测HH第12章微博文本情感分析HH第13章基于水色图像的水质评价HH第14章大模型技术与应用案例HH注:课程章节对课程目标的支撑强度分别用“H”(高)、“M”(中)、“L”(弱)表示;矩阵应覆盖所有必修环节。(三)课程教学安排第1章Python基础【教学目标】1.了解Python及Anaconda环境;2.理解Python基本数据类型与数据结构;3.掌握条件、循环、函数等核心编程概念。【教学重点】列表、字典、条件语句、循环语句、函数定义与调用。【教学难点】数据结构间的区别、函数的多返回值。【教学时数】2学时【教学方法】讲授法【教学内容】Python概述与安装、基本数据类型、公有方法、列表/元组/字符串/字典方法、条件语句、循环语句、函数。第2章科学计算包Numpy【教学目标】1.了解Numpy及数组概念;2.理解数组的创建、运算与切片;3.掌握数组操作及线性代数基础。【教学重点】数组创建、切片、运算、形态变换。【教学难点】数组切片、线性代数运算。【教学时数】2学时【教学方法】讲授法【教学内容】Numpy简介、数组创建、尺寸与运算、数组切片与连接、数据存取、形态变换、排序与搜索、矩阵与线性代数。第3章数据处理包Pandas【教学目标】1.了解Pandas及序列、数据框;2.理解数据结构的访问、切片与方法;3.掌握外部文件读取与基本数据处理。【教学重点】序列与数据框的创建、属性、方法、切片、外部文件读取。【教学难点】数据框的复杂切片与多文件读取。【教学时数】2学时【教学方法】讲授法【教学内容】Pandas简介、序列、数据框、外部文件读取(Excel,TXT,CSV)。第4章数据可视化包Matplotlib【教学目标】1.了解Matplotlib绘图基础;2.理解绘图流程与图形组成;3.掌握常见图形绘制与美化。【教学重点】散点图、线性图、柱状图、直方图、饼图、箱线图、子图的绘制。【教学难点】绘图流程原理、子图布局、中文字符显示。【教学时数】2学时【教学方法】讲授法【教学内容】Matplotlib绘图基础、图像构成、基本流程、中文字符显示、坐标轴刻度、常用图形绘制。第5章数据预处理与特征工程【教学目标】1.了解数据预处理的完整流程;2.理解各预处理步骤的原理;3.掌握使用Python进行实际数据清洗与特征构建。【教学重点】数据合并与关联、缺失值处理、数据规范化、特征组合与选择。【教学难点】多变量插值、主成分分析(PCA)用于特征组合。【教学时数】5学时【教学方法】讲授法【教学内容】重复数据处理、数据合并与关联、时间处理、映射与离散化、滚动与分组计算、样本均衡、缺失值处理、数据规范化、特征组合与选择。第6章机器学习与实现【教学目标】1.了解常用机器学习模型;2.理解模型基本原理与适用场景;3.掌握使用Scikit-learn进行模型构建与评估。【教学重点】线性回归、逻辑回归、神经网络、支持向量机、K-均值聚类、关联规则的原理与实现。【教学难点】神经网络、支持向量机原理、关联规则挖掘。【教学时数】5学时【教学方法】讲授法【教学内容】线性回归、逻辑回归、神经网络、支持向量机、K-均值聚类、关联规则。第7章集成学习与实现【教学目标】1.了解集成学习概念与类型;2.理解Bagging与Boosting原理;3.掌握随机森林、XGBoost等算法的应用。【教学重点】随机森林、AdaBoost、GBDT、XGBoost算法的原理与实现。【教学难点】Boosting系列算法原理与差异。【教学时数】3学时【教学方法】讲授法【教学内容】集成学习概念、Bagging算法、随机森林、Boosting算法、AdaBoost、GBDT、XGBoost。第8章深度学习与实现【教学目标】1.了解深度学习框架;2.理解多层神经网络、CNN、RNN原理;3.掌握使用TensorFlow搭建基础深度学习模型。【教学重点】TensorFlow基础、多层神经网络、卷积神经网络(CNN)、循环神经网络(RNN)。【教学难点】CNN卷积层与池化层计算、RNN的LSTM结构。【教学时数】4学时【教学方法】讲授法【教学内容】深度学习与框架简介、TensorFlow基础、多层神经网络、CNN、RNN。第9章基于财务与交易数据的量化投资分析【教学目标】1.了解量化投资分析流程;2.理解综合评价与技术指标;3.掌握从数据到策略的完整实现。【教学重点】指标选择与预处理、主成分分析用于综合评价、量化投资策略实现。【教学难点】业务数据理解、主成分分析模型应用、策略设计。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、基于规模与效率的综合评价、技术分析指标计算、量化投资模型与策略。第10章众包任务定价优化方案【教学目标】1.了解地理信息数据可视化;2.理解定价指标设计与模型构建;3.掌握回归模型在定价问题中的应用。【教学重点】Folium地图可视化、指标设计、多元线性回归与神经网络模型。【教学难点】地理信息数据处理、定价模型构建与评价。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、数据获取与地图可视化、指标计算、任务定价模型构建、方案评价。第11章地铁站点日客流量预测【教学目标】1.了解时间序列预测背景;2.理解客流特征提取与因素分析;3.掌握神经网络预测模型的应用。【教学重点】客流指标计算、因素分析(三次指数平滑)、神经网络预测模型。【教学难点】时间序列特征工程、因素分析模型选择。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、数据获取与指标计算、数据可视化、因素分析、神经网络预测模型。第12章微博文本情感分析【教学目标】1.了解文本分析基本流程;2.理解中文文本预处理与词向量;3.掌握多种分类模型在文本中的应用。【教学重点】中文分词、去停用词、词向量、多种分类模型(朴素贝叶斯、随机森林、LSTM)比较。【教学难点】文本向量化、LSTM网络用于文本分类。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、数据预处理(分词、去停用词、词向量)、多种分类模型实现。第13章基于水色图像的水质评价【教学目标】1.了解图像识别基本流程;2.理解传统特征方法与深度学习方法差异;3.掌握SVM与CNN在图像分类中的应用。【教学重点】颜色特征计算、SVM模型、CNN模型(灰图与彩图)。【教学难点】图像数据处理、CNN模型结构理解与实现。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、数据获取与探索、SVM分类模型、CNN分类模型。第14章大模型技术与应用案例【教学目标】1.了解大模型(BERT)基本概念;2.理解BERT的输入输出与微调任务;3.掌握BERT在文本分类与问答中的实战应用。【教学重点】BERT基本原理、特征提取、下游任务微调(分类、问答)。【教学难点】BERT输入参数构造、微调流程。【教学时数】5学时【教学方法】讲授法、案例教学法【教学内容】大模型基本认识、BERT模型基础、应用案例1(情感分类)、应用案例2(中文阅读理解)。实验/实践教学部分头歌实践教学平台智慧课程《Python大数据分析与挖掘实战(第2版)》配套的第1~13章的实验内容。如果无法使用该平台,则可以在人邮教育社区下载本教材配套的教辅资源《66574-本地化智能实验题库资源》,该资源与平台上的资源内容是一致的,即包含了实验的用户程序、测评程序和实验数据相关内容。也可以线上线下同步使用,即线下详细探索实验内容及实验数据详情,线上提交实验代码,使用效果更佳。第1-13章实验教学学时建议35学时,可提前布置学生开展实验,根据实验完成情况,在课堂上有针对性进行实验教学讲解。第14章实验作业为本章练习1和2,可先布置作业,然后课堂上进行点评,建议5个学时。章节实验名称及知识点列表如下。章节实验闯关题目对应的知识点(实验关卡名称)第一章Python基础(头歌平台)基本数据类型基本数据结构基本数据结构访问列表append和extend方法字符串连接字符串拆分和子串查找条件语句if循环语句while循环语句for和字典setdefault方法函数定义及应用第二章科学计算包Numpy(头歌平台)赋值定义较复杂数据结构内嵌函数定义较复杂数据结构数组运算数组切片数组连接第三章数据处理包Pandas(头歌平台)序列和数据框外部数据文件读取逻辑索引、切片方法,groupby分组计算函数应用数据框关联操作数据框合并操作序列移动计算方法应用数据框切片(iloc、loc)方法数据框排序数据框综合应用案例序列及简单随机抽样序列及较复杂抽样第四章数据可视化包Matplotlib(头歌平台)散点图绘制线性图绘制柱状图绘制直方图绘制饼图绘制箱线图绘制子图绘制第五章数据预处理与特征工程(头歌平台)数据关联与分组计算数据映射、离散化、去重、样本均衡与特征选择第六章机器学习与实现(头歌平台)缺失值填充数据标准化支持向量机分类模型及其应用逻辑回归模型及其应用神经网络分类模型及其应用线性回归模型及其应用神经网络回归模型及其应用支持向量机回归模型及其应用基于主成分分析的综合评价K均值聚类算法及其应用布尔数据集构建基于布尔数据集的一对一和多对一关联规则挖掘第七章集成学习与实现(头歌平台)随机森林模型评估梯度提升树模型评估第八章深度学习与实现(头歌平台)多层神经网络模型基本使用方法卷积神经基本使用方法循环神经网络模型基本使用方法第九章基于财务与交易数据的量化投资分析(头歌平台)移动平均线指标的计算指数平滑异同平均线指标的计算随机指标K、D、J的计算计算相对强弱RSI指标乖离率指标BIAS的计算能量潮指标OBV的计算涨跌趋势指标的定义及计算基于技术指标的股票价格涨跌趋势预测模型构建(支持向量机模型)第十章众包任务定价优化方案(头歌平台)基于经纬度地理坐标数据的指标计算Z1-Z5基于经纬度地理坐标数据的指标计算Z6-Z12任务定价模型的构建任务定价模型的应用任务定价调整方案评价第十一章地铁站点日客流量预测(头歌平台)大数据文件分块读取技术、二分法查找地铁进站人数和出站人数统计计算天气、周末、节假日数据指标设计及计算因变量和自变量数据的融合计算第十二章微博文本情感分析(头歌平台)文本数据预处理—-分词文本数据预处理—-去停用词及数值文本数据分类模型的构建—-支持向量机模型第十三章基于水色图像的水质评价(头歌平台)手写体图像数据集初识基于全像素特征的手写体图像识别模型基于全像素特征的人脸识别模型基于像素主成分的人脸识别模型基于纸币彩色图像的面额识别模型第十四章大模型技术及应用案例(课后练习)BERT分类模型基于文心大语言模型的Web聊天机器人(streamlitWeb框架及百度飞浆星河社区)五、课程教学评价及依据项目考核内容考核方式课程目标1Python基础、科学计算、数据处理与特征工程、数据可视化、机器学习、集成学习、深度学习和大模型基础知识及技能课堂讨论与讲解实验考核课程设计考核2.期末考试课程目标2金融投资、地理信息、新闻舆情分析、地铁客流预测、图像识别、大模型应用等典型应用场景案例以及web可视化开发1.课堂讨论与讲解2.实验考核3.课程设计考核课程目标3课程设计论文及作品说明课程设计考核六、考核方式与评价标准(一)考核方式1.考核方式:平时考核+课程设计考核。平时考核包括课堂讨论与讲解、实验考核、研究报告。课程设计考核采用课题研究、作品开发、综合案例分析等方式进行。2.总成绩评定:总成绩=平时考核成绩*30%+课程设计考核*70%平时考核成绩占30%课程设计考核占70%课程分目标达成评价方法考核方式课堂讨论与讲解、实验考核(满分100分)课题研究、作品开发、综合案例分析(满分100分)课程目标120分20分分目标达成度=30%*(平时成绩分目标平均成绩/分目标总分)+70%*(分目标试题平均分/分目标试题总分)课程目标280分50分课程目标30分30分3.平时成绩评定:课堂讨论与讲解(20分):日常课堂讨论及案例讲解次数及效果。实验(80分):通过实验完成质量进行评价。(二)评价标准1.课程目标评价标准评价分数90-10080-8970-7960-690-59课程目标1、2、31.熟练掌握Python科学计算、数据处理、特征选择、数据可视化、挖掘建模、大模型基础等基本知识,具有较好的数据敏感度、数据建模意识、规范的数据分析流程,熟练掌握AI+大数据应用等前沿内容2.熟练掌握大数据处理、挖掘分析、大模型应用等基本技能,以及典型大数据应用场景的建模分析流程和实现,熟练掌握AI大模型赋能大数据分析及应用,具备较好的行业应用背景及应用技能3.具有大数据服务民生、治理、商务应用等理念,具备较好的数据完全、数据分析、科学公平决策意识,恪守职业规范与风险意识1.较好掌握Python科学计算、数据处理、特征选择、数据可视化、挖掘建模、大模型基础等基本知识,具有较好的数据敏感度、数据建模意识、规范的数据分析流程,较好掌握AI+大数据应用等前沿内容2.较好掌握大数据处理、挖掘分析、大模型应用等基本技能,以及典型大数据应用场景的建模分析流程和实现,较好掌握AI大模型赋能大数据分析及应用,具备较好的行业应用背景及应用技能3.具有大数据服务民生、治理、商务应用等理念,具备较好的数据完全、数据分析、科学公平决策意识,恪守职业规范与风险意识1.基本掌握Python科学计算、数据处理、特征选择、数据可视化、挖掘建模、大模型基础等基本知识,具有基本的数据敏感度、数据建模意识、规范的数据分析流程,基本掌握AI+大数据应用等前沿内容2.基本掌握大数据处理、挖掘分析、大模型应用等基本技能,以及典型大数据应用场景的建模分析流程和实现,基本掌握AI大模型赋能大数据分析及应用,具备基本的行业应用背景及应用技能3.具有大数据服务民生、治理、商务应用等理念,具备基本的数据完全、数据分析、科学公平决策意识,恪守职业规范与风险意识1基本掌握Python科学计算、数据处理、特征选择、数据可视化、挖掘建模、大模型基础等基本知识,具有一定的数据敏感度、数据建模意识、规范的数据分析流程,了解AI+大数据应用等前沿内容基本掌握大数据处理、挖掘分析、大模型应用等基本技能,以及典型大数据应用场景的建模分析流程和实现,基本掌握AI大模型赋能大数据分析及应用,具备一定的行业应用背景及应用技能3.具有大数据服务民生、治理、商务应用等理念,具备一定的数据完全、数据分析、科学公平决策意识,恪守职业规范与风险意识1.Python科学计算、数据处理、特征选择、数据可视化、挖掘建模、大模型基础等基本知识掌握较差,数据敏感度、数据建模意识、规范的数据分析流程没有什么概念,2.大数据处理、挖掘分析、大模型应用等基本技能,以及典型大数据应用场景的建模分析流程和实现掌握较差,AI大模型赋能大数据分析及应用无法掌握3.大数据服务民生、治理、商务应用等理念薄弱,数据完全、数据分析、科学公平决策意识淡薄,恪守职业规范与风险意识不足2.课堂讨论与讲解评价标准评价分数90-10080-8970-7960-690-59课堂讨论与讲解情况能积极参与课上的问题讨论,对案例面向全班同学讲解,且效果好。能积极参与课上的问题讨论,对案例面向全班同学讲解,且效果良好。能参与课上的问题讨论,对案例面向全班同学讲解,内容完整。能参与课上的问题讨论,对案例面向全班同学讲解,内容或表达欠佳课堂讨论参与度低,也不对案例面向全班同学讲解3.实验评价标准评价分数90-10080-8970-7960-690-59实验完成情况能在规定时间内完成实验,且结果正确,并善于与同学们分享、帮助同学能在规定时间内完成实验,且结果正确。能在规定时间内完成实验,但结果不完全正确基本能在规定时间内完成实验,结果不够完整。无法在规定时间内完成实验,且结果不正确、不完整。4.课程设计作品评价标准评价分数90-10080-8970-7960-690-59课程设计论文及作品说明书能按要求完成,文档格式规范,内容全面、层次清晰、可读性强,能体现课程目标要求的内容。能按要求完成,文档格式基本规范,内容基本全面、层次清晰、可读性较强,能体现课程目标要求的内容。能按要求完成,文档格式基本规范,内容基本全面、层次基本清晰、可读性较好,能体现课程目标要求的内容。能按要求完成,文档格式基本规范,内容基本全面、层次基本清晰、具有一定可读性,能基本体现课程目标要求的内容。不能按要求完成,格式规范性和内容全面性方面较差。七、课程资源(一)建议教材黄恒秋.Python大数据分析与挖掘实战(微课版,第2版)[M].北京:人民邮电出版社.2025.06(二)主要参考书及课程资源1.张良均.Python数据分析与挖掘实战[M].北京:机械工业出版社.2016.2.王宇韬.Python金融大数据挖掘与分析全流程详解[M].北京:机械工业出版社.2019.3./paths/7kzwfgca(头歌实践教学平台本课程在线实验资源:Python大数据分析与挖掘实战(第2版))。编制人:审核人:审定人:年月日Python大数据分析与挖掘实战课程教案一、课程教学安排总览课程内容教学方法学时安排理论讲授实践教学第1章Python基础讲授法、实验教学法22第2章科学计算包Numpy讲授法、实验教学法22第3章数据处理包Pandas讲授法、实验教学法22第4章数据可视化包Matplotlib讲授法、实验教学法22第5章数据预处理与特征工程讲授法、实验教学法55第6章机器学习与实现讲授法、实验教学法55第7章集成学习与实现讲授法、实验教学法33第8章深度学习与实现讲授法、实验教学法44第9章基于财务与交易数据的量化投资分析讲授法、实验教学法22第10章众包任务定价优化方案讲授法、实验教学法22第11章地铁站点日客流量预测讲授法、实验教学法22第12章微博文本情感分析讲授法、实验教学法22第13章基于水色图像的水质评价讲授法、实验教学法22第14章大模型技术与应用案例讲授法、实验教学法55合计4040二、课程教学内容第1章Python基础【教学目标】1.了解Python及Anaconda环境;2.理解Python基本数据类型与数据结构;3.掌握条件、循环、函数等核心编程概念。【教学重点】列表、字典、条件语句、循环语句、函数定义与调用。【教学难点】数据结构间的区别、函数的多返回值。【教学时数】2学时【教学方法】讲授法【教学内容】Python概述与安装、基本数据类型、公有方法、列表/元组/字符串/字典方法、条件语句、循环语句、函数。第2章科学计算包Numpy【教学目标】1.了解Numpy及数组概念;2.理解数组的创建、运算与切片;3.掌握数组操作及线性代数基础。【教学重点】数组创建、切片、运算、形态变换。【教学难点】数组切片、线性代数运算。【教学时数】2学时【教学方法】讲授法【教学内容】Numpy简介、数组创建、尺寸与运算、数组切片与连接、数据存取、形态变换、排序与搜索、矩阵与线性代数。第3章数据处理包Pandas【教学目标】1.了解Pandas及序列、数据框;2.理解数据结构的访问、切片与方法;3.掌握外部文件读取与基本数据处理。【教学重点】序列与数据框的创建、属性、方法、切片、外部文件读取。【教学难点】数据框的复杂切片与多文件读取。【教学时数】2学时【教学方法】讲授法【教学内容】Pandas简介、序列、数据框、外部文件读取(Excel,TXT,CSV)。第4章数据可视化包Matplotlib【教学目标】1.了解Matplotlib绘图基础;2.理解绘图流程与图形组成;3.掌握常见图形绘制与美化。【教学重点】散点图、线性图、柱状图、直方图、饼图、箱线图、子图的绘制。【教学难点】绘图流程原理、子图布局、中文字符显示。【教学时数】2学时【教学方法】讲授法【教学内容】Matplotlib绘图基础、图像构成、基本流程、中文字符显示、坐标轴刻度、常用图形绘制。第5章数据预处理与特征工程【教学目标】1.了解数据预处理的完整流程;2.理解各预处理步骤的原理;3.掌握使用Python进行实际数据清洗与特征构建。【教学重点】数据合并与关联、缺失值处理、数据规范化、特征组合与选择。【教学难点】多变量插值、主成分分析(PCA)用于特征组合。【教学时数】5学时【教学方法】讲授法【教学内容】重复数据处理、数据合并与关联、时间处理、映射与离散化、滚动与分组计算、样本均衡、缺失值处理、数据规范化、特征组合与选择。第6章机器学习与实现【教学目标】1.了解常用机器学习模型;2.理解模型基本原理与适用场景;3.掌握使用Scikit-learn进行模型构建与评估。【教学重点】线性回归、逻辑回归、神经网络、支持向量机、K-均值聚类、关联规则的原理与实现。【教学难点】神经网络、支持向量机原理、关联规则挖掘。【教学时数】5学时【教学方法】讲授法【教学内容】线性回归、逻辑回归、神经网络、支持向量机、K-均值聚类、关联规则。第7章集成学习与实现【教学目标】1.了解集成学习概念与类型;2.理解Bagging与Boosting原理;3.掌握随机森林、XGBoost等算法的应用。【教学重点】随机森林、AdaBoost、GBDT、XGBoost算法的原理与实现。【教学难点】Boosting系列算法原理与差异。【教学时数】3学时【教学方法】讲授法【教学内容】集成学习概念、Bagging算法、随机森林、Boosting算法、AdaBoost、GBDT、XGBoost。第8章深度学习与实现【教学目标】1.了解深度学习框架;2.理解多层神经网络、CNN、RNN原理;3.掌握使用TensorFlow搭建基础深度学习模型。【教学重点】TensorFlow基础、多层神经网络、卷积神经网络(CNN)、循环神经网络(RNN)。【教学难点】CNN卷积层与池化层计算、RNN的LSTM结构。【教学时数】4学时【教学方法】讲授法【教学内容】深度学习与框架简介、TensorFlow基础、多层神经网络、CNN、RNN。第9章基于财务与交易数据的量化投资分析【教学目标】1.了解量化投资分析流程;2.理解综合评价与技术指标;3.掌握从数据到策略的完整实现。【教学重点】指标选择与预处理、主成分分析用于综合评价、量化投资策略实现。【教学难点】业务数据理解、主成分分析模型应用、策略设计。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、基于规模与效率的综合评价、技术分析指标计算、量化投资模型与策略。第10章众包任务定价优化方案【教学目标】1.了解地理信息数据可视化;2.理解定价指标设计与模型构建;3.掌握回归模型在定价问题中的应用。【教学重点】Folium地图可视化、指标设计、多元线性回归与神经网络模型。【教学难点】地理信息数据处理、定价模型构建与评价。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、数据获取与地图可视化、指标计算、任务定价模型构建、方案评价。第11章地铁站点日客流量预测【教学目标】1.了解时间序列预测背景;2.理解客流特征提取与因素分析;3.掌握神经网络预测模型的应用。【教学重点】客流指标计算、因素分析(三次指数平滑)、神经网络预测模型。【教学难点】时间序列特征工程、因素分析模型选择。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、数据获取与指标计算、数据可视化、因素分析、神经网络预测模型。第12章微博文本情感分析【教学目标】1.了解文本分析基本流程;2.理解中文文本预处理与词向量;3.掌握多种分类模型在文本中的应用。【教学重点】中文分词、去停用词、词向量、多种分类模型(朴素贝叶斯、随机森林、LSTM)比较。【教学难点】文本向量化、LSTM网络用于文本分类。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、数据预处理(分词、去停用词、词向量)、多种分类模型实现。第13章基于水色图像的水质评价【教学目标】1.了解图像识别基本流程;2.理解传统特征方法与深度学习方法差异;3.掌握SVM与CNN在图像分类中的应用。【教学重点】颜色特征计算、SVM模型、CNN模型(灰图与彩图)。【教学难点】图像数据处理、CNN模型结构理解与实现。【教学时数】2学时【教学方法】案例教学法【教学内容】案例背景与目标、数据获取与探索、SVM分类模型、CNN分类模型。第14章大模型技术与应用案例【教学目标】1.了解大模型(BERT)基本概念;2.理解BERT的输入输出与微调任务;3.掌握BERT在文本分类与问答中的实战应用。【教学重点】BERT基本原理、特征提取、下游任务微调(分类、问答)。【教学难点】BERT输入参数构造、微调流程。【教学时数】5学时【教学方法】讲授法、案例教学法【教学内容】大模型基本认识、BERT模型基础、应用案例1(情感分类)、应用案例2(中文阅读理解)。三、实验教学内容计划头歌实践教学平台智慧课程《Python大数据分析与挖掘实战(第2版)》配套的第1~13章的实验内容。如果无法使用该平台,则可以在人邮教育社区下载本教材配套的教辅资源《66574-本地化智能实验题库资源》,该资源与平台上的资源内容是一致的,即包含了实验的用户程序、测评程序和实验数据相关内容。也可以线上线下同步使用,即线下详细探索实验内容及实验数据详情,线上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年在线教育协调员招聘面试题库及参考答案
- 2025年汽车维修技师招聘面试题库及参考答案
- 新消防员理论题库及答案
- 2025年儿童心理发展顾问招聘面试题库及参考答案
- 2025年社交媒体管理专员招聘面试参考题库及答案
- 2025年机械维修工招聘面试参考题库及答案
- 2025年信贷审查员招聘面试参考题库及答案
- 中公教师招聘题库及答案
- 2025年手机游戏设计师招聘面试题库及参考答案
- 银行保安考试题库及答案
- 销售人员形象培训
- 2025视觉设计师秋招笔试题及答案
- 2025年工会考试真题及答案
- 2023年食品筛选清洗机械相关行业项目成效实现方案
- 衡重式挡墙设计与施工技术要点
- DB22∕T 389.1-2025 用水定额 第1部分:农业
- 2026届广东肇庆市高三一模英语试题答案讲解课件
- 2025年广东普法考试试题及答案
- 2024年云南云天化股份有限公司招聘考试真题
- 2025年山东省公务员考试申论综合分析专项训练试卷(含答案)
- 2025版房屋租赁合同模板
评论
0/150
提交评论