（财经大数据技术应用基础）项目四教案数据采集

上传人：h*** IP属地：山东上传时间：2025-09-02 格式：DOCX 页数：11 大小：46.21KB 积分：15 举报 版权申诉

已阅读5页，还剩6页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

教学内容项目四数据采集任务一Python读取数据文件教学方法项目教学法理论课时1课时实践课时1课时教学目标知识目标1.了解文件的定义、分类（文本文件和二进制文件）；2.了解txt、Excel、JSON文件的特点及在财务领域的应用；3.掌握Python中文件打开模式、读写函数（如open、write、read、json.dump等）及相关库（Pandas、json）的使用。能力目标1.能根据不同文件类型选择合适的Python读写方法；2.能使用Python正确读写txt、Excel、JSON文件；3.能处理文件读写过程中的常见问题（如编码错误、格式错误）。素质目标1.通过文件读写操作培养数据处理的逻辑思维和严谨性；2.具有主动探究文件处理技巧的意识，提升自主学习能力。思政目标认识数据在财务工作中的重要性，树立数据安全和隐私保护意识；理解Python工具在提升财务工作效率中的作用，增强技术应用的责任感。教学重点1.文件的分类及特点；2.txt、Excel、JSON文件的读写方法及相关函数、库的使用；3.不同文件类型在财务数据处理中的适用场景。教学难点1.理解不同文件打开模式的区别及应用；2.掌握Pandas库读写Excel文件的参数设置；3.处理Python字典与JSON数据的转换及格式问题。教学资源1.教材；2.网络教学资源（超星“学习通”平台课程）；教学过程教学阶段教学过程设计课前系统学知识【教师】1.利用超星“学习通”平台向学生推送课前学习任务清单与预习包（文件分类文档+财务文件案例），明确任务完成时间；2.根据学生完成任务进度，做出及时反馈，督促学生按照要求保质保量完成课前操作学习并布置预习测试（文件类型识别、常用读写函数判断）；课前自学课前自学1.阅读教材中“文件概述”“各类文件读写”相关章节；2.观看“Python文件读写基础”“Pandas库简介”微课视频；3.收集1个身边的财务相关数据文件3.对学生课前的学习情况进行分析，调整并确定本次教学的重点难点。【学生】1.完成超星“学习通”平台的视频学习和教材阅读任务；2.收集并提交身边的财务数据文件案例；3.记录自学过程中遇到的疑问（如“文本文件与二进制文件的具体区别”、“Pandas库如何安装”等）。课上重难点突破【教师】一、引入（5分钟）展示陆长风手动处理财务数据耗时易错的案例，提问“如何利用Python高效读写不同类型的财务数据文件？”，引发学生思考，导入本节课主题。二、文件概述（15分钟）1.文件的含义：结合财务数据存储需求，讲解文件作为数据持久化存储接口的作用；2.文件的分类：展示txt记账记录（文本文件）、图片格式的发票（二进制文件）实例，分析文本文件和二进制文件的区别及适用场景；重点介绍文本文件中的txt、Excel、JSON文件在财务领域的应用。三、读写txt文件（20分钟）1.打开txt文件：结合open函数，讲解不同打开模式（r、w、a等）的含义，通过财务txt文件的创建、修改案例说明模式选择；强调with语句自动关闭文件的优势。2.写入txt文件：演示write和writelines函数的使用，以员工信息录入为例，说明换行符的作用；3.读取txt文件：通过财务流水记录读取案例，讲解read、readline、readlines函数的区别及适用场景。四、读写Excel文件（20分钟）1.Pandas库导入：讲解Pandas库的安装及importpandasaspd的导入方法；2.读取Excel文件：结合“班级学生信息.xlsx”案例，讲解read_excel函数的参数（io、sheet_name等）及DataFrame对象的特点；3.写入Excel文件：以创建“员工年龄统计.xlsx”为例，演示to_excel函数的使用，说明index参数的设置对结果的影响。五、读写JSON文件（20分钟）1.JSON文件特点：讲解JSON轻量型、键值对结构的特点及在财务数据交换中的优势；2.写入JSON文件：演示json.dump函数的使用，以财务资金数据为例，说明indent参数对格式美化的作用；3.读取JSON文件：通过读取“financial_data.json”文件，讲解json.load函数将JSON数据转换为Python字典的过程。思政融入：结合财务数据泄露案例，强调在文件读写过程中保护数据安全的重要性。【学生】1.跟随教师演示，在自己的电脑上尝试进行各类文件的读写操作；2.分小组讨论“不同文件类型在财务数据处理中的优缺点”，每组派代表发言。课后强化求提升【教师】布置课后小组任务（每组3-4人）：实践操作：分别创建txt、Excel、JSON格式的财务数据文件（如员工工资数据），使用Python完成读写操作，截图提交代码及结果；思政思考：结合财务数据的敏感性，讨论“在文件读写和传输过程中如何保障数据安全？”。【学生】1.以小组为单位完成实践操作任务；2.参与思政话题讨论，录制并提交讨论视频；3.预习下一节课内容。教学内容项目四数据采集任务二Python读写SQLite数据库教学方法项目教学法理论课时1课时实践课时1课时教学目标知识目标1.了解SQLite数据库的定义、特点（自包含、无需配置等）及适用场景；2.掌握Python中sqlite3模块的常用API（connect、cursor、execute等）；3.掌握SQLite数据库的基本操作（连接数据库、创建表格、插入/读取/修改/删除数据）及对应的SQL语句。能力目标1.能使用Python的sqlite3模块连接SQLite数据库；2.能编写SQL语句在Python中实现数据库表的创建及数据的插入、查询、更新和删除；3.能结合pandas库读取数据库数据并进行简单分析。素质目标通过数据库操作培养数据结构化存储的思维，提升数据管理的逻辑性和严谨性；具有主动排查数据库操作错误（如SQL语句语法错误、事务未提交等）的意识，增强问题解决能力。思政目标1.认识数据库在财务数据管理中的核心作用，树立“数据规范化存储”意识；2.结合员工信息等敏感数据操作，强调数据修改、删除的谨慎性，坚守数据安全与隐私保护的伦理底线。教学重点1.SQLite数据库的核心特点（自包含、事务性等）及与其他数据库的区别；2.Python连接SQLite数据库的步骤（建立连接、创建游标、执行SQL、提交事务、关闭连接）；3.数据库基本操作（创建表格、插入/读取/修改/删除数据）的SQL语句及Python实现。教学难点1.理解游标对象在数据库操作中的作用及与连接对象的关系；2.掌握事务提交（commit）的时机，避免数据操作后未保存的问题；3.复杂SQL语句（如带WHERE条件的查询、更新）在Python中的正确执行及错误排查。教学资源1.教材；2.网络教学资源（超星“学习通”平台课程、Python官网）；教学过程教学阶段教学过程设计课前系统学知识【教师】1.利用超星“学习通”平台推送课前学习任务清单与预习（SQLite特点），明确任务：对比SQLite与Excel存储数据的差异，列举1个适合用SQLite的场景；2.布置预习测试（判断sqlite3模块常用API的功能、SQL语句的作用）；3.分析学生预习情况，调整课上重点（如针对“事务提交”的疑问增加演示）。课前自学课前自学1.阅读教材中“SQLite模块”；2.收集1个数据库应用案例，思考其存储优势3.对学生课前的学习情况进行分析，调整并确定本次教学的重点难点。【学生】1.完成超星“学习通”平台的视频学习（如“SQLite入门”“sqlite3模块基础”）和教材阅读；2.收集1个数据库应用案例（如手机通讯录数据库），思考其存储优势；3.记录自学疑问（如“游标对象的作用”“为何需要commit”）。课上重难点突破【教师】一、引入（5分钟）展示案例：陆长风手动管理员工信息Excel表时，出现数据重复、查询缓慢等问题，提问“如何用数据库高效管理员工数据？”，导入SQLite数据库主题。二、认知SQLite数据库（15分钟）1.定义与特点：结合“无需服务器、文件存储”的特性，对比MySQL，说明SQLite在中小型财务项目中的优势；2.核心特点：通过“员工信息表存储”案例，讲解自包含、跨平台、事务性（ACID）的具体含义。三、Python连接SQLite数据库（20分钟）1.连接步骤：演示sqlite3.connect()创建连接（如连接test.db，不存在则自动创建）；讲解游标对象（cursor）的作用：作为执行SQL的“桥梁”，通过conn.cursor()创建；强调操作后关闭游标和连接的必要性。2.代码演示：结合例411，展示连接数据库的完整代码，输出“连接数据库”验证成功。四、数据库基本操作（20分钟）1.创建表格：讲解CREATETABLE语句结构（列名、数据类型、约束如PRIMARYKEY）；演示创建COMPANY表（含ID、NAME等字段），强调mit()提交事务的作用（例412）。2.插入数据：讲解INSERTINTO语句的两种语法（指定列/全列插入）；演示插入4条员工数据，对比未提交事务与提交后的差异。3.读取数据：讲解SELECT语句（指定列、WHERE条件）；演示查询员工ID、NAME等信息，用for循环遍历结果集；拓展：用pandas的read_sql_query读取数据并展示。4.修改数据：讲解UPDATE语句（SET子句、WHERE条件）；演示将Paul的工资改为25000，验证修改结果。5.删除数据：讲解DELETE语句及WHERE条件的重要性（避免误删全表）；演示删除Paul的记录，强调操作前备份的必要性。思政融入：展示“误删财务数据导致损失”案例，强调数据修改、删除时的谨慎性及权限控制。五、学生实践（20分钟）任务：创建“财务人员信息表”，插入3条数据，查询薪资>3000的人员，修改其中1人的地址，最后删除1条记录；小组互助排查错误（如SQL语法错误、未提交事务）。【学生】1.跟随演示编写代码，记录游标与连接的使用细节；2.实践操作中关注事务提交和SQL语句格式；3.讨论“如何避免误删数据”，分享心得。课后强化求提升【教师】布置课后小组任务（每组3-4人）：实践操作：1.创建“部门预算表”（含部门ID、名称、预算金额、年份），插入5条数据，查询2023年预算>10万的部门，修改其中1个部门的预算，删除已撤销部门的记录，提交完整代码及运行结果；2.用pandas读取该表数据，生成简单统计表格（如各部门预算总和）。思政思考：结合“财务数据保密性”，讨论“如何通过数据库权限设置（如只读/读写权限）保护敏感数据？”，录制3分钟小组讨论视频。【学生】1.以小组为单位完成实践操作任务；2.提交思政讨论视频，总结数据安全防护措施；3.预习下一节课“数据库查询进阶”内容。教学内容项目四数据采集任务三网页数据采集教学方法项目教学法理论课时2课时实践课时2课时教学目标知识目标1.理解网络爬虫的定义、分类、工作流程及规范要求；2.掌握URL的组成结构及作用；3.了解HTML、CSS、XPath的基本概念及在数据采集中的应用；4.掌握Requests库发送HTTP请求、获取网页内容的方法；5.掌握BeautifulSoup库解析HTML、提取数据的方法，包括处理注释、脚本等无关标签；6.学会使用BeautifulSoup的CSS选择器及XPath表达式定位和提取特定元素。能力目标1.能够运用Requests库正确获取目标网页的HTML内容；2.能够运用BeautifulSoup库解析HTML文档，并提取所需数据；3.能够处理HTML中的干扰信息（如注释、脚本、样式），提高数据提取准确性；4.能够根据网页结构，选择合适的CSS选择器或XPath表达式定位元素；5.能够独立完成简单的财经网站公开数据采集任务。素质目标1.培养数据获取与分析的逻辑性和严谨性思维；2.提升自主学习和解决实际问题的能力；3.增强团队协作意识，在实践中乐于交流与分享经验。思政目标1.树立正确的网络爬虫伦理观，严格遵守网站robots协议和相关法律法规；2.培养数据安全与隐私保护意识，尊重知识产权和数据所有权；3.引导学生认识到技术的双刃剑效应，规范使用数据采集技术。教学重点1.Requests库的使用（get请求、响应对象属性）；2.BeautifulSoup库的基本使用（创建对象、查找标签、提取文本和属性）；3.CSS选择器和XPath表达式的构建与应用；4.网络爬虫的规范与伦理。教学难点1.理解HTML文档结构与爬虫解析逻辑的对应关系；2.准确构建CSS选择器或XPath表达式定位复杂网页中的目标元素；3.有效处理HTML中的注释、脚本、样式等无关标签，纯净提取数据；4.针对不同网站反爬机制（如简单的请求头验证）进行初步应对。教学资源1.教材；2.网络教学资源（超星“学习通”平台课程）；3.案例：公开的财经新闻网站、上市公司财报摘要页面。教学过程教学阶段教学过程设计课前系统学知识【教师】1.在教学平台推送预习任务：阅读教材中网络爬虫概念、HTML基础部分；2.布置预习思考题：“为什么需要遵守爬虫规范？”“HTML标签的作用是什么？”；课前自学1.课前自学1.阅读教材中相关章节；2.观看“网页源代码查看”微课视频；3.对学生课前的学习情况进行分析，调整并确定本次教学的重点难点。【学生】1.完成预习材料阅读和视频学习，记录疑问；2.尝试在浏览器中查看1-2个财经网站的源代码，观察HTML结构。课上重难点突破【教师】一、引入（5分钟）1.展示任务情景：陆长风需要采集竞争对手财务数据，引出网页数据采集的必要性；2.提问：“如何自动化获取网页中的数据？”，激发学生兴趣。二、网络爬虫基础（20分钟）1.讲解爬虫定义、分类（通用、聚焦、增量式、深层），结合财经数据采集说明聚焦爬虫的应用；2.演示爬虫工作流程：以“访问财经网站→获取页面→提取数据”为例；3.重点强调爬虫规范：合法性（robots协议）、道德性（不滥用请求）、版权意识。三、Web前端与URL（30分钟）1.URL结构：解析“协议://域名/路径”，结合财经网站URL举例；2.HTML基础：通过示例HTML文件（含表格、列表）讲解常用标签（<table>、<tr>、<td>、<div>、<p>），演示在浏览器中查看对应元素；3.CSS选择器与XPath：通过同一示例，对比演示用“div#contentp”（CSS）和“//div[@id='content']/p”（XPath）定位元素的方法。思政融入：树立正确的网络爬虫伦理观，严格遵守网站robots协议和相关法律法规四、Requests库实战（40分钟）1.讲解get()方法、响应对象（status_code、text、content）；2.代码演示：发送请求获取某财经新闻列表页，打印状态码和部分HTML内容；3.学生练习：修改URL，获取另一个页面内容，教师巡视指导。五、BeautifulSoup解析与实战（40分

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（财经大数据技术应用基础）项目四教案数据采集

文档简介

温馨提示

最新文档

评论

（财经大数据技术应用基础）项目四 教案 数据采集

文档简介

温馨提示

最新文档

评论

相关文档

（财经大数据技术应用基础）项目四教案数据采集