下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
XX学校《大数据应用技术基础》学科教案授课课题爬取网站数据表排序后保存到txt文件授课老师授课时间周一第1、2节授课课时2课时授课班级XX班班级地址??电脑室教学目标【知识目标】1.理解网络爬虫的基本概念及工作流程,掌握使用requests库发送HTTP请求获取网页内容的方法。2.掌握BeautifulSoup库解析HTML文档的基本操作,能够准确提取网页中的表格数据。3.理解Python列表的定义、常用操作(如添加元素、排序等),掌握按指定键对列表数据进行排序的方法。【能力目标】1.能够独立配置IIS服务器并发布网站,为爬虫获取数据提供基础环境。2.能够运用requests和BeautifulSoup库编写简单的爬虫程序,从指定网页中爬取销售数据表。3.能够对爬取到的数据进行处理,按销售额降序排序后,将数据正确保存到指定路径的txt文件中。【素养目标】1.培养学生的编程思维和问题解决能力,通过实际操作任务,提升学生分析问题和解决问题的能力。2.增强学生的数据处理和信息提取能力,树立数据意识,为后续大数据相关课程的学习奠定基础。3.培养学生的严谨性和规范性,在编写代码和操作过程中,养成良好的编程习惯和操作规范。教学重点及突破策略教学重点:1.使用requests库获取网页内容和BeautifulSoup库解析HTML表格数据的方法。2.Python列表的排序操作,特别是按指定键(如销售额)进行降序排序。3.将处理后的数据正确保存到txt文件的过程。突破策略:1.对于requests和BeautifulSoup库的使用,通过演示具体的代码示例,详细讲解每个函数的作用和参数,然后让学生跟随练习,加深理解。2.针对列表排序,结合任务中的销售数据排序案例,详细解释sort()方法的key参数和reverse参数的用法,通过多个简单的列表排序练习,让学生掌握排序技巧。3.数据保存到txt文件部分,重点讲解文件路径的设置、文件打开模式以及数据写入的格式,让学生亲手操作,确保能够正确将数据保存到指定位置。教学难点及突破策略教学难点:1.BeautifulSoup库解析HTML时,准确找到目标表格及提取表格行和单元格数据。2.对爬取到的销售额数据进行预处理(如去除逗号、转换为整数),以便正确排序。3.整个爬虫程序的逻辑连贯性,从获取网页、解析数据、处理排序到保存文件的完整流程的理解和实现。突破策略:1.解析HTML表格时,借助浏览器的开发者工具,展示网页的HTML结构,引导学生找到目标表格的标签和属性,逐步讲解如何使用soup.find('table')和rows=table.find_all('tr')等方法定位数据。2.对于销售额数据预处理,通过实例展示带有逗号的字符串如何转换为整数,强调strip()和replace()方法的使用,让学生进行针对性练习。3.整个程序的逻辑连贯性方面,采用分步讲解和调试的方式,先让学生理解每一部分的功能,然后逐步将各部分组合起来,通过打印中间结果,帮助学生理清程序的执行流程。教学方法和手段(含信息化技术)教学方法:讲授法、演示法、任务驱动法、小组讨论法。通过讲授法讲解基本概念和理论知识;演示法展示代码编写和操作过程;任务驱动法让学生围绕具体任务进行实践;小组讨论法促进学生之间的交流与合作。
教学手段:多媒体课件、PyCharm集成开发环境、IIS服务器、浏览器开发者工具。利用多媒体课件展示知识点和操作步骤;在PyCharm中实时演示代码编写和运行过程;通过IIS服务器发布网站提供爬取数据源;使用浏览器开发者工具辅助分析网页结构。课程思政元素1.培养学生的信息素养和数据伦理意识,引导学生在进行网络爬虫操作时,遵守法律法规和网站的robots协议,尊重数据版权,不获取和使用非法数据。教师教学实施学生学习活动课程引入通过提问的方式引入本节课的主题,如“大家在日常生活中是否遇到过需要从网页上获取大量数据的情况?比如获取一些商品的价格信息、排行榜数据等。那么如何高效地获取这些数据并进行处理呢?”,引发学生的兴趣,然后介绍本节课的任务——爬取网站数据表排序后保存到txt文件。授课过程讲解网络爬虫的基本概念,介绍requests库和BeautifulSoup库的作用。详细演示如何使用requests.get()方法发送GET请求获取网页内容,并设置正确的编码。接着讲解BeautifulSoup库的基本用法,如何解析HTML内容,找到目标表格及提取表格中的行和单元格数据。介绍Python列表的定义和常用操作,结合任务中的sales_data列表,讲解如何使用append()方法添加元素。重点讲解列表的sort()方法,通过实例说明key参数和reverse参数的作用,演示如何按销售额对销售数据进行降序排序。讲解文件操作的相关知识,包括文件路径的设置、使用withopen()语句打开文件以及write()方法写入数据,演示如何将排序后的销售数据保存到d:\data\datas.txt文件中。课堂实操内容指导学生在资源管理器中打开网站目录C:\inetpub\wwwroot,将网站文件复制到该目录下,完成IIS网站的发布。然后让学生启动PyCharm,创建Python项目,并在main.py文件中输入参考代码。在学生编写代码过程中,巡回指导,及时解决学生遇到的问题,如库的安装、代码语法错误等。让学生运行编写好的爬虫程序,然后打开d:\data\datas.txt文件,查看输出的降序数据是否正确。对于运行结果有问题的学生,帮助其检查代码,找出错误原因并进行修正。课堂小结(1)知识总结回顾本节课学习的主要知识点,包括requests库获取网页内容、BeautifulSoup库解析HTML表格数据、Python列表的操作(添加元素、排序)以及文件的写入操作。强调各知识点之间的联系和在实际任务中的应用。(2)优秀经验邀请几位操作成功且代码编写规范的学生分享他们的经验,如如何快速找到目标表格、在数据处理过程中遇到的问题及解决方法等,供其他学生学习借鉴。课程引入积极思考老师提出的问题,回忆自己在生活中获取网页数据的经历,对本节课的任务产生兴趣,明确学习目标。授课过程认真听讲,跟随老师的讲解理解网络爬虫的概念、requests库和BeautifulSoup库的作用。记录重点知识和关键代码,对于不理解的地方及时向老师提问。专注学习Python列表的相关知识,特别是sort()方法的使用,通过老师的实例演示,掌握按指定键排序的方法。学习文件操作的知识,了解文件路径的设置方法和数据写入的流程,为后续的实操做准备。课堂实操内容按照老师的指导,在资源管理器中进行网站文件的复制操作,完成IIS网站发布。启动PyCharm,创建项目并在main.py文件中输入参考代码,在输入过程中注意代码的语法和格式。运行程序后,打开指定路径的txt文件,检查数据是否正确排序并保存。如果遇到问题,先尝试自己解决,解决不了的向老师或同学求助。课堂小结(1)知识总结跟随老师一起回顾本节课的知识点,梳理各知识点之间的关系,加深对所学内容的理解和记忆。(2)优秀经验认真听取同学分享的经验,学习他们的优点和解决问题的方法,反思自己在操作过程中的不足。作业:应用本节课的例子,在本节课任务的基础上,设计一个有应用内容的页面作品,可以自选主题或升级老师给的主题,内容自行设置。1.主题可以选择爬取学校图书馆的书籍借阅排行榜数据、某电商平台的商品销量数据等。2.爬取的数据需包含至少3项不同的字段信息,如书籍名称、作者、借阅次数等。3.对爬取到的数据进行至少一种方式的排序(如按借阅次数降序、按商品价格升序等)。4.将排序后的数据保存到自定义路径的txt文件中,并确保文件格式清晰、易读。5.撰写一段简短的说明,介绍所爬取数据的来源、处理方法及结果意义。教学反思:1.在讲解BeautifulSoup库解析HTML表格数据时,部分学生可能对HTML标签的结构理解不够透彻,导致在提取数据时遇到困难。下次教学可以提前简要复习HTML的基本标签知识,或者利用可视化的HTML结构展示工具,帮助学生更好地理解。2.学生在编写代码过程中,对于库的安装(如requests和BeautifulSoup库)可能存在问题,有些学生可能不知道如何使用pip命令安装库。后续教学中,可以在课前提醒学生提前安装好相关库,或者在课堂上统一演示库的安装方法。3.任务中的数据预处理部分(去除逗号、转换为整数)是一个细节,部分学生可能会忽略,导致排序结果不正确。在教学中应强调数据预处理的重要性,并通过实例进行重点讲解和练习。4.课
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 气管吸痰护理的科研设计与实施
- 妇科贫血患者的心理支持
- 2026年圆形的物品幼儿园
- 2026年幼儿园感恩老师
- 2026年皮肤过敏幼儿园
- 2026年幼儿园暑假快乐
- 2026年幼儿园《买玩具》
- 消化系统疾病护理的科研方法
- 早产儿常见问题解答
- 客户投诉快速响应处理预案
- 《车用发动机电子控制技术》课件-第五章 电子控制汽油喷射系统(EFI)的控制方法
- 山东省济宁市2024-2025学年六年级(五四学制)下学期期末地理试卷(含答案)
- 矿井地质学课件第三章 生产地质研究
- GB/T 45665.2-2025麻醉和呼吸设备圆锥接头第2部分:螺纹承重接头
- 人防车位日常管理制度
- 公司战略发布会策划方案
- 投资建厂合作协议范文7篇
- 机器人学导论 课件 第2章 机器人运动学
- 2025年职工职业技能竞赛(物业管理师)参考试题(附答案)
- 羽绒生产知识培训课件
- 《术后低氧血症》课件
评论
0/150
提交评论