Python自然语言处理入门与实战-教案 第1、2章 导论、文本数据爬取_第1页
Python自然语言处理入门与实战-教案 第1、2章 导论、文本数据爬取_第2页
Python自然语言处理入门与实战-教案 第1、2章 导论、文本数据爬取_第3页
Python自然语言处理入门与实战-教案 第1、2章 导论、文本数据爬取_第4页
Python自然语言处理入门与实战-教案 第1、2章 导论、文本数据爬取_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章导论教案课程名称:Python自然语言处理入门与实战课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论40学时,实验24学时)总学分:4.0学分本章学时:3学时一、材料清单(1)《Python自然语言处理入门与实战》教材。(2)配套PPT。(3)引导性提问。(4)探究性问题。(5)拓展性问题。二、教学目标与基本要求.教学目标介绍NLP的基本概念和发展历程;讲解NLP的研究内容和与新闻传媒的关系;介绍常见NLP的处理工具和Python在NLP技术应用中的常见库;介绍Anaconda安装流程和NLP虚拟环境的创建方法。.基本要求了解自然语言处理的基本概念。了解自然语言处理的工具。(3)熟悉Anaconda安装流程以及自然语言处理虚拟环境的创建方法。三、问题.引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。(1)什么是自然语言?(2)现实生活中存在哪些自然语言处理技术?(3)该如何处理自然语言?.探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。Python中常用自然语言处理库有哪些?(2)自然语言处理的能够应用在那些场景?.拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。Python语言用于自然语言处理有哪些优势?(2)人与机器可以对话么?四、主要知识点、重点与难点.主要知识点(1)自然语言处理的概念、发展历程。(2)自然语言处理与新闻传媒。(3)自然语言处理的工具。Windows系统下Anaconda安装。NLP虚拟环境的创建流程。.重点(1)自然语言处理的概念、发展历程。Windows系统下Anaconda安装。NLP虚拟环境的创建流程。.难点NLP虚拟环境的创建流程。五、教学过程设计.理论教学过程(1)自然语言处理的概念。(2)自然语言处理的发展历程。(3)自然语言处理的应用场景。(4)自然语言处理的流程。在Windows操作系统上安装Anacondao(6)创建NLP虚拟环境。.实验教学过程在Windows操作系统上安装Anacondao(2)创建NLP虚拟环境。六、教材与参考资料.教材戴程,张良均.Python自然语言处理入门与实战[M].北京:人民邮电出版社.2022..参考资料[1]张良均.Python数据分析与挖掘实战[M].北京:机械工业出版社.2015.12]张良均.Python与数据挖掘[M].北京:机械工业出版社.2016.[3]肖刚,张良均.Python中文自然语言处理基础与实战[M].北京:人民邮电出版社.2021.第2章文本数据爬取教案课程名称:Python自然语言处理入门与实战课程类别:必修适用专业:大数据技术类相关专业总学时:64学时(其中理论40学时,实验24学时)总学分:4.0学分本章学时:6学时七、材料清单(Python自然语言处理入门与实战》教材。(7)配套PPT。(8)引导性提问。(9)探究性问题。(10)拓展性问题。八、教学目标与基本要求.教学目标对超文本传输协议(HTTP)及其相关机制进行了简要介绍,包括HTTP请求方式与过程、常见HTTP状态码、HTTP头部信息,以及Cookie机制。然后分别介绍爬取静态网页和动态网页中的数据的方法,包括实现HTTP请求、网页解析、数据存储、逆向分析爬取和使用Selenium库爬取.基本要求(4)熟悉HTTP请求方法与过程。(5)熟悉常见的HTTP状态码、头字段和Cookie。(6)掌握静态网页数据的爬取方法。了解静态网页和动态网页的区别。(8)掌握逆向分析和使用Selenium库爬取动态网页的方法。九、问题.引导性提问引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。(4)网页数据为什么可以被爬取?(5)拿到一个HTML代码文本,如果你想获取其中一些字段你会怎么获取?(6)你认为爬虫可以分为几个部分?.探究性问题探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问。或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问。打开一个简单的静态网站看见的数据会位于HTTP响应的哪一个位置?Selenium库爬取网站的优缺点是什么?Selenium库如何快速得到想要数据?.拓展性问题拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题。亦可以提供拓展资料供学生研习探讨,完成拓展性问题。Cookie和Session的相同点是什么?(4)如何规避通过访问频度反爬?(5)如何提高Selenium爬取网站速度?十、主要知识点、重点与难点.主要知识点HTTP通信过程中的客户端发起请求的方式与服务器发送响应的过程。HTTP通信过程中服务器发送响应的常见HTTP状态码。HTTP协议中的头部类型与对应类型的常用的头字段。Cookie机制的运作原理及其作用。(10)使用Requests库实现HTTP请求。(11)使用BeautifulSoup库解析网页。(12)将数据存储入MySQL数据库。了解静态网页和动态网页区别。(14)逆向分析爬取动态网页。使用Selenium库爬取动态网页。.重点HTTP通信过程中的客户端发起请求的方式与服务器发送响应的过程。HTTP通信过程中服务器发送响应的常见HTTP状态码。HTTP协议中的头部类型与对应类型的常用的头字段。Cookie机制的运作原理及其作用。(8)使用Requests库实现HTTP请求。(9)使用BeautifulSoup库解析网页。(10)将数据存储入MySQL数据库。(11)逆向分析爬取动态网页。(12)使用Selenium库爬取动态网页。3.难点HTTP通信过程中的客户端发起请求的方式与服务器发送响应的过程。HTTP通信过程中服务器发送响应的常见HTTP状态码。HTTP协议中的头部类型与对应类型的常用的头字段。Cookie机制的运作原理及其作用。(5)使用Requests库实现HTTP请求。(6)使用BeautifulSoup库解析网页。(7)逆向分析爬取动态网页。(8)使用Selenium库爬取动态网页。教学过程设计1.理论教学过程(7)介绍HTTP通信过程中的客户端发起请求的方式与服务器发送响应的过程。(8)介绍HTTP通信过程中服务器发送响应的常见HTTP状态码。(9)介绍HTTP协议中的头部类型与对应类型的常用的头字段。(10)介绍Cookie机制的运作原理及其作用。(11)使用Requests库实现HTTP请求。(12)使用BeautifulSoup库解析网页。(13)将数据存储入MySQL数据库。(14)介绍静态网页和动态网页区别。(15)逆向分析爬取动态网页。(16)使用Selenium库爬取动态网页。2.实验教学过程在Windows操作系统上安装Anaconda。(4)创建NLP虚拟环境。使用Requests库实现HTTP请求。(5)使用BeautifulSoup库解析网页。(6)将数据存储入MySQL数据库。(7)介绍静态网页和动态网页区别。(8)逆向分析爬取动态网页。(9)使用Selenium库爬取动态网页。十二、教材与参考资料.教材戴程,张良均.P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论