《python自然语言处理》教学大纲_第1页
《python自然语言处理》教学大纲_第2页
《python自然语言处理》教学大纲_第3页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ythonpython PAGE PAGE 9 / 9python 自然语言处理教学大纲课程名称:python 自然语言处理适用专业:计算机科学与技术、软件工程、人工智能、大数据等专业先修课程:概率论与数理统计、Python 程序设计语言总学时:56学时授学时:30学实验(上机)学时:26学时一、课程简介PythonPythonPythonPythonSklearn 和 NLTK二、课程内容及要求1(2主要内容:人工智能发展历程自然语言处理机器学习算法自然语言处理相关库语料库基本要求:了解人工智能发展历程、自然语言处理相关内容;机器学习算法相关概念;了解基于 Python 与自然语言处理的关系

2、;了解语料库的相关概念。重点:自然语言处理相关内容、机器学习算难点:基于Python的相关库2Python(2主要内容:pythonPythonpython代码书写规则基本要求了解 python简介、熟悉Python解释器、掌握python编辑器、了解代码书写规重点:掌握python编辑器、了解代码书写规则难点:掌握python编辑器第3章 Python数据类型(4学时主要内容:常量、变量和表达式基本数据类型运算符与表达式列表元组字符串字典集合基本要求:理解数据类型的概念、作用以及Python 语言的基本数据类型;掌握常量、变量基 本概念;掌握Python 语言各类运算符的含义、运算符的优先级

3、和结合性、表达式的构成以及表达式的求解过程。掌握序列基础知识;熟练掌握列表的定义、常用操作和常用函数;熟练掌握元组的 定义和常用操作;熟练掌握字典的定义和常用操作;掌握字符串格式化、字符串截取的方法;理解 与重 点:数据类型的作用、变量的定义,各类运算符以及构成的表达式的求解。序列、列表、元组的定义和常用操作。字典、集合的定义和常用操作。难 点:4Python(4)主要内容:数据输入与输出顺序结构单分支选择结构双分支选择结构多分支选择结构whilefor循环的嵌套基本要求:掌握程序的三种基本结构;掌握顺序结构程序设计;熟练掌握Python 语言中输入输出格式的规则和用法。熟练掌握if 语句的三

4、种形式和用法以及if 语句的嵌套使用;掌握分支结构的应用。熟练掌握循环结构while、for 语句的规则和用法;熟悉continue、break、pass 语句的用法;掌握循环结构的嵌套规则。重 点:ifwhile、for循环结构的应用。难 点:格式化输出的规则和用法。分支结构的应用。循环的嵌套。第 5 章 Python 函数(4 学时)主要内容:函数声明与调用函数传参lambda递归函数基本要求:理解函数的作用;熟练掌握函数定义和函数调用的规则和用法;掌握函数参数传递的规则和用法;lambda 函数;理解函数的嵌套和递归调用。重 点:函数的作用、定义和调用;参数分类。难 点:函数的参数传递、

5、递归调用。第 6 章 Python 数据分析(4 学时) 1.科学计算2. NumpyScipymatplotlibPandasSeaborn基本要求:了解科学计算的基本概念;掌握Numpy、Scipy、matplotlib、Pandas、Seaborn 的函数使用方法重点:Numpy、Scipy、matplotlib和难点:Numpymatplotlib和Pandas7SklearnNLTK(4主要内容:Sklearn2 基于Sklearn 机器学习3. NLTKNlTKNlTK基本要求:了解 Sklearn 的基本功能,数据集,了解基于Sklearn 机器学习流程。了解NLTK 的基本功能

6、、 NLTK 语料库以及NL 文本分类。重点:Sklearn与NLTK 难点:Sklearn与第 8 章 语料清洗(4 学时) 主要内容:数据清洗方法缺失值清洗异常值清洗2 数据转换3 missingno 4 词云基本要求:了解数据清洗,掌握缺失值、异常值和重复值的处理方法;掌握missingno 和词云使用方法重点:数据转换、数据清洗难点:缺失值、异常值和重复值清洗方第9章特征工程(4学时)主要内容:特征预处理规范化标准化鲁棒化正则化独热编码CountVectorizerTF-IDF基本要求: 了解特征预处理, 掌握规范化和标准化的处理方法。掌握独热编码、CountVectorizer 和T

7、F-IDF 基本原理和使用方法重点:特征工程预处理、独热编码难点:独热编码CountVectorizer 第10章中文分词(4学时)主要内容:常见中文分词方法基于规则和词表方法基于统计方法JiebaHanLP基本要求:了解常见中文分词方法,掌握Jieba 分词库和HanLP 分词库重点:Jieba分词库和HanLP分词库难点:Jieba分词库和HanLP分词第11章文本分类(4学时)主要内容:历史回顾贝叶斯定理朴素贝叶斯分类GaussianNBMultinomialNBBernoulliNB支持向量机线性核函数多项式核函数高斯核函数贝叶斯进行垃圾邮件分类基本要求:了解文本分类的历史回顾、文本分

8、类的相关方法;掌握贝叶斯定理、朴素贝叶斯分类;了解支持向量机原理,掌握线性核函数、多项式核函数和高斯核函数。重点:贝叶斯定理、朴素贝叶斯分类难点:朴素贝叶斯分类、支持向量机分第12章文本聚类(4学时)主要内容:文本聚类步骤主成分分析KmeansKmeans调整兰德系数轮廓系数掌握Kmeans基本要求:了解文本聚类步骤,掌握主成分分析、掌握 Kmeans 算法步骤,掌握调整兰德系数和轮廓系数、掌握Kmeans 进行英文和中文聚类重点:聚类算法、主成分分析k-means算法步骤难点:主成分分析K-means算法流程,Kmeans进行英文和中文聚第13章指标评价(4学时)主要内容:混淆矩阵准确率精确

9、率召回率F1 scoreROC 曲线AUC分类评估报告中文分词的指标未登录词和登录词召回率基本要求:F1 scoreROC 曲线、AUC 面积和分类重点:混淆矩阵和分类评估报告难点:混淆矩阵、精确率与召回率ROC 曲线AUC 面中文分词的指标、未登录词和录词召回率。第14章信息提取(4学时主要内容:相关概念信息信息熵互信息正则表达式基本语法re3 命名实体4 马尔可夫模型基本要求:了解信息提取的相关概念,如信息、信息熵、互信息等。掌握正则表达式的基本语法和 re 模块。了解命名实体和马尔可夫模型的特点和使用方式。重点:正则表达式的基本语法和re 模块、马尔可夫模难点:正则表达式的基本语法和re

10、模块第 15 章 情感分析(4 学时) 主要内容:情感分析概述基于情感词典方法textblob分句和分词词性标注情感分析snownlp分词词性标注断句情绪判断小说人物情感分析电影影评情感分析textblob 和 snownlp掌握小说人物和电影影评情感分析重点:掌握textblob和 snownlp难点:掌握textblob和 snownlp、掌握小说人物和电影影评情感分析三、教学安排及学时分配四、考主要内容自然语言处理概述2自然语言处理概述22Python 语言简介22Python 数据类型224Python 流程控制224Python 函数224Python 数据分析224Sklearn 和NLTK224语料清洗224特征工程224中文分词224文本分类224文本聚类224指标评价224信息提取224情感分析22430265

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论