《自然语言处理》课程教学大纲_第1页
《自然语言处理》课程教学大纲_第2页
《自然语言处理》课程教学大纲_第3页
《自然语言处理》课程教学大纲_第4页
《自然语言处理》课程教学大纲_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《自然语言处理》教学大纲课程名称:自然语言处理(NaturalLanguageProcessing,NLP)课程编码:1502ZY156课程类别:专业课-限选学分:2.5分总学时:40学时,其中理论学时:28学时,上机学时:12学时适用专业:电子信息工程先修课程:线性代数、概率论与数理统计、Python、人工智能导论、机器学习杨伏洲一、课程性质本课程是电子信息工程专业的专业选修课。学生通过本课程的学习,理解自然语言处理的基本概念、任务及基本分析方法,从数理基础、方法与应用、前沿专题三个层次培养学生的科学思维方法。鼓励学生针对某一方向深入思考,引导学生应用所学知识建模解决相关问题,在实践分析中深化相关问题的理解。二、课程目标(一)育人目标从培养学生的辩证思维方式,爱国教育、社会责任、人生领悟、民族自信等方面入手,将育人要素和自然语言处理专业知识嵌入到课堂中教学,凝聚学生对社会主义核心价值观的共识。通过科学家故事学习科学精神,通过课程概念原理学习系统论、工程论、科学思维,利用自然语言处理应用研究学习科技自信及爱国主义情怀,师生互动进行“三观”教育和学习方法指导,培养学生的专业素质和职业道德,全面提高学生缘事析理、明辨是非的能力,培养学生成为德才兼备、全面发展的人才。(二)知识和能力目标1、理解自然语言处理的基本概念、基本理论,将其应用于人工智能中语言模型、句法分析、语义分析、情感分析、词向量等问题。(毕业要求1.4);2、能够使用统计概率、机器学习、信息检索、自然语言处理等理论方法,求解自然语言中实际应用问题,使学生真正做到理论与实际相结合,将所学相关理论知识与真实应用场景结合起来。(毕业要求2.2)。课程目标与毕业要求指标点对应关系课程目标毕业要求指标点课程目标1毕业要求1.4,具有计算机系统、信息处理及机器学习专业知识,并能将其应用于解决复杂人工智能的应用问题。课程目标2毕业要求2.2,能认识到解决人工智能应用问题有多种方案,并能通过文献研究分析寻求有效解决方案。三、基本要求本课程的教学是以人工智能应用为背景、以自然语言处理的基本原理为主线,讲述自然语言处理领域的核心概念、任务和方法,兼顾经典理论和前沿研究方向,重视理解和掌握基本原理和方法,从数理基础、方法与应用、前沿专题三个层次培养学生的科学思维方法。鼓励学生针对某一方向深入思考,引导学生应用所学知识建模解决相关问题,在实践分析中深化相关问题的理解。教学过程中要注意与先修课程基础知识的联系,掌握自然语言处理的基本概念、基本原理、主要特性、基本方法。在自然语言处理的讲述中,注意培养学生综合运用所学知识的能力,同时使用统计概率、信息学、数据挖掘、机器学习、信息检索、自然语言处理等理论方法求解自然语言中实际应用问题,如序列标注学习问题(分词/词性标注/命名实体识别/依存语法树等),文本摘要问题,智能问答系统等。掌握自然语言处理的基本方法,使学生真正做到理论与实际相结合,能够将所学的相关理论知识与真实应用下的场景落地相结合,通过实践项目引导学生进一步深入探究,鼓励积极思考与创新,培养学生实际分析问题、解决问题的能力。四、教学内容分章节说明教学内容,课时安排,并说明教学重点、主要教学模式(包括授课、自学、实验、课堂讨论、作业等)。章节教学内容授课学时思政元素教学模式对应课程目标1自然语言处理综述4培养学生理解自然语言的基本概念,通过语言的不同特征拓展学生在NLP方面的知识,激励学生实践相关内容。课堂授课,课堂讨论课程目标12语言模型(N-gram语言模型)6就各种算法的复杂性和实际应用展开思考,培养学生语言模型的发散思维,如何突破语言模型的各种局限。课堂授课,课堂讨论课程目标13序列标注问题(Sequencelabellingproblem)6通过一些算法的来历来激励学生在特定算法上的优化,尤其以辩证法来思考问题,提高质疑精神。课堂授课,课堂讨论课程目标14句法、语义及情感分析6提出语言意识与语言心理学一些基本知识,了解新技术现状并初步应用。课堂授课,课堂讨论课程目标1/25词向量6借助于科大讯飞、百度等语音识别平台,让学生思考如何突破局限、如何实现离线识别等内容。课堂授课,课堂讨论课程目标1/2第一章自然语言处理综述1、人工智能发展历史综述2、机器学习知识3、自然语言处理层次架构4、具体任务介绍5、经验主义方法本章重点:熟悉不同领域自然语言处理应用问题及方法等,自然语言处理基本技术方法。能力:能够查阅不同领域自然语言处理应用问题及方法相关科技文献,熟悉自然语言处理基本技术方法第二章语言模型(N-gram语言模型)1、N-Gram语言模型2、链式规则ChainRule平滑处理技术本章重点:理解自然语言处理相关语言模型基础理论;理解相关平滑处理技术能力:能够运用N-Gram语言模型进行简单语言分析。第三章序列标注问题(Sequencelabellingproblem)1、离散/连续马尔科夫模型2、中文分词3、词性标注4、命名实体识别本章重点:理解序列标注学习极其相关应用等能力:能够应用马尔科夫模型进行相关语言模型的简单分析。第四章句法、语义及情感分析1、上下文无关文及自上而下句法分析2、概率上下文无关文法及依存语法树3、语义角色及语义角色标注4、基于句法树方法5、感情倾向性分析本章重点:理解自然语言中语法分析、语义分析及情感分析等基础理论知识能力:理解自然语言中语法分析、语义分析及情感分析的基础理论和相关分析方法,并能够查阅相关科技文献。第五章词向量1、Word2vec词向量2、基于循环神经网络语言模型本章重点:掌握Word2vec词向量的分析方法;掌握基于循环神经网络语言模型的应用。能力:能够应用Word2vec词向量、基于循环神经网络语言模型开展自然语言处理的实际相关应用。五、上机内容与学时分配上机项目与类型序号上机项目学时上机性质演示验证综合设计1基于规则的分词算法4√2隐马尔可夫模型在分词中的应用4√3基于K-means的文本聚类方法4√上机一基于规则的分词算法1.目的要求掌握完全切分,正向最长匹配,逆向最长匹配,双向最长匹配,且比较三种匹配效率。2.主要使用仪器计算机、Python。掌握要点掌握正向最长匹配算法,逆向最长匹配算法,双向最长匹配算法。4.实验内容基于字典、词库匹配的分词方法(基于规则),将待分的句子与一个大的词典中的词语进行匹配。上机二隐马尔可夫模型在分词中的应用1、目的要求中文分词序列标注的BMES,序列标准初始状态概率向量,状态转移概率矩阵,发射概率矩阵如何求出2.主要使用仪器计算机、Python。3.掌握要点了解BMES基本概念,熟悉隐马尔可夫模型的应用,。4.实验内容序列标注问题包括自然语言处理中的分词,词性标注,命名实体识别,关键词抽取,词义角色标注等。首先对中文分词进行标注,根据语料计算初始状态概率、状态转移概率、输出观测概率三个概率矩阵,使用维比特算法获得句子的最大概率分词标记序列。上机三基于K-means的文本聚类方法目的要求记录有某音乐网站6位用户点播的歌曲流派,给定用户名称和九种音乐类型的播放数量,通过K-means将6位用户分成3簇。主要使用仪器计算机、Python。3.掌握要点聚类准则、聚类特征类型、聚类算法、K-means算法。4.实验内容预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。六、教学方法本课程以“以学生为中心,以OBE培养目标”为教学理念。为了提高教学质量,增强学生综合分析能力,采用理论教学、课堂与课堂研讨等相结合的教学方式方法,达到使学生掌握自然语言处理基本处理方法的教学目标。主要教学环节包括课堂教学、课堂研讨、课堂练习以及课后自学。课堂教学根据教学计划中的教学内容将教学知识点进行梳理划分,对于重、难点部分主要以授课为主,对于拓展型知识点包括相关的技术应用主要以学生联想和讨论为主;课堂上对于自然语言处理抽象、深奥的问题与概念,采用图文并茂的多媒体课件代替板书,以形象、生动、直观的方式展现从而保证学生的听课效果。课堂、课后习题和自学课堂上采用多种教学方式吸引学生注意力,包括启发式教学、适时向学生提问题、引起学生的思考。针对知识点主要设置探究式问题,引导学生分析和解决问题,培养学生的自主思考及创新能力;针对实际应用情况主要采用学生自由讨论的方式,加深学生对知识点的理解。下课前对所学内容进行总结,加强学生的自学能力和学习方法。课堂研讨随着教学改革的深入,本课程开始研究型教学的探索,授课过程中采用学生课前自学、课堂讨论、教师总结、课后答疑的双向教学方式。七、考核与成绩评定方式及标准考核内容与成绩评定平时成绩(百分制):50%,包括课后作业、上机实验等。大作业(百分制):50%,课程结束后布置大作业,针对一个实际问题进行分析和操作。平时成绩评价标准基本要求评价标准优秀(0.9-1)良好(0.7-0.89)合格(0.6-0.69)不合格(0-0.59)能够理解自然语言处概念清晰,分析主要概念清晰,基本概念基本基本概念未掌理的基本概念、基本理得当。能够解决但部分分析有清晰,符号、单握,作业不完整论;熟悉自然语言处理问题,思路清误。主要思路、位等基本规范。或未交。的各种基本方法对语晰,计算正确。过程和计算过程言模型、句法分析、语独立完成作业,正确。独立完成义分析、情感分析、词书写工整、清作业,书写清晰,向量等问题进行简单晰,符号、单位主要符号、单位分析。等符合规范。等符合规范。大作业评判标准基本要求评价标准优秀(0.9-1)良好(0.7-0.89)合格(0.6-0.69)不合格(0-0.59)自然语言处理实际分析设计得当。思部分分析设计有基本完成应用应用程序不能问题的分析、设计、路清晰,应用程序误。应用程序编写程序。极小部分实现基本功实现,编写应用程序编写规范,运行正规范,运行正确小抄袭,符号、等能。大部分抄实现。确。独立完成作缺陷。独立完成作基本规范。袭或者作业不业,书写工整、清业,书写清晰,主完整或未交。晰,符号符合规要符号符合规范。范。课程目标达成评价《自然语言处理》课程目标达成评价分析报告一、课程基本信息课程名称自然语言处理课程性质专业限选学时学分40/2.5开课学期专业班级考核方式平时作业大作业任课教师:评价人员:课程组长,命题教师,阅卷教师二、课程目标达成评估课程目标支撑指标点课程目标评价数据源评价依据分值平均分达成度值Ki评价方式毕业要求1.4具有计算机系统、信息处理及机器学习专业知识,并能将其应用于解决复杂人工智能的应用问题。。目标1:理解自然语言处理的基本概念、基本理论,将其应用于人工智能中语言模型、句法分析、语义分析、情感分析、词向量等问题。大作业自然语言处理部分(60分)T10=60T1=42�1*0.5+�1*0.5�10�10=0.77平时作业A10=100A1=84毕业要求2.2能认识到解决人工智能应用问题有多种方案,并能通过文献研究分析寻求有效解决方案。目标2:能够使用统计概率、机器学习、信息检索、自然语言处理等理论方法,求解自然语言中实际应用问题,使学生真正做到理论与实际相结合,将所学相关理论知识与真实应用场景结合起来。大作业应用程序部分(40

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论