《人工智能通识》-项目2-1 AIGC文本生成应用 -相关知识_第1页
《人工智能通识》-项目2-1 AIGC文本生成应用 -相关知识_第2页
《人工智能通识》-项目2-1 AIGC文本生成应用 -相关知识_第3页
《人工智能通识》-项目2-1 AIGC文本生成应用 -相关知识_第4页
《人工智能通识》-项目2-1 AIGC文本生成应用 -相关知识_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AIGC文本生成应用项目2机械工业出版社《人工智能通识》配套资源制作:教材编写团队AIGC本课件为《人工智能通识(AIGC版)》配套教学资源,由编写团队精心打造。为便于教学使用,团队同步提供了丰富的辅助材料,涵盖微课视频、教学课件、实训手册、习题答案、课程标准及程序源代码等。同时,教材配套超星教学示范包,支持一键克隆为网络在线课程,助力高效开展线上线下混合式教学。欢迎联系出版方订购使用。

书名:《人工智能通识(AIGC版)》书号

:978-7-111-79447-9出版社:机械工业出版社主编:蓝永健、吴秀红、罗智聪副主编:邓爱玲、王有铭、叶菊、周弢PARTTWO相关知识2.相关知识思维导图2.相关知识——2.1.自然语言处理的内涵和应用自然语言处理(NaturalLanguageProcessing,NLP)是人工智能领域的重要研究方向,融合了语言学、计算机科学、机器学习、数学和认知心理学等多个学科领域的知识,是一门集计算机科学、人工智能和语言学于一体的交叉学科,它包含自然语言理解和自然语言生成两个主要方面,研究内容包括字、词、短语、句子、段落和篇章等多种层次,是机器语言和人类语言之间沟通的桥梁。图3-1是自然语言处理研究。(1)自然语言处理的内涵2.相关知识——2.1.自然语言处理的内涵和应用简单地说,自然语言处理(简称NLP)就是教计算机“听懂”和“说好”人类语言的技术。例如,对着手机说“明天天气怎么样”,手机能明白你的意思并回答,这就是NLP在帮忙。2.相关知识——2.1.自然语言处理的内涵和应用自然语言处理的方法包括统计学方法、规则引擎方法、机器学习方法和深度学习方法。统计学方法通过词汇和语法结构的频率推断文本含义;让计算机自己从大量例子中找规律,例如,发现“苹果手机”和“华为手机”经常一起出现,就知道它们都是电子产品;通过分析1000篇影评,学会“画面震撼”通常是好评。它的常用工具:词频统计、关联分析。(2)自然语言处理的方法2.相关知识——2.1.自然语言处理的内涵和应用自然语言处理的方法包括统计学方法、规则引擎方法、机器学习方法和深度学习方法。规则引擎方法基于语言学规则解析语言,但维护成本高。机器学习方法利用模型学习文本模式,例如,支持向量机(SVM)、朴素贝叶斯等。(2)自然语言处理的方法2.相关知识——2.1.自然语言处理的内涵和应用自然语言处理的方法包括统计学方法、规则引擎方法、机器学习方法和深度学习方法。深度学习方法通过神经网络(例如,RNN、LSTM和Transformer)自动学习深层特征,实现更精准的语言理解与处理。模仿人脑的神经网络,让计算机“自己琢磨”,例如,像背课文一样记住海量数据(例如,整个维基百科);能举一反三,学会翻译英文后,也能猜出法语句子的意思。它的典型应用:ChatGPT聊天机器人、抖音自动生成视频字幕等。(2)自然语言处理的方法2.相关知识——2.1.自然语言处理的内涵和应用自然语言处理(NLP)的工具和框架为研究人员和开发者提供了强大的支持,帮助他们快速构建和部署NLP应用。常用的开源工具包括NLTK(NaturalLanguageToolkit)、spaCy、StanfordNLP和Transformers等。NLTK是Python中广泛使用的NLP库,提供了丰富的文本处理功能,如分词、词性标注和句法分析。(3)自然语言处理的工具2.相关知识——2.1.自然语言处理的内涵和应用spaCy则以其高效性和易用性著称,支持多语言处理,适用于工业级应用。StanfordNLP提供了强大的自然语言分析工具,包括命名实体识别和依存句法分析。spaCy专为生产用途而设计,可帮助您构建处理和“理解”大量文本(3)自然语言处理的工具2.相关知识——2.1.自然语言处理的内涵和应用近年来,基于深度学习的框架如HuggingFaceTransformers成为主流,提供了预训练模型(例如,BERT、GPT和DeepSeek)和便捷的API,支持文本分类、机器翻译和问答等任务。这些工具极大地降低了NLP的开发门槛,推动了技术的普及和应用。(3)自然语言处理的工具“预训练-微调”流程与经典机器学习流程的对比2.相关知识——2.1.自然语言处理的内涵和应用自然语言处理技术在机器翻译、信息检索、问答系统、信息抽取、文档分类和情感分析等领域广泛应用,通过理解和处理文本数据,为跨语言交流、信息获取、知识管理和情感监测等提供了强大支持。(4)自然语言处理的工具2.相关知识——2.1.自然语言处理的内涵和应用在搜索引擎中,NLP技术用于理解用户查询意图,提供更精准的搜索结果。在语音助手中,NLP技术用于语音识别和自然语言理解,实现人机对话。例如,虚拟主播:用AI生成真人般的主播视频;智能音箱:说“开空调”就能控制家电;地图导航:语音输入“去最近的奶茶店”。(4)自然语言处理的工具2.相关知识——2.1.自然语言处理的内涵和应用在机器翻译领域,NLP技术能够自动将一种语言的文本翻译成另一种语言,极大地促进了跨语言交流。例如,谷歌翻译支持多种语言的即时翻译;有道词典提供文档翻译功能等等。(4)自然语言处理的工具2.相关知识——2.1.自然语言处理的内涵和应用在情感分析方面,NLP技术用于分析社交媒体、产品评论等文本中的情感倾向,帮助企业了解用户反馈和市场趋势。例如,电商平台通过分析用户评论判断产品满意度;品牌监测工具分析社交媒体上的舆情动态;市场调研机构利用情感分析预测产品市场接受度。(4)自然语言处理的工具一个情感分析示例2.相关知识——2.1.自然语言处理的内涵和应用在文本摘要领域,NLP技术能够从长文本中提取关键信息,生成简洁的摘要,广泛应用于新闻、法律和医疗等领域。例如,新闻网站利用文本摘要技术生成新闻头条;法律机构通过摘要提取案件关键信息;医疗研究者利用摘要快速了解医学文献的核心内容。(4)自然语言处理的工具一个AI写文本摘要示例2.相关知识——2.1.自然语言处理的内涵和应用在问答系统中,NLP技术用于理解用户问题并从大量文本中检索或生成答案,如智能客服和搜索引擎中的问答功能。例如,作业帮:拍照搜题+解题步骤讲解;英语趣配音:自动给你的口语打分。(4)自然语言处理的工具一个AI智能客服示例2.相关知识——2.2人工神经网络的内涵和应用(1)人工神经网络的内涵人工神经网络(ArtificialNeuralNetwork,ANN)是一种模仿人类大脑神经元工作原理的计算模型,是以脑和神经系统为模型的机器学习算法。它由大量相互连接的“节点”(也叫神经元)组成,这些节点通过“连接”传递信息,就像大脑中的神经元通过突触传递信号一样。每个节点接收输入数据,经过简单计算后,将结果传递给下一个节点。通过调整节点之间的连接强度(权重),神经网络可以“学习”数据中的规律,最终完成分类、预测等任务。例如,人类在学习骑自行车时,大脑不断调整动作,直到掌握平衡等。2.相关知识——2.2人工神经网络的内涵和应用(1)人工神经网络的内涵人工神经网络有很多种类,常见的类型有前馈神经网络(FeedforwardNeuralNetwork)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)、循环神经网络(RecurrentNeuralNetwork,RNN)、生成对抗网络(GenerativeAdversarialNetwork,GAN)和深度神经网络(DeepNeuralNetworks,DNN)等。2.相关知识——2.2人工神经网络的内涵和应用(2)人工神经网络的应用人工神经网络在多个领域得到了广泛应用,主要包括模式识别、信号处理、医学诊断、金融预测、智能控制、数据挖掘、自然语言处理和优化组合等。模式识别:用于图像识别、语音识别和手写文字识别等任务,能够自动提取特征并进行分类。信号处理:在生物医学信号处理(例如,心电图、脑电图分析)和通信信号处理中,用于信号的滤波、分类和预测。医学诊断:通过分析医学影像和生物信号,辅助医生进行疾病诊断和治疗方案制定。2.相关知识——2.2人工神经网络的内涵和应用(2)人工神经网络的应用金融预测:用于股票市场预测、信用评估和风险分析,通过对历史数据的学习预测未来趋势。智能控制:在机器人控制、工业自动化和智能交通系统中,用于实时决策和优化控制。2.相关知识——2.2人工神经网络的内涵和应用(2)人工神经网络的应用数据挖掘:用于从大规模数据中提取有用信息,如关联规则挖掘、聚类分析和异常检测。自然语言处理:在机器翻译、情感分析和问答系统等任务中,通过深度学习模型处理和理解自然语言文本。优化组合:用于解决复杂的优化问题,例如,路径规划、资源分配和调度问题。2.相关知识——2.3深度学习的内涵和应用(1)深度学习的内涵深度学习(DeepLearning)特指基于深层神经网络模型和方法的机器学习。深度学习是机器学习的一个分支,通过模拟人脑神经网络的层次结构,从大量数据中自动学习特征和规律。它使用多层“神经元”构建复杂模型,能够处理图像、语音和文本等非结构化数据,是实现人工智能的核心技术之一。2.相关知识——2.3深度学习的内涵和应用(2)深度学习的意义深度学习的意义在于它让计算机具备了“举一反三”的能力,极大地推动了人工智能的发展。传统机器学习需要人工设计特征,而深度学习可以自动从数据中提取特征,减少了人为干预,提高了模型的准确性和泛化能力。例如,在图像识别中,深度学习可以直接从像素中学习到边缘、形状等特征,而不需要人工定义“什么是边缘”。这种能力使得深度学习在复杂任务中表现优异,例如,自动驾驶、医疗诊断等。此外,深度学习的应用降低了技术门槛。通过开源框架(例如,TensorFlow、PyTorch),普通开发者也能快速构建AI模型,推动了技术的普及和创新。深度学习不仅是技术上的突破,更是推动社会智能化转型的重要力量,为医疗、教育和交通等领域带来了革命性变化。2.相关知识——2.3深度学习的内涵和应用(3)深度学习的应用深度学习在图像识别、语音识别、自然语言处理、自动驾驶、医疗诊断、金融预测和精准营销等多个领域有广泛应用。图像识别:例如,人脸识别、物体检测等,深度学习算法能够高效地从图像中提取特征,实现高精度的识别。语音识别:通过深度学习,机器可以准确地将语音转换为文本,实现自然语言交互。自然语言处理:深度学习在机器翻译、情感分析和问答系统等方面有重要应用,提高了自然语言处理的准确性和效率。自动驾驶:深度学习技术使自动驾驶汽车能够感知环境、识别障碍物并做出决策,推动了自动驾驶技术的发展。2.相关知识——2.4主流AIGC文本生成工具对比主流AIGC文本生成工具了解主流AIGC工具有助于把握行业发展趋势,选择适合自身需求的工具。这可以提高工作效率,优化内容创作质量,同时避免重复开发,节省时间和资源。此外,掌握不同工具的特点和优势,能够更好地应对多场景应用需求,提升竞争力,并为未来的技术选型和创新提供参考依据。2.相关知识——2.4主流AIGC文本生成工具对比主流AIGC文本生成工具工具名称所属公司/机构主要特点ChatGPTOpenAI基于GPT-4模型,支持多轮对话、代码生成和文本创作BardGoogle基于PaLM2模型,集成谷歌搜索,提供实时信息ClaudeAnthropic强调安全性和伦理约束,支持长文本处理文心一言百度基于ERNIE模型,中文理解能力强,支持多模态生成通义千问阿里云集成阿里云生态,支持企业级定制讯飞星火科大讯飞语音与文本结合,支持多轮对话和语音输入腾讯混元腾讯集成腾讯生态,支持社交、游戏场景DeepSeek深度求索专注于中文场景,支持长文本生成与多轮对话,注重数据安全与隐私保护智谱清言智谱华章)基于GLM模型,支持多轮对话和复杂任务处理天工AI昆仑万维支持文本生成、代码编写和多模态内容创作豆包抖音集成快手生态,支持短视频脚本生成和直播互动文案2.相关知识——2.4主流AIGC文本生成工具对比主流AIGC文本生成工具2.相关知识——2.4主流AIGC文本生成工具对比主流AIGC文本生成工具2.相关知识——2.5文生文”技术的工作原理与实现流程“文生文”技术(Text-to-TextGeneration)是自然语言处理(NLP)领域的一项重要技术,旨在根据输入的文本生成新的文本。其核心目标是让计算机能够理解输入文本的语义,并生成符合语法规则和上下文逻辑的新文本。2.相关知识——2.5文生文”技术的工作原理与实现流程(1)工作原理“文生文”技术的工作原理可以概括为三个主要环节:语言理解、语言生成和模型训练。“文生文”技术就像教计算机“读”懂人说的话,再“写”出新的句子。它主要分三步:读句子、写句子和练习写作文。1)读句子(语言理解)计算机先把句子拆成词语。例如,“我喜欢人工智能”会拆成“我”“喜欢”“人工智能”。然后给每个词语“贴标签”,例如,“苹果”可能是水果,也可能是手机品牌,计算机会根据上下文判断意思。2.相关知识——2.5文生文”技术的工作原理与实现流程(1)工作原理“文生文”技术的工作原理可以概括为三个主要环节:语言理解、语言生成和模型训练。“文生文”技术就像教计算机“读”懂人说的话,再“写”出新的句子。它主要分三步:读句子、写句子和练习写作文。2)写句子(语言生成)计算机根据读懂的句子,一个字一个字“写”出回答。例如,问“今天天气怎么样?”,它会先写“今天”,再猜下一个词是“晴天”还是“下雨”。写的时候,计算机会挑可能性最高的词(例如,“晴天”),或者偶尔随机选词让回答更自然。3)练习写作文(模型训练)计算机需要“读书”学习语言规律。例如,先读很多小说、新闻,学会怎么造句。再针对具体任务“补课”。例如,专门练习翻译,把中文句子翻成英文。2.相关知识——2.5文生文”技术的工作原理与实现流程(2)实现流程“文生文”技术的实现流程可以分为五个主要步骤:数据准备、模型选择、模型训练、文本生成和后处理。为了形象地理解,把“文生文”技术的工作过程类比成做菜的过程,分五步:买菜洗菜、选锅具、学做菜、炒菜和摆盘试吃。2.相关知识——2.5文生文”技术的工作原理与实现流程(2)实现流程1)买菜洗菜(数据准备)收集大量文字材料,例如,课本、微博和新闻。清理错误和重复内容,例如,删掉乱码。如果是翻译任务,需要准备中英文对照句子(例如,“你好→Hello”)。2)选锅具(模型选择)选合适的工具:例如,大炒锅(Transformer模型)适合处理长文章,能记住前后文关系。小汤锅(RNN/LSTM模型)适合短句子,但长文章容易“煮糊”。2.相关知识——2.5文生文”技术的工作原理与实现流程(2)实现流程3)学做菜(模型训练)先学基本功(预训练)让计算机读大量通用文章,学会造句规律;再学拿手菜(微调):再教它做特定任务,例如,翻译或写摘要。4)炒菜(文本生成)把用户的问题(例如,“讲个笑话”)转成计算机能理解的数字。计算机按顺序“炒”出回答,例如,先写“为什么”,再写“程序员”,最后补上“不爱出门?”。5)摆盘试吃(后处理)给生成的句子加标点、分段,让它读起来更顺。用打分工具检查质量(例如,笑话好不好笑),再让计算机改进。2.相关知识——2.5文生文”技术的工作原理与实现流程(3)关键技术“文生文”技术的实现依赖于以下关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论