单元1 初窥门径:开启AIGC之旅_第1页
单元1 初窥门径:开启AIGC之旅_第2页
单元1 初窥门径:开启AIGC之旅_第3页
单元1 初窥门径:开启AIGC之旅_第4页
单元1 初窥门径:开启AIGC之旅_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ArtificialIntelligence初窥门径:开启AIGC之旅单元一生成式人工智能素养1.1AIGC的基本原理与技术特点1.2AIGC行业的国内外发展现状与趋势AIGC的核心应用场景1.3应用探索1.5AIGC工具的基本使用方法1.4实践工坊1.61.1.1AIGC的技术原理AIGC(ArtificialIntelligenceGeneratedContent,人工智能生成内容)是指利用人工智能技术自动生成各种形式的内容,包括文本、图像、音频、视频等。1.深度学习深度学习是一种特殊的机器学习方法,它可以通过构建多层神经网络模型来学习数据的内在规律和表示。其核心在于利用深层神经网络模型捕捉数据中的复杂模式和关系,从而实现高效地学习和预测。深度学习模型主要包括前馈神经网络(FeedforwardNeuralNetwork,FNN)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)、循环神经网络(RecurrentNeuralNetwork,RNN)、生成对抗网络(GenerativeAdversarialNetwork,GAN)等。1.1.1AIGC的技术原理FNN作为最基本的神经网络结构,通过多层感知机的设计实现输入到输出的非线性映射,在回归、分类等基础任务中具有广泛应用;FNNCNN在图像处理领域具有重要地位,通过卷积层、池化层和全连接层处理空间数据,可以完成图像分类、目标检测等任务;CNNRNN及其变体长短期记忆网络(LongShort-TermMemory,LSTM)擅长处理序列数据,可以完成时间序列预测、自然语言处理等任务;RNNGAN通过生成器和判别器的对抗训练可以生成逼真的数据,在图像生成、艺术创作等领域展现出巨大的潜力。GAN1.1.1AIGC的技术原理2.自然语言处理自然语言处理(NaturalLanguageProcessing,NLP)作为AIGC在文本生成与理解领域的核心支柱,正深刻改变着人机交互的方式。NLP技术赋予计算机处理自然语言的能力,使其不仅能识别文本中的词汇与语法结构,更能深入解析语义关系、情感倾向及上下文逻辑,从而实现从简单字符识别到复杂语义理解的跨越。该技术涵盖文本分类、情感分析、机器翻译、问答系统等多元化任务。在AIGC的应用场景中,NLP技术扮演着“语义翻译官”的角色。当用户输入自然语言指令时,AI系统首先通过分词、词性标注等预处理步骤解析文本结构,随后运用深度学习模型提取语义特征,并结合知识图谱与上下文信息理解用户意图,最终生成符合逻辑规则的响应内容。这种基于语义理解的精准交互能力不仅提升用户体验,更推动AIGC在多领域的创新发展。1.1.1AIGC的技术原理3.计算机视觉计算机视觉技术作为人工智能领域的重要分支,赋予计算机“看”和“理解”图像与视频内容的能力,使其能够像人类一样解析视觉信息中的细节、结构与语义。在AIGC的框架下,计算机视觉技术被广泛应用于图像与视频的生成、编辑及分析等环节。例如,在内容生成方面,AI模型可基于用户的文本描述,通过计算机视觉技术将抽象的语言信息转化为具体的视觉表达。在编辑领域,计算机视觉技术则展现出强大的操控能力。例如,通过对图像进行风格迁移,可将普通照片转化为梵高《星月夜》般的艺术画作;通过超分辨率重建技术,可修复老旧视频中的模糊画面;通过人体姿态估计与动作捕捉,可实时编辑与替换视频中的人物动作。此外,计算机视觉技术还支撑着AIGC在分析层面的创新应用,如通过目标检测识别图像中的物体类别,利用场景分割技术提取视频中的关键帧,为智能安防、自动驾驶等领域提供技术支持等。1.1.1AIGC的技术原理4.大语言模型大语言模型(LargeLanguageModel,LLM)通过在大规模文本数据上进行无监督训练,展现出非凡的语言理解与生成能力。在AIGC的助力下,LLM的应用场景日益丰富,无论是撰写文章、编织故事、吟诵诗歌,还是编写代码,它都能游刃有余,并为创作者提供源源不断的灵感与支持。以国内的文心一言为例,作为典型的大语言模型,文心一言在自然语言处理和文本生成领域取得令人瞩目的成果,它不仅能准确理解用户的意图,还能生成流畅、自然且富有逻辑性的文本内容,无论是日常对话、专业咨询,还是创意写作,文心一言都能提供精准、高效的回应,目前已成为众多用户信赖的智能助手之一。1.1.2AIGC的工作流程AIGC的核心机制在于通过人类的训练引导,机器能够领会并执行人类下达的各项任务(即指令),并最终达成任务目标(产出解答)。尽管AIGC的具体流程可能因应用场合及产出内容的差异而有所变化,但其基本流程大致相似,主要包括:数据搜集数据预处理模型训练内容生成评估与优化图AIGC的工作流程1.1.2AIGC的工作流程AIGC的起点是广泛而深入的数据。无论是现有的大型数据集,还是精心设计的调查、用户交互活动,甚至是公开的互联网资源,这些数据都是AI模型学习与成长的宝贵养料。01数据搜集原始数据往往夹杂着多余、重复及不相关的信息,如果不及时处理这些数据,就会严重影响AI模型的训练效果。因此,数据预处理是AIGC工作流程中不可或缺的一环。02数据预处理03在模型训练阶段,开发者会根据数据的特性和任务需求来选择恰当的算法(监督学习或无监督学习等)训练模型。同时,开发者还会不断调整模型参数,力求降低预测误差,从而增强模型的适应能力。模型训练AI生成的内容并非完美无缺,为确保其满足特定的质量标准(如准确性、相关性、连贯性等),还需要评估与优化其生成的内容。该环节包括综合考量内容的逻辑结构、语言表达、创意水平等多个维度,必要时还需对AI模型进行额外的训练或调整数据预处理与内容生成策略,以不断提升内容的质量与用户体验。05评估与优化当AI模型经过充分的训练后,便能独自承担起内容生成的重任。无论是撰写新闻稿、创作文学作品、设计图像,还是剪辑视频,AIGC都能凭借其强大的学习与创造能力生成丰富多彩的内容。04内容生成1.1.3AIGC的技术特点作为一种革命性的内容创作模式,AIGC能够实现从简单文本到复杂多媒体内容的全面自动化生成,其特点如下。AIGC能够自动解析用户指令,并快速生成所需内容,省去烦琐的人工编辑环节,极大地提升内容创作的效率与灵活性。自动化生产借助AI的学习与优化能力,AIGC能够持续探索新的创作路径,并生成独具匠心、引人入胜的内容,以满足用户日益增长的个性化需求。创意驱动无论是静态图像、动态视频,还是音频、代码等,AIGC都能轻松驾驭,为用户提供多样化的内容体验。同时,它还能根据用户的反馈实时调整内容策略,以确保生成内容与用户需求的高度契合。全方位展示

依托大数据与云计算的强大支撑,AIGC能够不断吸收新知识、优化算法模型,实现内容与技术的双重迭代升级,这种持续进化的能力使得AIGC在激烈的市场竞争中始终保持优势地位。持续进化1.1AIGC的基本原理与技术特点1.2AIGC行业的国内外发展现状与趋势AIGC的核心应用场景1.3应用探索1.5AIGC工具的基本使用方法1.4实践工坊1.61.2.1国内AIGC行业的发展现状与趋势我国AIGC行业的发展得益于政府的高度重视与大力支持,以及技术创新的不断突破。下面从政策环境、技术发展水平、应用场景与市场规模3个方面进行介绍。政策环境我国政府高度重视人工智能产业的发展,并出台一系列政策措施以推动人工智能技术的创新与应用。例如,《新一代人工智能发展规划》中明确提出要加快人工智能与实体经济的深度融合,推动人工智能技术在各个领域的应用。技术发展水平我国AIGC技术发展迅速,在自然语言处理、计算机视觉、语音识别等领域取得了显著成果。其中,在自然语言处理方面,我国研究者提出了多种高效算法,有效提升了文本内容的生成质量,在计算机视觉方面,深度学习技术在图像识别、图像生成等方面表现卓越;在语音识别技术方面,我国在语音识别准确率、语音合成等方面取得显著进展,部分产品已在实际应用中展现优势。应用场景与市场规模AIGC在应用场景方面呈现出多样化的趋势。在媒体领域,AIGC可自动生成新闻、智能编辑新闻;在娱乐行业,AIGC用于创作音乐、绘画、影视作品;在教育领域,AIGC可辅助教师进行个性化教学;在医疗领域,AIGC可用于辅助诊断、病理分析等。1.我国AIGC行业的发展现状1.2.1国内AIGC行业的发展现状与趋势2.我国AIGC行业的发展趋势随着AIGC的广泛应用,相关法律法规和政策体系亟待完善。政府需加强对AIGC行业的监管,规范市场秩序,保障AIGC行业的健康发展。政策法规逐步完善05未来,随着AIGC市场的不断扩大和技术的不断进步,AIGC市场竞争将变得更加激烈,因此,企业需要不断创新和提升技术实力,以在AIGC市场竞争中占据有利地位。市场竞争格局加剧03随着技术的不断进步,AIGC的应用领域将进一步拓展,在零售、交通、环保、公共安全等领域,都将发挥重要作用。应用领域不断拓展02深度学习、强化学习等新算法的应用将进一步提升AIGC的性能,使其能够生成更加丰富、自然、准确的内容。技术创新持续推动01AIGC产业链上中下游的企业将加强合作,共同推动AIGC产业的生态建设。产业链协同发展041.2.2国外AIGC行业的发展现状与趋势1.国外AIGC行业的发展现状技术突破与应用拓展:国外AIGC技术在自然语言处理、计算机视觉和语音识别等领域不断取得新突破。其中,在自然语言处理方面,语言模型的性能不断提升,能够生成高质量、语义连贯的文本内容。01市场增长与行业渗透:国外AIGC市场呈现出快速增长的态势。在行业应用方面,AIGC已广泛渗透到多个领域。在营销领域,AIGC可生成个性化广告文案和图像,以提高营销效果;在教育领域,AIGC可用于智能辅导、个性化学习路径规划等,以提升教学质量和效率;在娱乐行业,AIGC可用于创作音乐、绘画、影视作品等,为内容创作带来新的活力。02竞争格局与企业布局:国外AIGC市场竞争激烈,形成多元化的竞争格局,科技巨头如谷歌、微软、IBM等凭借其强大的技术实力和资源投入,在AIGC领域占据重要地位。031.2.2国外AIGC行业的发展现状与趋势下面从技术创新持续深化、应用领域不断拓展、伦理与法律问题日益凸显、国际合作与竞争并存4个方面分析国外AIGC行业的发展趋势。2.国外AIGC行业的发展趋势未来,国外AIGC技术创新将不断深化。多模态大模型将成为主流,它能够融合文本、图像、语音等多种模态的数据,从而更全面地理解和生成内容,为各种应用场景带来强大的功能。技术创新持续深化在技术发展的推动下,AIGC将突破现有边界,向更广泛的行业应用场景延伸。在交通领域,AIGC可用于自动驾驶的场景模拟和路径规划,以提高自动驾驶的安全性和可靠性;在医疗领域,AIGC可用于辅助诊断、药物研发等。应用领域不断拓展随着AIGC技术的广泛应用,伦理与法律问题日益凸显。例如,AIGC生成内容的版权归属、虚假信息的传播等问题,引发了广泛的社会关注和讨论。伦理与法律问题日益凸显AIGC的发展具有全球性特征,国际合作与竞争并存。一方面,国际间的合作不断加强,各国科研机构和企业通过合作项目、学术交流等方式共同推动AIGC技术的发展。另一方面,各国在AIGC领域的竞争也日益激烈,各国纷纷出台政策支持本国AIGC产业的发展,争夺技术制高点。国际合作与竞争并存1.1AIGC的基本原理与技术特点1.2AIGC行业的国内外发展现状与趋势AIGC的核心应用场景1.3应用探索1.5AIGC工具的基本使用方法1.4实践工坊1.61.3.1文本生成与辅助创作AIGC的引入不仅极大地提高了创作者的工作效率,还激发了他们的创作灵感。通过AIGC生成的文本内容,创作者可以获得更多的创作素材和思路,从而进一步丰富和完善自己的作品。这一技术的优势在于AIGC强大的数据处理与整合能力,它能快速从海量的信息中提炼出有价值的元素,为创作者提供新颖的视角和切入点。同时,AIGC还具备学习与进化的特性,能根据创作者的反馈不断优化生成的内容,使创作过程更加高效且富有创新性,最终推动整个创作领域迈向新的高度。1.3.2AI绘画与图像编辑AI绘画是AIGC在视觉艺术领域的应用。借助深度学习算法,AIGC工具能够学习并模仿各种艺术风格,包括古典油画、现代抽象画等,甚至创造出新的风格,用户只需提供简单的描述或草图,AIGC工具就能自动生成精美的图像作品,满足广告设计、游戏开发、电影制作等多个场景的需求。此外,AIGC工具在图像修复、色彩调整等方面也展现出强大的能力,可以为视觉创意行业带来便利与新的可能性。1.3.3音、视频生成与编辑在音、视频领域,AIGC同样发挥着重要作用。从音乐创作、语音合成到视频剪辑、特效制作,AI技术正逐步取代传统的手工操作。例如,AIGC工具可以根据情感分析生成符合情绪变化的背景音乐,或基于文本描述生成自然流畅的语音播报。在视频编辑方面,AIGC工具能够自动识别并剪辑出视频中的精彩片段,并为该片段添加特效和滤镜,甚至生成全新的视频内容,这为影视制作、在线教育、直播带货等领域带来全新的体验。1.3.4代码生成与软件开发在软件开发领域,AIGC的应用更是颠覆了传统的编程方式。通过自然语言处理技术,开发者可以使用自然语言描述需求,而AIGC工具则能将需求文本自动翻译成相应的代码,这样不仅简化了编程流程,还提高了软件开发效率。此外,AIGC工具还能辅助进行代码审查、优化代码结构、预测潜在Bug(故障)等任务,从而保障软件的开发质量。1.1AIGC的基本原理与技术特点1.2AIGC行业的国内外发展现状与趋势AIGC的核心应用场景1.3应用探索1.5AIGC工具的基本使用方法1.4实践工坊1.61.4.1选择AIGC工具用户需要根据自己的需求和实际情况选择合适的AIGC工具。市面上的AIGC工具种类繁多,有的专注于文本生成,有的则擅长图像或音频创作。例如,一名文案策划人员可能需要一个文本生成工具;而一名设计师则可能更倾向于选择图像生成工具。1.4.2注册与登录AIGC工具选定合适的AIGC工具后,下一步便是注册与登录AIGC工具。这一步骤是确保用户能够正常使用AIGC工具并享受其提供的各项服务。

通常,注册过程会要求用户提供一些基本信息,如用户名、密码、邮箱等,部分平台可能还需要进行验证码验证或手机绑定,以增加账号的安全性。完成注册后,使用注册的用户名和密码便可登录对应的AIGC工具。1.4.3输入提示词与生成内容以文心一言为例,在文本框中输入提示词,然后单击“提交”按钮

,稍后便可获得所需的生成内容,如图所示。1.输入提示词2.单击1.4.4调整与优化内容虽然AIGC工具能够自动生成内容,但有时候生成的结果并不完全符合用户的期望。这时,用户可以调整和优化生成的内容,其方法主要有以下3种。修改原本的提示词,然后重新生成内容,如将提示词“写一篇关于人工智能的文章”修改为“用通俗的语言写一篇关于人工智能的文章”,这样AIGC工具生成的内容就会更加通俗易懂。修改提示词对生成的内容提出进一步的要求,如“请使用更加通俗易懂的语言进行改写”,这样AIGC工具就会将生成的内容改写得更加通俗易懂。提出进一步要求部分AIGC工具允许用户调整模型参数,以进一步设置生成内容的质量和风格。如:可以调整模型的“创意度”参数,使生成的内容更加新颖有趣;或者调整“准确性”参数,以确保生成的内容更加真实和可靠。调整模型参数1.1AIGC的基本原理与技术特点1.2AIGC行业的国内外发展现状与趋势AIGC的核心应用场景1.3应用探索1.5AIGC工具的基本使用方法1.4实践工坊1.6任务1.1注册并使用DeepSeek2.实践内容2.实践内容任务背景杨晓辉作为公司的技术骨干,肩负着探索AIGC前沿技术、推动团队智能化转型的重要使命。为了提升团队的技术应用能力,他决定从最近大热的DeepSeek入手,深入研究其核心功能与应用场景。他首先注册了DeepSeek账号,然后通过官方文档、技术论坛和实操测试等途径系统性地掌握了该平台的使用技巧与使用方法。任务分析要使用DeepSeek,需要先注册并登录账号,然后再通过生成旅行攻略、产品宣传文案,查看《哪吒之魔童闹海》票房,总结文档内容等操作体验DeepSeek的深度思考、联网搜索、上传附件等功能。任务1.1注册并使用DeepSeek2.实践内容任务实施step01

进入DeepSeek首页,输入电话号码和验证码后单击“登录”按钮,如图所示,进入DeepSeek的对话页面。step02

在文本框中输入所需的提示词,如输入“请为我制订一份为期3天的成都旅行攻略,包括景点推荐、交通安排和住宿建议,预算2000元。”,然后单击“提交”按钮,如图所示。step03

此时,DeepSeek将制订一份详尽的成都旅行攻略,效果如图所示。图

登录DeepSeek

输入提示词图DeepSeek生成的成都旅行攻略1.输入2.输入3.单击1.输入2.单击任务1.1注册并使用DeepSeekstep04

在文本框中再次输入“请为蓝牙耳机撰写一篇吸引喜好户外运动人群的产品介绍文案,突出其独特卖点和用户价值。”,然后选中“深度思考”按钮,再单击“提交”按钮,如图所示。step05

这次DeepSeek将先进行深度思考,然后再进行回复,如图所示。图DeepSeek知识库截止日期图DeepSeek先进行深度思考然后再进行回复图

选中“深度思考”按钮step06

取消选中“深度思考”按钮,然后询问DeepSeek“你的知识库截止日期是什么时候?”。从DeepSeek的回答中可以看出,其知识库最新更新时间为2024年7月,如图所示。step07

这时询问DeepSeek2024年7月以后的事情,DeepSeek就无法回答,如询问DeepSeek《哪吒之魔童闹海》的票房,DeepSeek的回答是“截至2024年7月,《哪吒之魔童闹海》尚未正式上映”,如图所示。图

询问《哪吒之魔童闹海》的票房1.输入2.选中3.单击任务1.1注册并使用DeepSeekstep08

选中“联网搜索”按钮,再次询问DeepSeek《哪吒之魔童闹海》的票房,此时DeepSeek会先联网搜索,然后再进行回复,如图所示。step09

取消选中“联网搜索”按钮,单击“上传附件”按钮,在打开的对话框中上传“立秋.pdf”(配套资源:素材\单元1\立秋.pdf)文件,然后让DeepSeek总结该文档的主要内容,DeepSeek的回复如图所示。图

开启联网搜索后《哪吒之魔童闹海》的票房图

总结文档内容任务1.1注册并使用DeepSeek2.实践内容2.实践内容任务背景杨晓辉体验DeepSeek之后,还想进一步对比不同AI大模型的具体表现。但面对市面上众多的AI大模型,他发现国外AI大模型不仅使用门槛高,而且部分AI大模型还需要单独付费,操作相当不便。为此,他决定使用AskManyAI对比不同的AI大模型。AskManyAI涵盖了国内主流的AI大模型,用户只需开通会员,便可以解锁所有收费AI大模型的权限。此外,在AskManyAI中可以同时选中多个大模型进行提问,以直观比较各个AI大模型的回复质量。任务分析在AskManyAI网站中通过3个问题对比不同AI大模型在逻辑推理、图像理解、文案生成等方面的能力。2.实践内容任务实施任务1.1注册并使用DeepSeekstep01

注册并登录AskManyAI,在AskManyAI的首页中选中“豆包1.5Pro”和“GPT-4omini”两个AI大模型,然后在文本框中输入“爱丽丝有N个兄弟,她还有M个姐妹,请问爱丽丝的兄弟有多少个姐妹?”,最后单击“提交”按钮。此时,豆包1.5Pro和GPT-4omini将同时对该问题进行回答,如图所示。从中可以看出,GPT-4omini的回答是错误的,豆包1.5Pro的回答是正确的。step02

返回AskManyAI首页,选中“DeepSeek-V3-0324”和“GPT-4omini”两个AI大模型,然后单击“上传图片”按钮,上传“小猪.png”(配套资源:素材\单元1\小猪.png)图片,并输入提示词“请描述一下这张图片的内容。”,最后单击“提交”按钮。此时,DeepSeek-V3-0324和GPT-4omini将同时对该问题进行回答,如图所示。从中可以看出,DeepSeek-V3-0324和GPT-4omini的回答均准确描述了该图片的内容,但DeepSeek-V3-0324在细节精度、文化深度及表述条理性上表现更优,适合需要专业分析的场景;GPT-4omini则更简洁,适合快速浏览。图

比较豆包1.5Pro和GPT-4omini在逻辑推理方面的能力

比较DeepSeek-V3-0324和GPT-4omini在图像理解方面的能力1.选中2.输入3.单击1.选中2.选中3.上传4.输入5.单击任务1.1注册并使用DeepSeekstep03

返回AskManyAI首页,选中“通义QwQ-32B”和“豆包1.5Pro”两个AI大模型,输入一段生成扫地机器人小红书文案的提示词,然后单击“提交”按钮。此时,通义QwQ-32B和豆包1.5Pro将同时对该问题进行回答,如图所示。从中可以看出,豆包1.5Pro生成的文案简洁直观,用口语化的方式表达了商品的核心卖点,侧重商品的实用价值;通义QwQ-32B生成的文案则更具场景感和情绪渲染,通过拟人化增强了代入感,表情符号的运用更贴合小红书年轻用户的偏好。

比较通义QwQ-32B和豆包1.5Pro在文案生成方面的能力1.选中2.输入3.单击1.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论