人工智能通识课件全套1-8 人工智能引论 - 生成式人工智能-

上传人：y*** IP属地：山东上传时间：2026-04-08 格式：PPTX 页数：251 大小：8.06MB 积分：50 举报 版权申诉

已阅读5页，还剩246页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

人工智能引论素养目标技能目标知识目标了解人工智能的应用领域；了解人工智能的关键技术。了解人工智能的定义；了解人工智能的基本研究内容；了解人工智能的诞生和发展。树立正确的人文道德素养；了解我国人工智能发展应用水平，树立民族自豪。学习目标智能是什么，人类具有哪些智能，机器会有智能吗,人工智能又是什么？让我们一起走进人工智能的世界。1.2.3.人工智能概述人工智能的诞生人工智能的发展4.人工智能的应用领域目录01人工智能引论智能通常指人的智慧和行动能力，包括人的感觉、学习、思考能力等。人工智能则是人类通过技术手段模拟和实现的智能，它需要计算机程序和算法来支持。人工智能（ArtificialIntelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是什么人工智能的定义人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学，研究目的是促使智能机器会听（语音识别、机器翻译等）、会看（图像识别、文字识别等）、会说（语音合成、人机对话等）、会思考（人机对弈、定理证明等）、会学习（机器学习、知识表示等）、会行动（机器人、自动驾驶汽车等）。人工智能的基本研究内容人工智能概述交叉学科02人工智能的诞生控制论与早期神经网络30年代末到50年代初，一系列科学进展交汇是最初的人工智能研究。神经学研究发现大脑是由神经元组成的电子网络，其激励电平只存在“有”和“无”两种状态，不存在中间状态。维纳的控制论描述了电子网络的控制和稳定性。克劳德·香农提出的信息论则描述了数字信号（即高低电平代表的二进制信号）。图灵的计算理论证明数字信号足以描述任何形式的计算。这些密切相关的想法暗示了构建电子大脑的可能性。PART01游戏AI游戏AI一直被认为是评价AI发展水平的一种标准。1951年，ChristopherStrachey使用曼彻斯特大学的FerrantiMark1机器写了一个西洋跳棋（checkers）程序；DietrichPrinz(迪特里希)写了一个国际象棋程序。五十年代中期和六十年代初，ArthurSamuel(亚瑟塞缪尔)开发的国际象棋程序的棋力已经可以挑战具有相当高水平的业余爱好者。PART021956年达特茅斯会议：AI的诞生1956年，达特矛斯会议的组织者是

马文·明斯基,人工智能与认知学专家，约翰·麦卡锡和另两位资深科学家

克劳德·香农，信息论的创始人)以及

内森罗切斯特（IBM）组织了此次会议。这一事件标志着人工智能学科的诞生。PART03人工智能的诞生一场持续两个月的会议一个不食人间烟火的主题：用机器来模仿人类学习以及其他方面的智能。1956年----人工智能元年。美国达特茅斯学院1.1人工智能的诞生03人工智能的发展神秘又令人神往的人工智能，它的发展并不是一帆风顺的，在充满未知的探索道路上它经历了兴起与低迷，然而，它又以新的面貌迎来了新一轮的发展。我们将人工智能的发展历程划分为以下6个阶段：起步发展期、反思发展期、应用发展期、低迷发展期、稳定发展期和蓬勃发展期。人工智能的发展03.01.02.起步发展期1956年—20世纪60年代初。人工智能概念提出后，相继取得了一批令人瞩目的研究成果，如机器定理证明、跳棋程序等，掀起人工智能发展的第一个高潮。反思发展期20世纪60年代—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望，人们开始尝试更具挑战性的任务，并提出了一些不切实际的研发目标。然而，接二连三的失败和预期目标的落空（例如，无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等），使人工智能的发展走入低谷。应用发展期20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题，实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功，推动人工智能走入应用发展的新高潮。人工智能的发展06.04.05.低迷发展期20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大，专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。稳步发展期20世纪90年代中—2010年。由于网络技术特别是互联网技术的发展，加速了人工智能的创新研究，促使人工智能技术进一步走向实用化。1997年国际商业机器公司（简称IBM）深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫，2008年IBM提出“智慧地球”的概念。蓬勃发展期2011年至今，随着大数据、云计算、互联网、物联网等信息技术的发展，泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展，大幅跨越了科学与应用之间的“技术鸿沟”，诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破，迎来爆发式增长的新高潮。人工智能的发展04人工智能的应用领域家居

智能家居主要是基于物联网技术，通过智能硬件、软件系统、云计算平台构成一套完整的家居生态圈。用户可以进行远程控制设备，设备间可以互联互通，并进行自我学习等，来整体优化家居环境的安全性、节能性、便捷性等。近两年随着智能语音技术的发展，智能音箱成为一个爆发点。小米、天猫、等企业纷纷推出自身的智能音箱，不仅成功打开家居市场，也为未来更多的智能家居用品培养了用户习惯。人工智能的应用领域零售人工智能在零售领域的应用已经十分广泛，无人便利店、智慧供应链、客流统计、无人仓、无人车等都是的热门方向。京东自主研发的无人仓采用大量智能物流机器人进行协同与配合，通过人工智能、深度学习、图像智能识别、大数据应用等技术，让工业机器人可以进行自主的判断和行为，完成各种复杂的任务，在商品分拣、运输、出库等环节实现自动化。人工智能的应用领域交通智能交通系统是通信、信息和控制技术在交通系统中集成应用的产物。目前，我国在智能运输系统方面的应用主要是通过对交通中的车辆流量、行车速度进行采集和分析，可以对交通进行实施监控和调度，有效提高通行能力、简化交通管理、降低环境污染等。人工智能的应用领域

人工智能医疗的具体应用包括洞察与风险管理、医学研究、医学影像与诊断、生活方式管理与监督、精神健康、护理、急救室与医院管理、药物挖掘、虚拟助理、可穿戴设备等人工智能的应用领域教育

通过图像识别，可以进行机器批改试卷、识题答题等；通过语音识别可以纠正、改进发音；而人机交互可以进行在线答疑解惑等。AI和教育的结合一定程度上可以改善教育行业师资分布不均衡、费用高昂等问题，从工具层面给师生提供更有效率的学习方式，但还不能对教育内容产生较多实质性的影响。人工智能的应用领域物流物流行业通过利用智能搜索、推理规划、计算机视觉以及智能机器人等技术在运输、仓储、配送装卸等流程上已经进行了自动化改造，能够基本实现无人操作。比如利用大数据对商品进行智能配送规划，优化配置物流供给、需求匹配、物流资源等。目前物流行业大部分人力分布在“最后一公里”的配送环节，京东、苏宁、菜鸟争先研发无人车、无人机，力求抢占市场机会。人工智能的应用领域安防近些年来，中国安防监控行业发展迅速，视频监控数量不断增长，在公共和个人场景监控摄像头安装总数已经超过了1.75亿。在部分一线城市，视频监控已经实现了全覆盖。人工智能的应用领域小结人工智能是相对于人的智能而言的。正是由于意识是一种特殊的物质运动形式，所以根据控制论理论，运用功能模拟的方法，制造电脑模拟人脑的部分功能，把人的部分智能活动机械化，叫人工智能。人工智能的本质是对人思维的信息过程的模拟，是人的智能的物化。尽管人工智能可以模拟人脑的某些活动，甚至在某些方面超过人脑的功能，但人工智能不会成为人类智能而取代人的意识。随着科学技术的发展，人工智能将向更高水平发展，反过来推动科学技术、生产力和人类智慧向更高水平发展，对人类社会进步将起着巨大的推动作用。谢谢机器爱学习素养目标技能目标知识目标能够设计简单的机器学习解决方案，并解释其工作原理；能够培养利用机器学习技术解决实际问题的意识；能够结合专业背景提出创新性应用思路。了解机器学习的主要类型；了解机器学习在现实生活中的典型应用场景;理解机器学习的基本概念；掌握机器学习的基本流程,能够用通俗语言解释其工作原理;增强数字化时代的责任感和使命感；树立正确的技术伦理观；培养创新思维和解决问题的能力。学习目标我们的手机以及家里的各种电气设备等智能装备越来越懂你，是因为它们非常“爱”学习，也就是用到了机器学习技术。该技术让机器像人一样“思考”和“学习”，帮助我们解决各种问题。1.2.3.机器学习概念机器学习原理机器学习分类4.机器学习应用场景目录01机器学习的概念机器学习是人工智能的核心技术之一，它使得计算机能够从数据中学习和改进自身的性能，是一个跨越多个领域的学科，其中包括统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学和脑科学等。机器学习的研究目标是让计算机模拟或实现人类的学习行为，以此获取新知识和技能，以及重新整合已有知识结构，不断提升其性能。机器学习的定义机器学习的目标通过观测数据（样本）来寻找其中的规律，并利用发现的规律来预测未来的数据或那些无法观测到的数据。机器学习的核心什么是机器学习02机器学习的原理机器学习的原理是通过数据驱动的方法，让计算机系统自动学习数据中的模式和规律，并利用这些模式进行预测或决策。机器学习的原理核心原理和关键步骤：数据是机器学习的基础模型训练：从数据中学习模型评估：验证模型性能模型泛化：在新数据上的表现机器学习的数学基础数据是机器学习的基础数据可以是结构化的（如表格数据）、半结构化的（如JSON格式）或非结构化的（如图像、文本）。数据的质量、数量和多样性直接影响模型的性能。两个概念：数据预处理特征工程PART01模型训练训练过程的目标是找到最佳的模型参数，使得模型在训练数据上表现良好。PART02模型评估训练好的模型需要通过评估来确定其性能是否满足要求。PART03机器学习的原理模型评估常用的指标分类任务回归任务交叉验证模型泛化机器学习的最终目标是让模型在未见过的新数据上表现良好，这称为模型的泛化能力。采用的方法：数据增强早停集成学习PART04PART02机器学习的数学基础常用数学工具概率论统计学线性代数优化理论PART05机器学习的原理03机器学习的分类根据分类方式的不同，机器学习有许多不同的分类方法机器学习的分类常用的分类方法：根据学习模型分类根据学习方法分类其他常见算法监督学习的目的：用已知的信息来帮助计算机预测未知的信息。监督学习无监督学习让计算机自己去观察和分析一大堆没有标签的数据，计算机会尝试找出这些数据中的规律，这样做的好处是，计算机可以自己发现数据中的隐藏信息，而不需要有人事先告诉它每条数据是什么。无监督学习根据学习模型分类半监督学习可以用少量的标记数据来指导学习，同时利用大量的未标记数据来发现更多的规律。半监督学习目前的主要挑战在于如何有效地利用无标签数据。半监督学习可以用于图像识别、文本分类、生物信息学等领域。半监督学习强化学习让计算机或者机器人通过尝试和错误来学习如何做事。强化学习的主要挑战在于如何处理大规模的状态空间和动作空间问题，如何做到有效的学习以及如何平衡探索和开发等。

强化学习根据学习模型分类传统机器学习就像这个魔法盒子。它用一些已经知道结果的数据（就像水果）来训练一个模型，然后这个模型就能用来预测新数据的结果。传统机器学习深度学习使用神经网络技术，这种技术模仿了人脑的工作方式。深度学习可以处理更复杂的数据，而且它能自己学习如何从这些数据中找出有用的信息。深度学习根据学习方法分类深度学习有两种特别模式一种是CNN---图片一种是RNN---文字、声音03.演化学习01.迁移学习02.主动学习迁移学习就是把在一个任务上学到的知识用到另一个相关的任务上。主动学习就是让计算机程序自己选择它需要学习的样本。主动学习可以让计算机程序更聪明地选择它需要学习的数据，减少需要的数据量。演化学习就是让计算机程序通过模拟生物进化的过程来学习。演化学习可以让计算机程序像生物一样进化，找到更好的解决方案。其他常见算法04机器学习的应用场景01风险评估与信用评分机器学习通过分析借款人的历史交易记录、信用历史、收入水平等数据，构建预测模型，帮助金融机构快速评估客户的信用风险。0203欺诈检测机器学习在欺诈检测中发挥了重要作用：传统机器学习算法深度学习算法模型融合与集成学习投资分析与预测主要包括以下领域：市场趋势预测量化投资高频交易智慧金融04客户行为分析金融机构通过分析客户的交易记录、浏览行为和社交媒体活动，构建用户画像，实现精准营销和个性化服务。聚类分析智能客服0506运营效率优化机器学习还可以用于优化金融机构的内部运营流程。流程自动化异常检测持续监控与模型更新为了确保机器学习模型的长期有效性，金融机构需要建立持续监控机制，如：模型监控数据更新与模型重训练智慧金融智能小区采用智能化、模块化、集成化的设计原则，以系统平台为核心，人工智能为方向，整合了视频安防、物联网、车辆管理等多个子系统。智能小区门禁管理门禁管理系统通过集成先进的人脸识别技术，实现了更高效、更安全的访问控制。01可视对讲和访客管理智能化的访客管理系统不仅提高了访客的访问体验，也加强了小区的整体安全防护。02视频安防视频安防系统是智能小区中不可或缺的一部分，它由一系列精密设备组成，包括监控前端、管理中心、监控中心以及PC客户端等。03智能小区车辆管理车辆识别管理系统通过先进的车牌识别技术，优化了小区车辆的通行流程，实现了高效自动化的车辆管理。系统的核心组件——车牌识别设备040智能家居智能家居系统，依托物联网技术，将住宅转变为一个高度互联的生态系统，这一系统由硬件设施、智能软件和云计算平台共同构成。05智能小区智慧教育是信息技术与前沿教学理念结合的典范，集成了自动建模、智能感知和个性化服务等先进功能。机器学习在智慧教育中的数据挖掘与知识发现的全过程智慧教育目标数据预处理与转换这一连续过程包括从大量信息中识别出有意义的数据，清洗这些数据以去除噪声和异常值，以及将定性数据转化为定量形式，以适应分析模型的需求。目标数据预处理与转换02利用机器学习技术构建数据挖掘模型，采用聚类分析、关联规则挖掘、分类法、回归分析等方法，以深入洞察教育数据。构建数据挖掘模型03综合传统与现代技术的大数据环境的构建，为机器学习在智慧教育中的应用和发展提供了坚实的基础，使得教育者能够更有效地利用数据驱动的洞察来优化教学方法和提升学习体验。构建智慧教育大数据环境01智慧教育04解释和评估模型对模型结果进行深入的解释和评估是揭示其内在价值的关键步骤，便于提炼出有益的规律和知识，而且这些知识按照实践类、原理类和优化类进行分类。内容推荐机器学习可以通过分析用户的兴趣、行为和偏好，构建个性化的推荐系统。包括：音乐推荐影视推荐游戏推荐内容创作机器学习不仅能够辅助内容推荐，还能直接参与创作，为艺术家和创作者提供灵感和工具。音乐创作影视创作艺术创作用户互动体验机器学习技术通过增强用户与娱乐内容的互动，提升了用户的参与感和体验。虚拟助手实时互动010302娱乐与创作实验案例：任务说明实验目标本次实验包含两个核心任务，旨在将理论知识应用于实战，深入掌握并理解机器学习的原理和应用。任务详情1智能分类器目标：理解机器学习的原理，体验监督学习的基本流程。2智能预测目标：体验AI如何利用机器学习进行预测，理解“数据驱动决策”在实际生活中的应用。图像的压缩PART02本章小结本章系统介绍了机器学习的基础知识与应用场景。首先阐述了机器学习的概念，明确其作为人工智能的核心技术。其次讲解了机器学习的工作原理，包括数据预处理、模型训练、评估与泛化四个关键步骤，并涉及概率论、统计学等数学基础。最后展示了机器学习在智慧金融（风险评估、欺诈检测）、智慧小区（门禁、安防）、智慧教育（个性化服务）及娱乐创作（内容推荐）等领域的广泛应用，体现了技术赋能各行各业的实践价值。谢谢机器看世界素养目标技能目标知识目标能够利用计算机视觉技术完成人脸识别；能够结合计算机视觉和专业背景提出创新性应用思路。理解计算机视觉的基本概念；了解计算机视觉的基本结构；熟悉计算机视觉的应用领域。培养其社会责任感和技术伦理意识；激发科技报国的热情；培养其辩证思维和社会责任感。学习目标

对于人类，看见是天生具有的，人接受信息中70%-80%来自视觉信息。但对机器而言，这样的任务，却是很艰巨的，如何让机器像人一样能“看见”眼前的事物？情景引入1.2.3.计算机视觉概述图像成像原理计算机视觉的结构4.5.计算机视觉的主要模型计算机视觉的应用场景目录6.计算机视觉的主要技术01计算机视觉概述图像的压缩数字图像和视频数据中存在着大量的信息冗余和主观视觉冗余，因此图像的压缩是必要的，也是可能的。PART02讨论机器（比如人脸识别设备）如何认得你是你？计算机视觉是模拟人类视觉系统的科学，通过相机、图像处理和算法，让机器像人一样“看懂”图像，是人工智能的重要分支。人类获取信息中70%-80%来自视觉，而机器视觉系统能够帮助计算机理解图像内容，从而在众多领域发挥重要作用。计算机视觉的定义计算机视觉的重要性随着技术发展，计算机视觉已广泛应用于安防、医疗、交通等领域，未来将在更多领域展现巨大潜力，推动社会变革。计算机视觉的应用前景什么是计算机视觉02图像成像原理成像原理人眼成像人眼的成像原理是外界物体的反射光线经过角膜、晶状体等折射，在视网膜上形成倒立的物像，再由大脑处理形成正常视觉。这是视觉感知的生物学基础。数字成像数字图像的成像原理模拟人眼机制：数码相机的镜头相当于晶状体，感光传感器相当于视网膜，将模拟图像信号转换为数字图像信号，最终存储为数字文件。图像的存储与呈现1.黑白图像：仅用0和1表示黑白两色，数据量最小。2.灰度图像：用0到255的数值表示不同亮度的灰色，呈现黑白过渡。3.彩色图像：通过RGB三通道组合呈现色彩。存储原理彩色图像通过红、绿、蓝（RGB）三个颜色通道的组合呈现色彩。每个像素点的颜色由三个通道的数值共同决定，并以三维矩阵的形式存储在计算机中。分类图像的压缩图像数据量通常很大，为了节省存储空间和提高传输效率，图像压缩技术应运而生。它主要分为两大类：无损压缩与有损压缩，分别适用于不同的应用场景。分类与特点无损压缩：无信息损失，可完全恢复，适用于医学影像等高质量要求场景。有损压缩：牺牲非关键细节换取高压缩比，广泛应用于网络图片与数字照片。简介概述不同的图像格式对应着不同的压缩方式和应用场景，了解它们的特点有助于我们选择合适的格式，平衡图像质量与存储传输效率。格式对比表名称性质典型应用开发公司/组织BMP无损Windows应用程序、高质量图像保存MicrosoftTIF有损/无损印刷出版、医学影像、专业摄影AldusGIF无损因特网、简单动画、图标CompuServeJPEG有损因特网、数码相机、日常照片ISO/IEC常见图像格式位图与矢量图根据图像的生成方式和存储原理，我们可以将数字图像分为两大类：1.位图(Bitmap)：由像素点组成，放大易失真，色彩丰富。2.矢量图(Vector)：由数学公式组成，无限放大无失真，体积小。位图特点与效果原理：由无数个像素点组成，类似马赛克。缺点：放大后会出现明显的锯齿和像素块，导致失真。应用：数码照片、复杂纹理的图像。矢量图特点与效果原理：由数学公式和几何图形（点、线、面）组成。优点：无论放大多少倍，边缘始终光滑，不会失真。应用：Logo设计、图标、工程图纸。💡核心区别：位图关注“像素点的色彩”，矢量图关注“图形的几何关系”。颜色深度与图像分辨率颜色深度：又称位深度，指每个像素点用多少位二进制数来表示颜色信息。位数越高颜色越丰富，如1位为黑白，24位为真彩色。图像分辨率：指图像的像素数量（宽×高）。分辨率越高，图像包含的细节越丰富，画面越清晰。图像的大小:图像的大小（数据量）是指在磁盘上存储整幅图像所占用的字节数。图像文件的字节数=图像分辨率*量化位数/8核心概念效果对比03计算机视觉的结构图像传感器如摄像设备等将外界景物转换为计算机内的数字化图像，可获取动态、静态等多种景物信息，是视觉系统的基础。图像传感器的作用除摄像设备外，还有热成像相机、高光谱成像仪等，它们具备超越人类视觉的能力，可观察到人类无法察觉的信息。多种图像传感器精确获取高质量的数字化图像是计算机视觉系统后续处理与分析的基础，直接影响系统性能与应用效果。图像获取的重要性数字化图像获取外界景物的数字化就是将外界景物转换成计算机内的用数字表示的图像，称为数字化图像。图像增强与复原通过图像增强和复原技术改善图像视觉效果，提高图像品质，使其更易于后续分析与理解，如去除噪声、增强对比度等。采用各种图像变换方法将空间域处理转换为变换域处理，同时运用编码压缩技术减少图像数据量，便于存储与传输。图像数据变换与压缩图像分割可提取图像中有意义的特征部分，如边缘、区域等，为图像识别、分析和理解提供基础；图像分割数字化图像处理图像管理图像管理也属于图像处理，包括图像的有组织存储，称为图像库，同时也包括对图像库的操作管理，如图像的调用、图像的增/删/改操作以及图像库的安全性保护和故障恢复等功能。图像分解指的是将图像中的一部分从整体中抽取出來。图像拼接指的是将若干幅图像组合成一幅图像。图像分解与拼接通过从物体外部测量的数据，经过数字处理后将2D平面物体转换成3D立体物体的技术。图像重建数字化图像处理03.01.02.图像描述图像描述是对图像中感兴趣目标进行检测和测量，获取其客观信息，为图像分析提供基础，可采用几何特性等方法进行描述。图像分类与识别图像分类与识别属于机器学习范畴，通过浅层或深层机器学习方法对图像进行分类判别，以识别图像中的目标。图像理解图像理解是更高级的图像分析，包括动作分析、行为分析、场景语义分析等，目标是使计算机具有通过二维图像认知三维环境信息的能力。图像分析与理解图像的分析和理解是指从现实世界中的景物提取高维数据以便产生数字或符号信息，它们可以转换为与其他思维过程交互且可引出适当行动的描述。04.图像特征提取图像特征提取指的是提取图像中包含的某些特征或特殊信息，为分析图像提供便利。04计算机视觉的主要模型主要模型卷积神经网络(CNN)计算机视觉的基石，通过卷积层自动提取图像特征，代表模型有LeNet-5、AlexNet、VGGNet、GoogLeNet和ResNet等。深度可分离卷积一种高效的卷积方式，将标准卷积分解为深度卷积和逐点卷积，显著减少计算量，被MobileNet等轻量级模型广泛采用。全卷积网络(FCN)用于语义分割任务，能够对图像中的每个像素进行分类，实现像素级的场景解析。目标检测模型如R-CNN、YOLO、SSD等，能够在图像中定位并识别多个目标物体。主要模型语义分割模型如SegNet、DeepLab，专注于将图像分割成具有不同语义类别的区域。生成对抗网络(GAN)由生成器和判别器组成，能够生成逼真的图像，广泛应用于图像生成、风格迁移、超分辨率等任务。人体姿态估计模型专注于检测图像中人体的关键点（如关节），构建人体骨骼结构，应用于动作捕捉、体育分析等领域。05计算机视觉的主要技术03.01.02.图像采集和处理使用摄像头及其他类型的传感器采集真实世界中的三维场景，将其转化为视频。目标识别物体进行识别，并在此基础上掌握更多的细节特征目标检测和图像分割把图像划分为若干个不同区域和物体。计算机视觉的主要技术04.目标追踪在视频中定位和跟踪物体05动作识别对动作和手势进行识别生成式对抗网络（GAN）负责尝试生成一些看起来很真实的东西，另一个网络名为判别式网络，它会把生成式网络所合成的东西与真实的东西进行比较，确定生成式网络的输出是真是假。计算机视觉的主要技术07.06场景理解对一个完整的场景进行分析并理解，掌握其中复杂而微妙的关系计算机视觉的应用场景0

我们在看电影时都看见过这样的场景，在一个人流量巨大的场所（比如机场），警察为了追踪一个罪犯，在监控室中将罪犯的头像与监控器中的人脸进行比对。在经短暂的比对后，罪犯的人脸在监控画面上被标记出来。更令人惊叹的是，监控摄像头一旦锁定了目标，就一直自动跟随着目标移动，直至罪犯被警察抓住。情景引入01人脸识别技术特点人脸识别具有非强制性、非接触性、并发性等特点，符合人类“以貌识人”的视觉特性，操作简单且隐蔽性好。0203人脸识别技术流程人脸识别系统包括人脸图像采集及检测、预处理、特征提取以及匹配与识别四个部分，通过这些步骤实现精确的身份识别。人脸识别的应用人脸识别广泛应用于安防、金融、手机解锁等领域，为身份认证提供了高效、便捷的解决方案，提升了安全性和用户体验。人脸识别人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。

某一天，你和家人乘坐无人驾驶汽车去郊外旅游，家里之前负责开车的人不再需要花时间专注于开车，一切交给自动驾驶来完成，一家人可以一起聊天、欣赏风景，这样的旅途是多么放松和惬意。情景引入无人驾驶技术特点无人驾驶通过多种传感器对环境感知和识别，利用人工智能技术进行决策和规划，实现车辆的自动驾驶，具有提高道路安全、减少拥堵等优势。01无人驾驶的等级无人驾驶分为从无自动化到完全自动化的六个等级（level0---level5），随着技术发展，车辆的自动化程度不断提高，推动了交通领域的变革。02无人驾驶的技术框架无人驾驶技术框架包括环境感知定位、决策规划和执行控制三个核心部分，各部分协同工作实现车辆的自动驾驶功能。03无人驾驶无人驾驶是指利用人工智能、机器学习、传感器、地图等技术，使汽车等交通工具能够在没有人类驾驶的情况下自主完成行驶、避障、停车等操作。

科幻电影里经常有这样的情节：在一场太空大战中，一个人类战士使用激光武器和敌人激烈交战中不幸受伤，他忍着疼痛，爬进一个神奇的医疗舱内，关上舱门，医疗舱就开始伸出机械手臂或是放出微型机器人开始治疗，而有些更高级的则是放出某种神秘的光线，在很短的时间里就能将重伤的患者治愈。情景引入计算机视觉在智慧医疗的技术流程包括数据采集、预处理、特征提取、模型训练、诊断分析、结果验证、临床决策支持、持续学习和改进、临床部署和监管合规等。计算机视觉在智慧医疗中的技术流程02智慧医疗面临数据隐私保护、算法透明度等挑战，但随着技术发展和优化，计算机视觉有望在智慧医疗领域发挥更大作用，推动医疗行业的进步。智慧医疗的挑战与展望03计算机视觉在医学影像分析、高准确率医学判断、特征工程与模式识别、多模态医学影像融合、实时监测与反馈、自动化和智能化流程、临床部署的挑战应对、持续学习和适应等。计算机视觉在智慧医疗中的应用01智慧医疗智慧医疗是一个利用现代信息技术，特别是互联网、大数据、人工智能等技术，来提升医疗服务质量和效率的概念。计算机视觉在智慧农业中的应用作物病虫害监测与识别、生长状态监测、智能灌溉管理、农作物收获自动化、农业机器人导航与自主驾驶、农业生态系统监测、农产品质量检测等。智慧农业的发展智慧农业结合计算机视觉等技术，实现农业生产智能化、精准化，提高农业生产效率和质量，促进农业可持续发展。智慧农业的挑战与展望智慧农业的推广需考虑农民技术接受度和培训，以及如何将这些技术与现有的农业生产实践相结合，以实现更广泛的应用。010302智慧农业计算机视觉在城市管理的各个领域发挥着重要作用。“高清化、网络化、智能化”已经成为城市建设的一种必然趋势。计算机视觉在智慧安防中的应用计算机视觉在智能交通中的应用智慧城市计算机视觉在环境监测中的应用提高公共安全优化交通管理犯罪预防及辅助侦查异常事件检测优化资源分配身份验证提升应急响应速度数据收集与分析计算机视觉在智慧安防中的应用智慧城市智能交通监控交通管理和规划带来便利交通安全教育和行为分析智慧城市计算机视觉在智能交通中的应用大气污染监测水质监测与管理垃圾分类与回收自然生态监测灾害监测与预警城市环境评价气象预测与分析基础设施结构健康监测智慧城市计算机视觉在环境监测中的应用实验案例：任务说明实验目标本次实验包含两个核心任务，旨在将理论知识应用于实战，深入掌握计算机视觉应用。任务详情1人脸人体识别目标：理解计算机视觉技术的基本应用流程。2智能目标检测目标：理解数据集、数据标注、模型训练、训练结果等关于目标检测技术的整体流程，并能分析影响AI准确性的环境因素。图像的压缩数字图像和视频数据中存在着大量的信息冗余和主观视觉冗余，因此图像的压缩是必要的，也是可能的。PART02本章小结本章首先介绍了计算机视觉的定义和图像成像原理，然后阐述了计算机视觉的结构和模型，接着讲解了计算机视觉在人脸识别、无人驾驶、智慧医疗等多方面的典型应用，帮助读者理解计算机视觉技术在实际生活中的广泛应用价值。谢谢机器听世界素养目标技能目标知识目标能够利用语音识别技术完成文字的录入；能够结合语音识别和专业背景提出创新性应用思路了解语音识别的概念；熟悉语音识别的关键技术；熟悉语音识别的模型和主要流程。树立民族自豪感，坚持民族自信；培养学生对国产优秀AI模型和产品的关注热情。学习目标人类能轻松地从嘈杂环境中分辨出熟悉的声音，理解其中的意义，并作出回应。但对机器而言，让它们“听懂”并理解人类的语言，却是一项复杂而艰巨的任务——需要将连续的声波信号转化为数字形式，提取关键特征，再借助声学模型与语言模型一步步推理，才能让机器像人一样“听见”并理解我们所说的话。1.2.3.语音识别概述语音识别的主要模型语音识别的主要流程4.语音识别的应用场景目录01语音识别概述什么是语音识别语音识别是人工智能技术，将语音信号转换为文本或命令，核心是将语音中的词汇内容转换为计算机可读输入，如按键、二进制编码或字符序列。语音识别概念声音是空气密度的周期性变化形成的声波，基本要素包括幅度、频率和相位。人耳能感知的频率范围约为20Hz~20kHz。声音的物理基础语音由声带产生周期性信号，声道作为滤波器形成特定共振峰，最终由嘴唇或鼻腔辐射形成语音信号。语音产生机制02语音识别的主要的模型GMM-HMM模型是传统声学模型，GMM建模语音特征概率分布，HMM建模语音信号时间序列结构，能处理输入输出长度不等的问题。高斯混合模型-隐马尔可夫模型（GMM-HMM）声学模型DNN-HMM模型用DNN代替GMM，估计HMM的观测概率，对复杂语音特征的表达能力更强，但缺乏对长时间上下文关系的建模能力。深度神经网络-隐马尔可夫模型（DNN-HMM）声学模型N-Gram模型是基于统计的语言建模方法，通过统计N-Gram片段出现的频率估算概率，结构简单但难以建模长距离上下文依赖关系。语言模型是语音识别系统中的重要组成部分，其主要作用是对词序列的合理性进行建模，用以约束识别结果的语法和语义结构语言模型N-Gram

模型RNNLM模型利用循环神经网络对词与词之间的关系进行建模，能捕捉长距离上下文信息，缓解未登录词问题。

RNNLM模型

端到端模型避免了传统模型中子模块训练目标不一致导致的误差累积问题，能直接优化最终目标，如词错误率或字错误率。端到端模型将整个识别流程视为一个统一的建模问题，直接对概率P(W|X)进行建模，简化了建模过程，主要有基于CTC和基于注意力机制两类方法。端到端模型03语音识别的主要流程语音信号预处理预处理步骤包括预滤波、采样与模数转换、预加重、分帧与加窗、端点检测等，目的是将模拟语音信号转化为便于后续处理的数字信号。预处理的重要性预处理是语音识别系统的起点，能提升语音信号的分析可行性和准确性，决定最终识别性能的重要因素之一。特征提取MFCC特征提取过程包括语音分帧加窗、快速傅里叶变换、通过梅尔滤波器组、取对数、离散余弦变换等步骤。常见特征包括MFCC、Fbank、PLP、LPCC等，其中MFCC是最经典和主流的特征提取方法，模拟了人耳听觉感知机制数据准备模型初始化010302定义损失函数模型训练训练优化0504评估与调参构建大规模、带时间对齐的“语音+文本”训练语料库，包括多个说话人、多口音、多场景，以增强模型的鲁棒性。选择合适的模型结构（如DNN、LSTM、Transformer、CTC、RNN-T等），对模型参数进行初始化根据任务选择交叉熵损失（分类）、CTC损失（对齐无关）或Seq2Seq损失（编码解码结构）通过梯度下降（如SGD、Adam）等算法训练模型，进行参数的学习，同时采用正则化、学习率调度等技术防止过拟合。在验证集和测试集上评估识别效果（如字错误率、词错误率），并据此优化模型结构、训练策略或调整模型参数等。03.01.02.输入帧信号通过麦克风采集语音信号，形成一帧帧的音频数据特征提取对每一帧音频进行MFCC等声学特征提取声学模型处理使用GMM对特征与声学状态进行匹配；使用HMM描述语音的时间变化结构，将状态序列解码为音素语音解码05.04.词典映射音素序列通过发音词典映射为单词序列。词典定义了每个单词对应的音素组合语言模型判断将单词进一步组合成句子，评估词序列的语法合理性与语义连贯性，从而选出最可能的句子作为最终识别结果04语音识别的应用场景语音输入12语音输入使信息录入和沟通更加高效便捷，能识别多种语言和方言，自动纠错、断句和添加标点，提升输入质量和交流效率。语音输入与通讯语音搜索内容用户可通过自然语言发出语音指令完成搜索，提升搜索效率，降低操作门槛，适用于多种搜索场景。语音客服自助服务语音客服系统通过自动语音应答提供引导服务，实现基础业务的自动闭环处理，还能识别客户语音中的多维信息，提供个性化服务。实时通话转录在客户与人工客服的实时通话过程中，语音识别系统能够将通话内容即时转录为文字，为客服人员提供辅助，提升服务效率。0102每个人的生活习惯和需求都有所不同，语音输入技术能够根据用户的个性化需求，提供定制化的智能家居服务个性化的语音服务02智能语音助手不仅能够识别并执行用户的语音指令，还能够通过学习和分析用户的使用习惯，为用户提供更加智能化的服务。智能语音助手03语音输入技术在智能家居控制中的应用不仅限于简单的指令执行，更能够实现场景化的控制。场景化的语音控制01智能家居语音输入技术还能够实现智能家居设备与其他智能设备的联动。与其他智能设备的联动04车载系统驾驶者可通过语音指令控制车载系统，避免因操作设备而分心，提高驾驶安全性。安全驾驶的得力助手车载系统中的语音助手能处理复杂任务，如拨打电话、发送短信、查询天气等，还能根据驾驶者意图提供相应服务。多功能的语音助手12每个人的驾驶习惯和喜好都有所不同，车载系统也需要具备一定的个性化和适应性。通过语音输入技术，车载系统能够学习和适应驾驶者的使用习惯，并提供定制化和个性化的服务。个性化和适应性通过语音输入技术，驾驶者可以轻松地控制家中的智能家居设备，如打开家中的空调、照明设备等。这种联动不仅提高了生活的便利性，也使得驾驶者与家居环境的互动更加紧密。与其他智能设备的联动34实验案例：任务说明💡实验目标本次实验包含两个核心任务，旨在将理论知识应用于实战，深入掌握语音识别技术应用。📋任务详情1上课录音转文字目标：通过语音识别平台，体验实时录音转写与音视频文件转文字的完整流程。2智能语音识别目标：在AI训练平台上完成语音数据采集、模型训练与测试，理解语音分类的整体流程，并能分析影响AI准确性的环境因素。谢谢机器讲你知素养目标技能目标知识目标能够利用自然语言处理技术完成与计算机的沟通；能够结合自然语言处理和专业背景提出创新性应用思路。理解自然语言处理的定义。；了解自然语言处理模型的演变历程；熟悉自然语言处理的主要技术。树立民族自豪感，坚持民族自信；培养社会责任感和职业道德；促进爱国情怀和科技自强决心。学习目标自然语言处理旨在使机器理解、解释并生成人类语言，实现人机之间有效沟通，使计算机能够执行语言翻译、情感分析、文本摘要等任务。1.2.3.自然语言处理概述自然语言处理的演变历程自然语言处理的主要技术4.

自然语言处理的应用场景目录01自然语言处理概述自然语言处理（NaturalLanguageProcessing，NLP）使机器理解、解释并生成人类语言，实现人机之间有效沟通，是机器语言和人类语言之间沟通的桥梁。自然语言处理的定义自然语言处理概述自然语言处理广泛应用于翻译、问答系统、语音助手、情感分析等领域，为人们的生活和工作带来极大便利。如今，NLP的发展使得人机交互更加自然和高效，极大地改善了我们的科技体验。自然语言处理的应用前景02自然语言处理模型的演变历程数字图像成像过程数字相机通过镜头、感光传感器等将模拟图像信号转换为数字图像信号，再经图像处理器压缩存储，完成图像的数字化。PART02自然语言处理模型的演变历程早期智能模型早期自然语言处理依赖人工编写规则，如词法、句法规则，处理简单语言现象，但难以应对复杂语言问题。应用场景情感分析工具系统通过统计“垃圾邮件”中常见的词汇（如“免费”“中奖”）来判断邮件是不是垃圾邮件。它们利用关键词的出现概率，对邮件进行简单的分类。系统通过统计“垃圾邮件”中常见的词汇（如“免费”“中奖”）来判断邮件是不是垃圾邮件。它们利用关键词的出现概率，对邮件进行简单的分类。垃圾邮件过滤器数字图像成像过程数字相机通过镜头、感光传感器等将模拟图像信号转换为数字图像信号，再经图像处理器压缩存储，完成图像的数字化。PART02自然语言处理模型的演变历程词向量模型

词向量模型（WordEmbeddingModel）将语言中的每一个词映射为一个稠密的、低维的向量（实数向量），这样模型可以更好地“理解”词与词之间的语义关系。如“猫”“狗”“动物”在词向量空间中接近，表示语义相似性，为模型处理语言提供数学基础。应用场景短视频标签推荐假设你上传了一段关于“烘焙”的视频，系统可以自动生成相关标签，如“蛋糕”“甜品”以及“烘焙教程”，因为它能理解“烘焙”和“蛋糕”之间的关系当你在搜索引擎中输入“如何养猫”时，系统不仅能输出相关内容，还能推荐“幼猫喂养指南”这样的相关内容，因为“猫”和“幼猫”在词向量空间中的距离很近。智能搜索数字图像成像过程数字相机通过镜头、感光传感器等将模拟图像信号转换为数字图像信号，再经图像处理器压缩存储，完成图像的数字化。PART02自然语言处理模型的演变历程深度学习模型

随着深度学习的引入，NLP模型开始能够处理更复杂的语言任务。就像我们学外语时，能将单词、语法与上下文联系起来，理解语言中的多义性和上下文之间的联系。应用场景语音输入法即使你使用带有方言的语音输入，如“俺想吃饺子”，系统也能够识别并将其准确转写为标准文字，因为它能够结合上下文理解语音的含义如果你询问“订单多久到货？”，系统不仅可以检索订单信息，还能够结合历史数据进行推理，给出准确的回答“预计明天下午送达”。智能客服数字图像成像过程数字相机通过镜头、感光传感器等将模拟图像信号转换为数字图像信号，再经图像处理器压缩存储，完成图像的数字化。PART02自然语言处理模型的演变历程Transformer模型

Transformer模型在多个任务上都能达到超人级别的表现，因其能够通过大规模预训练学习到语言的深层次规律。目前最常用的机器翻译模型是Transformer模型，它可以实时翻译对话甚至识别口音应用场景智能写作助手当你输入“写一篇关于环保的演讲稿”时，GPT能够根据你的需求，自动生成完整的文章结构，甚至包括引言、论点和结论想象一下，在一场中英文混杂的国际会议上，系统能够实时翻译与会者的讲话，甚至能够处理不同的口音和方言。实时翻译03自然语言处理的技术自然语言处理的技术0102基础技术高级技术（1）词语拆解（2）句法解析（3）语义理解（1）上下文推理——让机器“不健忘”（2）文本生成——机器的“写作课”自然语言处理的技术0304情感与交互技术学习技术（1）情感分析——判断“好评”还是“差评”（2）对话系统——24小时在线的“智能助手（1）监督学习——“开卷考试”（2）无监督学习——“自己找规律”03.01.02.词语拆解1）分词：把句子“切”成一个个词语。例如，“我想吃火锅”就变成了“我/想/吃/火锅”这样的分词组合。2）词性标注：给每个词贴上“身份标签”，就像给每个同学贴上不同的角色标签一样。例如，“小猫在沙发上睡觉”，给每个词贴上标签后就是“小猫（名词）、在（介词）、沙发（名词）、上（方位名词）、睡觉（动词）”句法解析句法解析是机器的“语法老师”，它教会计算机如何拆分句子的主谓宾结构，让机器能识别“谁在做什么”。语义理解（1）多义词消歧：就像“苹果”在不同场景中的含义不同，机器必须根据上下文判断词义。例如，在“苹果股价上涨”中，“苹果”指公司；而在“苹果富含维生素”中则指水果。（2）命名实体识别：就像在文章中“划重点”一样，用于识别文本中的人名、地名等实体。例如，“马斯克宣布特斯拉将在上海建厂”的重点是人名（马斯克）、品牌（特斯拉）、地名（上海）。基础技术01.02.上下文推理——让机器“不健忘”1）指代消解：就是解决“它”“他”“这里”指代什么的问题。例如，“小王买了一本书，他今天读完了它”，机器要能知道“他”指的是小王，“它”指的是书，这样才能准确理解句子的意思。2）话语分析，就像理解聊天记录中的“潜台词”。例如，用户问：“你们几点下班？”，表面是在问时间，其实可能是在关心“我现在是否还能过来办理业务”。文本生成——机器的“写作课”1）摘要生成：把长文变成“金句”。类似我们读了一篇很长的故事，然后用自己的话把这个故事的主要内容简单说一下。2）机器翻译：打破语言壁垒的“同声传译”。例如，我们出国旅游时，用翻译类的APP拍下菜单，它能实时显示“Sushi→

寿司”。3）故事创作：AI充当“编剧助手”。例如，输入“侦探在雨夜发现一封信……”AI就能根据这个开头续写破案过程，它就像一个有创意的小助手，帮助我们创作出有趣的故事。高级技术01.02.情感分析——判断“好评”还是“差评””1）情感分类：就像给评论“贴表情包”，让机器一眼就能看出评论是正面的还是负面的。例如，分析评论“这手机续航太差了！”，机器就会给它贴上“负面”的表情包标签。2）情感强度分析：不仅能判断出情感的好坏，还能区分情绪的强烈程度，就像我们能听出别人是有点生气还是非常愤怒一样。对话系统——24小时在线的“智能助手”1）问答机器人：“活的百科全书”，不管我们问什么问题，它都能给出答案。例如，询问“如何做番茄炒蛋？”，AI不仅会回复详细的步骤，还会提供视频链接。2）聊天机器人：“贴心客服”，能帮助解决各种问题。例如，淘宝客服机器人，可以帮助查订单、退换货，还会用“亲”开头来拉近和用户的距离，让用户感觉更亲切。情感与交互技术03.深度学习——“复杂任务专家”01.02.无监督学习——“自己找规律”监督学习——“开卷考试”

监督学习是一种通过带标签（答案）的数据训练模型的方法。模型通过比较预测结果与真实标签的差异，逐步调整参数以减少误差。其数学本质是优化损失函数（如交叉熵、均方误差），使模型输出逼近真实分布。

例如，用标记好的“垃圾短信”（广告、诈骗）和“正常短信”来训练分类器，这样机器就能学会区分垃圾短信和正常短信了。无监督学习不使用标签数据，而是通过聚类、降维等方法发现数据的内在结构和规律。其核心任务是挖掘潜在模式。例如，通过词频统计发现主题分布或通过用户行为聚类划分兴趣群体。深度学习通过多层神经网络模拟人脑的层次化信息处理机制。其核心优势在于自动提取高阶特征。例如，从原始语音信号中逐层提取音素、词汇到语义信息。自然语言处理的学习技术典型应用场景核心价值什么是多模态技术？

多模态技术是人工智能领域的革命性突破通过融合视觉、听觉、文本等多源信息赋予机器接近人类的综合感知与推理能力

例如，用标记好的“垃圾短信”（广告、诈骗）和“正常短信”来训练分类器，这样机器就能学会区分垃圾短信和正常短信了。"耳眼并用"的综合感知能力从"单一感官"→"全感官"从"工具"→"伙伴"

智能相册检索

语音："帮我找手机照片里的狗狗"↓

听懂指令+扫描图片+识别宠物↓

快速定位目标照片未来智能家居

摄像头

→

识别手势

麦克风

→

接收语音

温度传感器

→

感知环境↓

综合判断，精准服务技术技术前沿：多模态技术——让机器拥有"全感官"

04自然语言处理的应用场景01语音助手技术特点理解人类语言语音识别和生成上下文感知自我学习与改进0203语音助手技术流程（1）语音输入（2）语音识别（3）自然语言理解（NLU）（4）对话管理（5）自然语言生成（NLG）（6）语音合成（TTS）（7）输出回应语音助手的应用语音助手广泛应用于信息查询（如天气、新闻、百科）、生活服务（如闹钟、日程、购物）、智能家居控制（如灯光、家电、安防）、车载交互（如导航、音乐、通话））等场景，通过语音理解和执行命令，为用户提供高效、便捷、自然的操作体验。语音助手机器翻译的技术特点多语言支持、高效快速、持续改进、上下文理解、定制化翻译010203机器翻译机器翻译的技术流程（1）文本输入（2）语言检测

（3）文本预处理

（4）翻译模型应用

（5）语言生成

（6）后处理

（7）输出翻译结果02（1）文本输入（2）文本预处理（3）特征提取（4）情感分类（5）情感强度评估（6）结果展示（7）反馈与调整技术流程02情感分析广泛应用于舆情监测与品牌管理、客户反馈分析、市场调研、金融情绪预测、娱乐推荐以及心理健康监测等领域，通过对用户情绪的自动化识别与分析，帮助企业、机构和个人更精准地理解公众态度并做出相应决策应用场景031）情感识别2）多语言支持3）实时分析4）细粒度情感分析5）自我学习与改进技术特点01情感分析技术特点自动、高效分类；多类别支持；自我学习与改进；多语言处理；可扩展性强技术流程（1）文本输入（2）文本预处理（3）特征提取

（4）模型训练（5）模型验证与优化（6）文本分类（7）结果输出（8）持续学习与更新应用场景文本分类是一种利用自然语言处理和机器学习技术，将文本自动归入预设类别的技术，广泛应用于垃圾邮件过滤、新闻分类、舆情监测、客服工单自动分配、法律文书归档、学术论文主题识别、社交媒体内容审核等场景，通过快速准确地为海量文本打上标签，提高信息处理效率并支持自动化决策。010302文本分类实验案例：任务说明实验目标本次实验包含两个核心任务，旨在将NLP理论知识应用于实战，深入掌握自然语言处理技术的实际应用能力。任务详情1智能情感分析目标：理解文本分类、特征提取、模型训练的基本流程，能够构建简单的情感分析模型，判断文本情感倾向。2智能对话机器人目标：理解意图识别、实体抽取、对话管理的整体流程，能够搭建简单的问答系统，实现基础的人机交互。图像的压缩数字图像和视频数据中存在着大量的信息冗余和主观视觉冗余，因此图像的压缩是必要的，也是可能的。PART02本章小结本章首先介绍了自然语言处理的定义和发展历程，然后阐述了自然语言处理的主要技术，接着讲解了自然语言处理在语音助手、机器翻译、情感分析、文本分类等多方面的典型应用，帮助读者理解自然语言处理技术在实际生活中的广泛应用价值。谢谢第6章人工智能的发展趋势素养目标技能目标知识目标能够分析人工智能与其他领域（如医学、金融学）相结合的应用价值；能结合具体案例分析人工智能安全伦理问题。了解人工智能重点产业；了解人工智能技术与应用发展趋势；熟悉熟悉我国人工智能发展规划、国家重大的政策导向及法规；了解人工智能的安全与伦理问题。增强民族自豪感，厚植家国情怀；提升信息安全意识，培养遵纪守法和道德规范的自觉性；坚定文化自信自强，增强使命感与责任感。学习目标人工智能是新一轮科技革命和产业变革的重要驱动力量，以生成式人工智能为代表的新一代人工智能问世，改变了人工智能技术与应用的发展轨迹，加速了人与AI的互动进程，是人工智能发展史上的新里程碑。末来，人工智能技术与应用的发展又会呈现出哪些趋势？1.2.3.人工智能产业生态人工智能重点产业及发展趋势我国人工智能发展规划4.5.人工智能的安全人工智能的伦理目录6.人工智能伦理法律体系建设01人工智能产业生态主要可分为智能基础设施、智能信息及数据、智能技术服务、智能产品等方面。主要有软件产品开发、信息技术咨询、电子信息服务、信息系统集成、互联网信息服务、集成电路设计、电子计算机、电子元器件等。核心业态关联业态主要有智能制造、智能家居、智能金融、智能教育、智能交通、智能安防、智能医疗、智能物流等细分行业。衍生业态《人工智能标准化白皮书（2018）》中，把人工智能产业生态分为三个层次核心业态关联业态衍生业态02人工智能重点产业智能基础设施智能基础设施是支撑人工智能产业发展的基石，它提供了数据及算力资源，主要包含传感器、AI芯片、数据服务和云计算服务。PART01智能技术智能技术是人工智能行业发展的核心驱动力，侧重核心技术的研发，主要包括深度学习框架、算法模型开发以及人工智能平台。主要涉及的技术包括计算机视觉、机器学习、语音处理及自然语言处理等。PART02智能应用智能应用是建立在基础设施层与技术平台层的基础上，结合大数据和分布式计算技术生成针对各行各业的解决方案，解锁行业的人工智能应用场景，是人工智能技术与各行业的深度融合。智能应用细分领域众多、交叉性强，呈现出相互促进、繁荣发展的态势。PART03人工智能重点产业主要包含三个方面ep技术平台开源化通过技术平台开源化，可以扩大技术规模，整合技术和应用，有效布局人工智能全产业链，是抢占产业制高点的重要手段。谷歌、百度等国内外龙头企业纷纷布局开源人工智能生态，未来将有更多的软硬件企业参与开源生态。PART01多模态模型加速文本、图像和视频融合多模态模型能够处理视觉信息、文本信息、听觉信息等多元化数据，能够对不同表现形式的信息进行融合理解，是人工智能全面理解真实世界的重要一步。未来模型将面对更加复杂多样化的交互场景，更加注重各种形式的信息融合。PART02人工智能技术发展趋势阿里云通义千问大语言模型2025年1月20日，中国人工智能企业深度求索（DeepSeek）发布的开源模型DeepSeek-R1，犹如一颗投入平静湖面的巨石，在国际上激起千层浪。DeepSeek以开源思维挑战AI行业的传统路径，展现了中国人工智能技术的巨大潜力，其使用的算力能够远低于全球平均水平，还可以免费使用，而且是开源的，打破了美国对AI话语权的垄断。具身智能成为AI发展新形态具身智能是指一种使机器能够通过感知、理解和模仿人类动作的能力，这种智能不仅仅局限于机器的思维和计算能力，而是注重于机器能够像人类一样感知和交互的能力。它包含人工智能领域几乎所有的技术，是人工智能的集大成者。PART03走向通用人工智能的途径愈发明晰通用人工智能是一种可以执行复杂任务的人工智能，能够完全模仿人类智能的行为，能够执行任何人类智能活动的计算机系统。不需要人为干预就可以解决任何问题，它被认为是人工智能的更高层次。通用人工智能时代可能很快就会到来，未来十年内行业可能会拥有超强的AI系统。PART04人工智能技术发展趋势2025年央视春晚《秧BOT》2025年春节联欢晚会上，杭州宇树科技的H1人形机器人在舞蹈《秧BOT》中亮相，H1是首款能原地后空翻的电驱动人形机器人。该机器人目前最快速度为每秒3.3米，预计到2025年年底能达10米每秒，甚至超越人类跑步世界纪录。未来随着技术的不断突破和成熟，人形机器人或将在一两年后为工厂自动化、家庭带来更多可能性。脑机接口创造新的交互方式脑机接口，是在人或动物大脑与外部设备之间创建的直接连接，实现脑与设备的信息交换。脑机接口技术可以用于帮助瘫痪患者恢复行走、说话等功能；可以用于帮助盲人、聋人感知周围环境。PART05人工智能技术发展趋势“脑机融合智能辅助机械手系统”抓取饮用水瓶01.大语言模型将成为个人智能助理和新一代的流量入口随着大模型能力的不断增强以及插件生态的不断丰富，大模型有望成为新一代的人机交互方式以及流量入口。GPT-4正在逐步开放插件功能，通过底层模型连接第三方应用，从而构建丰富的生态系统。GPT-4自插件功能开放以来，目前已经接入超过500个插件，其中包括教育、金融等场景。人工智能应用发展趋势GPT-4构建的应用生态02.专业数据与成本驱动行业模型百花齐放大模型在垂直领域的商业化落地过程中，需要根据企业自身的特殊需求，对大模型进行微调和优化，从而形成了百花齐放的格局。企业端应用出于对模型的经济性考量，未来将呈现阶梯式需求。人工智能应用发展趋势大模型多层级结构05.03.04.降低应用成本，带动大模型端侧算力发展当前人工智能的使用成本十分高昂，ChatGPT每天消耗50万千瓦时的电力，英伟达B200芯片价格高达3万美元以上。随着大模型小型化、场景化需求增加，推理将逐步从云端扩展向端侧，用户可以更加经济、可靠、安全的使用AI服务，大模型端侧的应用布局不断加速。改写劳动力市场的未来大模型的应用带来劳动力市场结构的调整和变化。短期而言，可能替代部分低技能或重复性工作；中期来看，大模型也将创造新的人工智能相关就业机会；长期来看，大模型的应用将会深度改变各行业的工作模式和商业模式，让企业的组织架构更加扁平化和小型化。重塑科研范式人工智能与前沿科学的结合展现出了巨大潜力，可显著降低前沿科技研究中的智力成本并提升研究效率。生命科学、气象预测、数学、分子动力学等前沿科学均得到了人工智能的广泛助力，人工智能将带来科研范式的变革和新的产业形态。人工智能应用发展趋势03我国人工智能发展规划

2020年8月，为加强人工智能领域标准化顶层设计，推动人工智能产业技术研发和标准制定，促进产业健康可持续发展，国家标准化管理委员会、中央网信办、国家发展改革委、科技部、工业和信息化部五部门印发了《国家新一代人工智能标准体系建设指南》。

人工智能标准体系结构包括“A基础共性”、“B支撑技术与产品”、“C基础软硬件平台”、“D关键通用技术”、“E关键领域技术”、“F产品与服务”、“G行业应用”、“H安全/伦理”等八个部分。我国人工智能标准体系结构人工智能标准体系架构

2023世界人工智能大会（WAIC）“聚焦·大模型时代AIGC新浪潮论坛”上，中国信息通信研究院《2023大模型和AIGC产业图谱》正式发布。

图谱整体上包含行业应用，产品服务，模型与工具和基础层四个主要部分，图谱深入梳理了大模型和AIGC产业链上下游发展状况，详细展示了大模型和AIGC产品分类及分布态势。我国人工智能标准体系结构中国信通院《2023大模型和AIGC产业图谱》到2020年，人工智能总体技术和应用与世界先进水平同步，人工智能产业成为我国新的重要经济增长点，技术应用成为改善民生的新途径。到2025年，人工智能基础理论实现重大突破，部分技术与应用达到世界领先水平，人工智能产业成为带动我国产业升级和经济转型的主要动力。到2030年，人工智能理论、技术与应用总体达到世界领先水平，我国成为世界主要人工智能创新中心。010302新一代人工智能发展规划2017年7月，国务院印发了我国第一个人工智能规划——《新一代人工智能发展规划》。这份具有里程碑意义的规划，对人工智能发展进行了战略性部署，确立了“三步走”目标，力争到2030年把我国建设成为世界主要人工智能创新中心。构建开放协同的人工智能科技创新体系，从前沿基础理论、关键共性技术、创新平台、高端人才队伍等方面强化部署。01培育高端高效的智能经济，发展人工智能新兴产业，推进产业智能化升级，打造人工智能创新高地。02建设安全便捷的智能社会，发展高效智能服务，提高社会治理智能化水平，利用人工智能提升公共安全保障能力，促进社会交往的共享互信。03新一代人工智能发展规划加强人工智能领域军民融合，促进人工智能技术军民双向转化、军民创新资源共建共享。04构建泛在安全高效的智能化基础设施体系，加强网络、大数据、高效能计算等基础设施的建设升级。05前瞻布局重大科技项目，针对新一代人工智能特有的重大基础理论和共性关键技术瓶颈，加强整体统筹，形成以新一代人工智能重大科技项目为核心、统筹当前和未来研发任务布局的人工智能项目群。06新一代人工智能发展规划

美国斯坦福大学发布的《2023年人工智能指数报告》显示，我国人工智能领域发表论文数量居首位，在发表论文总量世界前十的机构中，我国共占九席。高水平论文被引用量与美国的差距进一步缩小，腾讯、阿里巴巴和华为等公司已经成为人工智能研究领域排名进入世界前十的公司。

百度、阿里巴巴、华为、字节跳动、腾讯、小米、科大讯飞、三六零、京东、医渡科技分别为我国人工智能行业龙头企业。从地域来看，我国人工智能企业主要集中在北京市、上海市、广东省、浙江省，形成京津冀、长三角、粤港澳三足鼎立的格局。

我国人工智能核心产业规模2021年突破4000亿元，比2019年增长6倍多，2023年达5787亿元，企业数量超过4400家，已建设近万个数字化车间和智能工厂。2023年我国数字经济核心产业增加值占国内生产总值比重达10%，提前实现《“十四五”数字经济发展规划》的2025年发展目标。新一代人工智能发展规划人工智能技术与智能计算产业正处于中美科技竞争的焦点，我国在过去几年取得了很大的成绩，但依然面临诸多发展困境，特别是由美国的科技打压政策带来的困难。美国在AI核心能力上长期处于领先地位，中国处于跟踪模式；高端算力产品禁售，高端芯片工艺长期被卡；国内智能计算生态孱弱，AI开发框架渗透率不足；AI应用于行业时成本、门槛居高不下。我国应发展用得起、安全可信的人工智能技术，消除我国信息贫困人口、并造福“一带一路”国家；低门槛地赋能各行各业，让我国的优势产业保持竞争力，相对落后的产业能够大幅地缩小差距。2025年初，以宇树科技、深度求索等人工智能企业为代表的“杭州六小龙”爆火出圈，被外界称为“神秘的东方力量”。在人工智能这一科技新赛道，我国已经显示出引领时代浪潮的全新气象。新一代人工智能发展规划04人工智能的安全人工智能技术需要大量的数据来进行训练和学习。这些数据可能包括个人的生活习惯、消费行为、位置信息等敏感信息。如果这些数据被不当收集或滥用，将对个人隐私造成严重威胁。人工智能应用中的数据源于许多方面，用户个人在智能应用软件中输入和提供的数据资料，都可能成为人工智能应用中被监控的部分，构成对用户自身完整的行为勾勒和心理描绘，用户很难在此情况下保护自己的个人隐私。数据采集过度网络安全漏洞或内部人员恶意泄露，大量用户的数据可能会落入不法分子手中。即使数据被加密存储，也有可能被黑客攻击并解密。一旦数据被泄露，可能会被用于进行精准营销、针对性广告

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能通识 课件全套1-8 人工智能引论 - 生成式人工智能-

文档简介

温馨提示

最新文档

评论

相关文档

人工智能通识课件全套1-8 人工智能引论 - 生成式人工智能-