中国数字人发展报告(2024)电子版_第1页
中国数字人发展报告(2024)电子版_第2页
中国数字人发展报告(2024)电子版_第3页
中国数字人发展报告(2024)电子版_第4页
中国数字人发展报告(2024)电子版_第5页
已阅读5页,还剩146页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国数字人发展报告(2024)中国互联网协会主编单位中国互联网协会主编武锁宁副主编裴玮执行编辑周妹妍李金穗赵冀昌李景亚参编人员(按姓氏拼音排序)杜冀中高子晗郭晚平郭子淳黄金贾晓博简伟华李韩李胜菊裴志刚吴燕吴庆才伍穗颖武亚强熊伟杨丹张力军张平张顺四张晓平参编单位(排名不分先后)中国互联网协会网络文化与数媒工作委员会中国互联网协会人工智能工作委员会中国信息通信研究院工业互联网与物联网研究所中国信息通信研究院安全研究所中国传媒大学数字人研究院北京快手科技有限公司北京百度网讯科技有限公司央视国际网络有限公司北京智谱华章科技有限公司联通在线信息科技有限公司中电信人工智能科技有限公司中国电信股份有限公司四川分公司二六三网络通信股份有限公司中关村互联网教育创新中心广州凡拓数字创意科技股份有限公司中国移动通信集团天津有限公司北京元客视界科技有限公司广州趣丸网络科技有限公司北京中网易企秀科技有限公司南京汇智互娱网络科技有限公司前言的发展前景正成为备受关注的焦点。技术和培育新业态作为重要的职责和使命。2宙热潮兴起之初,尚冰理事长主持召开元宇宙的机遇与挑战等研讨会,协会咨询委员会主任、原理事长邬贺铨院士多次发表网络趋势的洞察分析报告。在协会领导和专家咨询委员会的指导及协会秘书处的推动下,协会组织政产学研用资等各方,展开了广泛的调研和二十多次座谈研讨,对中国数字人的发展趋势形成初步共识:成本低、应用广的数字人不仅是元宇宙创新的高效切入口,数字人也是人工智能亲和、便捷的理想入口,或将成为发展已在数媒、服务、行业领域循序渐进全面启动。中国数字人的创新发展,在有关部门的关心指导下,在业界权威机构和领先企业的深入参与下,协会专题组特撰写发表 一、数字人异军突起引领网络创新 3(一)数字人定义和内涵正在更新换代 3(二)数字人在元宇宙起落中脱颖而出 5(三)数字人切入降低元宇宙成本压力 7(四)数字人技术演进带来功能大提升 9(五)数字人或成为下一代互联网窗口… 二、人工智能技术是数字人创新的引擎 (一)四大模因构建数字人的基本板块 (二)智能工具加快四大板块制作效率 (三)智能技术驱动四大模因交互贯通 (四)大模型创造多模态智慧生成能力 (五)呈现技术进一步释放数字人潜能 三、数字人应用已经有序展开 (一)应用是数字人创新的"起落架"… (二)数字人应用领域正在迅速拓展 (三)应用数字人逐步形成三类属性 (四)数字人应用呈现循序渐进规律 (五)数字人正随要素变化叠加演进 四、中国数字人产业正全面加速 (一)数字人产业进入规模化发展阶段 (二)算力算网设施加速布局和追赶 (三)各类数字人大模型进入迭代进程 (四)安全保障相关建设引起各方关注 (五)三类应用正全面进入叠加发展期 五、推进数字人发展的对策倡议 (一)高度重视数字人全局价值 (二)引导数字人产业集约发展 (三)积极推动数字人应用演进 (四)双管齐下打造数字人保障体系 (五)营造数字人协同创新生态 附录1:《中国数字人应用场景荟萃(2024)》 附录2:《中国数字人产业生态图谱(2024)》 附录3:数字人典型案例集 引言潮流。数字人的崛起不仅突破了元宇宙领域的发展困境,也标志着人工智能应用的重大突破。数字人的定义和内涵经历了不断的更新换代,从最初的虚拟角色到高度拟人化智能体,其发展历程体现了科技进步与应用需求的双重推动力。数字人兴起之初伴随着元宇宙的热潮而引发广泛关注,但元宇宙的宏大构想也面临着巨大的成本压力和商业模式的不确定性。在技术、成本和商业模式等多方面的挑战下,数字人成为应对这些挑战的创新突破口,展示了其在降低技术成本、提升用户体验等方面的独特优势。数字人不仅能在虚拟世界中模拟人类的行为和情感,还能通过技术演进显著提升其功能,实现更加自然和沉浸式的交互人工智能技术的进步是推动数字人创新的关键因素。四大模因(形模因、声模因、行模因和神模因)构建了数字人的基本板块,智能工具的应用大大加快了这些板块的制作效率。人工智能技术的不断发展,尤其是生成式人工智能的突破,使得数字人在交互和表现上都达到了前所未有的水平。数字人的潜能。技术的进步不仅提升了数字人的功能,使其在更多领域中得到有效应用,从虚拟助理到数字营人应用的广泛性和多样性正在逐步形成。现阶段,中国数字人产业发展已进入全面突破时期。随着数字人产业的规模成熟,数字人实现工厂化制作,AIGC数字人生成及服务实现平台化,算力和网络设施在加速布局支持数字人广泛落地,各类数字人大模型的迭代进程也在不断推进。在各级政府及社会各界的支持下,为数字人产业的发展提供了坚实的政策保障。中国数字人应用已经从早期的探索阶段进入全面叠加的发展期,数字人应用类型从媒介人到服务人到行业人不断叠加演进。根据艾媒咨询数据显示,2023年中国数字人带动产业市场规模和核心市场规模分别为3334.7亿元和205.2亿元,预计2025年分别达到6402.7亿元和480.6亿元,呈现出蓬勃发展的态势。泛的应用前景和巨大的市场潜力,需要高度重视其全局价值,全和应用仍面临诸多挑战,亟需解决技术成本高、商业模式字人安全发展保障,营造协同创新的生态环境,推动数字人产业的健康可持续发展。2、数字人异军突起引领网络创新数字人的酝酿和积累已有二十年,目前正随人工智能两个风口的兴起及人们对下一代互联网的探索而异军突起。(一)数字人定义和内涵正在更新换代所熟知并广泛关注的数字人与早期概念相比发生了本质变化。今天我们所讨论的数字人被赋予了人工智能时代的形态和内涵,其定义上实现了新飞跃。1.数字人的新定义数字人(DigitalHuman)是通过多种数字智能技术创建,具备人类外观形象、声音语言、肢体动作与思维功能等特征的数字智能体。技术层面,数字人通过数字建模手段实现,度学习等多项技术的综合运用,呈现于以视频、程序等为载体的数字虚拟空间中。2.数字人形态不断发展丰富近年来,在人工智能技术的驱动下,数字人概念和外延不断拓宽。经过技术迭代,数字人的主流形态正在从卡通人还将形成形态多样、功能丰富的数字智能体(AIAgent)。卡通人:卡通人是数字化时代最早的产物之一,它们是通过计算机图形学创建的数字形象,用于电子游戏、动画动3漫等二次元世界中的角色扮演,形象拟人但形态相对简化、表现形式相对夸张。仿真人:仿真人比卡通人在形象、动作和声音上更贴近音语调使其具备了更强的表现力,广泛应用于各类生活和工虚拟人:虚拟人是基于传播、代言、娱乐等某种社会需求,通过技术手段设计、创作、虚构出来的机构代表或个人化身。虚拟人主要由人类创作和设定,创作者或委托机构对其拥有知识产权。数字技术手段等身量制而成的,可以代表本人行使其委托的社会职责和社会职能。数字智能体(AIAgent)具备自主学习、决策和管控能力,可以在千行百业中执行复杂任务,被视为数字人的高级形式。与其他数字人不同,数字智能体弱化了对人类外形的模拟,通常以语音助手或聊天机器人形式存在,专注于处理互性等高阶特征,也被称为数字代理,借助于人工智能技术检索和任务管理等高级智能的服务。结合数字人高度的拟人化特征和AIAgent对人类思维和行为的高度模仿,数字人用作咨询顾问、数字员工等场景的4实用价值更大,提供更具沉浸感的用户体验,共同推动了人工智能和虚拟技术的进步,改变了人机互动的方式。二)数字人在元字宙起落中脱颖而出数字人的革新得益于元宇宙的兴起。元宇宙的概念经过三十年发展,在小说、游戏和电影中不断尝试探索,于2021年迎来爆火。但是元宇宙的构想过于宏大,受到成本压力和商业模式的限制,经历了起起落落,在此过程中数字人脱颖1.全球元宙的发展历程以数字化身份"阿凡达"生活、工作和娱乐。2003年,在线游戏《第二人生》让元宇宙的理念从小说走向现实,玩家能够创建虚拟角色、建造家园并进行交易。2018年电影《头号玩虚拟世界,将其变成了现实的延伸。产业分析机构sensorTower报告显示,自2019年起,美国的元宇宙游戏下载量领先全球.2019年,沙盒游戏《Thesandbox》引入区块链技术,将游戏中的物品和土地转化为独特的NFT,引发广泛关注。2021年,元宇宙大型平台Roblox上市首日股价上涨54%,公司估值超过450亿美元。紧接着,脸书 (Facebook)宣布转型为元宇宙公司,并改名为Meta。这些5RealityLabs部门在2022年出现巨额亏损,证明了运营和维护成本的高昂。虚拟场景制作成本远高于传统视频拍摄,虽然技术有提升,但制作一个虚拟场景的费用仍是普通视频拍摄的10倍以上。商业模式尚未成熟,尽管游戏和电影领域有一些成功案例,但难以复制。Roblox通过虚拟货币构建了一个完整的商业体建立,商业变现模式不明确,某些早期商业模式已被证伪。例如,NFT交易量的急剧下降以及高达95%的NFT价值归零,显示出商业模式的脆弱性。元宇宙的产业发展需要长期的技术积累、市场培育和商业实践,才能实现可持续增长。数字人切入降低元宇宙成本压力字人结合低成本的视频、绿幕等背景,制作起来省时省力。同时,作为万物之灵的人的化身,数字人的创新可以说是画小投入获得大效果,可以消化解决成本高昂的问题。1.切口小可大幅缩小范围降低成本空间的面积上"人"是很渺小的,制作一个数字的视频大小仅是元宇宙场景中的一小部分,所占用的资源少;7规模化复制上,与变幻多样的元宇宙场景相比,人的特征趋同,都是五官和四肢,因此流程和技术在成熟后可以快速规模化。成本有限的情况下选择数字人切入,即使在同等精细化程度的情况下,数字人的开发与创新成本仅是元宇宙中很小的一部分。2.数字人与场景模板高效结合目前主流的数字人制作方式分为2D数字人和3D数字人。人工智能技术尤其是生成式AI的参与,使具有低代码特征的数字人编辑、运营产品层出不穷,提高了数字人的制3D数字人的制作更精良,技术门槛较高,但随着实时渲染、动作捕捉等技术的升级,制作周期也相应缩短几倍,最短在棚录制技术、视频合成等,数字人背景环境的替换也十分便捷。在不少旅游景区,通过数字人和景区超高清视频相结合,展示多个慢直播点位,有了数字人交互的加入,能够全面生让观看者有身临其境之感。3.人是元宙的画龙点睛之笔8生动地演绎出风云变幻的历史画卷和世态炎凉的社会万象。数字人本身也是元宇宙的灵魂。元宇宙的瑰丽畅想中,虚拟场景是元宇宙的环境载体,而拟人化身(Avatar)是元宇90年代初,我国航天事业奠基人、人民科学家钱学森了解到 "virtualReality"(虚拟现实技术)时,将其取名为"灵境"。间。人是万物之灵,人机和谐离不开"人"的沉浸式参与。四)数字人技术演进带来功能大提升互联网协会基于对元宇宙和数字人发展的跟踪研究分析,认识到数字人在元宇宙创新中具有特殊的意义和价值。在2021年元宇宙兴起之初,协会发起了聚焦于数字人创新的"数字人精品秀"活动。通过对历届作品的对比研究分析,我们发现了数字人的创新速度日新月异,数字人技术演进带来功能的大提升。1.数字人作品的制作水平快速提升参展作品超过两百个,成为汇聚数字人创新力量,见证数字人应用发展的一道靓丽风景线。从四届数字人作品征集情况9例也逐年增多,需要内部择优提交。第一届富,应用场景更为广泛。数字人从简单的卡通形象到高度仿真的数字人,并开始向交互数字人转变。首届精品秀征集征集的数字人作品中,从80%为卡通人演进成80%为仿真人。仿真人的外观和行为变得更加接近真实人类,而且在语音、过90%为仿真人,部分作品因为接入了大模型,询功能,成为能够在多个专业领域提供智能服务的数字助手。2.数字人的效能得到了显著拓展数字人不再局限于简单的信息展示和基础互动,开始在更加复杂的应用场景中发挥作用。例如,企业名人争相打造事长杨杰通过"数实双生"的方式以数字人身份亮相并用英语发表演讲,后又在广州举办的中国移动全球合作伙伴大会字人带火了直播经济,大幅降低了商家直播的运营成本,并且实现24小时日不落播出,带来GMV(商品交易总额)的明显增长。数字人主播的人设定位丰富多样,有网红美妆、字人的效能得到了显著拓展。相关的企业114.4万家。今年,我国数字人相关企业数量大幅增加,仅2024年1~5月,又新增注册企业17.4万余家。信息技术服务业合计占比超6成,占据主流。数字人企业如五数字人或成为下一代互联网窗互联网的代际革命是基于交互方式的迭代更新而驱动随着数字人时代的到来,数字人有望成为新一代互联网的代表性界面和窗口,并成为拉动元宇宙乃至下一代互联网的 网页浏览器发明之前,人们需要通过编写代码的方式进行访能邀游互联网世界,交互便捷性大幅提升。特别是1995年微软推出了InternetExplorer浏览器,作为windows操作系统的一部分,从而迎来了PC互联网的时代。进入移动互联网时代,智能手机和移动应用成为主要的指一点,就能上网。2007年,iphone的问世被认为是移动互联网的起点。2010年左右,3G网络速率明显提升以及智能手机独有的操作系统和访问界面,让所有的互联网信息都需整个移动互联网的产业协作方式有了翻天覆地的变化。随时道。2.亲和可感的数字人是下一代互联网的理想入回顾互联网发展历史,界面演变的进程就是人机交互方式便可感的数字人将是比较理想的选择。12字人具有高度的定制化能力,可以根据用户的需求和喜好,提供个性化服务。此外,数字人集成了多种先进技术,实(VR)、增强现实(AR)、具身智能等终端技术的飞速发展,数字人将颠覆传统的屏幕互动模式,引领交互方式的革为连接人类与数字世界的桥梁,开启全新的交流和协作模式。2023年,比尔·盖茨提出AIAgent将彻底改变计算机使用方式,并颠覆软件行业,它将成为"下一个平台".openAI创始人兼CEOSamAltman在其首届开发者大会上预测,未来各行各业,每一个人都可以拥有一个AIAgent。数字人创新发展的前景成为全球行业共识。人人都拥有数字人"分身"来全新的互联网运行范式。人工智能是数智时代网络创新的主要动力。目前人工智能及多模态大模型创新是以类脑创新为主攻方向,数字人创新也是以人类仿真为主攻方向,二者技术关联度高。数字人13、人工智能技术是数字人创新的引擎技术创新是数字人创新的根本驱动力。数字人技术发展至今几十年,经历了20世纪80至90年代的技术基础奠定期、2010年前后的技术成熟与应用期、以及从2023年开始的人工智能大爆发及数字人技术飞跃期。数字人是通过形象、声音、行为及思维这四类数字技术制作完成的。在这四类技术发展进程中,人工智能技术起到决定性作用,是数字人创新的引擎。人工智能赋能的制作工具加快了数字人的生产效率,智能驱动提升了数字人各板块此,技术是数字人创新的关键、是风向标,决定发展象限。(一)四大模因构建数字人的基本板块借助模因论对数字人技术进行板块拆解,数字人在数字世界中呈现的形象、声音、行为及思维可统称为数字人技术的四大模因,构成了数字人制作的基本板块。1.形模因为分为2D和3D两类,二维为平面驱动式,制作简单;三维技术相对复杂,需要建模完成。早期数字人形象技术主要基14和硬件技术的进步,数字人技术开始进入三维时代。三维建模技术的发展使得数字人的外观更加立体和逼真,动作捕捉技术的应用也让数字人的动作更加流畅自然。声音是数字人传达信息的重要形式之一。声相关的子模因。数字人理解和生成语言的能力决定了数字人的交互水平,直接关系数字人的交互体验。声模因的核心技术包含语音合成(TTS)、语音识别(ASR)和自然语言处理 (NLP)等。语音合成技术是指将文本转换为语音,目前语音合成技术已经非常成熟。声音克隆技术上,最短只需要录语言选择上,能够支持不同国家的语种,针对不同语种可提力,可淋漓尽致地表达出喜怒哀乐等多种情感,带给用户极致的听觉体验,提高语音交互的自然度。3.行模因人行为交互能力的重要表现。行模因所涉及的技术主要包含字人的行为驱动主要有三类方式:动画驱动、真人驱动和智能驱动。数字人的行为呈现形态主要是视频,通过播放视频15展现丰富的肢体动作,如果需要进行互动则需要借助终端设备接收信号。终端设备主要有两大类,一是屏幕显示技术,二是立体显示技术。屏幕显示技术包含各类大、中立体显示技术包含裸眼3D、头戴设备等,可提供沉浸式三维观看体验。4.神模因神模因,即数字人的思维模因,包含抽象的逻辑思维、感性和理性的具象思维等多种形式。神模因与其他三类模因一样是数字人制作的基本技术模块,与大模型链接使其具备解决任何问题而不需要人为干预,是技术界追逐的方向,也是神模因的发展方向。以上四大模因技术相互协作,共同构成完整体系,使得数字人能够更加逼真和智能地模拟真实人类的行为和交流方式。(二)智能工具加快四大板块制作效率进入人工智能时代,数字人的"四大模因"技术也而上,其制作过程从一个复杂的、分阶段的任务演变成集成化、平台化及智能化的流水线作业,全面提质提效。三维建模作为形模因的核心技术之一,主要通过建模软件创建详细的脸部和身体模型,包括肌肉、皮肤和骨骼结构,使数字人的外观更加逼真。以往的三维建模工具如Maya、3dsMax等,需要设计师从。到1创建出具有复杂细节的数时需要考虑人物的比例、解剖学特征和美学元素,以确保数字人的外观尽可能接近真实人类。在智能工具的支持下,借助高精度扫描、面部融合等技术,以照片或视频来训练模型字人形象。同时对数字人的形象模型进行骨骼、表情的绑定以便于实现后续的智能驱动。2.参数合成法大幅优化语音合成作为声模因的核心技术之一,有了人工智能的加持,合成方法也有了大幅度的质效提升。目前语音合成有波形拼接法和参数合成法两类。波形拼接法,需要前期准备大量的语音素材,从中抽取合成所需要的基本单位如音节、的语音参数(包括基频、频谱、非周期性参数等),通过声码器把这些参数合成为波形。基于人工智能算法的声码器将得到的频谱图直接映射为波形。得益于人工智能尤其是深度学的音质水平。除了合成方法的升级,智能的语音合成工具还17互中有更好的情感状态识别力和表达力提供支持。3.智能驱动省时省力数字人行模因主要基于驱动技术实现,目前有三类驱动方式:动画驱动、真人驱动和智能驱动。个对象的所有节点属性包括位移、大小、旋转等进行人工设置来制作动画。创建动画时,动画师需要制作每个动画序列的起始帧、结束帧和关键帧,中间帧由计算机根据人体运动分析的原理来补充完成。真人驱动通过捕捉真实人类的动作和表情来直接驱动数字人,借助"中之人"穿戴的全身动作捕捉及面部捕捉设备,实时驱动数字人,能实现数字人的即兴表演和实时互动。动画驱动和真人驱动都需要耗费大量的人力和时间。智能驱动工具基于人工智能技术,训练数字人模型学习并模仿人类行为,还原人体运动各身体部位的参数映射关系,并基于用户反馈调整数字人的行为模式。有智能工具接入的数字人,不需要其他复杂的人力投入便可实时驱4.大模型为数字人"铸魂"早期数字人的神模因是人类主导设计的,例如游戏和电影中的数字人物,从外观形象、能力特征和人物性格都由主18之人"驱动完成。随着人工智能的发展,尤其是生成式人工随着垂类大模型的崛起,数字人在不同领域的思维能力逐步换。三)智能技术驱动四大模因交互贯通除了四大板块的制作效率提升,他们之间的交互驱动也在人工智能的加持下全面贯通。人工智能仿佛给数字人"请的整体。1.大模型充当"中枢神经系统"在人工智能技术深度参与之前,数字人四模因之间的交互较弱,各模因的前期制作相对独立,各板块设计完成后再智能大模型通过机器学习、深度学习、逻辑推理等算法调优体各处也就是数字人各模因的传入信息,整合加工后成为协调的运动反应传出。2.各模因交互贯通实现自然的情感表达以情感识别和表达为例,当数字人的神模因接受外部信号,首先通过语音识别和自然语言处理进行情感分析和语境理解,生成符合情感语气的回应,这里神模因和声模因交互贯通起来,面部表情、肢体动作和语言语调都做出相应的反协调面部和身体之间的参数联动,这里声模因与行模因交互贯通起来。在人工智能的驱动下,情感状态和语音语调的协之间交互模式,深度模拟了人类思维与身体各部位的协同机人工智能技术在数字人建模时就建立了形象、声音、动参数间的潜在映射关系,形成自主的驱动模型,展现数字人的自主性、还原度和智能化,使数字人在交互时更协调、更流畅且更生动。四大模型创造多模态智慧生成能力2023年,以GPT为代表的生成式人工智能技术实现飞跃,AIGC(人工智能自动生成内容)成为生产力提升的关键。2024年随着GPT-4的成功,人工智能大模型从文本交互的单一模态升级为可以接受文本与图像组合的多模态输入。多20模态大模型更加符合人类的多渠道感知和认知方式,能够应型生成内容的速度更快、质量更高及形式更多样,大模型的创造力赋予了数字人多模态智慧生成能力。1.理解能力是生成能力的前提生成能力作为数字人的生产力,也是数字人辅助人类或者替代人类的核心。在内容生成之前,首先需要理解信息。理解世界。视觉大模型让数字人有更敏锐的"眼睛",绪的变化。听觉大模型基于语音识别技术和自然语言处理,听懂言外之意。理解人类的意图之后,数字人才能根据需求生成相应的内容。2.智慧生成基于多种模型的融合openAI发布专注于不同模态信息理解、生成和交互的大模型。chatGPT是能够根据上下文语义理解进行多轮对话的聊天程序,支持最长达32,000个字符生成,可以执行各种任务,包括代码编写、数学问题求解、写作建议等。GPT-4V是图像识别领域,上传X光片,GPT-4V即可准确地识别图像21中的骨折位置、程度等医学问题,并给出相应的处理建议。DALL-E是一款专注于图像生成的模型,嵌入到chatGPT中,根据用户的指令完成图片编辑和生成。以及用于视模型sora,被称为世界模拟器。只需要一段文本就能生成60s逼真视频,并且画面场景精细、人物表情生动以及镜头运动复杂。2024年5月,openAI发布全能模型GPT-40,可以实时对音频、视觉、文本及人类情感进行推理。案例展示中,让GPT-4编曲唱歌、作业辅导和会议记录均应大模型已经实现了多模态的全面打通,也为数字人接入和交互水平与人类更加靠近。数字人的智慧水平完全取决于其背后接入的模型水平,模型的未来能走多远,数字人的智慧就能走多远。五呈现技术进一步释放数字人潜能呈现技术也是数字人技术创新的一个重要领域。数字人的基本输出形式是基于虚拟环境的视频或者程序,还需要借助终端设备呈现于用户面前,完成与物理世界的连接。不同的呈现媒介服务于不同的应用领域,数字人的呈现技术决定屏幕类技术是最早、最广泛的数字人呈现方式。屏幕显22示技术涵盖多种设备如LCD、OLED和投影屏幕,根据屏幕大小适应不同的播放场景。大屏显示用于户外广告或会议中心,适合远距离观看。中屏显示如商场显示屏和家庭电视,适用于商业展示和家庭娱乐。小屏显示如智能手机和平板电准确度和动态范围的提升,如4K、8K和HDR技术增强图像细节和视觉冲击力。新型显示技术如柔性屏和可折叠屏,为数字人展示提供新的可能性和交互体验。通过多设备联动,实现数字人在不同屏幕上的无缝切换和同步互动。例如,用户可以在手机上开始与数字人的对话,然后在电视上继续,或者在平板电脑上进行更复杂的互动操作。这种多屏幕互动将提升用户体验的连贯性和便利性。头戴类技术为用户提供沉浸式的数字人观看体验。头戴显示(HMDs)基于虚拟现实(VR)和增强现实(AR)技术,目前在游戏、教育、医疗等领域应用广泛。VR设备例如oculusRift、HTcvive等,主要用于游戏和娱乐,提供沉浸式的虚拟环境。AR设备类如MicrosoftHoloLens,将虚拟内容叠加到现实环境中,广泛应用于工业设计、教育和医疗;混合现实设备(MR)如苹果2024年2月份发布的MR眼镜visionpro,结合VR和AR的优势,实现虚拟与现实的融合互动。目前,头戴设备的技术进步主要体现度上的不断提升。减少线缆限制,利用云计算等技术简化头23升,减少使用疲劳感。未来,头戴显示设备将不仅适用于游3.裸眼类裸眼显示技术包括裸眼3D和全息投影,用户无需佩戴任何设备即可看到立体的数字人。裸眼3D主要通过视差技术让观众在不佩戴设备的情况下看到立体图像。例如L型拐角屏幕利用两个相互垂直的屏幕产生的视差形成立体效果;3D手机、3D平板电脑通常是在显示屏上覆盖一层柱状透镜,通过光的折射和反射实现立体效果。全息影像通过记录和再现光波的干涉条纹来实现三维图像,属于投影技术,技术较型演出活动的全息舞台及医疗成像中使用的桌面全息显示屏等等。随着技术的进步,裸眼3D和全息步降低,应用范围也在扩大。裸眼显示技术主要应用于广告的互动,沉浸感和互动性大大增强。24、数字人应用已经有序展开最终形成性质生产力的关键。过去三年,中国数字人应用正在循序渐进、分类分步启动,支撑着数字人创新正在由玩到(一)应用是数字人创新的"起落架"如果说人工智能技术是数字人起飞的引擎,那么人应用是数字人创新发展的"起落架",它是数字人技术创新1.应用是数字人创新的起点。创新不同于发明,发明往往是好奇心驱动下的奇思妙想,而发明则是瞄准目标的系统有目标和任务,飞机就不可能从跑道上昂首起飞。2.应用是数字人创新的支点。一项创新要想持续必须要有商业模式,而商业模式必须建立在应用的基础之上,有了应用才会产生价值,应用是运营得以持续的支点。数字人持续创新离不开合理回报和资本投入。从商业发展的角度看,数字人创新持续投资必须建立在市场收益的基础上,理性而健康的市场预期和持续的产业投入,是推进数字人持续创新3.应用是数字人创新的落脚点。"玩"是启动应用的跑道,从生活到生产,都必须通过应用来转化。要把数字人创新最25终转化成新质生产力,应用是关键。研究数字人应用的推进规律对推动生产方式变革,推进数字人创新转化为新质生产力具有十分重要的意义。二)数字人应用领域正在迅速拓展近年来,中国互联网协会已发起组织了四届中国数字人精品秀活动,并展开了数字人应用场景和成功案例的征集。从收集到的精品和案例统计看,目前我国数字人的数量日益加速拓展。统计分析已有的应用探索和案例,数字人的批量应用领域已经拓展到方方面面(详情请见附录1《中国数字人应用场景荟萃(2024)》),以下是具有影响力和代表性的20多个领域:1.数字主播数字主播是最早出现的数字人应用形态。早在2021年国内很多网络媒体和大型论坛中就出现了按照预设脚本完容的配合基本处于动漫配音水平,但因为形式新颖,广受青睐。随着数字人技术的迅速推进,数字主播加速向仿真数字人演进,近乎逼真的数字主持人,已经可以根据编辑人员输入的文本稿件,实现形态自如、语言流畅2.数字网红数字主播在应用于文化娱乐、营销推广等场景中催生了一批有粉丝效应的网红数字人。数字网红在数字主播基础上26生,也可以进行全新的IP创造。3.数字名人数字名人是基于现实存在的名人,通过模仿其外表形象、言谈举止以及行为习惯,可使观众感受情绪共鸣和感染力。其中数字历史名人打破时间和空间的屏障,让观众能穿越时科学家钱学森,历史名人苏小妹。4.数字手语主播随着行为技术进步,数字人肢体动作的复杂度和精准度升级,出现了面对特殊群体的数字手语主播。整合3D数字人建模、机器翻译、语音识别和自然语言理解等多项技术,通过手语翻译引擎和自然动作引擎,在广播功能的基础实现手语和形体表现功能,通过灵活的手势动作配合面部表情、沟通"。5.数字代言人的数字代言人。数字分身代言人借助数字技术,在某些功能27方面甚至出现了超越本人的功能拓展。比如2023年呈现的会说英语和粤语的杨杰;2024年上线的京东刘强东、格力电器董明珠等。解说员在比赛中充当着桥梁的角色,需要敏锐的临场反应和精准的表达能力,才能将瞬息万变的赛况以通俗易懂的方式传达给观众。数字解说员利用人工智能赋予的"智商",模拟真实解说员的形象和声音,自动读取和播报比赛数据,描述比赛场面,实时更新重要赛事信息,为观众提供精准、生动的赛事解说。7.数字对话人数字对话人是拥有现场互动功能的数字主播。这类数字人在具备看稿广播功能和根据文案演绎对话外,还能达到真与访谈对象进行现场互动的功能,在理解和生成能力上有大幅提升。随着人工智能技术的发展,数字人的交互对话能力增强,应用范围拓展。数字人逐步应用于电商直播场景,为更多观众提供"线上导购"服务。电商数字人不仅可以按照程序和众交流对话,初步"读"懂直播间深入的营销咨询业务。289.数字引导人数字引导人应用于线下场景,分为固定式引导人和移动式引导人。固定式数字引导人设置在相对固定的位置,通过大屏幕提供数字人引导服务。移动式数字引导人运用虚拟与现实的定位融合系统,为用户提供伴随式虚拟现实定位导引服务,自带SLAM(同时定位与地图构建)运动跟踪效果,路线精准贴合,数字人精准落地行走,操作极为简便,选择机场指路数字人。10.数字导览人数字导览人在提供方向导引服务的基础上,提供内容介绍功能,可以作为虚拟导览员为参观者提供导览讲解服务,指引参观者前往不同的展览区域,讲解展区和展品的详细信11.导游数字人基础上为游客提供导游讲解服务,可与景区游客实现面对面导览讲解等智能服务,打造沉浸式的交互体验,做到"吃喝览成本,高效便利游客。2912.导诊数字人数字导诊人可以7*24小时不间断在线或线下的方式与患者互动,帮助患者了解掌握互联网医院的使用方法和配套精准匹配到与病情相适应的临床科室和专家,并辅助挂号。诊后,还可为患者建立健康档案,方便患者健康管理。13.数字助理教师数字助理教师利用人工智能和虚拟现实技术创建,针对学生提供个性化、全方位的学习支持和指导。通过人工智能技术的支持,数字人教师能够通过学生的反馈与情感信息实时调整难易程度与教学策略,帮助学生更好地理解和掌握知识,可以实现个性化教学。数字助理教师还能进行智能聊天对话,通过情感陪伴的方式帮助学生缓解压力与情绪波动。数字助理教师可以为教师提供教学辅助和指导,帮助其更好地组织教学内容和活动,提升教学效果和学生的学习成果。14.数字咨询师数字咨询师具备一定的专业知识储备和亲和力的互动30形式,为用户提供心理、健康、理财等专业领域智能化和精细化的咨询服务。15.数字助理医师根据患者的回答以及上传的检查、检验报告,通过人工智能大模型将病情整理成规范的病史小结,发送至医生,方便医生在患者进入诊室时提前了解病史,提高工作效率、减轻工作负担。16.数字助理律师数字人律师依托法典和条例,叠加互联网问答,并结合律所实践经验,为政法系统工作者及普通民众提供法律支持、文件,有了数字人律师,可帮助律师在工作中随时检索需要的法律条款,提高工作效率。17.数字客服数字客服,是指通过网络界面和手机终端,回答产品相关问题,全天候提供服务,提升客服沟通效率和服务温度。数字人客服能以"写实"真人的方式提供更具亲和力的交互服务。数字客服可通过知识库提供的内容规范准确地回答客3118.数字前台数字前台,是依托自然语言理解和智能对话技术和 题,推荐服务信息,为客户提供从咨询到指引再到办理的全旅程陪伴式服务。19.数字政务助手数字政务助手工作内容包括多语种的政策解读、为群众等多模态交互方式与数字政务助手进行拟人化交流,通过技术手段智能分析用户需求,通过虚拟人智能推送服务入口,出件的全流程统一管理,指导用户办理相关手续。20.企业数字秘书企业数字秘书是基于桌面终端,融合大模型、AIAgent及AI多模态交互技术和个性化本地知识库的综合智能体。据与用户交流过程中捕捉到的用户的语气和情感作出不同反映,当感受到用户积极的情绪时,可以营造出愉悦的氛围感;当感受到低落的情绪,可以化身为心理按32应用于工业制造业,对优秀工匠的经验知识进行规范化提炼整理,形成专业技能数据库,同时结合人工智能大模型技术,以数字师傅的形象辅导新员工学徒学习操作技能,辅助员工进行实际操作训练,帮助员工更好掌握专业技能。通过模拟真实场景,使员工身临其境进行业务演练、快速提升22.数字稽核员数字财务助手发挥高效、精准的工作优势,为公司提供多维度的数字流程自动化处理服务。数字财务助手凭借先进的图像识别技术和数据处理能力,可从发票单据中准确识别据规范填写至对应部门的表格文档中,并匹配对应的报销人对于缺失或错误的文件信息,数字财务助手还能生成提醒作用的文档,提供给工作人员进行修正。23.数字监控员数字监控员应用于数字监控大屏的操作控制,用户通过语音对话下达指令,在屏幕调出数字人监控员,数字人监控员响应和执行语音指令,调取和展示各类监控数据,以图形更加直观、生动地了解业务现状和发展趋势,从而提升管理33效率和决策策略的科学性和准确性。24.数字操作助理在工业自动化中,数字人可以被用来控制和优化机器人的操作,提高生产效率,降低事故风险。数字人可以帮助机器人进行物体识别、运动规划和路径规划等工作,实现操作管理。(三)应用数字人逐步形成三类属性根据不同的社会功能,从应用的维度,数字人大致可以分为媒介类数字人、服务类数字人、行业类数字人三大类。分类研究是把握事物发展规律的基本方法。科学 (science)原义就是分科之研究。笛卡儿在《方法论》中指出,可以将要研究的复杂问题,尽量分解为多个比较简单的小问题,一个一个地分开解决。分类可以总结事物的与差异性,研究事物的本质和规律。数字人应用的类型众多然而又各有不同的发展特点,对其分类研究有利于掌握数字人应用演进的规律。1.媒介类数字人随着数字人形象和语言功能逐步形成,数字人在新闻播都属于媒介型数字人。媒介数字人的发展过程中,初期的广播类媒介数字人以数字人的形象和语音技术的创新为核心,以信息传播为主要34与人的信息交流领域。随着人工智能技术进步和应用,互动类媒介数字人凭借人格化、交互性的形象,赋能内容生产和传播升级,提升内容的服务性、互动性和体验性。主持人、数字直播导购等。2.服务类数字人随着媒介数字人的发展,交互功能不断增强,数字人进入社会生活的方方面面,开始在各领域提供信息传播和交互之外的各类辅助服务,出现了服务型数字人。在生成式人工智能技术的有力支撑下,服务型数字人凭真人来提供自动化、智能化、标准化的咨询服务以及内容生务供给。除了具备媒介类数字人的一般功能外,服务型数字人还具有把控现场的初步能力,并熟练运用众多专业知识,为个人提供专业化服务。服务型数字人能够通过语言、行为等方式,代替真人完成线下线上特定场所的引导工作,还可以结合业务流程自动35用户体验;或者为企业端和个人端的用户提供个性化的专业咨询和拟人化的情感陪伴等服务。确地回答客户关于常见业务的咨询,节省了人力成本;在医疗领域,它能为患者提供初步的病情咨询和引导,提高医疗人可以给予温馨的情感陪伴,让他们感受到关怀。服务型数字人可以在不同服务场景,如企业内,公共服数字导览人、数字导游、数字助理医生等,根据服务领域,3.行业类数字人与各行各业的生产管理和社会服务深度结合的数字人称为行业型数字人。虽然安全、管控等条件有待完善,行业数字人目前在企业、行业、工业的应用还处在起步和初级阶段,不能完全进入到生产领域,但在企业辅助领域已经开始出现了应用,比如17-24类,应用,但随着媒介、服务类数字人的创新成果逐步渗透到工36行业型数字人广泛应用的先声。行业数字人指参与行业管理的某个环节,或对行业具备控制力,能替代真人独立承担某个工作环节,或者辅助人类成新的商业模式和产业竞争力。的智能化水平在工业制造领域尚有待进一步提升,达到具身智能的阶段。具身智能指一种智能系统的设计理念,其目标是通过将感知、决策和行动融合在一起,使机器能够像人类一样具备身体和运动能力,从而在复杂环境中执行任务。工业生产中,数字人的应用离不开具身智能作为链接物理世界的媒介,然而数字人与具身智能的协同配合程度有待加强。未来,随着条件的持续完善与成熟,行业型数字人终将涉足精益生产的制造行业,展现出极为广阔的应用前景。例如,在汽车制造行业,行业型数字人能够精准监控生产线上的每一个环节,及时发现并解决潜在问题,提升生产质量又如在电子设备制造领域,它们可以对复杂的零部件生产过程进行精细管理,确保产品的高精度和高可靠性。四)数字人应用呈现循序渐进规律371.循序渐进是互联网创新规律厂厂免费媒体信息服务电子商务智慧城市行业应用工业应用技术要素:比特比特+支付比特+支付+物流比特+支付+物流+物联感应比特+支付+物流+物联感应+行业流程比特+支付+物流+物联感应+行业流程+中国创造元素网安要求:尽力而为可信可管万无一失管控需求:充分开放管放结合有效闭环互联网,依赖于要素条件的逐步丰富和保障条件的逐步完善呈现出循序渐进的发展规律。任何应用都是有条件的,条件的形成需要一个过程。技术是支撑互联网应用的首要条件,技术水平决定了应用瓶颈和门槛。初级的技术构成初级由低级向高级波浪发展的一般规律。网络技术的创新首先从创新元素比较简单、创新链条相对较短的领域突破,然后根据要素的增加由低到高循序渐进。比特就可以做信息交换,所以最早出现了互联网信息网站。BBS论坛、博客等都是属于媒介类型应用。它消除了信息不正进入了"互联网+"时代。38对安全的要求逐步提高。工业等行业需要更高的安全要求。过去几十年互联网的发展走过的就是一条这样的道路:从媒循递增规律。互联网发展呈现出由低级到高级的发展趋势。2.数字人的各类应用也将呈现循序渐进的规律数字人应用演进也将随着它的要素成长由低级向高级业链相对较短的游戏、媒介领域引入,然后逐步进入服务行厂__厂厂媒介数字人服务数字人行业数字人技术要素:形象建模语音合成语料库垂类小模型A大模型工业标准网安需求:尽力而为可信可管万无一失管控需求:充分开放管放结合有效闭环五)数字人正随要素变化叠加演进1.互联网应用遵循叠加演进规律39互联网的技术演进是迭代的,但是业务演进是叠加的。网络演进网络演进数智互联网移动互联网/PC互联网在新的技术因素和创新条件变化的驱动下,不仅会出现出各类应用长期并存、叠加演进的规律。数字人从媒介人到服务人到行业人的演进,不仅仅是递人一方面随着技术条件的变化波浪推进,同时各类型应用也在不断提升功能中持续发展,三类数字人将分别叠加演进。行业人/从从广播类到互动类40经过中国互联网协会组织的三次数字人精品秀,分析征集到的数字人作品类型分布,可以发现近年来数字人形态已经呈现出从媒介人到服务人再到产业人的变化。第一届基本是媒介人,第二届服务人大面积出现,占比80%,第三届行数字人应用的发展遵循循序渐进的规律,其发展实践丰演进;服务领域正处于从引导类向咨询类突破的阶段;数字人在工业和行业的辅助领域已开始大量应用,并正在广泛融入行业企业内部。随着人工智能大模型的迅速发展,数字人以数字员工的身份参与到企业管理环节,逐渐在工业生产中发挥辅助作用,行业数字人应运而生。行业数字人辅助人类操控机器进行生模式和产业竞争力。例如在办公秘书领域,招商银行的数字人招小影,被集线等领域得以应用。行业数字人还会在辅助工业安全监管、工业机器人控制协作、工业培训和人员管理等产业方向发挥作用,逐步参与行业的管理管控,达成个性化生产和数字李生的精益制造,在工业领域具备广阔的发展前景。412.数字人应用正随着要素条件变化由低级到高级演进网络元素和环境条件是数字人应用演进的关键因素。数字人的应用根据条件变化逐步增长,不仅是数字人三大类应用之间呈现由低级到高级发展,数字人三大类内部也是由低级到高级逐步发展。每一个阶段以及内部都依赖于条件的变化。数字人应用起步初期,形象技术以及文字转语音等技术出现;因此,媒介数字人首先从卡通类的主播起步;有了语言驱动技术后,就出现了可以根据文稿和脚本播音的广播类媒介数字人。随着chatGPT等技术出现,促使数字主持人向更高阶迈进。随着交互技术进步,媒介型数字人拥有了基础的交互能力,同时该能力不断增强之后,媒介数透到社会生活的方方面面,在各领域提供信息传播和交互之外的各类生活服务,由此衍生出以生活服务为主的各类服务型数字人。与此同时,数字媒介人也将随着智能驱动技术和智能大模型的出现和应用,由初级媒介人向功能更强大的媒介人演进升级。服务型数字人的起点高于媒介人。其中导引类数字人,需要有固定的程序和有限的小语料数据库支撑,通过点击操作或语音进行简单交互,从而获得对应的设定好的选项式回答,实现问答型对话和任务型对话,以应对标准化解答数据库内事先设定的高频引导类问题。导引类服务人要想成为咨42询类服务人,回答专业问题,需要专业语料库和模型的支撑。服务数字人的功能实现从问路导引到提供咨询的升级,要由小程序、小语料到有专业数据储备和处理能力的转变,甚至是需要垂直模型的支撑,才能实现专业咨询功能。助理类数字人,要回答更加复杂的问题,需要算力模型的支撑以及学可基于大模型或垂类模型支撑,回答某一领域的专业类问题,够保留对话记录,编码并存储感知和事件记忆,与人类产生有记忆的连续性互动,显著提升交互体验和咨询质量。在特定场景中提供情感关怀和处理专业事务,其拟真人程度更高,能更好满足用户的情感需要。3.数字人随着安全环境的完善逐步演进媒介型、服务型数字人向行业数字人演进,需要提升管都要具备管控职责,这需要数字人本身以及对数字人拥有足如果数字人应用到工业领域,达到精益制造,更需要毫秒级的实时管控。同时,安全保障对于数字人演进也十分重要。行业人需媒介人、服务人需要事后追溯的安全能力,工业生产需要强大的实时管控能力,需要在工业生产毫秒级时延要求基础上,43人工智能的持续革新,为数字人从"媒介"迈向"服务" "生产"应用创造条件,加快数字人转化为新质生产力的步条件、要素的完善,数字人有望全面突破应用边界,升级成人将成为我们在数字世界的AI代理人"。通过与Ta们的直提供全天候、全方位的人性化陪伴和智能化服务,成为人们通向虚实融合世界的超级入口。数字人可以随着安全和控制条件的营造,加速从"玩"44四、中国数字人产业正全面加速数字人产业进入规模化发展阶段,国内算力基础设施加速布局和升级,各类数字人大模型进入迭代进程,同时安全保障相关建设引起各方关注。中国互联网协会根据行业的发展现状研判认为,2024年中国数字人创新进入全面突破时期。(一)数字人产业进入规模化发展阶段AIGC出现后成为促进数字人创新的关键驱动力,打破人产业进入规模化发展阶段。促进经济发展的关键因素。分工合作不仅提高了个体企业的动了产业生态的形成和区域经济的发展。中国已经逐步形成完整的数字人产业生态链,为数字人应用的蓬勃发展提供了坚实基础。上游软硬件技术服务商主要负责提供硬件设备、算力网络及核心技术等底层服务。中游产品及运营解决方案提供商则负责将这些核心技术集成到具体的应用场景中,开发出各种数字人产品和解决方案。下游产业应用方则将这些数字人产品和解决方案应用到实际的业务场景中,实现商业价值,共同打造了一个健康发展的数字人产业生态。45中国互联网协会于2023(第二十二届)中国互联网大会因"能力研发与创新的智能模型伙伴、关注数字人形象设计、与数字人相关的企业114.4万家。今年,我国数字人相关企业数量大幅增加,仅2024年1~5月新增注册企业17.4万余家。(详情请见附录2:《中国数字人产业生态图谱(2024)》)2.数字人生产实现产业化定制随着人工智能大模型促进了数字人制作各项技术的升在中国互联网协会组织的第三届数字人秀作品征集中出现了多个产业化定制能力的演示作品,这类作品展示了低代码、高集成的数字人生产过程。数字人及其应用的生产流程演进妆容和服装等形象设计方案,为制作团队提供丰富的视觉参考资料,极大提高了数字人制作的效率和灵活性。AI语音合46成对语料库的需求降到数十秒内,在声音克隆的效率和效果上都大幅提升。其次,AI生成动作仅需关键词输入,便可自较于传统真人动作捕捉更为便捷的解决方案。相比以往,建得与真人形象、语音近似的数字人,成本从百万元降到百元3.数字人服务实现平台化运营不仅生产制作流程化、时间周期下降,数字人服务也逐渐平台化运营,大大降低了数字人的使用门槛。用户只需上传基本的图像或视频资料,系统就能自动生成高仿真度的数字人形象。平台还提供了丰富的模板和素用户也能轻松上手,实现快速生成和应用。通过无代码或低代码开发环境,降低了开发和运营数字人的技术门槛和成本。同时,数字人服务的平台化运营有效解决了长尾市场中多样、灵活的个性化需求,借助模块化的服务组件,较低成本提供个性化的运营服务。目前数字人服务平台主要有两类,saas产品形态主要面向无独立运营能力的个人用户和小微企业用户;paas产品形态主要面向具备独立运营和开发实力的企业用户。数字人服务平台开放API接口,方便企47业将数字人平台与现有业务系统进行集成,实现功能扩展和数据共享。利用云计算技术,平台提供数字人云端托管和管理服务,减轻企业的运维负担。数字人服务平台基于其灵活性、低门槛极大地推动了数字人技术的普及和应用,为各行各业的数字化转型提供了新的可能。根据易企秀数字人平台数据显示,在2023年11月数字人业务上线以来,企业用户量和使用量节节攀升,单月数字人制作量峰值破十万,尤其今年5月份以来,单月使用人数超过过去半年累计人数,数字人在中小企业的营销应用中推广开来。二)算力算网设施加速布局和追赶数字人的广泛应用带来算力需求的爆发式增长,加快算力基础设施的布局和升级对于发展人工智能技术至关重要。随着新一轮科技革命和产业变革深入发展,人工智能成为新者共同构成新质生产力的重要驱动因素。目前我国算力基础设施正在加速布局和追赶,基础网络条件全球领先、算力网络体系已有部署、算力芯片研发正全力追赶。1.算力基础条件布局领先完备的网络基础设施是人工智能算力的重要支撑,它不仅影响数据传输的速度和稳定性,还决定了计算资源的整合显著提升整体计算性能和应用效果。人工智能应用需要处理大量的数据,网络基础设施的性能直接影响数据的传输速度48和带宽。高速、稳定的网络连接能够确保数据在不同设备和节点之间快速传递,从而提高人工智能模型的训练和推理效常依赖于云计算和边缘计算,网络基础设施在其中起到了整合和调度计算资源的关键作用。通过高效的网络连接,云端和边缘设备可以协同工作,合理分配计算任务,充分利用分布在不同地点的计算资源,优化资源利用率。2019年国家提出把5G、人工智能、工业互联网、物联网等新型基础设施建设作为经济建设的重点任务之一,经过五年"新基建"的发展,我国已建成全球规模最大、技术领先的网络基础设施。5G基站超过了380万个,全球占比达到大动脉不断拓宽畅通,互联网国家顶级域名注册量全球第一。IPv6地址资源总量算力总规模均位居世界前列,网络服务质量加快迈向世界一流。光纤网络接入带宽实现从十兆到百兆、再到千兆的指数级增长,做到了千兆光纤入村,累计服务超36万个行政村,数字基础设施实现"市市通千兆、县县通5G、工智能等与制造业深度融合,推动了产业数字化、数字产业化的不断加快。2.算力云网体系正加速部署基础网络设施是必备条件,算力云网体系是支撑人工智能发展的关键基础设施。通过构建数据中心、云计算、大数49据一体化的新型算力云网体系,实现资源高效调合云计算的强大资源、网络的高效连接、边缘计算的低延迟处理和终端设备的本地计算能力形成云网边端协同的分布在分布式算力基础设施中,任务会被分成很多小部分,并分配给多个芯片处理器来处理。这就像是让很多人同时帮你做不同部分的作业,大幅缩短完成复杂任务的时智能模型的训练,可以在几小时内完成原本需要几天甚至几甘肃、宁夏等地建设的8个国家算力枢纽节点已全部开工,10个国家数据中心集群同步布局。西部地区新开工建设的数大运营商及头部互联网公司发挥自身优势和特点,聚焦国家 "东数西算"枢纽节点,打造多个千亿参数以上训练能力的公共智算中心,为国内通用人工智能发展奠定坚实的算力基全网智算规模超过每秒30百亿亿次浮点运算。从全国来看,50智能算力在算力总规模中的比重超过了30%,算力结构不断推进人工智能计算架构和软件生态建设,加快打造全国统一算力服务大市场,不断提升算力普惠易用水平。2024年4月,中国移动正式对外发布全球运营商最大单体智算中心该智算中心填补了我国人工智能广泛应用所需算力的巨大3.算力芯片研发正加速追赶GPU(图形处理单元)和TPU(张量处理单元)是两类支持大规模数据处理和深度学习模型训练的芯片处理器,为训练和运行复杂的大模型提供了足够的硬件基础和计算速度,使得实时数据处理和大规模并行计算成为可能。数据并行是指将训练数据划分为多个小批次(mini-batch),在多个计算节点上并行训练;模型并行是将大型模型划分为多个部分,分配到不同的计算节点上并行计算;这两类技术都能提升整体计算的吞吐量。英伟达(NVIDIA)、英特尔(Intel)、AMD等企业在芯片制造工艺上处于全球领先地位,先进制程(如5nm、3nm)技术成熟。英伟达的GPU如A100、H100和英特尔的神经计算芯片等在性能和能效上均居于全球领先水平。近年来,我国出台多项扶持政策大力支持半导体和人工51智能产业的发展,国内企业加大了在芯片研发上的投入,推在芯片设计和制造工艺上取得了显著进展,逐步缩小与国际领先水平的差距。今年以来,我国扎实推进算力基础设施的建设,不断强化产业创新能力,持续推动算力了解,中国移动智算中心部署了约2万张AI加速卡,AI芯片国产化率超85%,智能算力规模高达6.7EFLOPS(每秒670亿亿次浮点运算)。三)各类数字人大模型进入迭代进程追赶状态,垂类大模型逐渐崛起,进入迭代进程。1.通用模型呈现"百模争先"人工智能领域的核心竞争主要在模型层,近几年国内外大模型技术迭代飞速,从GPT-4的多模态能力到paLM2的多语言支持,再到LLaMA的小规模高性能设计,人工智能代技术。从全球已发布的大模型地域分布看,中国和美国大的大模型技术群。今年,国产大模型的平均水平已经超过GPT3.5,无限逼近GPT4。但GPT4本身还在不断迭代,最新发布的GPT4O在整体性能、效果及效率上都有了显著提升。通用大模型持52续不断的更新迭代,以适应日益复杂工智能备案信息,我国共有117个生成式人工智能服务完成2.垂类大模型开始发力落地通用大模型"卷来卷去"只会造成资源浪费,国家互联网信息办公室登记备案的生成式人工智能服务数量已连续间如何。众多企业把创新重点放在垂类领域,根据生成式人工智能备案信息发现,垂类领域的身影屡见不鲜,例如网易有道"子曰"教育大模型、金山软件推出的WPSAI办公类大模型、蚂蚁集团发布的工业级金融大模型AntFinGLM、滴滴推出的以个人出行和企业差旅为场景的出行大模型等。随着大模型能力开始深入各行各业,垂类大模型引发关落地应用场景最丰富的赛道之一。人工智能大模型在数字人场景的应用发展已经相对成熟,大模型即插即用,有垂类大模型加持的行业数字人也遍地开花。以今年数字人精品秀征集的应用场景作品为样本,数字人功能提升速度飞快,各类数字人大模型进入迭代阶段,类别越来越细,周期越来越短,频次越来越高。533.人工智能探索赋能行业为代表的人工智能创新发展机遇,以人工智能和制造业深度模型,加快推进人工智能赋能新型工业化。人工智能聚焦数域加入了大量人工智能技术研发为核心的企业,专注于人工智能技术在数字人领域的研发探索,赋予数字人先进的算法数字人成为人工智能赋能千行百业的重要载体之一,除了教如何发挥真正的生产力是数字人发展的下一个重要命题。四)安全保障相关建设引起各方关注技术发展提供的创新条件已经充分,但数字人创新发展的过程中面临着监管政策、法律法规不完善,部分伦理道德问题的社会共识未达成等难题。安全保障的建设工作已经逐步展开,引起各地政府及社会各界高度关注,正努力创造条件为数字人创新保驾护航。1.各级政府高度重视54业。工业和信息化部等五部门印发的《元宇宙产业创新发展三年行动计划(2023-2025年)》中多次提及对数字人发展及医疗等领域的场景打造。北京市经济和信息化局编制了《北京市促进数字人产业创新发展行动计划(2022-2025年)》,推台关于虚拟数字技术的产业发展计划等近百项政策措施,聚川区、海南陵水县均在已发布的相关政策中提到数字人的产业发展规划和应用方向。2.安全保障工作列为重点国家《元宇宙产业创新发展三年行动计划(2023-2025年)》中明确提出构建安全可信产业治理体系是五项重要任风险事件处置机制,建立健全违法信息监测、识别和处置机储、使用等行为,提升数据安全治理能力和个人信息的保护水平。《北京市促进数字人产业创新发展行动计划(2022-2025年)》中提出探索多层次风险防控机制,督促数字人企业做好数据安全和个人信息保护,加强信息内容安全管理,落实信55息内容服务主体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论