《人工智能通识(AIGC版)》 课件 项目6 AIGC+数字人应用_第1页
《人工智能通识(AIGC版)》 课件 项目6 AIGC+数字人应用_第2页
《人工智能通识(AIGC版)》 课件 项目6 AIGC+数字人应用_第3页
《人工智能通识(AIGC版)》 课件 项目6 AIGC+数字人应用_第4页
《人工智能通识(AIGC版)》 课件 项目6 AIGC+数字人应用_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AIGC+数字人应用项目7AIGC机械工业出版社《人工智能通识》配套资源目录CONTENTSLOGO0101项目描述与项目分析0202相关知识0303项目实施0404人工智能伦理案例分析PARTTWO相关知识2.相关知识思维导图2.相关知识——数字人的内涵数字人(DigitalHuman/MetaHuman),是运用数字技术创造出来的、与人类形象接近的数字化人物形象。从广义上讲,数字人是指数字技术在人体解剖、物理、生理及智能各个层次、各个阶段的渗透。而从狭义上讲,数字人是信息科学与生命科学融合的产物,利用信息科学的方法对人体在不同水平的形态和功能进行虚拟仿真。在本教材中研究的数字人,泛指结合计算机图形学、动作捕捉、深度学习、语音合成等技术创造的虚拟人物,它们能像真人一样说话、做表情,甚至与人互动。2.相关知识——数字人的生成技术数字人的构建主要依赖人工智能、3D建模与动画、自然语言处理(NLP、深度学习与大数据)等核心技术。数字人的构建涉及众多专业理论,其内容广泛且深奥。为使读者能更直观地把握,可借助比喻手法来进行说明,具体如下。造身体——3D建模与动作捕捉:用电脑像捏橡皮泥一样塑造数字人的外形(3D建模),再通过摄像头、传感器记录真人动作(动作捕捉),让数字人灵活摆手和眨眼,就像动画电影角色的制作过程。装大脑——人工智能驱动:给数字人装上“AI大脑”:语音识别让它听懂说话,自然语言处理让它理解语义,深度学习让它能对话、创作(类似手机语音助手升级版)。例如教育数字人能回答学生提问,就是靠这些技术。添灵魂——表情与语音合成:通过人脸肌肉模拟技术让数字人微笑皱眉,再用语音合成(如文字转语音)配上自然的声音。比如虚拟主播的生动表情和语调,背后都是算法在精准控制。当前很多数字人生成平台已经拥有2D真人、3D超写实、卡通、美型等多种风格的形象资产库,配套3D服装、发型、配饰等模型资产以及形象动作、表情库,同时支持针对2D真人和3D形象提供虚拟人形象定制,可满足多场景应用需求。2.相关知识——数字人的分类数字人可根据功能用途、技术形式、驱动方式和应用场景进行系统分类。从功能用途看,数字人主要分为服务型和身份型两类。服务型数字人主要替代真人完成重复性任务,如数字客服、虚拟导游等,强调功能性和效率;身份型数字人则具备独立人设,如虚拟偶像或企业IP形象,侧重品牌塑造与用户情感连接。如图7-2所示。按技术形式划分,数字人可分为2D和3D两类。2D数字人基于平面图像技术,制作成本低、周期短,适用于直播带货等场景;3D数字人则依托三维建模与渲染技术,具备立体化形象与多角度交互能力,广泛应用于影视特效、虚拟教育等领域。从驱动方式来看,数字人可分为智能驱动型和真人驱动型。智能驱动型依赖AI算法实现自主交互,如语音助手或教育数字人;真人驱动型则通过动作捕捉技术,由真人实时操控,如虚拟主播或影视替身,确保动作与表情的高度拟真。按应用场景分类,数字人可覆盖教育、娱乐、商业等多个领域。教育数字人可辅助教学演示;娱乐数字人包括游戏角色与虚拟演出;商业数字人则应用于电商直播、金融客服等场景,推动行业智能化升级。2.相关知识思维导图2.相关知识——数字人的应用数字人的应用已有研究表明,虚拟数字人的吸引力、拟人化、可信度、专业性、相关性、个性匹配度、人设植入与真实性等特征能够影响用户的感知、态度、接受度与行为意愿。2024首届中国数字人大会发布的《中国数字人发展报告(2024)》预计,2025年中国数字人核心市场规模将达480.6亿元,带动产业市场规模可达6402.7亿元。2.相关知识——AI智能编程助手的核心功能教育领域数字人可作为虚拟教师,通过语音合成与AI对话技术为学生提供个性化辅导。例如,模拟真人教师讲解知识点,并自动生成练习题。比如,2024年广东财经大学全民数字教育学院积极探索技术赋能教育的路径,已率先应用AI技术,创新推出了AI数字人课程和卡通动画教学视频。娱乐领域虚拟偶像通过2D/3D形象与粉丝互动,举办线上演唱会或发布数字专辑。这类数字人依赖动作捕捉技术与深度学习模型实现自然表演。2.相关知识——AI智能编程助手的核心功能

新闻领域AI新闻主播可24小时不间断播报新闻,通过语音合成和表情驱动技术模拟真人播报效果,大幅提升新闻制作效率。比如,2024年春节期间,浙江省杭州文化广播电视集团的《杭州新闻联播》节目,使用AI数字人进行新闻播报,且做到了零失误率,引发社会关注。服务领域数字人在服务领域主要应用于客户交互与流程自动化,提升效率并优化用户体验。例如,数字客服通过自然语言处理(NLP)技术实现7×24小时在线应答,处理咨询、投诉等标准化业务;虚拟导览员则在博物馆、景区等场景提供智能讲解与路线指引。此外,金融数字员工可协助完成开户审核、理财咨询等任务,降低人力成本。随着多模态交互技术的发展,服务型数字人正逐步实现更自然的语音、表情和动作反馈,推动智能化服务升级。2.相关知识——主流数字人模型及其特点主流数字人模型及其特点模型/产品名称开发机构主要特点MetaHumanEpicGames(美国)UnrealEngine高保真3D建模。提供超写实3D数字人建模工具,支持实时动画与表情捕捉OmniHuman字节跳动(中国)从单张图片生成逼真全身动态视频,支持自然表情、手势和物体交互OneShotOneTalk中国科大与香港理工单图生成个性化动态说话头像,实现逼真动画效果。降低了创建逼真、可动的虚拟形象的门槛,使得用户可以仅通过一张图片就能生成具有高度个性化和表现力的虚拟形象。AnchorCrafter中国科学院和腾讯将人-物交互(HOI)集成到姿态引导的人体视频生成中。专注主播形象生成,支持动态背景与实时口型同步EchoMimicV2阿里巴巴蚂蚁集团支持通过音频驱动半身人体动画生成。通过输入一段音频、一张参考图片以及简单的手势序列,它可以生成头部、手势和上半身动作的动态视频。MimicTalk字节跳动与浙江大学基于NeRF技术,仅需15分钟训练个性化3D说话人脸模型,提供高精度3D数字人驱动duix.ai硅基智能(中国)AIGC实时渲染、2D真人建模。50帧/秒超流畅画面,低算力要求,适用于直播、社交等实时交互。全球首个AI数字人开源项目Hallo2复旦大学与百度(中国)音频驱动、长视频生成。支持1小时长视频、4K分辨率生成,适用于教育、虚拟现实等场景2.相关知识——主流数字人制作工具对比按功能划分按功能,主流数字人制作工具可分为公模与私模两类。公模工具(如即创数字人、剪映数字人)提供免费或低成本的预制角色模板,用户可通过简单编辑快速生成内容,但同质化风险较高,适合预算有限或需求简单的场景。私模工具(如HeyGen、焦点数字人)需用户提交真人视频训练专属模型,支持高度个性化形象克隆,独特性强,但成本较高,适用于品牌营销、高端内容制作等对形象独特性要求高的领域。2.相关知识——主流数字人制作工具对比按技术路线划分按技术路线,数字人工具主要分为2D视频合成与3D虚拟驱动两类。2D技术(如蝉镜)通过视频合成实现数字人生成,成本低、效率高,适合电商直播、短视频等轻量化场景。3D技术(如魔珐有言)基于专业建模与动作捕捉,可驱动高精度虚拟角色,实现复杂交互与动画效果,多用于影视制作、虚拟IP开发等对表现力要求高的领域,但技术门槛与成本较高。2.相关知识——主流数字人制作工具对比主流数字人制作工具对比工具名称开发机构主要特点主要应用场景百度曦灵百度数字人平台,集数字人生产、内容创作和业务配置服务于一体。企业宣传、产品介绍、教育培训腾讯智影腾讯-3D虚拟角色驱动,AI智能文案生成内置教育场景模板教育课件、品牌宣传商汤如影商汤科技基于“商汤日日新SenseNova”大模型短视频和直播抖音公模2D合成自媒体短视频剪映数字人字节跳动抖音生态深度适配,一键生成带货脚本与AI成片抖音短视频、直播切片即梦AI深圳脸萌科技有限公司AI绘画和动效效果连贯性强、流畅自然的视频生成自媒体蝉镜厦门蝉镜科技极速克隆真人形象(2分钟视频即可),支持24小时AI直播与电商带货模板电商直播、短视频带货魔珐有言魔珐科技专业级3D虚拟角色库,支持智能动效与多模态交互影视动画、品牌IP打造焦点数字人焦点视界私模克隆高端品牌营销飞影数字人灵之宇实时动作捕捉驱动虚拟人,低延迟直播推流技术虚拟直播、线上活动互动HeyGen深圳诗云科技支持多语言克隆真人形象与声音,300+视频模板,5分钟生成口播视频跨国企业宣传、培训视频AIGC+数字人应用项目7AIGCPARTTHREE项目实施3.项目实施思维导图3.项目实施任务1构建数字人“李白”文化大使“李白故里”文化节筹备组需要制作能吟诵唐诗、讲解历史的数字代言人。技术团队使用有言3D平台的共享模型库,选择符合盛唐气质的基底模型,通过语音驱动和文本输入,生成能实时互动问答的“数字李白”。该数字人将在景区智能终端展示。3.项目实施任务1构建数字人“李白”文化大使”文本生成:选用DeepSeek等大语言模型工具,快速生成文化大使的背景故事、研究内容等文本。视频生成:使用有言AI生成视频数字人。视频优化:使用剪映对视频进行画质优化与添加背景音乐。技术工具选用有言AI是一款原生3D内容AIGC产品。可以实现3D视频,一键生成。用有言AI创作视频,无需拍摄,无需真人出镜,有大量的高质量超写实3D数字人角色库可供选择。通过魔珐自研的AIGC全栈技术能力,即AIGC三维动画、AIGC三维超写实形象、AIGC三维运镜、AIGC声音,有言能够一键生成:场景、运镜、动画、声音,从拍摄到剪辑。有言简单易用,仅需通过生成内容、编辑镜头、视频包装三步操作,即可打造一个高质量的3D视频。有言AI简介3.项目实施任务1构建数字人“李白”文化大使”剪映客户端和移动端提供视频编辑服务。用户可以切割、剪切视频,调整播放速度,应用特效、转场效果。它还有滤镜、美颜、文本、贴纸功能,支持多种字体、语音转字幕。音频方面,有音乐资源和变声功能。剪映简介3.项目实施任务1构建数字人“李白”文化大使总的来说可以分为以下四个步骤,用AI工具(如DeepSeek)写一段“数字李白”的背景故事和互动场景,以生成角色描述。用AI视频工具(如有言)输入描述,生成李白朗诵诗歌的虚拟人视频。用剪映加上字幕和背景音乐(如古筝曲),让画面更生动。制作流程确定需求生成角色描述视频生成视频优化审核与反馈3.项目实施任务1构建数字人“李白”文化大使作品效果3.项目实施任务1构建数字人“李白”文化大使详细步骤请查看教材步骤说明,并观看对应的微课视频感谢聆听AIGCAIGC+数字人应用项目7AIGCPARTTHREE项目实施3.项目实施思维导图3.项目实施任务2制作非遗“青林口高抬戏”视频在成功打造静态文化IP后,项目升级为动态非遗体验。江油市青林口古镇计划在数字文旅平台上推出“AI非遗高抬戏小课堂”。技术团队需使用即梦AI,快速创建一个身着羌族服饰的AI导游“云小羌”,并在虚拟青林口古镇场景中完成一段5秒的“青林口高抬戏”经典台步动作(如甩袖、转身、抬手),用于非遗文化线上展厅的互动演示。3.项目实施任务2制作非遗“青林口高抬戏”视频文本生成:选用DeepSeek、文心一言等大语言模型工具,快速生成羌族文化元素设计角色形象文本内容。视频生成:使用即梦AI实现动作捕捉驱动的虚拟数字人。技术工具选用3.项目实施任务2制作非遗“青林口高抬戏”视频分为以下四个步骤。1)角色生成:收集相关素材,选用预设的“少数民族女性”模型,添加羌族服饰。2)动作捕捉:利用即梦AI文字生成高抬戏动作视频。3)场景合成:使用即梦AI合成场景添加语音讲解,并进行细节优化。4)审核与反馈:将生成的数字人视频导出提交给数字文旅平台审核,根据反馈进行调整和优化。制作流程角色生成动作捕捉场景合成审核与反馈3.项目实施任务2制作非遗“青林口高抬戏”视频作品效果3.项目实施详细步骤请查看教材步骤说明,并观看对应的微课视频任务2制作非遗“青林口高抬戏”视频感谢聆听AIGCAIGC+数字人应用项目7AIGCPARTTHREE项目实施3.项目实施思维导图3.项目实施任务3用数字主播讲解非遗工艺结合跨境关税调整热点,技术团队为江油遗工坊设计国货出海方案。使用蝉镜平台搭建具有川西特色的虚拟直播间,数字主播“绵小阳”需同步讲解中坝酱油非遗工艺。实现文化输出与商业转化的结合。3.项目实施任务3用数字主播讲解非遗工艺文本生成:选用DeepSeek、文心一言等大语言模型工具,快速生成AI带货主播主播内容、研究内容等文本。视频生成:使用蝉镜AI生成视频数字人。视频优化:采用剪映添加销售产品并优化视频。技术工具选用3.项目实施任务3用数字主播讲解非遗工艺”蝉镜AI平台集成了AI文案创作、多音色AI配音、数字人视频生成等功能,使用户能在几分钟内轻松创建数字人视频,快速生成逼真的口播和带货视频,为品牌获客、电商带货和各业务领域提供新内容营销手段。蝉镜AI简介3.项目实施任务3用数字主播讲解非遗工艺1)文案创作:根据江油市特色选择产品,使用DeepSeek生成带货文案,需包含商品核心卖点(如中坝酱油的“非遗工艺”)。2)手持动作配置:上传商品高清图(如酱油瓶),蝉镜AI自动生成“自然持握”动作,调整手指关节角度避免穿模。3)生成视频:根据文本描述,使用蝉镜AI生成AI带货主播的视频形象,并进行细节优化。4)视频优化与编辑:将生成的AI带货主播视频导入剪映中,进行精细化处理,确保视频内容与产品展示无缝衔接。制作流程文案创作手持动作配置生成视频视频优化与编辑3.项目实施任务3用数字主播讲解非遗工艺效果3.项目实施任务3用数字主播讲解非遗工艺详细步骤请查看教材步骤说明,并观看对应的微课视频感谢聆听AIGCAIGC+数字人应用项目7AIGCPARTFOUR人工智能伦理案例分析AI生成物的伦理争议案例分析AI生成物的伦理争议主要围绕其版权归属、创作的独特性与价值、对人类创作者的影响以及潜在的社会风险等方面展开,随着AI技术在各领域的广泛应用,这些问题愈发凸显,引发各界深入思考,其解决对于AI健康发展与社会和谐稳定至关重要。Level1:多学科融合备课资源整合4.人工智能伦理案例分析人机交互中的安全事故案例分析(1)中国首例“AI文生图”侵权案:北京互联网法院审理的全国首例“AI文生图”著作权侵权案获最高人民法院“两会”工作报告关注。李先生的AI绘图被刘女士盗用,法院认定李先生享有著作权,刘女士构成侵权。该案明确了AI生成图片的作品属性及创作者身份。(来源:澎湃新闻,2023)典型案例4.人工智能伦理案例分析人机交互中的安全事故案例分析(2)美联邦法院:AI不能当专利发明者:人工智能系统DABUS创作的发明申请专利时,因DABUS不具备法律意义上的发明人资格,其专利申请被驳回。该案例引发了关于AI创作物的专利保护以及AI在创新过程中的地位和作用等伦理问题的讨论(来源:澎湃新闻,2021)典型案例4.人工智能伦理案例分析人机交互中的安全事故案例分析(3)Midjourney“名画”作者版权注册遭拒后上诉:2022年,杰森艾伦用Midjourney创作的《太空歌剧院》获美术比赛第一名,却引发争议。2023年其版权申请被拒,今年9月艾伦上诉,认为创作投入心血应获版权。非营利组织律师持反对意见。目前艾伦募资打官司,案件结果或影响AI艺术创作领域发展。(来源:腾讯网,2024)典型案例4.人工智能伦理案例分析人机交互中的安全事故案例分析(4)多方起诉StabilityAI侵权,AI绘画领域版权纠纷再起波澜:AI绘画法律争端升级,华盖创意

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论