版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026/03/13人工智能关键技术及应用CONTENTS目录01
人工智能关键技术及应用02
人工智能生成内容(AIGC)03
AI智能体技术04
具身智能技术人工智能关键技术及应用01机器学习:人工智能的基石定义与核心流程机器学习是人工智能的重要分支,通过“数据输入-模型训练-分类决策”的系统,从数据中挖掘学习规律。数据(small/bigdata)学得模型模型空间(linear/nonlinear)学习优化算法(SGD等)模型层面学习层面学习结果数据层面机器学习系统及关键要素示意机器学习:人工智能的基石学习类型与应用涵盖监督学习、半监督学习、无监督学习、强化学习等学习类型,在图像识别,文分分类等领域具有广泛应用监督学习(有标签)半监督学习(部分有标签)无监督学习(无标签)强化学习(评级标签)行为智能体状态环境奖励机器学习:人工智能的基石数字人文领域应用助力处理海量人文数据,如文本分类、情感分析等,推动学术研究与生活智能化。
文本分类依据不同的类别,例如文学、历史、科学等为文本赋予恰当的“标签”,以便读者能够轻松地找到所需资料。
情感分析情感分析的目的在于解析文本所传达的情感倾向,协助深入理解大众的情绪及作者的情感表达。自然语言处理:人机语言桥梁
定义与发展历程自然语言处理是一个让计算机理解、处理和生成人类语言的技术领域。目标是搭建连接人类与机器的“人机语言桥梁”,使得计算机能够解读我们日常使用的文字,并执行各种与语言相关的任务,实现人机自然交互。1956年达特茅斯会议:正式提出“人工智能”NLP逐渐形成独立研究领域20世纪30-50年代艾伦·图灵提出图灵机为现代计算机提供了理论基础20世纪50年代诺姆·乔姆斯基提出转换-生成语法理论为NLP提供了语言学思路自然语言处理:人机语言桥梁
典型应用场景机器翻译:消除语言隔阂,使不同语言的使用者能够实现高效'顺畅的跨语言沟通文本分类:通过为文本赋予恰当标签来实现信息的高效管理情感分析:解析文本所传达的情感倾向,协助深入理解大众的情绪以及作者的情感表达问答系统:使计算机能够理解用户提出的问题,并提供准确且有帮助的回答,协助高效地检索所需信息自然语言处理:人机语言桥梁
数字人文价值NLP在数字人文领域,发挥着至关重要的作用,帮助学者们从浩瀚的文本数据中提取有价值的信息,提升古籍整理、历史研究效率,如自动分类古籍、分析历史文本情感倾向。计算机视觉:让机器“看懂”世界
图像识别技术从人工特征设计到卷积神经网络(CNN),如LeNet、AlexNet、ResNet,实现自动特征学习。
目标检测与跟踪从传统方法到深度学习(RCNN、YOLO),实现快速精准的目标定位与跟踪。图像分割技术从传统方法到深度学习(FCN、U-Net),实现精确的像素级语义分割与目标轮廓提取。
定义计算机视觉的主要目标是让计算机能够“看懂”图像和视频。它通过模拟人类的视觉系统,结合特征工程、深度学习等技术,实现对图像内容的识别、图像中目标的检测、目标跟踪以及语义目标物体分割等任务。计算机视觉:让机器“看懂”世界
数字人文应用用于古籍文字识别、文物损坏检测、古旧地图分析,辅助文化遗产保护与研究。北理工团队的古籍文字检测与识别工作云冈石窟壁画损伤检测Zhan,Jiawei&Meng,Yu&Zhang,Longqing&Li,Kangshun&Yan,Fengting.(2025).Researchoncomputervisioninintelligentdamagemonitoringofheritageconservation:thecaseofYungangCavePaintings.npjHeritageScience.13.10.1038/s40494-025-01567-4.人工智能生成内容(AIGC)02大语言模型:文本生成核心引擎
架构与训练机制基于Transformer架构,通过预训练和指令微调,实现翻译、创作等多语言任务。
代表模型ChatGPT讯飞星火通义千问DeepSeek大语言模型:文本生成核心引擎
数字人文应用辅助古籍整理、历史研究,如生成文献综述、分析历史文本主题。山东大学团队构建了首个边疆历史文化专业知识库,并基于此开发了“边疆历史文化数字景观平台”和可交互的“数字人”系统。古籍数字化的过程是一项集文献数字化、分类检索、整理校勘于一体的综合性工程。国家图书馆(国家古籍保护中心)整合了国内外多家机构的古籍资源,涵盖甲骨、敦煌文献、碑帖拓片、地方志、家谱等类型。多模态大模型:跨模态交互利器
定义与核心能力融合文本、图像、音频等多种信息,实现跨模态检索与生成,并与用户进行交互。
代表模型OpenAI的GPT-4oDeepMind的Gemini2.0FlashAnthropic的Claude3Opus阿里巴巴的Qwen-VL多模态大模型:跨模态交互利器
数字人文应用用于古籍文献分析、博物馆数智人构建,提升文化展示与研究的交互性。博物馆数智人构建图像与视频生成:创意与复原工具
图像生成技术从GAN到扩散模型(StableDiffusion、Midjourney),用于文物修复(如敦煌壁画)、艺术创作。
视频生成技术如Sora、Pika,可模拟历史场景、复原古建筑,实现虚拟空间沉浸式漫游。MidjourneyStableDiffusionSora:能根据用户输入生成1分钟的高清视频Pika:生成3D动画、动漫、卡通和电影等图像与视频生成:创意与复原工具
数字人文应用辅助文化遗产数字化保护,提升展览与研究的视觉体验。敦煌莫高窟壁画AI修复前后对比图中国古代壁画《朝元图》中玉皇大帝的AI修复前后对比图《清明上河图》AI实景复原(本视频出自浙江大学)音乐生成模型:旋律创作新载体Suno音乐生成模型音乐领域的“ChatGPT”时刻,用户可根据简单的提示词,快速生成高质量的音乐。MakeasongforaSundaystudysessionMakeasongforaheroicdesertcorebattleMakeasongforametaloperaaboutMondays音乐生成模型:旋律创作新载体GoogleLyria3结合Gemini多模态能力,可实现依据视听画面生成定制化配乐支持流行、摇滚、爵士、电子、民谣、古典、说唱等20余种曲风多模态输入支持:新增图片转音乐、视频转音乐功能三维生成模型:场景与文物的数字构建工具
湖南博物院针对马王堆汉墓丝织文物,利用AI辅助提取污损特征实现“修旧如旧”,并构建“旧衣”与“新衣”三维数字仿真模型。
火山引擎多媒体实验室研发三维重建技术,利用火山引擎视频云算法实现敦煌石窟的高真实建模。依托AI单图重建等智能技术,从二维图像中精准复原文物与历史场景,为数字人文研究提供核心支撑。AI智能体技术03AI智能体:自主决策与交互系统定义与发展阶段AI智能体是一种能够在特定环境中感知并执行动作以实现特定目标的智能系统。
规则智能体基于规则构建的,依据事先设定的规则做出决策并执行行动,类似于遵循固定程序的机器人。
强化学习智能体通过在环境中反复尝试并根据奖励机制调整其行为策略,如AlphaGo以及玩星际争霸游戏的智能体等,通常是专用智能体,无法跨领域完成任务。
大模型智能体依赖于强大的大型语言模型或多模态大模型,可解析复杂的用户任务指令,并在多样化的情境中做出智能决策和行动AI智能体:自主决策与交互系统推理规划记忆模块工具使用思维链、思维树强化学习推理增强短期记忆、长期记忆调用工具、微调模型大模型智能体核心架构模块AI智能体:自主决策与交互系统openclaw基于智能体的感知、规划和决策能力,智能体为不同领域的用户提供服务,包括智能体的客服助手,虚拟助手等。AutoGPT基于GPT-4实现,能够自主分解用户给出的任务、执行操作、并最终完成任务。斯坦福西部世界小镇构建多智能体生活的沙盒环境,通过不同性格特点的大模型智能体来模拟人类社会中的社交行为。厦门大学与腾讯、安阳师范学院联合研发的甲骨文智能体“殷契行止”
可完成文字识别、释义查询、文献溯源等任务。OpenClaw,本地部署的智能体框架,通过通信软件与用户交互,结合大模型完成任务理解、规划、执行与结果反馈。具身智能技术04具身智能:物理交互与智能增长第一人称智能(具身智能)环境探索反馈多源信号决策信息感知决策定义与核心特点具有物理实体,通过感知-认知-决策-行动闭环与环境交互,学习范式契合生物智能。具身智能:物理交互与智能增长关键技术模块包括具身感知(SLAM、语义建图)、认知、决策、行动控制及世界模型构建。感知认知规划底层控制决策行动语义建图目标检测具身多模态大模型行动决策大模型环境具身桌面操作具身移动操作具身导航具身智能任务具身智能:物理交互与智能增长AI导览机器人“小莫”,在莫高窟数字展览中心为来访的游客提供导览指引和敦煌文化的讲解互动。上海市历史博物馆具身智能机器人导览员“历小博”,是全国首个在博物馆提供讲解服务的轮式机器人,支持多时长全程讲解与定点跟随导览。成都自然博物馆机器人“小芯”具身智能讲解员为游
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 质量控制检查与改进计划模板
- 智能云服务器部署操作八项规范指南手册
- (二模)杭州市2026年3月高三年级教学质量检测化学试题卷(含答案)
- 员工差旅费用报销流程修订函(8篇范文)
- 销售经理渠道拓展与管理方案
- 空间技术应用推广承诺函(6篇)
- 异地法院起诉方案范本
- 国企廉洁采购方案范本
- 乡村家宅规划方案范本
- 厂区提升改造方案范本
- 水利工程安全度汛培训课件
- 文旅局考试试题及答案
- 穿越河道管理办法
- 【化工废水(酚醛树脂)水解酸化池的设计计算过程案例1400字】
- 医学教育中实践教学环节的质量监控与评价体系研究报告
- 内蒙古地质矿产勘查有限责任公司招聘笔试题库2025
- 反恐验厂管理手册程序文件制度文件表单一整套
- 中考地理真题专题复习 两极地区(解析版)
- 湖南省2024年中考数学试卷(含答案)
- HG/T 20686-2024 化工企业电气设计图形符号和文字代码统一规定(正式版)
- 平安中国建设基本知识讲座
评论
0/150
提交评论