AIoT 2.0重塑智能硬件行业分析报告:让设备真正“听懂、看懂、思考”_第1页
AIoT 2.0重塑智能硬件行业分析报告:让设备真正“听懂、看懂、思考”_第2页
AIoT 2.0重塑智能硬件行业分析报告:让设备真正“听懂、看懂、思考”_第3页
AIoT 2.0重塑智能硬件行业分析报告:让设备真正“听懂、看懂、思考”_第4页
AIoT 2.0重塑智能硬件行业分析报告:让设备真正“听懂、看懂、思考”_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

RK182X让设备真正“听懂、看懂、思考”——

AIoT2.0重塑智能硬件智能设备的重塑IoTAIoT1.0AIoT2.0万物智联连接、控制典型芯片RK3188,

RK3288数据处理无深度学习CNN目标识别、分类、检测典型芯片大模型听懂、看懂、思考典型芯片RK1820,

RK1828数据处理RK3568,

RV1106,

RK3588数据处理按规则识别

“人车非”泛化、理解、规划、决策201420182025首推搭载Android进入IoT市场首推内置NPU芯片首推端侧大模型协处理器芯片大模型从云到端边端侧模型能力及产品需求边端侧部署的必要性Agent能力融合感知理解、自主规划、工具调用、多步执行本地知识库(RAG)、习惯、记忆隐私安全

(Privacy)敏感数据

(视频、音频)“不出端侧”,建立用户信任。大模型泛化能力自主分析异常,解决各类边界问题;视频分析、工业检测、语音处理等应用实时性

(Latency)毫秒级响应,满足工业控制、自然交互等场景需求。小参数大模型类型广泛ASR、TTS、翻译、视觉编码、OCR、多模态、3D深度估计等各类模型层出不穷Token带宽成本

(Bandwidth

Cost)端云结合产品,仅传输端侧过滤后需深度思考数据;全端侧产品,无持续云端Token需求小参数大模型能力迅速变强可靠性

(Reliability)Qwen3.5-4B

Qwen3-VL-8B

>Qwen2.5-VL-14B无网弱网可用,不依赖网络,稳定可靠大模型端侧部署的挑战大模型性能需求挑战端侧大模型运行效果和生态挑战大模型运行的超大带宽需求模型精度挑战

->

量化方案支持Transformer架构/Attention机制支持模型生态挑战

->

主流模型支持和厂商合作端侧设备的功耗挑战端侧设备可商业化挑战AI算力功耗

->

高算力带来的功耗DRAM功耗

->

超大访存带来功耗商业化性价比

--

晶圆面积限制

->芯片性能商业化性价比

--

外挂DDR容量及成本Transformer时代的“内存墙”危机算力特性转变:从计算密集到内存密集算术强度的困境与带宽需求(以

7B模型INT4

量化为例)传统

SoC的物理极限与能耗挑战物理瓶颈与性能受限需求带宽CNN(AIoT

1.0)Transformer速度(带宽受限)(大模型)人类阅读(约20

Tokens/s)~70

GB/s推理速度慢

(~10Tokens/s),体验卡顿,“智能”

变“智障”。自然对话(约50

Tokens/s)~175

GB/s~350

GB/s计算密集型(Compute-Intensive)内存密集型(Memory-Intensive)极致响应(约100

Tokens/s)能耗噩梦(数据搬运代价)算力要求高带宽要求相对较低Decode阶段逐个生成Token,每次需加载全部权重(算术强度低)。传统SoC

(如RK3588)片外数据搬运能耗远高于计算,导致设备发热、降频。理论带宽峰值:100GB/S

(44GB)业内首颗3D堆叠端侧AI芯片

突破DRAM带宽瓶颈传统封装面对“内存墙”

“能耗墙”,DRAM

DieRK182X

采用革命性

3D

堆叠技术,将

DRAM

晶圆直接堆叠在

NPU逻辑晶圆之上,带来物理层面的降维打击。高密度TSV/HybridBonding(微米级互联)CPUNPUNPULogic

Die带宽数量级提升极致的推理性能突破性的能效比传输距离极短,访存功耗低单位比特能耗

(pJ/bit)

量级降低同样电池下运行更久建立数万个微米级垂直数据通道。RK182X等效带宽可达数百GB/s(相比传统

LPDDR4/5的几十GB/s)彻底消除

3B

+大模型带宽瓶颈。实现远高于普通

SoC的推理速度跑3B模型推理输出超100TPS内置DRAM无需外挂DDR布板简单面积小数百GB

vs

数十GBRK182X:专为端侧大模型设计的AI推理芯片优势项低功耗详细内容收益访存功耗比SoC低一个数量级内置2.5GB、5GB

3D

DRAM实测达到几百GB

(端侧唯一)平均能耗比远高于竞品无需外挂DDR3D

DRAMDRAM内置超高带宽高性能,3B模型推理输出100+TPS架构/算子加速量化支持低比特模型精度提升硬件支持Transformer及Attention机制支持W4A16量化,内存占用少5GB版支持8B大模型NPU设计支持FP16激活参数,Group量化模型效果好真多核,大小模型同时运行保障实时任务(ViT/LLM任务时间长)不影响主控已有业务独立选配升级平台方案主+协

算力解耦支持CNN/ViT/LLM/VLM/Omni/语音/嵌入/扩散等各类开源、商用模型与模型厂商直接合作:千问、智谱、面壁、阶跃、讯飞...AI生态模型适配全面LLM

性能实测对比

体验升级,3B大模型输出破百!能耗对比

RK182XvsO**nNX8GB三倍性能,六倍能耗比Qwen2.5-3B

性能功耗对比能量效率RK182XO***

NX8GBRK182XO***

NX8GB120.00100.0080.0060.0040.0020.000.001098765432109.02102.8035.6026.001.3711.40推理速度

(TPS)平均功耗

(W)TPS/W瑞芯微

AIoT2.0产品生态感知规划、决策执行AIAgent信息处理、任务规划、控制物理控制声音输出、视觉反馈采集声音图像数据麦克风

摄像头结构光主控

/RK182XAI

处理器扬声器

显示器

机械臂音频拾音算法端侧大模型云端大模型回声消除、噪声抑制、自动增益感知与理解多模态感知理解、记忆、学习端侧优势音频处理算法隐私与数据安全实时性与低延迟弱网离线可用推理成本确定ASR、TTS、翻译、声纹、多音轨规划与决策深度思考、路径规划意图理解、指令生成视觉算法(CNN)目标检测、分类、图像分割、关键点检测算法伙伴科大讯飞iFLYTEK思必驰AISPEECHUltralyticsyolo千问Qwen智谱GLMEdge面壁MiniCPM阶跃星宸STEPEdge从“听清”

到“听懂”AIoT人机交互(机器感强)期待的人机交互精准语音识别怎么说都懂,理解意图(不理解潜台词)连续对话,像朋友一样聊天关键词唤醒(每次对话都“失忆”)主议,自动完成复简单指令执行(固定操作)杂任务链有温度,个性化的回应基础问答(标准回复)从“听清”

到“听懂”—

AIoT2.0给语音交互装上大脑连续情境对话多轮对话,上下文记忆深度语义理解复杂任务执行结合常识、消除歧义自主规划、调用服务多模态融合感知个性化与人格化情绪分析、真

“察言观色”长期记忆、学习用户习惯体验升级

智能助手智能家居:从“遥控器”到“私人管家”智能办公:从“录音笔”到“专属秘书”自动管理设备,了解家庭成员习惯,老幼报告生成自动完成:翻译、总结、待办提醒智能车载:从“导航仪”到“副驾伙伴”智能机器人:从“遥控”到“自主助理”成员识别,自然交互陪伴,基于时间地点自主规划任务场景识别情绪分析,基于记忆个性化交互,自主完成任务体验升级

GUIAgentDemo从“看清”到“看懂”—

AIoT视觉AIoT视觉优势看得清:高清画质,超低照度认得准:精准识别“人、车、物”等目标反应快:基于固定规则触发告警AIoT视觉局限性没有环境、行为、事件分析能力容易误报:规则死板,环境干扰检索效率低:依赖关键词从“看清”到“看懂”—

AIoT2.0给视觉装上大脑场景理解能理解环境意图分析能分析行为背后的意图传统

AIoT能认到有人出现多模态大模型场景和行为分析异常行为预警逻辑推理自然交互高性能能关联时间地点能用人类的语言问答总结2S内发出预警AIoT2.0视频分析

从被动记录到主动预警、分析总结老幼看护预警日报周报生成自动时光缩影智慧家庭智慧厂区智慧交通智慧零售规范操作预警劳保用品穿戴事故自动发现拥堵原因分析门店热力图客流排队分析员工动线分析体验升级

事件检索“一键即达”视频搜索自然语言输入秒级快速反应精准匹配视频找失物“谁把箱子搬走了?”RK182X应用方向智能座舱智慧家庭存算中心教室监控分析会议纪要设备工业缺陷检测泛安防视频分析结构化搜索智能机器人边缘AI计算瑞芯微

AIoT2.0新战略

最佳端侧AI芯片方案主芯片+协处理器,成为瑞芯微并行研发、快速迭代的双轨重要资源线RK3688RK3668RK3572RK3588RK3576RK1899RK1880RK18602026RK1820RK181020252027双轨研发策略主控+协处理器旗舰主控姊妹片迅速迭代研发一代成熟一代协处理器紧跟旗舰主控工艺(高中低端)主控聚焦通用任务协处理器聚焦AI算力和带宽灵活配置->最高性价比主控+协处理器:解耦算力与控制传统硬件迭代痛点:升级主控(AP)是“痛苦”的RK182X

“协处理器”商业模式:完美解决痛点研发成本高重新设计

PCB、调试

BSP、重新认证主控(Host)协处理器

(CP)USB/PCIe负责:OS、外设控制、网络连接例如:RK3568

/MCU负责:核心

“思考”、大模型推理例如:RK182X

(M.2模组)生命周期错配设备周期长

(5

-10年)

vsAI迭代快

(几个月)战略优势无缝升级成本优势算力解耦不改动原有主板,通过

USB/PCIe

外挂M.2模组,瞬间赋能

AIoT2.0。专为端侧设计,内嵌

DRAM内存;无需外挂

DRAM,BOM

成本低。可选配不同算力的模组;下一代AI模型出现时,仅升级协处理器模块,无需整机重设计。RK1828典型

LLM/VLM

性能模型名称输入长度输出长度首字时延

TTFT(ms)输出速度

TPSQwen2.5-3B12812883.09100.75Qwen

2.5-7BQwen3-4B128128128128158.28106.5869.3786.87模型图像分辨率ViT(ms)LLMTTFT(ms)输出速度

TPSFastVLM_1.5B512*51214448.19148.47InternVL3-2B448*448392*392190.80279.3447.93148.2670.02Qwen2.5-VL-7B159.40Qwen3-VL-4B384*384158.89108.2989.69注:数据基于RKNN3

SDK

V1.0.0所有模型使用

w4a16

量化,VL

LLM部分

input

为128RK182X典型

ViT/CNN

性能模型图像分辨率单核帧率多核帧率YOLOv5s640x64035.4212.6ResNet50V2ViT_b_p16224x224224x224224x224448x252113.748.954.8/851.3/DINOv3331.027.3DepthAnythingV2模型精度保持模型类别模型名称数据集考察重点原始精度RKNN3精度数据类型LLMQwen3-4BQwen3-4B-InstructQwen3-4B-InstructInternVL3.5-4BYOLOv8sGSM8k数学能力90.689.84LLMLLMVLMCNNCNNIFEval(strict)BFCL(avg)指令遵循函数调用图片理解目标检测图片分类88.7384.9490.4285.3477.410.3800.721W4A16MMBench(cn)Coco201778.690.39(AP@.5:.95)0.729(Top1)W8A8ResNet50V2ImagenetRK182X全面的模型支持•Qwen

2.50.5B

/1.5B

/3B/7B•

Qwen30.6B/1.7B/4B/8B•

SigLIP1/2•

DINOv2/v3大语言模型

(LLM)视觉类ViT/CNN文本理解、生成、机器翻译GLM

EdgeHunyuan-MT1.5EVA02CLIPViT-B/L••图像分类、分割、目标检测、深度估计•••

Youtu-LLMCNN类•

YoloV5/V6/V8/World/26•

SenseVoice•

WhisperMobileNet语音模型••

ResNetASR、TTS深度估计

(Depth

Estimation)•

Depth-Anything-V2-small••Qwen2.5VL3B

/7BQwen3VL2B

/4B多模态/视觉语言模型

(VLM)•

GELab-Zero•••

FastVLM1.6B•

MiMo-VL-7B-RL•

Janus-Pro向量嵌入与重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论