2024年英伟达2024 GTC大会要点梳理

上传人：小*** IP属地：重庆上传时间：2024-06-04 格式：DOCX 页数：11 大小：1.12MB 积分：28 举报 版权申诉

已阅读5页，还剩6页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2024年英伟达2024GTC大会要点梳理英伟达推出新一代计算平台Blackwell英伟达GTC大会概述英伟达2024GTC大会于2024年3月18日举行，英伟达CEO黄仁勋发表主题演讲，发布加速计算、生成式AI以及机器人领域的突破性成果，同时英伟达的高级研发、管理人员以及其他AI领域的专家共同出席讨论人工智能在生物医疗、机器人、游戏等领域的研发成果和应用前景，重点聚焦在生成式AI、AI生物医疗和机器人，展示最新成果，展望技术趋势。英伟达CEO黄仁勋在GTC大会展望了新式产业革命：一是新工业革命，生成式人工智能将完成现代化；二是此次革命的Blackwell计算机，具有强大的计算能力；三是Nims，允许随身携带的新类型软件；四是NemoandNvidiaAIFoundary，帮助创建新型应用程序和聊天机器人并完成集成；五是OmniverseandISAAC机器人，搭建数字孪生平台全宇宙。2024GTC正式推出Blackwell计算架构英伟达从2006年进军AI计算之后，其计算架构基本保持两年一代的迭代速度。2024春季GTC上，英伟达CEO黄仁勋正式推出了Blackwell计算架构，Blackwell产品使用两块4nm光刻极限尺寸的裸片，通过10TB/s的片间互联技术连接成一块统一的GPU，以出众的性能、效率和规模揭开了生成式AI领域的新篇章。Blackwell产品同时取得多项技术突破，其采用第五代TensorCore技术，支持FP4/FP6的数据格式，其互联技术整体升级，NVLink技术和NVSwitch芯片技术均得到提升，引入可靠性、可用性和可服务性引擎(RAS)。英伟达推出新一代计算平台Blackwell和B200芯片英伟达推出全新GPU平台Blackwell，配备B200芯片。Blackwell架构GPU具有2080亿个晶体管，采用专门定制的台积电4NP工艺制造。Blackwell产品均采用两块光刻极限尺寸的裸片，通过10TB/s的片间互联技术连接成统一的GPU。Blackwell构架B200GPU的AI运算性能是前一代Hopper构架H100的2.3倍，功耗显著优化，配备192GBHBM3E内存。B200由两颗紧密耦合的GPU组成B200并不是传统意义上的单一GPU，B200由两个全掩模尺寸的GPU芯片紧密耦合形成，两个芯片通过10TB/s的NV-HBI（高带宽接口）连接，以确保它们能够作为一个完全一致的芯片正常工作，单芯片面积理论上的最大值为858mm2。每个管芯周围有八个HBM3e堆栈，每个堆栈为24GB，每个堆栈在1024bit接口上具有1TB/s的带宽。Blackwell支持第二代Transformerengine，支持FP4精度与FP6精度。Transformerengine在计算工作负载时，会不断跟踪整个神经网络中每个层、每个张量的精度动态范围，它将帮助用户自动将模型转换为适当的精度格式，以达到最大性能。英伟达Blackwell采用第二代transformerengine和RAS引擎第二代transformer引擎助力Blackwell实现性能和效率翻倍。第二代Transformer引擎将定制的BlackwellTensorCore技术与NVIDIATensorRT-LLM和NeMo框架创新相结合，加速大语言模型和专家混合模型(MoE)的推理和训练。BlackwellTransformer引擎利用微张量缩放的细粒度缩放技术，优化性能和准确性，支持4位浮点(FP4)AI。可以支持的新一代模型的性能和大小翻倍，同时保持高精度，未来在移动设备和边缘计算场景有大规模使用的潜力。Blackwell通过专用的RAS（可靠性、可用性、可维护性）引擎建立智能可靠技术。RAS引擎增加了智能恢复能力，可以识别早期可能发生的潜在故障，从而更大限度地减少停机时间。NVIDIAAI驱动的预测管理功能持续监控硬件和软件中数千个数据点的整体运行状况，以预测和拦截停机时间和低效的来源，从而节省时间、能源和计算成本。英伟达推出第四代NVLinkSwitch芯片NVLinkSwitch芯片性能显著提升，通信能力迭代升级。NVIDIANVSwitch基于NVLink的高级通信能力构建，可为计算密集型工作负载提供更高带宽和更低延迟。为了支持高速集合运算，第四代NVSwitchTray包含144个NVLink端口，并配有NVIDIASHARP引擎，可用于网络内归约和组播加速。NVIDIANVSwitch芯片在一个72-GPU的NVLinkdomain(NVL72)中实现130TB/s的GPU带宽，并提供4倍的带宽效率。第四代NVSwitchSystem可以支持多达576个GPU，总的带宽上限可达1PB/s。NVLinkSwitch与NVLink协同，提升GPU工作效率。借助NVSwitch，NVLink连接可在节点间扩展，以创建无缝、高带宽的多节点GPU集群，从而有效地形成数据中心大小的GPU。人形机器人基础大模型GR00TGR00T项目：用于人形机器人的通用基础模型GR00T项目：英伟达发布人形机器人基础大模型GR00T，将推进机器人在具身智能方面的突破进展。该模型采用语言、视频、人类示教等多模态指令作为输入，直接生成机器人需要执行的下一个动作，搭载全新计算平台JetsonThor，在模拟环境的对GR00T进行训练。大模型通过学习人类视频，学习人类动作，提升动作流畅性与拟人性，真正实现人机交互，提升其智能性。基于GR00T人型机器人基础模型，可以实现通过语言、视频和人类演示，来理解自然语言，模仿人类动作，进而快速学习协调性、灵活性以及其他的技能，进而能够融入现实世界并与人类进行互动。机器人学习和扩展开发：NVIDIAIsaaclab和NVIDIAOSMO机器人学习和扩展开发的利器：GR00T使用的Isaac工具可以为任何环境中的机器人创建新的基础模型。这些工具包括用于强化学习的IsaacLab和用于计算编排服务的OSMO。NVIDIAIsaaclab：高级运动技能的机器人，如行走和抓取，均需在模拟环境中运用深度强化学习，并在虚拟世界反复训练以掌握技能。作为IsaacGym的升级版，Isaaclab为开发者提供了一个强大的端到端平台，助力开发、模拟及部署人工智能机器人。在GTC2024主题演讲中，黄仁勋宣布了对Isaaclab机器人平台的升级，包括新增的机器人预训练模型、库及参考硬件集合，旨在加速学习进程并提升效率。更新内容支持探索新的机器人模型，包括FANUC和Techman，以及支持Orbbec、Sensing、Zvision、Ouster和Real-Sense的传感器生态系统；获取对自定义ROS消息的支持，允许独立脚本手动控制模拟步骤；探索为机械臂和移动基座用例添加的模拟中的随机化。GR00T项目加速人型机器人产业化落地从供给端看，具备更加强大的技术支持：人形机器人大规模应用的一大难题是它们还不够“聪明”，常常只能执行预先设定的任务，人机交互能力欠佳。最新的人形机器人通用基础模型和高性能GPU，为人形机器人变得更聪明提供了强大的软硬件支持，有望让人形机器人更好地理解并执行复杂任务，从而推动其大规模应用。这意味着人形机器人将有可能实现自主式模仿学习，只需要较少的数据输入（如观察人叠衣服的动作）便能实现模仿，而不需要预先的任务设定。从应用端看，将加速人形机器人产业化进程：GR00T大模型完善了人形机器人的产业生态，从模型训练到模型应用场景都给予了强有力的支撑，降低了应用开发的进入壁垒，在上游对口模型开发训练和下游机器人商品制造环节都将可能涌现更多的新兴科技企业，有望促进人形机器人产业化加速落地。自动驾驶Thor平台搭载全新BlackwellGPU英伟达发布新一代集中式车载计算平台ThorDRIVEThor是专为生成式AI打造的车载计算平台。2023年9月，英伟达Thor芯片首次发布，该芯片可提供高达2000TFLOP高性能算力，将自动驾驶、自动泊车、智能座舱等功能集成到一个单一的中央计算平台中，实现车内计算单元的大一统。同时，Thor兼容Linux、Android和QNX三种系统，有效解决车机系统碎片化问题。Thor车载计算平台分为两个版本，分别是单片1000TOPS算力版本和双片2000TOPS算力版本。Thor预计最早明年开始量产，同年上车。DRIVEThor具有超级计算架构，技术优势显著。DRIVEThor支持多域计算、自动驾驶隔离功能和IVI，可以帮助制造商有效地将许多功能整合到单个片上系统(SoC)上。DRIVEThor是第一个集成推理转换器引擎的AV平台，可以将Transformer深度神经网络的推理性能提高多达9倍。新的超级芯片还采用了最新的NVLink-C2C芯片互连技术，它能够以最小的开销跨链路共享、调度和分配工作。英伟达全新车载计算平台THOR合作需求旺盛多家头部电动汽车制造商在GTC上宣布其搭载DRIVEThor的下一代AI车型。比亚迪、昊铂、小鹏、Plus、Nuro、Waabi和文远知行纷纷采用DRIVEThor。比亚迪正在将与NVIDIA的长期协作从车端延伸到云端，除了在DRIVEThor上构建下一代电动车型外，比亚迪还计划将NVIDIA的AI基础设施用于云端AI开发和训练技术，并使用NVIDIAIsaac与NVIDIAOmniverse平台来开发用于虚拟工厂规划和零售配置器的工具与应用。新能源汽车品牌广汽埃安宣布旗下高端豪华品牌昊铂下一代电动汽车将采用DRIVEThor平台，新车型将于2025年开始量产，可实现L4级自动驾驶，于2025年量产。小鹏也将Thor平台作为“智能大脑”，助力自研XNGP智能辅助驾驶系统的开发。理想汽车和吉利旗下的极氪汽车均宣布将采用英伟达的DriveThor技术。Thor赋能长途卡车、配送车和自动驾驶出租车。除乘用车外，DRIVEThor还能够满足卡车、自动驾驶出租车、配送车等其他细分领域的不同需求。在这些领域中，高性能计算和AI对于确保安全、可靠的驾驶操作至关重要。英伟达AI应用百花齐放NVIDIAGPU加速计算药物研发和应用NVIDIAClaraDiscovery集GPU加速及优化的框架、工具、应用和预训练模型于一体，可为医学影像、医疗器械、基因组学、药物研发等医疗健康和生命科学领域的AI解决方案提供强劲助力。GPU助力的深度学习算法和Transformer模型将加速药物研发的每个阶段，从训练能够理解化学空间的大型语言模型(LLM)，到分子动力学模拟、蛋白质结构预测以及生成药物设计，新型深度学习技术正在改变科学家探索不断扩展的化学领域的方式。ClaraDiscovery经过优化，可基于NVIDIADGXA100（提供5petaFLOPS的性能）运行。DGXA100专为各种大规模加速计算工作负载而打造，可帮助研究人员更快地解决问题，并为IT提供统一的、易于部署的基础设施，以支持新一代药物研发。英伟达宣布推出BioNemo,部署生物大模型在GTC大会上，英伟达宣布推出BioNemo，这是一款基于NVIDIANeMoMegatron构建的应用框架和云服务，用于在超级计算规模下训练和部署大型生物分子TransformerAI模型。BioNeMo随附预训练的大型语言模型，专为蛋白质、DNA和简化分子线性输入规范(SMILES)的语言而设计。BioNeMo可以用于在超级计算规模下训练和部署基于NeMoMegatron的生

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2024年英伟达2024 GTC大会要点梳理

文档简介

温馨提示

最新文档

评论

2024年英伟达2024 GTC大会要点梳理

文档简介

温馨提示

最新文档

评论

相关文档