版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
序言序言II构建多元AI算力应用,助力本地化算力普惠发展第一章从周期律动到生态重构,开启智能新时代5第二章创新AI核心技术体系2.3制造业工业质检海量长期存储创新技术23第三章AI技术实践案例能新时代253.1基于国产化软硬件的AI大模型3.2智慧金融:大模型技术助推基金公司实现降本增效303.3汽车制造:大模型训推技术赋能吉利智驾333.4工业制造:工业质检AI解决方案实践案例36第四章迈向AGI时代的战略展望394.1新一代AI基础设施布局404.2智能化转型赋能体系CONTENTS 2025年7月,国家发布的《关于深入实施“人工智能+”行动的意见》表明,企业要深入实施“人工智能+”行动,推动人工智能在经济社会发展各领域加快普及、深度融合,形成以创新带应用、以应用促创新的良性循环。这一政策导向,为当前以大模型为代表的人工智能技术革当前,AI大模型正以前所未有的速度重塑产业格局,产生的影响已从技术层面向认知范式、生产方式乃至生产关系渗透。DeepSeek等代表性技术的突破,已然打破了传统产业对AI技术"从技术演进视角看,大模型的发展已进入“质变”阶段。早期AI依赖规则驱动,如今大模型通过海量数据学习和参数规模扩张,实现了从"专用工具"到"通用智能"的跨越。DeepSeek的突破性意义在于,它通过算法创新,大幅降低模型训练成本,使得企业能够共享AI红利。这种技术普惠性正在催生“长尾效应”――比如面向制造业,小企业可通过云端大模型实现智能质检;产业层面的范式重构更具革命性。在医疗领域,大模型已从辅助诊断扩展到药物研发全流程,例如通过分子模拟将新药筛选周期从数年缩短至数月;在汽车行业,它正重塑从设计、生产到服务1的价值链。更深远的影响在于,大模型正在打破行业壁垒,形成跨域协同的生态网络。例如金融风控模型可融合交通、社交等多维数据,城市管理能整合能源、环保等跨部门资源。这种融合创《2025AI方案赋能白皮书》系统梳理了大模型技术的最新进展与产业应用路径,为各行业提供2025年8月233 序言II构建多元AI算力应用自去年4月份异构智算产业生态联盟成立以来,联盟已经携手联想等众多生态伙伴,持续走进国内多家智算中心,共同见证了DeepSeek大模型落地新突破,并围绕异构智算、DeepSeek大模型落地数据中心、超智融合等话题与行业专家、客户、生态伙伴们进行了深入交流,共同探讨了异构智算与AI大模型应用的深度融合。同时我们也能看到,AI的价值不仅在于技术的创新突破,更在于如何将这些技术精准融入实际场景,构建完整的AI应用支撑体系,并实现高效的、"开箱即用"的本地化解决方案。无论是智慧城市中的交通调度优化,还是工业互联网中的设备预测性维护,亦或是智慧医疗中的影像辅助诊断,都可以依托AI大模型实现从技术突破到产业普惠的闭环,让AI创新技术与应用可以基于新AI基础设施,真正做到“百花齐放,争奇斗艳”!这也是我们在2024算力大会上发布《异构智算产业趋势与技术发展白皮书》之后,继续联合中国智能计算产业联盟、中国科学院、中国信通院及众多生态伙伴推出第二本《2025AI方案赋能》白皮书的缘由。2025年版本的异构智算产业联盟产业白皮书也从关注AI算力解决方案升级到关注AI应用落地的全方案。该白皮书也展示了联想在AI基础设施领域技术的深厚积淀与对客户需求的深刻洞察,为行业树立了全新落地实践标杆。3此次发布的2025版白皮书,不仅聚焦于AI技术本身,更深入探讨了AI创新技术与新AI基础设施的融合路径。从揭示大模型如何重构产业认知范式,到剖析AI技术在不同产业中的应用场景;从分享实践案例,到展望智能时代的战略布局,我们希望为大家呈现一个全面、深入的AI应用与新型基础设施融合全景图,提供可借鉴、可操作的AI落地实践新方式。"不积跬步,无以至千里;不积小流,无以成江海。"面对AI与新基建融合发展的广阔前景,我相信并也正看见,整个联盟依然朝着目标坚定前行:与众多优秀的伙伴们一道,为中国智算产业的蓬勃发展提供坚实基础,为我们在智算时代取得成功寻找正确方向。2025年8月4从周期律动到生态重构,从周期律动到生态重构,5第章从周期律动到生态重构,开启智能新时代5 AI发展的周期性60多年来,人工智能的发展,始终遵循“技术突破-预期膨胀-瓶颈显现-理性回归”的性规律,与Gartner技术曲线高度吻合。第一次浪潮(1956-1974)以达特茅斯会议为起点,通过人工定义逻辑规则来模拟智能,在数学定理证明、简单语言交互等领域取得初步突破;第二次浪潮(1974-1990s)依托“if-then”规则库构建的专家系统,在医疗诊断、工业控制等垂直领步入本世纪,互联网的广泛普及带来海量数据,GPU算力呈指数级提升,算法也取得新突破,共同催生了人工智能的第三次浪潮。经过近20年的发展,可以发现,第三次AI浪潮也并非是第一阶段(2012-2019)以深度学习为核心驱动力,依托卷积神经网络(CNN)等架构,实现年AlexNet的成功成为深度学习复兴的引爆点,2016年AlphaGo击败世界围棋冠军展示了其在复杂决策领域的巨大潜力。但这一阶段本质上仍属判定式的专用模型,另外还需依赖人工标注第二阶段(2017-2024)以2017年基于“自注意力机制”的Transformer架构的提出为代表,开启了大语言模型(LLM)主导的生成式人工智能革命。在这一阶段,“预训练-微调”的范式成为主流,证明了先在海量文本上预训练,再在特定任务上微调的有效性;模型越大、训练数据越多和算力更强,模型的能力就越强的规模定律(ScalingLaw)被广泛信奉;2022年底ChatGPT的爆发标志着LLM从技术突破走向了大众应用,2023年GPT-4等模型能根据文本生成高质量图像标志着多模态模型的兴起,生成式和通用AI(AGI)成为新的追求目标。时间来到2025年,作为第二阶段关键信仰的规模定律的边际效益明显递减,模型能力随着规模供给出现了断层且价格居高不下,全球易获取的互联网文本数据已接近耗尽,虚假信息和知识产66技术、资源、成本和伦理等多重约束,正倒逼人工智能技术实现新的发展,必须从暴力扩张转向精细化演进。目前看来,第三阶段大致有三大发展主线:能力边界拓展、技术效率优化和场景深一是能力边界主线。学术界主导的基础研究聚焦智能本质的突破,推动模型从数符号神经融合探索将深度学习的统计学习能力与符号主义的逻辑规则结合,通过知识图谱嵌入、因果推理引擎等技术,解决大模型幻觉、数学推理薄弱等问题。原生多模态智能通过统一语义空间构建,实现文本、图像、音频、视频、3D结构的深度理解与生成,以突破文本-图像拼接的伪多模态模式。这些探索,预示着二是技术优化主线。产业界主导的工程性优化聚焦资源效率提升和可持续发展,通过精耕细作提升模型落地的性价比。比如,混合专家模型通过动态路由机制分配专家模型,从而在保持性能的同时大幅降低了计算成本;动态训练与推理根据任务难度和数据特征动态调整参数规模,再结合模型剪枝、知识蒸馏等技术,进一步降低了部署成本;混合精度训练采用FP16/BF16等低精度格式与FP32高三是场景化落地主线。用户侧主导的AI技术与业务的深度融合,通过模块化、插件化、协同化和标准化等,实现大模型的行业渗透以及与场景的深度结合,把实验室技术全面转化为新质生产力。比如,LoRA等技术通过只调整模型的极少数参数,实现与行业专业知识的适配,将金融、医疗等领域的微调成本从百万元级降至十万元级。在模型与外部交互方面,MCP(模型上下文协议)实现大模型与企业数据库、ERP系统的标准化对接,A2A(Agent-to-Agent)协议支持多智能体协同;各种Agent赋予大模型环境感知、自主决策和采取行动的能力。77随着第三次人工智能革命的发展进入新阶段,其所需要的数据、算力、能源等基础型资源以及伦厂L厂L在数据方面,更强调多模态、专业化和工程化。一是数据类型的多元化,从单一文随着来自互联网上的训练数据即将耗尽,数据标注从通用向场景化标注(如工业缺陷类型、病灶分期)演进,这要求标注人员需具备专业技能和行业知识,对数据集的质量要求更高,标记要求更精细。三是数据治理工程化,逐步迈入全生命周期和全域数据治理,采用DataOps等方法以更加标准化、工具化和智能化的方式,做在算力方面,算力供给侧从重训练到训推均衡等演进。随着AI发展重点从模型训练转向前端应用,以及大模型在低延迟、高并发场景中的应用日益增多,市场对推理算力和边缘算力的需求将显著上升。在此背景下,从训练与推理分离逐步迈向训推一体成为行业发展的必然趋势,这有助于降低模型迭代与部署成本,提升整体效率。另外,随着AI应用场景的多样化,异构算力将加速普及,CPU、GPU、在能源领域,人工智能能耗的持续快速增长,促使电力供给布局不断优化,带动了新一代核电、可再生能源等产业的发展,助力算力与电力实现协同共进,并推动单88一是监管范围全域化,逐步从型训练AI科技伦理正从理论探讨走向实践落地伦理原则和评分体系,开源工具如Fairlearn、ModelCards助力算法偏见检99最先受到影响的场景是交互与深度推理的客服、三是技术性应用类场景,以语言为接口实现自动化,代码生成、运维自动化、RPA+AI等。最后是跨模态与具身应用的场景,以大语言模型为语义中枢,驱动机器人、AR/VR等与物理世界交智能座舱、工业巡检等场通过微调解决“不懂行话”、“答非所问”和“态度不端正”的问题,让模型“懂行业”、“守规矩”、“答得准”。领域微调通过修改知识存储解决模型不懂行话的问题,任务微调通过修改例如,借助RAG、知识图谱等动态知识库弥补知识盲区,突破纯文本生成局限;让模型调用能操作现实世界的插件、规则引擎等智能工具,并运用可统筹多工具协作的Agent。最后是“集成”,这是AI应用的最后一公里。重点是保持原有ERP/CRM等的业务流不变,用AI增强关键节点的能力。比如云端、边缘和混合等的柔性部署,模型压缩、推理提速、批量处1.6从互联网到AI技术的路径演变正如TCP/IP协议和WWW分别成为互联网的统一架构和应用生态基础,Transformer架构和Agent也正成为AI的统一模型和生态基础。历史上技术发展的轨迹总是相似的,未来人工智能的发展也将沿着当年互联网的发展路径演进:统一底层的技术框架—>形成上层的应用生态—过去30年,互联网编织信息巨网重塑世界;未来20-30年,AI将如超维引擎,驱动人类突创新创新AI核心技术体系第二章创新AI核心技术体系在经典的RL框架中,智能体(Agent)通过与环境交互来学习策略,以最大化长期奖励。尽管预训练语言大模型(LLM)在理解和生成自然语言方面展现出强大能力,然而,它们在复杂推理和链式思考上的表现仍有限。这促使研究者开始探索和思考将强化学习与大模型结合,希望通过后训练(post-training)方式提升模型的思维与推理能力。从OpenAI的ChatGPT等模型使用人类反馈强化学习(RLHF)优化生成质量,到Anthropic的Claude采用对齐驱动的RL方法优化模型行为,越来越多的大模型在训练中加入强化学习的步骤以取得更好的效果。当前,最引人注目的RL+LLM的项目,无疑是Open-AI的O1和第二章创新AI核心技术体系比如对业务领域的理解不够深入、准确性欠佳、超大参数带来的高昂成本,以及外部调用时可能引发的隐私泄露问题等。传统监督微调(SFT)虽能通过标注数据让模型有一定适应性,但严重而通过强化学习微调(RFT,ReinforcementFine-Tuning)的方式,仅需少量简单示例与奖励反馈就能快速校准模型行为,使其在业务流中自动持续更新迭代,相比监督微调(SFT),在降标注成本、提泛化能力、贴合人类偏好及行业规范上优势显著;针对特定场景,小模型用RFT可显著超越超大通用模型,业务推理部署成本也优势突出;不过,现有方案多依赖NVIDIA对于强化学习架构,我们摒弃了传统架构(ColocatedArchitecture使用解耦架构(DisaggregatedArchitecture使得生成(Generation)和训练(Train)分布在不同的Producer-ConsumerPattern是一种经典的软件设计模式,用于在两个进程或线程之间管理资实现高效的数据采样与训练解耦,支撑GRPO等大规模、分组、自适应的训练策略。用户可根据资源情况,灵活地配置推理组(生产者)与训练组(消费者)的数量,从而达到高效利用资源两部分。前者使用当前策略模型与环境进行交互以获取奖励(Reward并收集相关数据;后第二章创新AI核心技术体系者使用收集的数据来更新策略模型。因此,在这个模式中,推理引擎(如vLLM)作为生产者(Producer将数据存入共享缓冲区(SharedBuffer而训练框架(如Colossal-AI)则持续读取缓冲区数据,高效地进行策略更新;更新后的模型可以再被推理引擎加载从而进入下一个rollout循环。使用共享缓冲区作为桥梁,生产者与消费者两个步骤可以独立运行。同时,异在数学的训练过程中,模型的reward持续上升,同时伴随着在Math500evaluation过程中从训练、推理、调度三个维度,我们成功打通了基于国产芯片原生开发深度思考模型的链路。具体而言,借助Colossal-AI多维并行训练方案实现训练加速,利用Ascend-vLLM引擎达成推理加速,再通过Fuyao-ray进行NPU调度及HCCL通信管理,最终实现在国产芯片上开箱即用式地开发基于Qwen系列模型的深度思考模型,且训练与推理速度提升超50%。此外,该方案支持GRPO、DAPO等强化学习算法,还具备长序列训练能力。第二章创新AI基于全国产算力软硬件训练的Qwen2.5-7Bpreview版本,经一系列优化后,在AIME24、25等benchmark测试中已展现出显著进步。不仅如此,它还能进一步融合RAG知识库、Agent以强化微调技术,解决通用大模型在落地应用中的业务领域理解不足、超大参数成本高昂、外部调用隐私泄露等多重挑战。强化微调技术可以仅用少量简单示例结合奖励反馈,快速校准模型行在强化微调技术方案中,我们通过创新的解耦架构和Producer-Consumer模式,实现了三大1.训练效率提升:流水线式强化学习和异步式强化学习有效实现并发执行,极大提升训练吞吐3.高可扩展性:支持灵活扩展训练资源,独立调整不同类型任务的训练资源针对现有解决方案大多依赖特定平台如NVIDIAGPU,在国产化软、硬件平台上,为客户提供第二章创新AI核心技术体系在AI技术深度融入企业核心业务的进程中,算力基础设施的复杂性、集群管理的低效性以及资源调度的割裂性,正成为制约AI模型从实验环境走向规模化生产的关键瓶颈。以下几大挑战,AI应用场景的多元化,放大了算力匹配的复杂性:企业既需要动态选择算法框架与硬件组合,又面临混合部署环境下硬件故障模式缺乏系统性验证导致的可靠性风险,同时多框架共存引发的开发工具链冗余,正逐步抵消“灵活适配”数据显示,千卡集群每月因硬件故障、网络抖动或软件异常导致的中断次数达15次以上,而在依赖预设断点续训的常规方案下,单次故障恢复需数小时,每月千卡集群的额外费用超过百万元。且随着AI集群规模从千卡到万卡,故障中都会导致AI算力利用率低。理论上大规模集群具有强大的计算能力,实际往往难以实现性能的线性增长。提升集群的整体性能,需要客户深入分析并采取相第二章创新AIAI-HPC资源割裂与共享僵局HPC集群部分会用到GPU节点,AI集群者的用户希望跨集群按任务优先级和资源情况共享GPU,但因AI与HPC集随着AI技术的发展,深度学习模型愈发复杂庞大,对算力算力爆发”。这要求更强大硬件支持,如GPU、TPU等。然而,现有硬件可能无法满足快速或实时数据处理需求,推理性能成为AI普及的关键瓶颈,尤其2.2.22.2.2产品特性和架构大模型训推技术――联想万全异构智算平台,是高度自动化的AI全流程开发平台,整合异构GPU与CPU算力,统一管理与智能调度,提供稳定高效的AI/HPC混合算力,覆盖高性能计算与人工智能场景。它支持AI模型开发、训练、微调及推理部署,提升端到端效率;统一纳管大模型训推技术还提供软硬一体优化方案及全栈软件栈,通过前沿技术优化AIGC、CV、NLP等模型开发与部署,提升AI基础设施利用率与任务效率。此外,该技术还能提供可视化管理和基于全球领先的算力性能与可算力组合与算法策略,实现算平台突破传统算力利用瓶颈,将AI基础设施利用率与任务执行效率提升至行业领先水微调、推理等全场景需求,结合实时监控与智能告警功第二章创新AI核心技术体系架构设计层面,该技术通过模块化架构设计,提供从资源管理到业务落地的全栈能力,覆盖安全受管资源任务状态摘要视图,图形化展示任务分类和数况(GPU类型,分配卡数,空闲卡数,CPU和内存的使用情况,GPU利用率,CPU和内存利用率)。平台提供集群节点的可视化列表管理功能,支持运维人的运行状态,覆盖HPC与AI节点的全维度监控需求。可快速获取节点基础信息(包括名称、机型、序列号、IP地址、CPU/内存插槽规格、GPU型号及支持业务使用IB网络通信,支持ROCE/RDMA网络;可监控主机网络接口信息(包第二章创新AI核心技术体系平台提供完善的监控和告警系统,可实时发现并处理定运行。此外,平台支持根据集群中部署的资源管理器类型,快速查看对应GPU资源针对混合集群资源共享需求,基于AI和HPC调度构建而成的超级调度器,可切换调度模式,满足科学计算等场景的HPC与AI计算调度需求。它能跨集群动态管理和调超级调度器是资源共享的关键,它架构于K8S(AI训练集群)和Slurm(HPC集群)调度器之上,收集状态信息,全面监控任务,识别可承载不同软件定义数据中心管理平台需设计并实现高效的调度算法,以负载均衡:选择负载均衡时,平台将作业调度到剩余GPU资源多的节点,尽量保持负最小碎片化:选择最小碎片化时,平台将作业调度到剩余GPU资源少的节点,以减少根据应用/作业/任务执行过程中实际使用的CPU,MEM,GPU资源量进行计费和支持登录页、主页的LOGO、标题及主题色自定义,企业可快速植入品牌元素,打造20第二章创新AI核心技术体系202.2.32.2.3核心技术能力集成海量硬件评测与AI算子算法,标识AI场景、算法与集群配置的匹配关系。用户输入场景和数据,系统可自动规划调度最佳算法与集群配超级调度器可实现双类型调度架构,切换AI的K8S与HPC的Slurm调度,全局监网络通信效率提升超10%,集群规模越大,效果越显著,突破集群计算瓶颈,训练效AIAI高效断点续训平台可对数据进行多级备份,精简备份数据量,从最佳路径提取数据;基于AI故障特征库,开发预测模型,实现“用AI预测AI”;集成硬件监控与调度器故障监控,确保AI故障抓取万无一失,实现分钟级AI断点续训针对AI推理和中小训练,采用GPU内核态虚拟化算法,突破操作系统层用户态虚拟第二章创新AI核心技术体系AIAI推理加速算法集采用INT8/FP16混合精度量化降低计算与存储需求,同时保障模型精度;通过推测推提升推理速度;利用分布式并行技术跨节点分配任务,大幅提高AIAI编译优化器通过多种技术手段降低训练和推理开销。操作融合技术将多个相关操作合并为一个操作,减少内存访问和数据传输次数;操作替换技术用更高效的实计算效率;路径优化技术对计算图的执行路径进行优化,选AIAI训推慢节点故障与自愈通过异步实时状态监测与综合故障分析,系统能够及时发现况;异步备份与恢复功能确保在出现故障时能够快速恢复到功能提前发现潜在故障隐患,实现故障预测与自愈。该系针对专家模型架构深度优化通信效率。训练中涉及AlltoAll和AllReduce等操作,22第二章创新AI核心技术体系22目前,全球制造业已经进入智能化转型的深水区,AI质检作为更智能、高效的解决方案正在被广泛应用到制造业产线的质检场景中。但在轮胎行业,各家轮胎生产企业仍高度依赖传统的人工1工作环境相对比较恶劣,每半年的工人流失率高达30%1工作环境相对比较恶劣,每半年的工人流失率高达30%32国内人力成本行业的信息化行业的信息化2.3.22.3.2解决方案某公司推出的轮胎表面缺陷终检全检设备,采用先进的机械与光学设计。它借助高清工业相机,能够全方位采集轮胎胎冠、胎侧、胎肩、趾口以及胎里等部位的图像数据。这些数据结合某公司全自研的小样本终身学习技术,并部署在搭载高性能CPU/GPU的ThinkSystem系列和问天系列服务器上,可实现轮胎表面缺陷的快速建模。该设备不仅能全方位检测轮胎表面缺陷,还支持这款轮胎质检全检设备尺寸为长3m、宽2.6m、高2.5m,具备多种功能,包括轮胎的上/下该解决方案依托某公司边缘大脑工业质检开发套件,充分考虑了轮胎生产企业的生产环境、生产效率、流水线特性以及质检要求等多方面因素,从光学、机械、电气、算法、软件等多个层面进23第二章创新AI核心技术体系2324第二章创新AI核心技术体系24AIAI技术实践案例25AI技术实践案例能新时代25 AI大模型强化学习微调方案在国产化软硬件蓬勃发展的当下,基于国产化软硬件的AI大模型强化学习微调方案凭借其独特该技术方案在互联网、电商、工业、能源、金融、教育等众多领域均具备广泛的应用潜力。强化学习微调(即基于已有模型或策略,借助动态反馈信号来优化决策)已在这些领域展现出极为显我们以RFTasaservice为基础,搭建了适用于生产环境的全自动定清晰的奖励机制,为模型自身的rollout数据赋予明确的奖励,进而自动化地构建训练数据,在业务场景中,大模型的核心价值不是“输出正确答案”,而是“达成业务目标”。以电商售后客服为例,预训练大模型可能擅长流畅对话,但未必能高效解决“退货退款”“物流纠纷”等问题――这就需要强化学习(RL)介入,让模型从“会说话”进化为“能办事”。业务目标不是“对话长度”或“语法正确性”26第三章AI技术实践案例能新时代26用户发送负面情绪词汇(如“差评”“投诉”寄配件”“修改收货地址”)、不同情绪(冷静咨询/愤怒投诉)的用户行为。物流状态)、用户标签(VIP客户/新用户/历史投诉用户)。•动作(Action)定义:模型在当前状态下生成的回复内容(如“请提供订单号,我为您查询第三步:用“人类反馈+强化学习”(RLHF)优化模型利用模拟训练环境的训练数据,进行模型优化训练,在测试环境中,达到一定的准确性后,该模型则可以准入上线;另外,我们同时可以将用户的真实行为收集打分构建训练数据,从而不断优27第三章AI技术实践案例能新时代27以提升复杂Agent工具调用能力为例,对于未通过工具测试(在现有模型条件下,不能达到•根据工具调用的正确性、调用成功后执行结果的正确性等结果设置Reward数值•在模型能力达到预期百分比,如99%时,就可以将该工具和经过优化后的模型投入上线在整个过程中,Reward由交互环境提供,具体涵盖工具调用的正确性分数、调用成功后执行结果的准确性等方面。这部分可通过仿真环境进行测试验证。一旦模型能力达到特定百分比,比如在上述基于国产化软硬件的AI大模型强化学习微调方案的应用案例中,我们已然看到其在多领域的出色表现与强大潜力。而这一方案不仅在应用层面成效显著,更能为用户带来全方位、深层维度一模型,降低AI模型开自动迭代替代人工调28第三章AI技术实践案例能新时代28从奖励函数的精心设计,到业务流的深度嵌入,提供一站式、端到端的实施服务,确保方案顺利落地,降本增效的预期效果,让企业决策有据可依,投代更新,无需企业重复投入大从电商到金融,从能源到教育,强化学习微调方案正帮助越来越多企业实现“AI从通用到专用”29第三章AI技术实践案例能新时代29 在当今数字化浪潮席卷的金融领域,基金行业正面临着新一轮的机遇与挑战。技术的飞速发展促使基金公司不断探索创新,以提升自身的竞争力和服务质量。某公司作为全凭借自身在AI、高性能计算等领域的深厚技术积累和丰富实践经验,为基金行业提供了全方位公司没有实际两台8卡H20方案以及IB网络部署经验,也没有POC环境进行验证测公司没有实际两台8卡H20方案以及IB网络部署经验,也没有POC环境进行验证测公司虽有一定AI大模型技术积累,但对多卡硬件平台以及模型框架了解有限,前期需要对平台以及框架的规划进行细致评估,以确保技术的可行性30第三章AI技术实践案例能新时代30和技术团队详细分析大模型业务在不发量等各种情况下的Token和技术团队详细分析大模型业务在不发量等各种情况下的Token输出能力,并在此基础上设计包含IB网络在内的完整解决方案,满足自身在AI技术应 使用2台WA7780G3AI服务器,单台配置8卡H20模组,并通过一台400GBIB交换机实现互联,同时提供万全DeepSeek671b满血大模型专家部署服务。这些硬件设施和专业的部署服务,为基金公司的业务发展提供了强根据根据DeepSeek模型的特点和金融数据处理的需求,售前售后专家在项目的实施阶段对项目保持高度关注,提供快速的响应并解决客户在实施过程中碰到的系统框架以及IB网络性能方面的各种难题,提升了模型的运行速度和数据处理能力,确保通过多次产品交流,充分了解AI服务器在性能以及可靠性上的优势,以及ThinkSystem品牌策略和问天双品牌策略,消除选品3.2.23.2.2用户价值:优化流程,改善效能AI替代率达30%-50%AI替代率达30%-50%。例如智能代码研发使策略回测周期缩短70%,通过“企业级RAG”技术,投研团队从基础数据处理中借助DeepSeek模型MLA注意力机制和FP8低精度训练等技术,训练成本仅为成本降至2%-3%,有效降第三章AI技术实践案例能新时代3.2.3行业影响与经验辐射具有广泛的可复用性,可为其他基金公司提供借鉴。同时,某公司针对基金行业客户需求,持续提供定制化落地服务,进一步推动了人工智能、高性能计算等技术在基金行业的广泛应用,助力通过与某公司的合作,该基金公司在技术创新和业务发展方面取得了突破,提升了自身的核心竞32第三章AI技术实践案例能新时代32 在HPC领域,某公司是经验丰富的厂商。在HPCTOP500榜单中,入围数量连续9届排名世界第一,以接近1/3的份额超越业内所有厂商。特别是在水冷技术方面,自研的海神温水水冷软件技术方面,某公司的实力也十分突出。研究院联合高校研究机构,经多年研发推出GPU内核态虚拟化技术。此技术直接作用于GPU驱动层进行虚拟化与资源管理,借助新算法将虚拟化某公司基于多年集群网络设计经验,积累了大规模集群网络拓扑优化方法,并与高校合作开发出基于深层数学原理的集合通讯优化算法。在千卡规模训练集群中,采用集成集合通讯库的异构智算平台管理调度,网络通讯效率可提升超10%,且集群规模越大效果越显著。此外,某公司的Newtalk智能体应用,支持与训推大模型对接,提供可视化对话、Prompt定制、知识库挂载及联网搜索等功能,助力用户快速体验智能体,积累大模型使用经验后,用户可自主决定智能体的研发成本居高不下,原PBS集群调度系研发成本居高不下,原PBS集群调度系统按节点订阅模式计费,每年按许可收费,随着集群规模不断扩大,使用为保持产品领先竞品对超算中心进行算力提法自主可控,存在国际供应链风33第三章AI技术实践案例能新时代33某公司的大模型训推技术HPC版,赋能吉利汽车中央研究院,打造了1000+节点超算中心,大模型训推技术HPC版专注于HPC工作负载场景,能更便利地使用集群计算资源,持续稳定地输出算力,不断突破计算效率瓶颈。它深化了对软、硬件的全面监控,优化多任务运行效率,简化与底层计算资源的交互,使吉利汽车能够利用主流的开源集群工具,更加高效便捷地在HPC和AI环境中使用相关资源。同时,提供集群管理和监控、作业调度和大模型训推技术HPC版为吉利汽车超算中心配大模型训推技术HPC版为吉利汽车超算中心配备了Lenovo水冷服务器SD650V3、高性能NDRIB网络等先进硬件设备。这些硬件设备相互配合,保证了超算中心的高性能,能够满足吉利汽车复杂车辆仿真研发的需求,为加速车型迭代提供了有针对吉利汽车需要替代PBS调度系统的需求和研发安全性要求,大模型训推技术HPC版提供原厂研发人员客户现场领域的22款核心工程仿真软件的应3.3.23.3.2用户价值:降低研发成本,业务平稳升级升级过程平滑,实现了业务零中断,确保了吉利汽技术自主可控,规避了供应链风险,为吉利汽车的最终,凭借某公司的全方位的解决方案和技术团队深厚的技术积累,吉利汽车成功打造国产化超升级过程平滑,实现了业务零中断,确保了吉利汽技术自主可控,规避了供应链风险,为吉利汽车的降本增效效果显著,节省了商业授权费用,降低了34第三章AI技术实践案例能新时代343.3.3树立行业标杆,辐射典型经验在行业影响方面,吉利汽车超算中心项目成为中国汽车行业最大规模为行业树立了榜样。某公司提供的成熟系统集成和迁移方案,具有典型经验可复用的特点,可为其他制造业企业提供借鉴。此外,某公司针对制造
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 流行钢琴练习曲小汤三视频教程
- 商业银行信贷风险管理流程与案例分析
- 电力系统设备检修与安全操作指南
- 幼儿园社交能力发展评价体系
- 人生成长咨询室设计方案
- 教师考编咨询方案有哪些(3篇)
- 财务转型咨询方案范文怎么写(3篇)
- 崇明区商务信息咨询方案(3篇)
- 企业管理咨询方案书范文(3篇)
- 大学生专业选择咨询方案(3篇)
- 2025年教师编制考试面试题库及答案
- 幼儿园家长工作沟通技巧培训教材
- 一汽丰田销售流程
- 二类医疗器械零售经营备案质量管理制度
- 荣县2025年度公开招聘社区专职工作人员(8人)笔试备考试题及答案解析
- 黑龙江省 2025 年专升本英语全真模拟卷
- 浙江南海实验高中2025年秋9月月考高一数学试题+答案(9月29日)
- 司法鉴定人岗前考试题及答案解析
- 地面保洁施工方案
- 医用耗材不良事件课件
- 讨薪合同(标准版)
评论
0/150
提交评论