计算机行业科技引领主线:AI应用加速落地国产软件加速突围_第1页
计算机行业科技引领主线:AI应用加速落地国产软件加速突围_第2页
计算机行业科技引领主线:AI应用加速落地国产软件加速突围_第3页
计算机行业科技引领主线:AI应用加速落地国产软件加速突围_第4页
计算机行业科技引领主线:AI应用加速落地国产软件加速突围_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录CatalogTOC\o"1-2"\h\z\u一、市场行情回顾 4(一)整体行情 4(二)代表企业 4(三)板块估值 5二、人工智能产业动态 8(一)数据要素、数据交易所最新新闻及政策 8(二)算法端:国内外巨头大模型动态 10(三)算力端:AI服务器、AI芯片最新动态 11三、前沿行业动态 12(一)前沿技术动态 12(二)前沿政策动态 16四、前沿企业动态 17(一)前沿产品动态 17(二)投融资事件 22五、投资建议 24六、风险提示 25一、市场行情回顾(一)整体行情A股人工智能指数(884201WI)截至10月31日收盘价为11122.38,月涨跌幅为-2.28%。计算机行业指数(801750.SI)截至10月31日收盘价为5514.4,月涨跌幅为-2.28%。图1:10月人工智能指数走势图1400012000100002023-01-032023-02-032023-01-032023-02-032023-03-032023-04-032023-05-032023-06-032023-07-032023-08-032023-09-032023-10-032023-11-032023-12-032024-01-032024-02-032024-03-032024-04-032024-05-032024-06-032024-07-032024-08-032024-09-032024-10-032024-11-032024-12-032025-01-032025-02-032025-03-032025-04-032025-05-032025-06-032025-07-032025-08-032025-09-032025-10-03

人工智能指数 沪深300(二)代表企业A股 人工智能指(884201WI截至10月31日总市值32064.3亿含成分股85支,权重等分。板块上市公司分布为主板16支,创业板34支,科创板13支,中小板22支。表1:10月成分股涨幅前十股票代码股票简称10月涨跌幅10月31日收盘价(元)相对计算机指数涨跌幅300520.SZ科大国创64.99%42.2767.27%688615.SH合合信息35.80%216.8538.08%300071.SZ福石控股13.90%5.0816.18%688111.SH金山办公13.42%358.9915.70%600560.SH金自天正11.14%18.2513.42%300182.SZ捷成股份9.92%6.6512.20%300081.SZ恒信东方9.86%5.3512.14%600756.SH浪潮软件9.03%16.9011.31%002184.SZ海得控制8.58%15.3110.86%603533.SH掌阅科技8.05%20.8010.33%表2:10月成分股跌幅前十股票代码股票简称10月涨跌幅10月31日收盘价(元)相对计算机指数涨跌幅002920.SZ德赛西威-%118.48-%603893.SH瑞芯微-%181.45-%688036.SH传音控股-%76.30-%603444.SH吉比特-%472.98-%300766.SZ每日互动-%36.66-%300571.SZ平治信息-%31.45-%688343.SH云天励飞U-%77.34-%000977.SZ浪潮信息-%65.23-%300458.SZ全志科技-%45.81-%688228.SH开普云-%182.58-%(三)板块估值人工智能指数(884201WI重要成分股2021-2024年近三年整体营业收入复合增长率15.62%,净利润复合增长率-2.63%,截至10月31日平均估值PE(TTM)74.88倍,PS(TTM)4.76倍。图2:1080%60%40%20%-0%2020-01-022020-03-022020-05-022020-07-022020-09-022020-01-022020-03-022020-05-022020-07-022020-09-022020-11-022021-01-022021-03-022021-05-022021-07-022021-09-022021-11-022022-01-022022-03-022022-05-022022-07-022022-09-022022-11-022023-01-022023-03-022023-05-022023-07-022023-09-022023-11-022024-01-022024-03-022024-05-022024-07-022024-09-022024-11-022025-01-022025-03-022025-05-022025-07-022025-09-02

人工智能指数 上证指数 沪深300表3:10月人工智能主题基金一览基金代码基金简称(官方)基金规模(亿元)10月31收盘价(元)近1月回报(%)近3月回报(%)近6月回报(%)第一重仓股(25年三季报)0186F前海开源人工智能A7.501.44-12.6719.2615.34歌尔股份0529F南方人工智能主题6.243.21-4.1630.9150.95新易盛0544F东方人工智能主题A6.021.47-8.2427.6537.00中微公司0562F宝盈人工智能A8.514.33-1.7437.8063.06海光信息0563F宝盈人工智能C5.274.09-1.8137.5362.41海光信息0681F万家人工智能A13.613.57-0.3544.2160.54新易盛0820F华富中证人工智能产业ETF联接A11.681.44-5.0040.7167.53恒玄科技0821F华富中证人工智能产业ETF联接C14.901.41-5.0240.6067.29恒玄科技0885F华夏人工智能联接A21.221.38-2.9136.8258.72新易盛0886F华夏人工智能联接C25.601.36-2.9336.7258.48新易盛0939F融通中证人工智能主题C2.042.29-2.9237.0459.12新易盛0132F西部利得中证人工智能A2.231.49-2.8634.8155.25新易盛0133F西部利得中证人工智能C3.331.46-2.9034.6754.93新易盛0139F天弘中证人工智能主题A7.301.52-2.9736.7959.17新易盛0140F天弘中证人工智能主题C29.851.51-2.9836.7359.01新易盛0233F易方达中证人工智能主题ETF联接A30.621.72-2.9736.2758.33寒武纪-U0234F易方达中证人工智能主题ETF联接C76.171.72-2.9836.2358.26寒武纪-U0462F万家人工智能C14.823.46-0.4143.9159.88新易盛0430F汇添富中证人工智能主题联接A0.061.020.000.000.00-0431F汇添富中证人工智能主题联接C0.061.020.000.000.00-0711F东方人工智能主题C48.231.46-8.2727.5336.73中微公司0180F华夏人工智能联接D11.821.36-2.9336.7358.49新易盛0386F前海开源人工智能C0.831.43-12.7019.1515.11歌尔股份0307F华宝创业板人工智能联接A1.561.55-0.9236.2485.12-0308F华宝创业板人工智能联接C10.651.55-0.9436.1584.85-0320F博时上证科创板人工智能联接A1.251.22-7.7824.6132.21-0321F博时上证科创板人工智能联接C21.981.22-7.8024.5132.02-0350F银华上证科创板人工智能联接A0.301.21-7.0523.6030.49-0351F银华上证科创板人工智能联接C9.771.20-7.0623.5530.36-0352F银华上证科创板人工智能联接I4.291.20-7.0523.5830.43-1963F华宝创业板人工智能ETF43.520.87-0.9639.1091.87中际旭创1981F华夏创业板人工智能ETF6.321.63-0.8939.0791.65中际旭创1988F国泰创业板人工智能ETF2.721.77-0.9838.7290.33中际旭创1902F汇添富中证人工智能ETF0.130.790.000.000.00-1919F易方达中证人工智能ETF250.041.49-3.2339.4163.17新易盛1131F融通中证人工智能主题A8.992.34-2.8837.1859.45新易盛5230F平安中证人工智能ETF31.762.13-3.2539.3163.09新易盛5570F华夏中证人工智能ETF95.961.89-3.2339.2362.75新易盛5580F华富中证人工智能产业ETF80.790.86-5.3347.6977.59中科曙光5700F方正富邦中证沪港深人工智能50ETF3.451.07-2.9929.2544.43寒武纪-U5830F易方达上证科创板人工智能ETF17.531.49-7.5528.3136.86澜起科技5860F广发上证科创板人工智能ETF24.900.77-7.6328.6136.94澜起科技5890F博时科创板人工智能ETF70.590.81-7.6727.9736.53澜起科技5830F银华上证科创板人工智能ETF23.261.59-7.5727.8235.86澜起科技5910F华夏上证科创板人工智能ETF7.401.43-7.6328.4636.82澜起科技5920F华宝上证科创板人工智能ETF5.760.61-7.5628.3036.38澜起科技表4:人工智能主要上市公司近况一览(数据截至2025年10月31日)股票代码股票名称24度营收增24年三季度净利润增速(%)25度营收增25年三季度净利润增速(%)总市值(亿元)市盈率PE(TTM)市销率PS(TTM)月涨跌幅(%)今年以来涨跌幅(%)000977.SZ浪潮信息72.2666.4944.8515.35960.2738.730.63-12.3526.11002230.SZ科大讯飞17.73-1039.8414.4180.601285.30153.535.04-0.8015.31002236.SZ大华股份0.77-3.972.0638.92672.1417.252.061.4931.58002362.SZ汉王科技17.8729.909.85-21.5556.62-44.822.93-6.082.21002405.SZ四维图新9.069.425.20-45.55213.36-16.215.85-5.76-6.64002415.SZ海康威视6.06-6.221.1814.943012.4922.843.235.5211.04300229.SZ拓尔思2.9582.98-45.57-460.24179.79-60.2036.33-8.17-1.72300474.SZ景嘉微-5.9953.2812.14-403.81395.31-151.1576.04-8.59-19.02616.三六零-16.76-56.398.1878.88837.85-131.509.975.8417.85631.中科曙光3.652.129.6825.551557.4973.8911.18-10.7347.83688.虹软科技14.098.349.3960.51214.7593.3224.71-9.7340.15686.石头科技23.178.2272.22-29.51423.3827.452.49-22.114.86680.格灵深瞳-72.99-684.0355.337.4742.01-20.8727.85-6.3513.90685.寒武纪U27.0912.302386.38321.495798.17308.94103.603.77108.97688.海天瑞声44.90111.8056.6910.3269.99596.8221.75-10.0718.15689.倍轻松-11.16183.41-34.07-600.9825.25-36.883.16-1.41-1.41002410.SZ广联达-8.06-17.59-2.2245.90243.0069.773.984.6226.47682.-34.51-23.6956.8139.14165.03-33.2331.35-8.2631.32684.云天励飞U112.52-41.5196.8529.95277.52-61.4420.04-12.5955.93684.嘉和美康-11.52-4748.76-30.67-320.6835.13-9.047.87-16.072.94639.瑞芯微48.47354.9045.46121.65763.7674.6818.55-19.5565.82300033.SZ同花顺-1.59-15.5339.6785.291952.8982.1138.20-2.2927.68300496.SZ中科创达-4.70-69.7539.3450.72316.5765.334.63-11.4815.57681.金山办公10.9017.2315.2113.321662.7793.2229.3113.4225.77687.萤石网络12.93-6.698.3312.68254.2146.104.40-4.698.10300634.SZ彩讯股份10.72-37.7810.810.61120.8852.256.78-1.1423.61300624.SZ万兴科技-3.91-105.428.50-1,020.40140.07-63.809.16-6.5314.73301162.SZ国能日新18.157.9636.9741.7579.4068.5711.60-0.3259.93688.柏楚电子31.1930.1024.5124.61395.2737.2419.24-10.550.22表5:境外上市人工智能企业近况一览(数据截至2025年10月31日,-为未公布)证券代码证券简称(原始币种、亿元)最近一期营业收入同比增长率(%)最近一期归母净利润(币种、亿元)长率(%)总市值(种、亿元)市盈率PE(TTM)市销率PS(TTM)月涨跌幅(%)涨跌幅(%)TAO特斯拉699.26-2.8629.54-40.4815,184.36298.7915.882.6613.05QCMO高通330.1314.9686.5819.881,951.9116.864.518.7419.78VAO英伟达908.0561.91451.9743.5749,205.0756.8229.788.5350.82MFO微软776.7318.43277.4712.4938,485.5936.6813.10-0.0323.52MEAO脸书1,410.7321.49376.90-9.2316,341.8427.928.63-11.7110.99GOOLO谷歌2,890.0713.98977.1532.8033,959.3227.338.8115.6749.03O百度集团651.65-0.43150.3937.52415.5210.912.24-8.2743.36AAPL.O苹果4,161.616.431,120.1019.5039,942.4635.669.606.188.359988.HK阿里巴巴W2,476.521.82406.4966.6631,515.3419.382.87-6.72103.732158.HK医渡科技7.15-11.41-1.1839.5860.92-47.737.86-13.7918.790700.HK腾讯控股3,645.2613.691,034.4915.5657,576.6025.247.46-5.1352.160020.HK商汤W23.5835.55-14.7839.84916.57-25.3319.04-17.9959.06二、人工智能产业动态表6:数据要素最新新闻及政策

(一)数据要素、数据交易所最新新闻及政策日期具体内容10.28十五五规划建议发布:健全数据要素基础制度,建设开放共享安全的全国一体化数据市场,深化数据资源开发利用中共中央关于制定国民经济和社会发展第十五个五年规划的建议发布。其中指出,深入推进数字中国建设。健全数据要素基础制度,建设开放共享安全的全国一体化数据市场,深化数据资源开发利用。促进实体经济和数字经济深度融合,实施工业互联网创新发展工程。加快人工智能等数智技术创新,突破基础理论和核心技术,强化算力、算法、数据等高效供给。全面实施人工智能+行动,以人工智能引领科研范式变革,加强人工智能同产业发展、文化建设、民生保障、社会治理相结合,抢占人工智能产业应用制高点,全方位赋能千行百业。加强人工智能治理,完善相关法律法规、政策制度、应用规范、伦理准则。完善监管,推动平台经济创新和健康发展。10.21数据要素x沪港合作开放数据竞赛2025港队凯旋而归展现数据应用实力在刚结束的数据要素x沪港合作开放数据竞赛2025中,两支本地团队凭借创新技术方案脱颖而出,囊括多项殊荣,全面展现了香港在数据应用方面的技术优势,更突显跨部门及跨界别合作的卓越成效,进一步巩固香港在数据创新领域的领先地位。数字政策办公室高级系统经理(内地及产业合作)黄颕欣表示,数字政策办公室再度与上海市数据局携手,促成沪港两地连续三年合办竞赛。今届竞赛成功促进两地创科专业人才进行广泛深入的交流,例如善用上海决赛期间的企业参访、成果展和路演10.10企查查冲刺主板IPO,精准卡位数据要素国家战略近日,企查查科技股份有限公司(以下简称企查查)正式递交招股说明书,计划在上海证券交易所主板上市。本次IPO拟公开发行不超过4,025万股,占发行后总股本的10%,由中信证券担任保荐机构。作为国内商业大数据服务的开创者和领军企业,企查查的上市进程备受市场关注。自2014年成立以来,企查查始终专注于商业大数据的收集、清洗、挖掘与分析,通过一站式企业信用信息大数据服务平台深度服务国家数字经济发展战略。截至2025年6月,企查查累计注册用户已突破1.5亿,月活跃用户超8,000万人,在商业大数据服务行业中稳居头部阵营。网美社红本 院表7:数据交易所新闻及政策日期具体内容10.28昆明国际数据交易所西双版纳城市服务站成立10月28日,昆明国际数据交易所西双版纳城市服务站(以下简称西双版纳城市服务站)在景洪揭牌成立,标志着西双版纳在数据要素市场化配置改革上迈出了重要一步。昆明国际数据交易所于2024年9月揭牌成立,由昆明联合产权交易有限公司联合中国移动云南公司共同建设运营,旨在构建以数据登记服务、数据生态、数据资产评估、数据交易、跨境交易为特征的全省综合性数据流通交易应用服务平台。昆明国际数据交易所立足1个省级数据流通交易平台,与16个州市建立城市服务站,积极拓展N的战略布局,形成1+16+N数据流通服务体系,将数据交易服务延伸至产业发展最前沿,推动数据与场景应用深度融合。截至目前,已完成330家数据需方、124家数据供方、134家数据商、114家第三方专业服务机构入驻,达成撮合交易金额约7450万元,为数据要素价值释放奠定坚实基础。10.15深圳完成首宗医疗健康数据产品场内交易深圳市首宗由医院直接通过深圳数据交易所达成的医疗健康领域数据产品场内交易在深圳市人民医院完成,标志着深圳在医疗数据合规流通、价值释放领域迈出关键一步,为粤港澳大湾区乃至全国医疗数据市场化应用提供深圳样本。过去医院的数据多用于院内科研、质量控制,价值局限在院墙之内。深圳市人民医院院长耿庆山表示,为打破这一局限,医院开启了将临床数据转化为宝贵资产的长期探索,而首个落地的,正是老年专病库。这次挂牌上市的数据产品,源自深圳市人民医院近十年临床实践的深厚积累。项目团队运用人工智能技术,将文本、影像等多模态医疗数据编织成一条清晰、结构化的数据链,构建起以老年心血管疾病为核心,并逐步扩展至心身疾病、退行性疾病、代谢性疾病的研究队列,就像组建了一支覆盖多类疾病的数据战队。尤为关键的是,所有数据均经过严格的匿名化脱敏处理,并进行了深度清洗与标准化整合,在充分保护患者隐私的前提下,确保了数据的高质量与高可用性。作为第一个吃螃蟹的医疗机构,深圳市人民医院计划以专病数据集和多模态医疗数据为重点,持续释放数据的源头活水,提供更丰富、优质的数据供给。这场交易具有破冰意义。它不仅证明了医疗数据完全可以在合规前提下安全流通,更能直接赋能实体研发、反哺民生,为整个行业打了个样,有望让深圳更多医疗机构参与数据共享,推动一个可持续的医疗数据交易生态圈加速形成。10.15链聚庐州数据要素资产化专场活动举办2025年10月14日,链聚庐州数据要素资产化专场活动在中国声谷举办。安徽省数据交易所、上海数据交易所、上海区块50(10.14江苏省数据产业发展现场推进会在宁举办1014加快构筑产业竞争新优势,着力打造数据产业发展的江苏样本。会议要求,要坚持数据驱动、价值引领为核心导向,深化数实融合,加快构建主体活跃、支撑有力、开放创新的数据产业生态。一要加快数据企业增转引育,重点推动国资国企、行业龙头等依托数据资源禀赋新设一批新型经营主体,引导一批传统企业向数据业务领域延伸拓展,形成各类数据企业融通发展的数据产业格局;二要强化政策供给、资金支持和资源整合,支持产业创新联合体和产业公共服务平台发挥重要作用,打造一批示范性活动品牌,持续优化数据产业发展环境;三要深化人工智能、数据产业融合创新,推动形成数据驱动AI创新、AI赋能产业升级、产业反哺数据生产的良性循环,构建面向智能原生的数据产业服务体系。新、广、省数局合日 院(二)算法端:国内外巨头大模型动态表8:国内人工智能大模型动态时间模型主要内容10.16豆包大模型V1.6火山引擎发布豆包大模型1.6升级版,日均Tokens调用量突破30万亿!火山引擎宣布对旗下豆包大模型矩阵进行全新发布和升级,并重磅推出智能模型路由服务,以加速企业迈向AgenticAI时代。火山引擎此次共发布和升级了四款豆包大模型:豆包大模型1.6升级:核心能力提升,原生支持四种思考长度,为复杂任务提供更精细的推理控制。全新发布:豆包大模型1.6lite、豆包语音合成模型2.0、豆包声音复刻模型2.0正式亮相,进一步完善了模型的轻量化和多模态能力。为解决企业在迈向AgenticAI过程中,需要更精细地平衡模型效果与成本的挑战,火山引擎正式发布智能模型路由。该服务支持对豆包大模型、DeepSeek、Qwen、Kimi等多种主流模型的智能选择调用,帮助企业实现模型调用的最优化。随着AI产业落地持续加速,火山引擎展示了强劲的增长势头。截至2025年9月底,豆包大模型日均Tokens调用量已突破30万亿,相比今年5月底增长超过80%。在企业市场,据IDC报告显示,2025年上半年中国公有云大模型服务市场,火山引擎以49.2%的份额占比位居中国第一。10.15阿里通义Qwen-VL4B/8B超越GPT-5Nano,阿里通义Qwen3-VL系列全新成员4B与8B模型开源上线QLDeseQV-QeV-BQeV-B/B(Des)QeVLIstt和ThiigQL-B在E、、OtGeii5Fahie和P-5oQe5V-。10.15百度蒸汽机百度蒸汽机推出可实时交互长视频功能,支持打断、改写、续写10月15日,百度视频生成模型蒸汽机(文心专精)再次升级,实现了AI长视频实时交互生成。该功能升级依托流式视频技术实现无限时长生成,突破传统AI视频生成10秒左右的时长限制,生成速度超越国内主流视频生成模型。在百度蒸汽机中,用户只需上传单张图片与一段提示词即可启动视频生成流程,并能实时预览模型推理全部内容。在生成过程中,用户可随时暂停,或在任意节点修改提示词,实现对视频剧情、画面、转场的实时控制,全程干预。这意味着,AI视频从单向生成迈向双向共创。T家AIbase基中国营 院表9:海外人工智能大模型动态时间模型主要内容10.16Haiku4.5Anthropic性价比最高模型:Haiku4.5登场thicI模型aeaku5thicaei(oe(和大型)。较大的模型基于更大的神经网络,通常包含更深层次的上下文知识,但运行速度较慢且成本更高。而Haiku系列模型通常通过蒸馏技术,构建出规模较小的AI模型,让其在编码等功能性任务中达到大型、老旧模型的性能。在应用场景方面,Anthropic表示,Haiku4.5能够完美结合高智能处理速度,满足用户对即时反馈的需求,专门针对实时聊天助手、在线客户服务代理以及辅助编程工具等需要高响应速度的应用场景设计。在性能方面,ClaudeHaiku4.5编码性能与Sonnet4基本持平,但在成本上仅为后者的三分之一,处理速度则提升了超过两倍。谷歌发布Gemini2.5ComputerUse模型:专攻浏览器交互谷歌正在预览一款全新的eii人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使AI智能体能够在原本为人而非机器人设计的用户界面中执行操作。这款名为Gemini2.5计算机使10.8Geiiotere用(Gemini2.5ComputerUse)的模型,利用视觉理解与推理能力分析用户的请求,并完成APIAI(AIMode)功能,以及研究原型项目Mariner,该项目利用AI智能体在浏览器中自主执行任务,例如根据食材清单自动将商品添加到购物车。T之 院(三)算力端:AI服务器、AI芯片最新动态表10:最新AI服务器、AI芯片动态时间主要内容10.28高通技术公司发布AI200和AI250,重新定义AI时代机架级数据中心推理性能IalomI200与0IIQlomI200AIAI768GBAIQalom0(aeoryoi)0倍的AIAIPCIe与以太网横向扩展,并具备机密计算,保障AI工作负载的安全性,整机架功耗为160千瓦。10.28黄仁勋甩出王炸,英伟达最强芯片来了,震惊全球1028GTCRubin(Superchip)102.9I-(G向G10.8OpenAI与博通达成数十亿美元芯片开发协议OeI(oa)0(AI)OpenAI算力需求所作出的长期战略布局。大界半体纵横芯智 院三、前沿行业动态(一)前沿技术动态1.中国科学院NeurIPS推出SpaceServe在中国科学院计算技术研究所入选NeurIPS2025的新论文中,提出了SpaceServe的突破性架构,首次将LLM推理中的/D分离扩展至多模态场景,通过EPD三阶解耦与「空分复用」,系统性地解决了MLLM推理中的行头阻塞难题。该研究由中国科学院计算技术研究所处理器芯片全国重点实验室编译与编程团队博士生李志成与副研究员赵家程等人共同完成。其核心洞察源于对MLLM资源消耗的定量分析:视觉编码器,计算密集,内存带宽需求低;文本解码器,内存密集,严重依赖HBM带宽存储KVCache。二者资源需求高度互补,却在时间复用架构下被迫串行执行,造成GPU资源严重浪费。SpaceServe的关键创新在于:EPD三阶段逻辑解耦+物理共置。将所有模态编码器从共享文本解码器中完全解耦,支持独立调度;利用现代GPU运行时(如NVIDIAlibsmctrl/green-ctx,AMDcumask)提供的细粒度SM分区能力,将编码器与解码器共置在同一GPU上,实现并发执行。TWSRFT编码器调度策略。在时间窗口内,按「剩余工作量最短优先」批处理编码请求;避免大图阻塞小图,平滑解码器输入流,提升吞吐稳定性。基于资源利用曲线的资源动态分配运行时。离线构建资源-效用曲线,刻画不同输入(像分辨率下编码器/解码器的延迟与SM占用关系;在线根据请求元数据(patch数、上下文长度动态分配SM计算单元,最小化端到端延迟。图3:SpaceServe的关键创新智 院在Qwen2VL系列模型(2B–72BSpaceServe显著优于vLLMv1。根本原因:vLLM中,编码器独占GPUSpaceServe通过空分复用,让解码器在编码器运行的同时持续生成token,彻底解耦执行流。图:在enVL系列模型(BB)上pcSerev1智 院2.DeepMiThd再登Nature:AIAgeTht造出了最强RL算法DeepMind最新研究DiscoRL,让智能体在多环境交互中自主发现强化学习规则——无需人类设计算法。它在Atari基准中击败MuZero,在从未见过的游戏中依旧稳定高效。人工智能(AI)的主要目标之一,是设计出能够像人类一样在复杂环境中自主预测、行动、最终实现目标的智能体(Agent)。智能体的训练离不开强化学习(RL),相关研究也已经持续了几十年,但让智能体自主开发高效的RL算法的目标始终难以实现。针对这一痛点,GoogleDeepMind团队提出了一种通过多代智能体在不同环境中的交互经验来自主发现RL规则的方法。在大型实验中,DiscoRL不仅在Atari基准测试中超越所有现有规则,更在未曾接触过的挑战性基准测试中超越人工设计,击败了多项主流RL算法。这表明,未来用于构建高级AIRL算法,可能不再需要人工设计,而是能够由智能体自身的经验自动发现。据论文描述,他们的发现方法涉及两种优化:智能体优化与元优化。智能体参数通过更新其策略和预测来优化,使其趋向于RL规则生成的目标。同时,通过更新RL规则的目标来优化其元参数,从而最大化智能体的累积奖励。图5RL注:智能体自主发现RLb(π)(y)(z)(q)(p)yz智 院在智能体优化方面,研究团队使用Kullback–Leibler散度衡量两者之间的差距,以确保训练过程的稳定性与普适性。智能体会输出策略、观测预测和动作预测三类结果,元网络为其生成相应的学习目标。智能体再根据这些目标更新自身,从而逐步改进策略。同时,模型还引入了一个辅助损失,用于优化预定义的动作价值与策略预测,使学习过程更稳定、更高效。在元优化方面,研究团队让多个智能体在不同环境中独立学习,元网络则根据它们的整体表现计算元梯度,并调整自身参数。智能体的参数会定期重置,使学习规则能在有限时间内迅速提升表现。元梯度的计算结合了智能体的更新过程与标准强化学习目标的优化,具体由反向传播与优势行动者-评论家(A2C)算法完成,并配合一个专用于元学习阶段的价值函数进行评估。为验证DiscoRL,团队评估时采用四分位数平均值(IQM)作为综合性能指标,该指标基于多任务基准测试的标准化分数,已被证实具有统计学可靠性。Atari测试:Atari基准测试是强化学习领域最具代表性的评估标准之一。为验证算法自动发现的能力,团队基于57款Atari游戏元训练出Disco57规则,并在相同游戏中评估。评估时使用与MuZero相当规模的网络架构,结果显示,Disco57的IQM达13.86,在Atari基准上超越了包括MuZeroDreamer在内的所有现有强化学习规则,并且在实际运行效率(wall-clockefficiency)上显著优于最先进的MuZero。Disco57在Atari实验中的评估结果。横轴表示环境交互步数(以百万为单位),纵轴表示在基准测试中IQM得分。图:Dic7在ti注:轴示境互数以为单)纵表在准中M得。智 院泛化能力:研究团队进一步评估了Disco57的通用性,在多个它从未见过的独立基准测试上进行测试。在16个ProcGen二维游戏上,Disco57超越了包括MuZero和PPO在内的所有已发表方法;在Crafter基准测试中也表现出竞争力;在NetHackNeurIPS2021挑战赛中获得第三名,且未使用任何领域特定知识。对比在相同设置下训练的IMALA智能体,Disco57明显更高效。此外,它在网络规模、重放比例和超参数调整等多种设置下也表现鲁棒。Disco57在ProcGenCrafter、NetHackNeurIPS中的评估结果。图7:Disco57在ProcGen、Crafter、NetHackNeurIPS中的评估结果智 院环境的复杂性和多样性:研究团队基于Atari、ProcGen和DMLab-30三个基准,共103个环境,发现了另一种RL规则Disco103。Disco103在Atari基准上的表现与Disco57相当,尤其是在Crafter、基准上达到了人类水平的表现,并在Sokoban上接近了MuZero的最先进性能。这些结果表明:用于发现的环境越复杂、越多样,所发现的强化学习规则就越强大、越具泛化能力,即使是在训练过程中从未见过的环境中也能保持出色表现。Disco103与Disco57在相同测试中的对比结果。蓝线(Disco57)表示在Atari基准上发现的规则,橙线(Disco103)表示在Atari、ProcGen和DMLab-30基准上共同发现的规则。高效率和稳定性:研究团队对多个Disco57的版本进行了评估。最优表现是在每个Atari游戏约6亿步内被发现,相当于在57个Atari游戏上进行3轮实验,这相比传统的人工设计RL规则要高效得多——后者往往需要更多实验次数,以及大量研究人员的时间投入。此外,随着用于实验的Atari游戏数量增加,DiscoRL在未见过的ProcGen基准上的表现也随之提升,这表明所发现的RL规则能够随着参与实验的环境数量与多样性的增加而得到扩展。换句话说,所发现RL的性能取决于数据(即环境)与计算量。DiscoRL最佳规则在每款游戏约6亿步内被发现;随着用于发现的训练环境数量的增加,DiscoRL在未见过的ProcGen基准测试上的性能也变得更强。研究团队表示,未来高级AI的RL算法设计,可能将由能高效扩展数据与计算能力的机器主导,不再需要人类设计。(二)前沿政策动态表11:相关政策法规时间部门文件内容1023中国共产党第二十届中央委员会第四次全体会议通过《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》引。1021工信部《算力标准体系建设指南(2025)》要求:到2027年,围绕基础通用、算力设施、算力设备、算网融合、算力互联、算力平50项以上标准建设。1011中央网信办、国家发展改革委《政务领域人工智能大模型部署应用指引》性、高频需求,因地制宜、结合实际,选择典型场景进行人工智能大模型探索应用。强调规范部署。政务部门应根据不同政务场景需求与现有技术基础,审慎选择人工智能大模型实施路径。应探索构建一地建设、多地多部门复用的集约化部署模式,统筹推进政务大模型部署应用,防止形成模型孤岛强调运行管理。应建立健全全周期管理体系。应将持续迭代优化作为人工智能大模型部署应用的关键环节,建立常态化更新机制。应扎实做好安全管理。应严格落实保密要求。府网 院四、前沿企业动态(一)前沿产品动态奥特曼官宣ChatGPT「终极OS入口」OpenAI2025开发者日上,奥特曼重磅官宣四大更新:首发AppsSDK要把ChatGPT打造为「操作系统终极入口」,一键拖拽构建智能体AgentKit,无代码Codex开发,以及Sora2等三大API登场。AppsSDK:与外部应用无缝集成,OpenAI最大野心——把ChatGPT打造成未来的操作系统;AgentKit:无需编码,拖放搭建智能体。人人都可快速开发智能体,还能评估智能体能力;CodexAPP;API更新:三大APISora2API同步上线。最重磅的,还是AppsSDK,所有人皆可在ChatGPT中构建原生应用,其意义堪比2023年首发的GPTsAppsSDKChatGPT可以集成各种应用。目前公布支持的APPB、CanvacourseraExpediaFigmaSpotify和ZillowOpenAI的软件工程师Alexi现场展示了如何在ChatGPT直接调用这些外部应用。比如只需要输入「CourseraChatGPT就能自动识别并调用Coursera的功能。可以直接在ChatGPT中要求「Canva」制作海报,而不需要额外跳转。可以直接在ChatGPT中使用Zillow查询周边房价,并使用Zillow的UI来直接呈现。1717图8:直接在ChatGPT中要求「Canva」制作海报智 院图:直接在CaPT中使用Zw查询周边房价智 院蚂蚁集团重磅推出万亿参数思考模型RiThg-1T10月14日凌晨,蚂蚁集团正式发布万亿参数思考模型Ring-1T。在数学竞赛(AIME25、HMMT25,代码生成(CodeForces、逻辑推理(ARC-AGI-v1Ring-1T取得开源领先水平。图10:Ring-1T在数学竞赛,代码生成、逻辑推理上取得开源领先水平智 院在OpenAI的医疗问答HealthBench测评中,Ring-1T表现惊艳。与此前发布的预览版Ring-1T-preview相比,正式版Ring-1T在数学竞赛、逻辑推理、医疗问答上表现更出色、推理更准确。Ring-1T虽然是思考模型,但也具备极强的通用能力:在综合榜单(Arena-Hard-v2)、创意写作(CreativWriting-v3上,表现强劲,与DeepSeekQwen等最新思考模型同属开源第一梯队。特别是,在「高难度真实用户查询」Arena-HardV2基准测试中,Ring-1T成功率高达81.59%,登上开源模型榜首——直逼OpenAI的GPT-5-Thinking(High)的成绩82.91%。目前,普通用户可在蚂蚁百宝箱选择Ring-1T直接体验。谷歌更新Veo3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控谷歌更新Veo3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控。可合成多人物场景、音画同步,片段最长约148秒;规格至1080p/24fps。Veo3.1目前已接入GeminiAPI与VertexAI。普通用户也可以直接在Flow或者Gemini中体验。图11:Flow使用方式:新建项目后即可使用智 院图12:Gemini选择创建Video即可使用Veo3.1智 院百川智能重磅发布「首个循证增强的医疗大模型」——BaichuaTh-M2Plus10月22日,百川智能重磅发布「首个循证增强的医疗大模型」——Baichuan-M2Plus。新模型将「循证医学」理念深度融入训练和推理,通过首创「六源循证范式」,模拟人类医生思维,有效辨别不同层级医学证据、评估其可靠性,并在回答中优先引用高等级证据。在多项权威医学考试中,M2Plus成绩直接拉满,医学知识运用能力远超人类平均线。图13M2Plus智 院此外,这种「循证驱动」的生成逻辑,使其有效避免了无中生有的幻觉,让可信度比肩资深临床专家的水平。在多场景医疗评测中,M2Plus幻觉率指标,较Deepseek-R1低3倍,并且显著领先美国最火医疗产品OpenEvidence。图14:多场景医疗评测中,M2Plus幻觉率指标,较Deepseek-R1和OpenEvidence低智 院Cursor发布首款自研编码模型ComposerCursor迎来重大升级,发布了首款自研编码模型Composer。Composer的速度是同等模型的4倍。Cursor说这是一款专门为低延迟智能编码打造的模型,大部分任务都可以在30秒以内完成。在Speed一栏,Composer的速度达到了200okens/秒。图15:Composer速度达到200Tokens/秒智 院除了自研模型,Cursor这次重构了交互逻辑,带来了多智能体模式,在单个提示下,可最多并行运行8个智能体。此功能使用gitworktrees或远程机器来防止文件冲突。这次2.0版本还将浏览器嵌入编辑器内,这对于前端开发非常友好。可以直接选择元素并将DOM信息转发给Cursor。这次一个更大的更新是引入了语音模式(oiceMode)。同时,改进了带有标记上下文的复制/粘贴提示,已从上下文菜单中移除了许多显式项,包括@Definitions@eb@Link@RecentChanges、@LinterErrors等。Agent现在可以自我收集上下文,无需在提示输入中手动附加。(二)投融资事件表12:10月AI相关投融资事件融资方行业赛道融资日期融资轮次融资金额斯年智驾汽车无人物流车2025-09-29B+轮数亿人民币六岳微电子电子AI工业2025-10-09eA轮近1亿人民币面壁智能信息技术AI大模型2025-10-09B+轮数亿人民币滴滴自动驾驶汽车自动驾驶汽车2025-10-11D轮20亿人民币九识智能汽车自动驾驶2025-10-13战略融资数亿美元光羽芯辰电子AI芯片2025-10-15A+轮近1亿人民币爱诗科技信息技术AI视频生成2025-10-17B+轮1亿人民币聚时科技电子AI工业2025-10-20B轮数亿人民币讯兔科技信息技术AI软件2025-10-22eA轮超1亿人民币LiblibAI信息技术AIGC2025-10-23B轮1.3亿美元新石器无人车汽车智慧物流2025-10-23D轮超6亿美元月之暗面信息技术AI大模型2025-10-24C轮数亿美元华鲲振宇信息技术算力网络2025-10-28A轮4亿人民币数巅科技信息技术AI大模型2025-10-28eA轮数亿人民币浪潮计算机信息技

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论