半导体行业市场分析1_第1页
半导体行业市场分析1_第2页
半导体行业市场分析1_第3页
半导体行业市场分析1_第4页
半导体行业市场分析1_第5页
已阅读5页,还剩30页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

半导体行业市场分析

1.类ChatGPT的对话式交互推动AI算力芯片需求激增

1.1.在线式搜索应用潜力更优,芯片为成本大头

ChatGPT访问量激增带来算力需求成倍增长。根据最新统计数据,

2023年3月ChatGPT全球用户访问次数是16亿次,环增近六成,

是1月访问量(5.9亿次)的近3倍。访问量激增带来的是算力需求

的成倍增长。可以猜想的是,下一代搜索引擎的形态也许已经形成。

我们按2023年3月ChatGPT月活16亿次,用户每轮咨询提问6

个问题(微软Newbing平均提问轮次约为3次,而ChatGPT不限

轮次)测算,则ChatGPT单月咨询量达到80亿次,折合年960亿

次,对话式搜索已经逐步向主流搜索方式渗透。根据华为的预测,到

2030年,全球数据年新增1YB;通用算力增长10倍到3.3ZFLOPS,

AI算力增长500倍超过100ZFLOPS。

在线式搜索的单次搜索成本约为离线式搜索的6倍,其中芯片成本占

比65%。根据OneFlow,假设OpenAI云服务的毛利率75%的情

况下,分别采用ChatGPTEquivalent(离线式:直接使用大模型推

理,使用时无法访问外部知识)和2-StageSearch(在线式:可在推

理时访问Google等传统搜索引擎)方法所估算的单次搜索成本是

0.01和0.066美元,数量级与OpenAlCEOAltman所言的

Single-digitscents"相符。我们认为未来在线式搜索具备更大应用潜

力,但该方法相当于每次用大模型查询K次,返回最优结果,会增

加算力成本。考虑技术降本趋势,中性估计未来单次搜索的成本约

0.04美元。此外,根据推测,将英伟达A100按5年寿命线性折旧,

单次查询的推理成本中有65%来自购买GPU的折旧成本。考虑性能

追求下的芯片更新换代需求,GPU实际使用寿命可能短于5年,因

此实际的芯片成本占比可能更高。

训练卡价值量显著高十推理卡,推理卡增长潜力有待边缘应用场景需

求升级。大模型训练需要使用专业的AI服务器,其中的训练芯片当

前以英伟达的A100、H100为主。而当基于大模型的应用规模化推

广到用户侧时,应用场景对推理芯片的需求同步扩张,增速可能超过

训练卡。未来推理卡的需求数量可能和训练卡相等,但推理卡的单卡

性能低于训练卡,价值量也相对低。比较英伟达的T4和A100,前

者FP32下理论峰值计算能力为8.1TFLOPS,是后者(19.5TFLOPS)

的42%。根据ZOL中关村在线,英伟达T4推理卡参考报价10999

元,折合为0.16万美元,明显低于A100(1.25万美元)。目前无

论是在PC还是智能音箱这类交互入口中,大模型类应用主要还是通

过调用云端API完成,因此边缘侧算力卡的潜力尚未释放(至少要达

到英伟达T4的性能)。参考华为的预测,到2030年,将有80%的

数据在边缘处理,全球边缘计算市场规模将从100亿美元增长至数

千亿美元。

困2:GPU折旧成本在大模型推理成本中占比最高,为65%

推理成本分解($/HOUR)

NvidiaAl(xmtg$12500

工作年限5years

硬件成本$0.285perhour

功就300W

电费($0.09/kWh)$0.027perhour

1.2.Al产业链有望形成“上游寡头垄断+中游行业专有模型+下游应用

百花齐放”的分工形式

未来的AI产业链可能形成此种分工方式:少量大公司掌握通用的CV、

NLP、科学计算等大模型;部分有高质量行业数据和Know-how的企

业与掌握微调能力的IT企业结合,训练得到特定行业/应用场景的专

属大模型,并进行持续微调和维护;下游千行百业通过API接入云端

使用大模型或者购买定制化的私有模型。上游:少数几家大模型公司

寡头垄断。类似当前的微信、windows操作系统。

理由1:大模型的进化原理决定该行业具有明显的马太效应,具有先

发优势的玩家将会优则更优。原始的GPT-3使用大量基于互联网的

文本数据进行训练,一开始只能仿写人类提供的prompt。在。penai

大量开展指令微调(InstructionFine-tuning)之后,其逐渐表现出了

对特定任务的理解能力,但其产生的回答表现出对性别、种族、意识

形态的强烈偏见。因为masked-language-modeling方法是通过统计

概率生成可能的词序列,但在实际应用中,语言模型的目的是产生符

合人类价值观的认知工作。OpenAI提出的RLHF(Reinforcement

95:训练I75B的GPT-3需要的算力

XIRKO(

IcultramTDUItramHop*1MHI**punuMacti«r

cwiip*IWMIMtoKct%pwpramMullfor*«»*«P«nforeach

Model(PF/yM<Aom)(M)(billicmipertoicntmdpazpertoLcn

T5Small工(ME40011.00033038

TSX,<->■-6“M>20MX1)3J

T5IJ»XC:.67E4OI2.)IE«2II.IXN)3JI0.35

TSWl.otBMD900ECIi.an3J

T5-IIB3J2E*O23ME♦门i.ono3303

BtRTBay1WX)IME«X)25083

BIRTljtffc♦MMO533E.2O25063

RoHIJlTaRMI.74F.Ol150li*2l2.0006)

RoBERTal^r-4.95E4OI4»fc*2lion6J*

GmSmall工MEdX)225E4»MI>63

GKT-3Medium7.42EMM)6.4IE*2OMM>63

GK-3LM*CI^ME4OII.37ECI30063

GPTJXI.27SE*OI2WE*2IW)63界

GFT-J2.7B55^*01477E♦外W>63

GPT367B1W-4021^22xx>63北

CiPTJIAB2.6KE*O2:UJL^工MX)6J

GPTJI75B264E®QUETZJI74.MM)MX>63

Table1>.1:Slanmj:fnwnthengmhandMJCandmmingleft,wehqjinwiththenumberoftnuningl<>kcn\l>uieach

modeltraineduiih.NeilwenoteOutwnceT$usesancocuder-decodermodel,onlyhalfoftheparamrterxMC

activeforeachtokendun”a(oc^ardcrpawWethennotethatechcoicnisimx4%rdmaungkaddilHin

andaanglemviliplyforeachactiveparametertntheformrdpaz(ignoringMEionKThenucaddAmulbplicrof

3%towoum(crthetwkwani%pax>(a%computin’both勺,・rand:::uya^iimUramcMintofctwnputc4the

forward、pa%s.Combining(heprciomtwonumbm.wegetI,totalHop*perparametefperloixnWcmuluplyihi>

valuebytheloultramingk<cn\andihctuulpammetersloyieldihcnumber<<Soul小俨uydduringtrainingW:

reportbolhflcip*andpcUflo(V%sh)(cwhofwhichan?8.64c*19flopsi

理由3:时间性价比,使用他人预训练好的模型可以避免“重复造轮子”。

上述种种原因导致B端无法形成自己训练大模型的行业共识与能力。

中游:中等数量的专有行业大模型组成细分市场,推动各行业智能化

升级。当专有模型的需求逐渐明晰且固化,为实现高性价比,可能带

动ASIC芯片、FPGA芯片的需求增长。

实例1:SAM模型的出现预示着强泛化性的通用大模型已经渐行渐

近,将迅速统一各类基础任务。类似ChatGPT做至I」的“回答一切”,

近日Meta所开源的CV大模型SAM(SegmentAnythingModel)

已经能够在分割任务(CV的典型任务之一)做到了“分割一切”,说

明NLP的prompt范式已经开始延展到CV。英伟达的人工智能科学

家JimFan认为Meta的这项研究是CV领域的GPT-3时刻之一,而

这也将启发其余领域在通用大模型的爆发。该类模型的出现为统一各

种深度学习的主要任务带来可能,比如目标检测、语音识别、科学计

算等。

实例2:华为已经为行业大模型赋能千行百业提供了范例。在大模型

出现前,医学领域已经有了使用深度学习赋能行业前沿研究的案例。

比如DeepMind开发的AlphaFold2已经预测出了98.5%的人类蛋白

质结构,而此前科学家们数十年的努力,只覆盖了人类蛋白质序列中

17%的氨基酸残基。华为在2021年发布盘古大模型之后,就陆续发

布了药物分子、矿山等行业大模型。其中,华为云盘古气象大模型成

为全球首个精度超过传统预报方式的AI模型,1小时至7天预测精

度均超欧洲气象局实时预报,预测速度比传统天气预报提升10000

倍;台风硅基预测准确度世界第一,比欧洲气象局提升约20%。可

以预见的是,当通用大模型成熟&模型部署、微调成本下降,各行业

或者各细分需求场景的大模型就有望涌现。

图8:行业大模型,赋能千行百业智能升级

下游:大模型赋能百花齐放的应用企业,落地领域扩散范围可能与现

有行业数据集规模强相关。从目前第一时间通过API接入ChatGPT

的主流应用(比如知识管理应用NotionAl、内容写作工具JasperAL

编程工具PyCharm)可推知,目前“文本创作”和“编程”是大语言模型

的两大主流应用方式。当前C端的商业模式主要是由已有的应用打

通OpenAl的API渠道,用户自己填入自己的APIKey,从而获得更

优的用户体验。在比过程中,应用软件并未获得直接收入。未来1-2

年随AI底层基座的成熟,相关应用可能迎来爆发。考虑到行业数据

的瓶颈,我们认为大模型可能会沿已有高质量数据集的方向落地。

实例:AI可极大促进企业降本增效,已有游戏公司3成原画师被裁。

通用图片和文本是网络上最方便获取的公开数据,也是目前在AIGC

领域广泛受到认可的ChatGPT和stablediffusionmidjourney所

基于的公开数据形式。目前AI绘画已经能用远快于人类的速度【从

2周到3天)帮助面师完成前期50%的工作,AI模特能用远低于真

人的成本(从5万元到5元)完成一次拍摄。去年AI绘画爆火之后,

国内各游戏公司开始陆续使用AI降本增效。根据36氯对某游戏公司

特效总监的采访,该公司从2023年初开始已陆续裁掉了30%的原画

师,基木为初级和中级原画师。目前AI己经可以帮助画师完成前期

50%的工作,达到了中级原画师的水平。除原画师首当其冲,根据现

有可获取训练集大小,未来建模、UI设计、动作、地编和特效也可

能依次逐步被AI渗透。

阿里云宣布开放大模型能力,率先提供大模型B2B合作范例。此外,

阿里云智能CTO已经于4月11日在北京云峰会宣布,阿里云将提

供算力及大模型基础设施,助力企业打造自己的专属大模型。让未来

的企业既可以调用通义千间模型,也可结合企业自己的行业

Know-How和应用场景,训练自己的企业大模型。阿里云也将与

OPPO联合打造OPPO大模型基础设施;与吉利汽车、毫末智行、

波司登等展开相关合作。大语言模型的接入有可能率先对此前基于关

键词的搜索交互场景产生冲击,比如电商场景下,未来可能通过详细

描述衣物/物品的方式进行线上购物,对企业传统'业务赋能。随着大

模型通过增大训练参数而获得更优性能的方法的边际效益递减,高质

量数据集重要性将愈发凸显。在质量较高的数据集上进行训练,那么

小到可以在本地运行的模型也可以获得类似大模型的优秀性能。随着

各公司密集发布大模型,模型的稀缺性降低,高质量数据的价值逐渐

凸显。

2.需求:AI有望在医/食/住/行/城/自然等场景全方位改善人类生活

未来,AI有望在衣食住行城等场景全方位改善人类生活。科学探索

边界不断拓展,带来算力需求提升,计算有望迎来创新的黄金10年。

图II:算力相关宏观越势及谀测

政策

中■:栩片.人工mt■

wnDNAmivfr^flMt4>a

KB:75%mUKimjmMs

it*打造・台

■孑计II机

2.1.医食住行:从感知智能到认知智能,从物理+数字世界到虚实融

智慧交通:智能交通从“运力”时代进入“算力”时代。通过传感器采集

生成全息数据,实现实时、历史路况的全息呈现,最后经云端计算形

成不同的交通指令,出行将变得更加高效、低碳。国际能源署(IEA)

预计,到2030年,在道路上的电动汽车、公共汽车、面包车和重型

卡车的数量将达到1.45亿辆。若按照每辆车平均每天行驶2小时,

行驶中每秒上传的压缩数据从当前的10KB升至1MB测算,则10

万辆车智能网联汽车需要传输的数据量大约为720TB/天。车辆行驶

过程中产生的海量数据交给AI,其以计算为核心,持续支撑交通的

数字化升级和智慧化管理。“算力”的解放带来了交通安全、效率、体

验的提升。有AI相助,城市日均通勤时间将缩短15-30分钟;交通

治理方面,拥堵会缓解,事故将会减少,停车难”问题也可能得到解

决。更加高效、低碳的出行会释放出新生产力,推动社会经济的发展。

无人驾驶:Al应对边缘案例能力有望超越人类,促进L5级无人驾驶

落地。随着边缘案例(ComerCase)的产生积累,以及对自动化无

监督的视频级AI机器学习训练的实现需求,智能驾驶算力需求大幅

增长,摩尔定律逐渐失效。到2030年,L4+自动驾驶汽车单车算力

将达到5000T,催生端云协同的计算需求,预计未来单个车厂的云端

至少需10EFLOPS以上的算力。L4级的自动驾驶商用后,AI会不断

在实例中学习训练,愈发“聪明”,最终于应对能力超越人类,得以实

现L5级完全自动驾驶。智慧城市:通过数据实现城市能源高效调度,

将带来100倍的社会数据聚集。据联合国人居署的统计,城市只占

地球表面不到2%的面积,却居住地球超50%的人口,消耗全世界

78%的能源,排放超过60%的温室气体。城市智慧化治理是实现城

市可持续发展的必然方案。借由物理传感器,城市数字挛生得以建立,

将带来100倍的社会数据聚集,能源调度效率将会提升,将居民高

峰用电平均需求减少15%以上。

精准医疗:AI参与病情推理,提高效率,缓解卫生工作者短期难题。

在医疗领域,人工智能已经可以自动识别出微小的肺结节,与以往肉

眼识别、手工标识相比诊断效率更高,可以节省医生大量时间。未来

人工智能将在复杂的问诊中与医生“讨论病情”,为医生提供诊断依据

和预期疗效分析,逐渐形成人工智能出方案、医生审核成为普遍的诊

疗模式。据世界卫生组织,到2030年,预计出现1800万卫生工作

者的短缺,AI可成为应对这一挑战的解决方案。药物筛选:通过将

AI的推理过程透明化,帮助人类完成药物筛选等复杂任务。以前,

Al是一个黑盒,而当人类仅得到结果,很难做出决策,所以发挥作

用有限。未来,AI不仅告知结论,同时也能展现思考过程,和人类

建立彼此的互信,帮助人类完成复杂的任务,如药物筛选。

待大模型应用进入深水区,可能形成AI问诊的诊疗新模式。出于跨

学科知识的鸿沟,医疗人员难以直观感受大模型在其工作场景的应用

潜力,而大模型的研究员对医疗业务场景的理解又难以深入,因此大

模型短期可能难以进入交叉学科应用的“深水区”。但目前在国家医保

局成立后,医疗信息化建设趋势渐起,医保数据要素有望成为数据市

场化和资产化的首批放开方向。随着大模型应用逐步落地,AI问诊

前景可期,甚至可能冲击当前分诊室看病的诊疗模式。比如向大模型

输入病情、过往病例及诊疗结果,模型反馈初步的病情诊断结果,再

配合人类医生的进一步判断,可大幅提升诊疗效率。

个性化教育:人工智能可帮助人类重新认识教育、改革教育。人类训

练人工智能模型的过程,也是了解人类自身认知、推理能力形成机理

的过程(比如强化学习、RLHF技术的出现与人类认知行为密切相关)。

未来可能出现AI教员,其通过精细化地分析学生的行为习惯、能力

等,为学生制定个性化的教学内容,将人工时代所稀缺的教育资源变

得更为普惠。华为预计到2030年,全球连接总数将达到两千亿,传

感器的数量达到百万亿级,数据量、时延等原因决定了产生感知的计

算在边缘完成,未来能处理大约80%的数据。通过AL更多的行业

可获得感知自我的能力,并进一步驱动企业数字化创新。

图13:Al动力人美实现对自然社会更纵深地感知

预计到203眸,全球连接总数达到两千亿传感器数・达到百万亿;80%的数据通过边缘计首

[企业]

Qw农业智能控制设备生产机H人

ESfi»MKi50%每万名制造业员工与392机器人

产品生产周期缩短50%共同工作

不良屁率降低50%

建立智能衣业'口遥感发君网络人与机”

衣业数字化.网络化.智微化改造.卜G

智慧农业:农业将迎来全方位全过程的数字化、网络化、智能化改造。

未来,现代信息技术与农业深度融合,为实现具备农业信息感知、定

量决策等功能地全新农业生产方式,也将产生广泛的对边缘AI计算

的需求。智能化农业信息遥感网络也将加快发展农业电子商务、食品

溯源防伪、农业休闲旅游、农业信息服务水平。智能控制设备:AI

技术将提升关键生产环节的生产质量与与成本收益。AI可帮助企业

实现智慧化运营、贯通层海量数据分析挖掘以及感知层更低时延诊断

预警,若在生产系统普及,则将带来工厂作业模式、人员配置、部门

区域协同等一系列的升级,如《中国制造2025》所提出的,制迨业

重点领域全面实现智能化,试点示范项目运营成木将降低50%,产

品生产周期缩短50%,不良品率降低50%。

制造业机器人升级:人工智能将驱动企业业务重塑。未来,人工智能

将参与企业更多的非操作性任务,人与机器形成无缝的协作关系。华

为预计到2030年,每万名制造业员工将与390个机器人共同工作。

人与机器的协同将改变产品设计、生产、销售,到企业架构、员工的

雇用和培训等各个环节的业务,最终让人类告别重复枯燥的任务、让

人类远离危险的工作,并在越来越多的任务领域中赋能人类,帮助人

类获得超越自我的能力。

智慧交互:未来AI可辅助人类完成更多创造力工作,实现从感知到

认知、从弱人工智能到强人工智能的转变c现今,人工智能已参与完

成一些过去难以胜任的任务,如通过图像辨别植物,帮助完成家务劳

动等。2030年,家用智能机器人使用率有望超过18%。未来,AI将

实现从感知到认知、从弱人工智能到强人工智能的跨越。当今,AI

在作画、写诗、文学创作进行了初级的尝试,而在未来,AI可完成

更为复杂的创造性工作。比如,通过多种插件的配合,实现从自然语

言到自主搭建网站的过程;通过多个传感器配合,实现更智能的家居。

AR/VR:虚拟世界将重新定义人类生活、工作和学习的方式。未来,

通过丰富的传感器硬件,数字空间将与物理世界共同组成虚实融合的

世界,人与人、人与社会、人与自然、人与机器的交流方式将发生革

命性的改变。华为预计2030年,超过30%的企业在数字世界中运营

与创新,各种虚实结合的AR/VR用户数达到10亿。

元宇宙:通过数字体验驱动计算走向边缘端,人与设备之间实现实时

交互。云端将实现物理世界的建模、镜像,经过计算、加入虚拟元素

形成数字世界,准确感知和还原物理世界c边缘设备将具备听觉、视

觉、触觉、嗅觉和味觉能力,多维协同的计算将用户所处的环境整体

变成一台超级计算机,在虚实结合的世界中识别用户意图,并通过全

息、AR/VR、数字嗅觉和数字触觉等技术进行用户呈现。

2.2.前沿探索:AI助力天气精准预报/地震预测/生物结构模拟等

数字世界算力的规模决定了物理世界探索的广度和深度。未来,随着

人类认知边界的不断扩展,科研用算力将爆炸性增长。比如,2027

年底欧洲核子研究组织(CERN)将投入使用高光度大型强子对撞机,

每秒发生约10亿次粒子碰撞,数据计算量将增加50-100倍,存储

需求达到ZB级。

图16:AI动力人奥更精分是业拿来如世界

科研用II力坊炸塔长:2027年底CERN将投入使用高光度大型强子对撞机,每杪发生约132次粒子硬撞,数据计算

■将增加50・1001置存储需求达到ZB级

自然气欧地震/海洋RI浦自然宇宙结构探测

天气预报物g规梗和II力需要精确计算数十万到百万个

M♦■■凯切参数计M

需求提升lOOTOOOffi宇宙论般

有效解决环蛔战天气圈6博度大■曜升一

在得更好时台陋读更从容地应对救送天气

生态监测:AI帮助人类得出更好治理模式,有效解决环境挑战。以

大数据为基础,利用模型预测不同管理措施效果,并不断优化,AI

可为人类提供优良的环境保护方案,如确定位污染源,预测污染扩散

等。气象:气候模拟和天气预报精度更高,人类能够更加从容地应对

极端天气。受限于海量数据和巨大算力需求,目前很难对天气实现准

确预测。据华为数据,天气预报将从当前的10公里的精度,提升到

公里、次公里,数据规模和算力需求提升100〜1000倍。2030年

100EFLOPS级超级计算机的实现,可突破算力极限,大幅提升预报

能力,使人类在极端天气面前不再被动。

自然灾害预测:地震预报准确性、可靠性将极大提高。人工智能方法

可突破震源机制参数的计算难题;应用地震大数据训练人工智能神经

网络,可完善预报系统的准确性和可靠性,实现地震预报领域的突破。

宇宙结构探测:人工智能将助力加速研究宇宙大规模结构。传统研窕

办法需要对数十万到百万个宇宙论模型进行精确的计算,已有全部计

算资源都不难以完成。

风洞仿真:有望实现更大级别子系统,甚至整机的高精度仿真测试。

计算机风洞仿真是飞机、高铁等高速运动产品的重要测试手段。高精

度仿真结果要求更大计算量,需分解测试系统为更多子系统。在AI

辅助下,未来计算能力将提升2~3个数量级,高精度仿真测试成为

可能。新药探索:人工智能将为解决“维度灾难”开辟新办法,加速人

类认知的扩展。现如今,在生物、材料、化学、宇宙等研究方向上,

传统的计算方法面临“维度灾难”,算力需求指数级增长,比如对于更

复杂的人脑思维、记忆和行为研究。如模拟人脑在特定刺激下的反应,

每一小时模拟Summit需要计算1024年。人工智能有可能突破“维度

灾难”,为科学研究打开新的探索之道。2020年戈登贝尔奖的研究工

作就利用人工智能实现了1亿原子规模模拟,比过去的同类工作计算

空间尺度至少增大100倍,同时计算速度提高至少1000倍,实现了

传统方法无法模拟的大尺度计算。

算力挖掘数据价值:优化生产关系,更好地匹配生产力和客户需求。

以云计算、大数据为基石,AI可驱动行业数字化,提升管理效率,

比如如020服务、电商等。实现全面应用上云,构筑10X的性能、

效率、成本优势。端边云全栈Serve门ess化是企业数字化、智能化

转型现代化改造的主流技术。其基于云原生计算模式的编程厝言、诺

言runtime、应用诡度、运行、运维,构成了现代化软件及全栈Server

less化的基础。

图18:AI动力企业实现更高效的运营效率

企业精细化的资源使用软件定义运营企业低碳DC

新的资源管理技术的广泛应用将充传统计算有超60%能耗集中于数据

少50%以上资源浪费迁移,未来计算将使畿效提升数十倍

r------------------------------------------

!尊云例代-云技术-?收本m中心II力网维

更加便通地使用计M资源形成全方位的故据依族在得更曲色的计算筑源

大・必>企业计・资源浪费通过软件处理的同,定义运置器源效率得到抠敷*,中

••

精细化资源使用:新计算技术使得资源应用更加便捷,大幅减少企业

计算资源浪费。在非云化时代,处理器仅有10%的利用率,容器技

术则将这一比例提升到40%以上,未来新的资源管理技术的广泛采

用将进一步减少50%以上的资源浪费。软件定义运营:工业制造等

传统企业将在更加复杂的产业链上下游环境中实现由软件定义的高

效企业运营。工业物联网将驱动全球的供应、制造、维护、交付和客

户服务等业务流程实现广泛联接,未来企业将通过软件处理跨组织复

杂协同,通过软件快速定义'业务的运营。

低碳DC:企业将获得更加绿色的计算资源,能源效率更能得到指数

级提升。随着创新计算架构的引入,计算能效将极大的提升。传统计

算过程中超过60%能耗集中在数据迁移,而未来以数据为中心的计

算将使得能效提升数十倍。模拟计算(如量子计算、模拟光计算)成

为重要算力来源,能源效率得以指数级大幅提升。未来数据中心受能

源分布、算力需求分布的双重影响,计算架构发生更大空间维度的变

化,通过算力网络更好匹配绿电、时延、成本的差异,从而实现最优

能源利用效率与碳排放。

3.趋势:从计算智能到感知智能,从“云端训练、边缘推理”到端边

云协同

AI正从智能感知走向智能认知,多模态学习成为AI发展趋势。A1从

早期的计算智能,升级到如今的感知智能,现在正逐步向认知智能发

展,在这一发展过程中,多模态学习是获得信息融合和协同、构建多

模态大规模基础模型的重要手段。构建大规模基础模型可以提高AI

对复杂环境的认知能力,丰富AI的应用场景。以ChatGPT的发展

为例,ChatGPT的输入端只接受文字信息,而GPT-4已经发展到能

够接受图片、表格等多样的输入方式,具有多模态的数据处理能力。

在该趋势下,多模态学习还需要解决以下问题:1)利用跨模态数据

的互补性及冗余性做好表征学习;2)处理表征学习后的向量关系映

射:3)处理训练场景下某个或某类模态数据缺失后模型自适应的学

习及迁移能力,保障模型精度维持在可接受范围内;4)处理推理场

景下,某个或某些模态数据缺失后的模型拓扑路由,提高推理增益等。

图19:实现多模态学习需要解决数据异枸性等多重挑战

■高效表征学习

•精准关系映射

・自适应学习(训练)

•模型拓扑路由(推理)

生成式Al(Algeneratedcontent,AIGC)是最佳的自动化生产要素,

其应用场景指向金融银行、游戏、影视等需求侧。通过AIGC技术,

AI从理解内容走向自动生成内容,并将人类创意融入内容生成过程,

可进行文本续写、文字转图像、视频创作,甚至生成AI主持人、游

戏中的智能NPC等。AIGC也在助力金融银行发展,在智能客服、

数字员工、数字营业厅、内容营销、智能投研中具有广泛的应用场景。

尽管AIGC已得到广泛应用,其仍面临以下问题:1)某些生成模型

不稳定且难以控制其行为,如生成的图片精确性不足但无法判别原因;

2)可能被用于欺诈目的。如AI主持人、智能NPC等都可能被远程

攻击、篡改,从而被用于诈骗行为。

3.1,高算力带来高能耗,低PUE政策带动液冷服务器、液冷芯片需

高算力带来高能耗,低PUE政策带动液冷服务器、原生液冷芯片需

求。全球数据中心总能耗占电力需求的1%,通用计算的总能耗每3

年增长1倍,AIGC&碳中和目标将驱动算力提升百倍的同时提升能

源利用效率。根据工信部2021年发布的《新型数据中心发展三年行

动计划》,至1J2023年底,全国数据中心总算力超过200EFLOPS,

高性能算力占比达到10%,新建大型及以上数据中心PUE(即数据

中心总设备能耗/IT设备能耗,理想水平为1,表示只有IT设备在耗

能)降低至1.3以下,严寒和寒冷地区力争降低至1.25以下。根据

腾讯云,一个典型的Google数据中心在投产初期的PUE~1.25。而

AI服务器在执行复杂任务时,需要更高的能耗,PUE通常大于1.5。

因此需要通过液冷、去冷机、去空调等技术优化数据中心的PUEo

2022年5月,英伟达发布了首款采用原生液冷芯片(Direct-to-Chip)

技术的PCIeGPU,就是基于A100和H100芯片,该类GPU在主

流服务器的GPU中尚属首例。根据英伟达估计,液冷数据中心的PUE

可能达到1.15,远低于风冷的1.6。根据英伟达报告,切换至液冷后,

2k台服务器(4k张A100)的总电力需求降低了28%。

3.2.大算力需求下,新架构新技术开启新道路

2.5D、3D、Chiplet等先进封装工艺成为延续摩尔定律良药。在未来

算力需求大幅增长,而“微缩化”逐渐逼近摩尔定律极限(硅原子直径

是0.2nm,台积电己经达到2nm)的情况下,2.5D/3D封装技术成为

权衡该状况的极佳选择。2.5DSilicon/FOInterposer+Chiplet技术可

以降低能耗、集成更优性能。根据华为的数据,2.5D封装对传统封

装板级互连方案单bit能耗降低至约1/2,预计2025年2.5D封装的

硅中介层尺寸将超过4xReticle(1Reticle=25mm*32mm),未来封装

基板大小可能会超过110mm。由于3D封装需要采用小于

10pm甚至更小pitch的超高密Bonding技术,其相对2.5D封装具

有显著的带宽、功耗优势,单bit功耗有望降低至1/10。

云计算打破了传统安全边界,数据加密成为应对新型攻击的方式。云

计算将巨大的数据处理分解为若干小程序,通过多部服务器计算出结

果后返回给用户,巨大的数据传输量使传统的外挂式安全防护方案无

法应对新型攻击,因此在网络的任何位置通信都应加密。具体做法为

在每一个服务器中融入加密通信的高性能硬件卸载能力,并支持后量

子加密算法。

图23:隐私计算重走数字信任体系

00Md

r•■法-a——

o_t_田便全多力计一密态计一)o

未来的计算可在最合适的地方以最合适的算力进行,呈现多样化计算

趋势。不仅DPUCDataProcessingUnit,数据处理单元)、NPLKNeural

ProcessingUnit,嵌入式神经网络处理器)等内设可以进行数据处理,

硬盘、网卡、内存等外设也将逐步开始拥有数据分析和处理能力,多

样化计算可以减少数据搬移,提高整体系统的性能。近内存计算:可

使内部数据传输不受外部总线带宽制约,使DRAM内有效带宽实现

倍数级提升。总线作为各种机能部件之间传送信息的公共通信干线,

其带宽大小会对各处数据搬移产生制约,这成为如今数据传输、计算

的瓶颈。未来通过在DRAM(DynamicRandomAccessMemory,

动态随机存取存储器)的控制电路上增加并发的可编程计算单元,同

时优化DRAM阵列结构,可提升内部数据传输的并发度,使内部运

算不受外部总线带宽的约束,可实现数据运算有效带宽的倍数级提升。

英特尔提出的PCI-Express(peripheralcomponentinterconnect

express,一•种高速串行计算机扩展总线标准)所连接的设备分配独享

通道带宽,不共享总线带宽,可支持主动电源管理、错误报告、端对

端的可靠性传输、热插拔及服务质量等功能。英伟达开发出的NVlink

采用点对点结构、串列传输,用于中央处理器与图形处理器之间的连

接,也可用于图形处理器之间的连接,具有高带宽、低延迟、低功耗

和高密度的特点。

存算一体能打破算力和存储的边界,预计能效比冯诺依曼架构提升

10倍以上。存算--体即存储介质既能做存储单元又能做计算单元,

目前已有成熟的存储器可实现存算一体,很多新型的存储器也在探索

存算一体。基于SRAM(StaticRandom-AccessMemory,静态随机

存取存储器)和NORFlash(非易失闪存)的存储器将有望在2-3

年内实现规模商用,在端侧、边缘侧的人工智能推理运算中展现出

10倍的能效优势;基于ReRAM(Resistiverandom-accessmemory,

可变电阻式内存)、PCM(PhaseChangeMemory,相变存储器)、

MRAM(MagnetoresistiveRandom-AccessMemory,磁性随机存储

器)等新型非易失存储器具有高性能、低功耗的特点,虽还未实现存

算一体,但已在积极探索中,一旦实现存算一体,未来十年有望在数

据中心侧实现突破,存算一体要实现规模应用,还需突破以下难点:

1)计算精度比数字计算低。器件在兼顾存储和计算时的一致性、稳

定性相比数字计算低,因此会产生更多误差,同时计算过程中存在噪

声,进一步降低其计算精度。需要结合电路特征优化算法,使得计算

结果满足应用需求;2)对数据映射工具的要求更高。存算一体需要

将神经网络模型部署在合适的存储单元上,并通过数据流调度来控制

整个运算过程,因比需要更高效智能的数据映射工具;3)基于向量

乘矩阵的运算方式使其目前只能运用于特定的机器学习,难以实现通

用。需要在存储器件、编程模型、系统架构和应用上实现突破,使存

算一体扩展至更多应用场景。

边缘计算开始在ICT行业广泛应用,2030年全球市场规模有望达数

千亿美元。边缘计算可在靠近物或数据源头的一侧,采用网络、计算、

存储,应用核心能力为一体的开放平台,提供最近端服务,随5G技

术、物联网技术的发展,边缘计算开始在ICT行业广泛应用,预期

2030年全球市场规模将从100亿美元增长到数千亿美元。边缘计算

要实现规模应用,需要针对以下方面进行突破:1)智能化升级与改

造。若边缘计算能够实现在制造、电力、城市、交通、金融等垂直行

业的智能化升级与改造,形成完备的SDK(SoftwareDevelopment

Kit,软件开发工具包),解决跨行业的共性问题和智能制造的共性

问题,其将实现爆发式增长;2)算力网络能力的提升。未来应用边

缘计算的业务将越来越多元化,对算力的要求也将越来越高,其中全

息及多维感知类业务要求算力至少提高100倍,存储业务要求算力

提高100倍乃至1000倍,网络带宽业务要求算力达到10Tbit/s级别;

3)数据安全的保障。由于边缘计算距离物更近,因此更易受到攻击。

预计2030年80%的数据都将在边缘计算,一旦安全得不到保障,用

户就会遭到重大损失。因此需要加强数据采集、传输等过程中的保护,

同时又要避免对数据过度保护造成AI在在医疗、金融、工业等领域

的潜在价值无法充分发挥。

端边云计算正在从“云端训练、边缘推理'的模式走向“合作式”的训练

和推理。与以往云计算的云端与边缘“分工运行”不同,在如今的端边

云计算中,负责全面感知的终端、负责局部数据分析和推理的边缘、

负责汇集数据及感知分析的云端可同时协蚱,可应用于智能制造、智

能城市、智能交通等。2023年3月,鹏城实验室牵头制订的数字视

网膜系统国际标准在IEEE标准协会正式发布,该标准是全球首个端

边云技术的国际标准。正走向“合作式”的端边云技术还需解决以下问

题:1)协同训练的精度和收敛速度问题;2)决协同推理时延和准确

率问题;3)数据类问题:数据孤岛问题、小样本问题、数据异构问

题;4)其他诸如安全隐私、通信成本、端/边设备的资源受限等问题。

图24:端边云协同计算

端边云协同计算

⑥昌

*日由③X愿

I«MviauJEAH

数字挛生:未来的物理世界将会有一个挛生的数学世界对应,形成该

类数学世界需要增加100倍的算力进行三维建模。与物理世界一一

对应的数学世界可实现“双系统”协同运行,卡奥斯COSMOPlat发布

的D3OS数字季生产品正助力企业打造虚拟工厂,优化生产经营流

程,实现降本增效。利用信息化技术促进产业变革的工业4.0时代以

及着眼于建设制造强国的《中国制造2025》战略,都在积极推进数

字挛生。实现数字挛生需要先对物理世界里影像、视频、声音、温度、

湿度、力学等各种数据进行多维感知和采集后,再通过三维建模构建

数学世界。这样的三维建模需要使用100-路摄像机阵列采集的高精

度数据的数据量,比2D图像数据量增加100倍以上,分辨率提升至

8K,单路算力提高4倍,因此所需的算力也需增加100倍以上,并

且需要高效的三维建模软硬件系统。

量子计算目前正处于高速工程化的阶段,未来十年重点为实现基于

NISQ的专用量子计算机。量子计算目前处于NISQ(Noisy

IntermediateScaleQuantum,中等规模带噪声量子器件)时代,并处

于高速工程化阶段。目前量子化学模拟、量子组合优化算法及量子机

器学习是最具商业价值的落地场景。而未来十年重点是实现基于

NISQ的专用量子计算机,这样的量子计算机可以有效模拟自然界发

生的任何过程,在物流管理、供应链管理、机器学习、电子制造等方

面的应用上具有巨大潜力。

未来全闪存将成为新型存储的主流。全闪存可同时应用于主存储和辅

助存储,预计未来有72%的企业存储数据基于全闪存;企业的所有

数据中,有82%的业务数据存在备份需求。根据数据存储的热温冷

差异,未来存储介质将向高速高性能和海量低成本方向演进。新型内

存型介质将成为热数据存储的主流介质。目前存储热数据的SSD和

DRAM都无法满足热数据存储的要求,诸如PCM、MRAM、ReRAM、

FeRAM(FerroelectricRandom-AccessMemory,铁电式随机存取

内存)等新型内存型介质技术将成为热数据存储的主流介质,但仍需

面临以下挑战:1)容量挑战。预计到2030年,热数据总量将相当

于目前SSD存储的数据总量,因此热数据介质的容量密度至少需要

达到目前SSD的1Tb/die,扩大10倍左右;2)能耗挑战。PCM、

ReRAM等基于电阻,能耗较大。ReRAM和MRAM的单位bit功耗

是FeRAM的10倍,PCM高达其100倍,因此FeRAM类低工作电

压介质潜力更大。

高密NANDFlash介质将成为温数据存储的主流介质。温数据介质需

要兼顾性能、容量和低成本,需要面临以下挑战:1)Cell多值的性

能和寿命挑战。目前Cell存储容量多1个比特,电压级数都将增加1

倍,读写性能和寿命下降数倍;2)3D堆叠的工艺挑战。华为预计

2030年堆叠层数将达到千层量级,介质硅通孔宽深比将达到120:1,

加工难度大大上升。光存储将成为冷数据存储的主流介质。未来冷数

据长期存储规模将从1.2ZB增长至26.5ZB,同时存储寿命需要提升

5~10倍。就中国国家档案馆而言,关键档案数据的存储寿命要从100

年提升到500年,数据规模将从100PB增长至ij450PB。传统的存储

材料无法满足这一需求,光存储将成为冷数据的主流存储介质,其需

面临以下挑战:1)介质寿命需提升10倍,且具有应对各种复杂环

境的能力;2)容量达到蓝光的10倍,成本下降5倍,性能提升10

倍。

图28:各种存储介质的性能比较

4.投资分析

4.1,华为线条:Chiplet先进封装破局,受益华为复苏回归

兴森科技:行业需求下行致业绩承压,扩张产品产能待厚积薄发,成

立于1999年。主营业务包括PCB(2022年营收占比75%)、半导

体测试板(9%)、IC载板(13%)。公司是国内最大的印制电路样

板小批量板快件制造商,产品广泛应用于通信、工控、计算机、军工

等。2022年海外营收占比50%。目前公司已具备3.5万平米/月的

BT载板产能。公司正在持续推进FCBGA载板业务,其中珠海项目

预计于23Q2开始客户认证,23Q3小批量试生产。广州项目目前正

在进行厂房装修,预计23Q4进入试产,公司有望成为国内首家实现

FCBGA封装基板量产的企业。预计公司2023/2024年EPS分别为

0.45/0.66元。

德邦科技:业绩高速增长,加快高端电子封装材料国产替代。成立于

2003年。公司是国家集成电路产业基金重点布局的电子封装材料生

产企业,主营业务包括集成电路封装材料(2021年营收占比14%)、

智能终端封装材料(31%)、新能源应用材料(46%)、高端装备应

用材料(9%)四类,产品广泛应用于晶圆加工、芯片级封装、板级

封装等封装工艺环节。公司的芯片固晶材料产品、晶圆UV膜产品已

通过华天、长电等认证并批量出货;芯片级底部填充胶、Lid框粘接

材料、芯片级导热界面材料等产品目前正在配合国内领先芯片半导体

企业进行验证测试,后续有望率先实现国产化。智能终端材料•:公司

已进入苹果、华为等供应链并实现大批量供货,仍有份额提升空间;

动力电池封装材料:公司已陆续通过宁德时代、比亚迪、中航锂电等

头部企.业验测,并起量。公司拟募集6.44亿元用于高端电子专用材

料生产项目、年产35吨半导体电子封装材料建设项目、新建研发中

心建设项目,伴随着产能的陆续释放,公司有望成长为高端电子封装

材料巨头。预计公司2023/2024年EPS分别为1.81/2.76元。

长川科技:测试机出货持续增长,国产替代先进封装之关键。成立于

2008年,主要为IC封测企业、晶圆制造企业、IC设计企业等提供

测试设备。公司主营产品为测试机(2021年营收占比32%)、分选

机(62%)等。公司测试机和分选机的核心性能参数接近国外先进水

平,同时服务本土客户响应迅速,合作开发快速进步。公司测试机分

选机、探针台不断迭代提高,持续兼并扩张,有望充分受益于国产替

代进程。预计公司2023/2024年营收分别为37.66/50.59亿元,归母

净利润8.49/12.75亿元。

伟测科技:兼CP与FT测试之长,引领国内第三方测试,2022年盈

利超预期。成立于2016年,公司聚焦第三方集成电路测试领域,主

营业务包括晶圆测试(2021年营收占比58%)、芯片成品测试(42%)。

公司的技术实力、服务品质以及产能规模在行业内具备较高认可度,

同时积累了广泛的客户资源。公司客户涵盖芯片设计、制造、封装、

IDM等类型的企业,其中不乏紫光展锐、比特大陆、晶晨股份等行业

高端客户。高端客户的产品不断创新,带来具有较高确定性的测试需

求,进而有效抵消行业需求下行的负面影响。与此同时,公司高端机

台数不断扩充,测试产能充足,将满足高端客户的测试需求。中国大

陆地区第三方测试市场集中度较低,各家规模较小,伟测科技营收规

模与技术水平均处于国内领先地位。预计公司2023-2024年实现营

收11.33/15.37亿元,归母净利润3.43/5.16亿元。

方邦股份:业绩暂时承压,可剥离铜箔成国产先进封装载板破局之光。

成立于2010年,公司专注于提供高端电子材料及应用解决方案,主

营电磁屏蔽膜(2021年营收占比83%)、铜箔(15%)等。公司可

剥铜产品作为基础复合电子材料,在芯片封装、超细线路制备等领域

具有重要作用。据数据显示,2021年全球IC载板的市场规模为144

亿美元,超过硅片的126.2亿美元。作为IC载板领域的新产品,可

剥铜具有不弱于ABF载板的最小线宽线距,以及同等面积下显著的

成本优势。当前ABF载板市场几乎被日本味之素所垄断,国内多家

厂商尚处于产品验证导入阶段,可剥铜有望成为实现IC载板自主化

的另一大关键技术,在大力推进半导体国产替代的背景下具有重要意

义。当前可剥铜仅日本三井可提供,公司可剥铜产品今年有望实现出

货,进一步打开业绩增长空间。此外,公司PET铜箔稳步推进,四

大核心技术奠定公司技术优势,通过现有屏蔽膜产线可快速实现PET

铜箔量产。若产品顺利认证,工艺+产能的优势将助力公司快速抢占

市场,实现第二业绩增长曲线。预计公司2023-2024年实现营收

6.36/8.89亿元,归母净利润0.62/1.71亿元。

华正新材:CBF积层绝缘膜突破,先进封装打开上涨空间。成立于

2003年,是国内最早从事研发生产环氧树脂覆铜板的企业之一。公

司主营产品为覆铜板(2022年营收占比77%)、导热材料(6%)、

功能性复合材料(6%)、交通物流用复合材料(10%)。作为先进

封装领域中FCBGA高密度封装基板、芯片再布线介质层、芯片塑封、

芯片粘结、芯片凸点底部填充等重要应用场景的关键封装材料,CBF

积层绝缘膜长期被日本企业垄断,市占率达到95%以上。公司与中

科院深圳先进院、电子材料院合作研发CBF绝缘膜,目前成功开发

多款CBF绝缘膜,将对海外厂商垄断的现状实现有效突破。公司已

经布局覆铜板、复合材料和锂电池软包用铝塑膜等产品,并且广泛用

于5G通讯、数据交换、新能源汽车、智慧家电、医疗设备、绿色物

流等领域。公司加强CBF积层绝缘膜的萌发,将进一步丰富公司IC

载板业务产品线,提升技术能力,以此拓展客户群体并且稳固行业地

位。预计公司2023-2024年实现营收42.05/52亿元,归母净利润

1.16/2.22亿元。

4.2.算力线条:云端与边缘端齐发力,大小算力全面替代

寒武纪:国产AI算力芯片行军者。成立于2016年,专注于人工智

能芯片的产品研发与技术创新。根据报告,若以英伟达A100显卡的

处理性能计算,训练ChatGPT将需要使用3万枚A100(单价1万

美元以上)。从各代GPT参数规模看,GPT-1/2/3分别有1.2/15/1750

亿个训练参数。GPT-4虽然并未公布具体参数量,但OpenAlCEO

对“GPT-4是人类迄今所实现的最复杂的软件”持肯定态度,并表示

“GPT-4会比GPT-3使用更多的计算资源",而这将进一步推升模型

对于高算力芯片的需求。目前进行AIGC业务所需的AI算力芯片格

局主要由英伟达主导,而其A100和H100(CUDA核心数较低的PCIe

版单价都高达24万元)系列在2022年8月被美国限制对华出口。

因此

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论