长江证券-电子行业:AI重构生产力下的电子行业投资机遇分析_第1页
长江证券-电子行业:AI重构生产力下的电子行业投资机遇分析_第2页
长江证券-电子行业:AI重构生产力下的电子行业投资机遇分析_第3页
长江证券-电子行业:AI重构生产力下的电子行业投资机遇分析_第4页
长江证券-电子行业:AI重构生产力下的电子行业投资机遇分析_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AI重构生产力下的电子行业投资机遇分析长江证券研究所电子研究小组27•证券研究报告•评级看好维持分析师及联系人首席分析师杨洋SAC执业证书编号:S0490517070012电邮:yangyang4@分析师钟智铧SAC执业证书编号:S0490522060001电邮:zhongzh@010102020303ChatGPT:生成式AI引爆技术奇点AI+Chiplet:信息革命的基石0501ChatGPT:生成式AI引爆技术奇点01ChatGPT:生成式AI引爆技术奇点ChatGPT搜索热度居高不下002022/12/12023/1/12023/2/12023/3/1搜索热度7日均线0000各应用1亿用户达成时长(月)ChatGPTTikTokInstagramPinterestSpotifyTelegramUberGooglenslatePTokagramterestSpotifyTelegramUberGoogleTranslate01ChatGPT:生成式AI引爆技术奇点能正在生成新的东西,而不是仅仅局限于分析已经存在的东西,实现了人工智能从感知理解世界到生成创造世界的跃迁。因此,从这个意义上来看,广义的生成式AI技术的成熟应用进程时间表2020年2020年之前,水平高于手文本生成终文本生成初版用程序垃圾信息别译问答回应AIRoblox可依梦想定制的戏与电影,水平高于术家、设师等域的文案实现可精调 (论文等)用程序,比开发者水平频/3D/游戏领域终稿(产品设计、筑等),水平高于平均值步尝试3D文件模仿(产品设、建筑等)代码的表达多语种更垂直大模型可用情况文本文案撰写初稿基本实现代码领域未来潜力初步尝试文本领域码补足码生成2030?2025?2023?2020202201人工智能带来的生产力变革风声已近代表的信息结构性变革和自动化生产,其共同的特征就是生产规模的不断扩大、生产方式上科技应用不断地向工业和社会的更高层结构渗透。底层的、低技术含次工业革命第一次工业革命机械时代第二次工业革命信息革命信息时代智能革命(进行中)代心成果机械织布机、蒸汽机发电机、内燃机计算机、互联网人工智能标志事件机(核高效能运算、智能手机、无线电报能)、互联网、材料技术网络升级(5G)、物联网、20世纪初:流水线、飞机、移动终端、移动互联网人工智能、汽车等发展基础(技术层面)发展瓶颈牛顿力学等自然科学积累第一次工业革命的新增工如钢铁、煤炭、机械加工等的发展学为代表始引领工业展论和应用发连携提速,科学技术转化为直接生产力的速度加快数据在社会中的全面渗透在材料等多种基础工业突破下算力的指数增长信息传递的广覆盖、高精信息处理与传递演进,科技应用指数增长数据渗透全面化,智能应社会全场景主要围绕生产蒸汽机、机械使得制造业向军事蔓延流水线使得单一工厂生产科技革命形态转变,出现用倾向技向民用下沉的速开始加快,尖端、军用科技研究方向外开始出现科技民用化的研究革命浪卷人类社会全三要素逐步成熟,推动行业进入爆发期数据层面01人工智能三要素逐步成熟,推动行业进入爆发期三要素逐步成熟,推动行业进入爆发期数据层面AIGCAI拟现实世界的数字孪生模型;美元。大大数据语料库高高精度训练集投投喂标注训练标注训练计算任务计算任务算法层面算法层面核核心技术突破多多模态认知计算数据数据巨量化AIGC认知交互力算力内算力内容创造力跨模态融合算力层面算力层面硬件算力-本地化实时算力-云计算数字孪生感知+交互数字孪生虚虚拟现实全全息立体应用场景智能交互-边缘计算0全球及我国人工智能市场收支规模及预测(亿美元)82102161EE全球中国01大模型参数量快速提升,算力需求大幅增加IParams网的算法参数量约千亿级别甚至万亿级别,与已知应用级别的呈现指数级别的差异。这些模型不仅在参数量上建设情况abAIGC模型的参数量巨大模型参数量(亿)解与生成0-语言理解与生成、推理、代码生成理解与图像生成理解与图像生产别解、生成解与生成AlphaCode成语言理解与生成、推理等成语言理解与生成、推理等-语言理解与生成、推理等yAIeDiffusion理解与图像生产-01大模型参数量快速提升,算力需求大幅增加IParams网的算法参数量约千亿级别甚至万亿级别,与已知应用级别的呈现指数级别的差异。这些模型不仅在参数量上基础是庞大的算力基建2018年后大模型训练算力需求显著提升01大模型参数量快速提升,算力需求大幅增加若481B模型的计算时间限制为一周,则仅加速卡成本将达到18.35亿美元。又好(参数量大)、又快(迭代时间短)的需求将大幅推升龙头件军备竞赛。算力加速卡需求情况练模型数量 词数 词语计算总计算量(万亿亿次)算力(TFLOP/s)用时 hGPU需要数量(颗)仅考虑A100GPU成本A100成本(亿美 亿美元)元)语言理解与生成1068统---------语言理解与生成、推理、代码生成61语言理解与图像生成6语言理解与图像生产6觉识别6Turing-NLG言理解、生成6OPT1758模型66nd66言理解与生成6AlphaCode生成6语言理解与生成、推理等6CLIP&DALL-E6生成6PT语言理解与生成、推理等---------ingNLG语言理解与生成、推理等62ityAIableDiffusion语言理解与图像生产---------AIGC算力假设为英伟达TeslaA100GPU算力19.5TFLOPS;A100成本为包含8张TeslaA100及配套芯片,即整机价格)01大模型参数量快速提升,算力需求大幅增加域大显身手。人工智能技术对于算力的核心拉动点在于未来各应用场景内单设备芯片算力的增长和人工智能技术的行业渗透率的进一步提升,带动对云计算中心、OPS片所能提供的算力。00基础是庞大的算力基建772019202020212022E2023E2024E2025E2026E中国通用算力规模(EFLOPS)中国智能算力规模(EFLOPS)能相关应用就将带来海量算力需求02AI+Chiplet:信息革命的基石02应用-软件-硬件循环向上,AI芯片发展多元变化AI芯片相关技术对算力的具体要求研究所02应用-软件-硬件循环向上,AI芯片发展多元变化中国AI芯片市场规模占比(IDC)9.6%1.0%0.4%ICAI芯片的目标领域主要AI相关芯片的市场规模及增速(百万美元,Gartner)202020212022E2023E2024E2025E2026ECAGR2021-2026E应用处理器(分立或嵌入式)460P6FPGAGPU786MCU/SoC微处理器嵌入式微处理器其他ASICAI芯片为主)02应用-软件-硬件循环向上,AI芯片发展多元变化U的局面。性能功能效率灵活性延迟CPUGPUFPGAASIC主要AI芯片的功能特性比较GPUFPGAASIC化程度型化化性好好好本高高低语言/架构/大小成熟平均性能较高、功耗较低、灵活性强强,功耗很低、体率不高、不可编辑、功语言难度大间长、技术风险大场景云端推断终端推断云端训练、云端推断、终端推断表企业芯片英伟达Tesla、高通Adreno等rsalArria谷歌TPU、寒武纪Cambricon等02GPU:并行运算带来对AI应用的高度适配结构;而GPU一般是众核(many-core)结构。CUDAISA以及GPU内部的并行计算引擎。英伟达在GPU里面增加了TensorCore为AI服务,它的并行力度就从基reCPU和GPU架构对比CUDACore做卷积(以点为基本粒度进行)02GPU:并行运算带来对AI应用的高度适配➢英伟达AmpereGA100是迄今为止设计的最大的7nmGPU。GPU完全针对HPC市场而设计,具有科学研究,人工智能,深度神经网络和AI推理等NVIDIAA100基于7nmAmpereGA100GPU,具有6912CUDA内核和432TensorCore,540亿个晶体管数,108个流式多处理器。采用第三代NVLINK,GPU和服务器双向带宽为4.8TB/s,GPU间的互连速度为600GB/s。另外,TeslaA100在5120条内存总线上的HBM2内存可达40GB。新Hopper架构的,800亿个晶体管的H100,这是首款支持Pcle5.0标准的PUHTbsIOAmpere架构H100可大幅加速大模型训练时间从从5天加速到19小时 (GPT-3,1750亿参数)从7天加速到20小时 (MoE,3950亿参数)AI的核心驱动与英伟达的三重壁垒GPUDPUCPUNVlinkConnectXCUDADOCAOmniverseAIEnterpriseCIS5G视频流、社交媒体……数据持续高增,算力需求远超现存数据多芯配合算力迭代突破硬件摩尔定律限制三芯战略硬件层多芯互联瓶颈打AI的核心驱动与英伟达的三重壁垒GPUDPUCPUNVlinkConnectXCUDADOCAOmniverseAIEnterpriseCIS5G视频流、社交媒体……数据持续高增,算力需求远超现存数据多芯配合算力迭代突破硬件摩尔定律限制三芯战略硬件层多芯互联瓶颈打开算力上限互联网络AIAI发展关键瓶颈算力、功耗、体积与成本以及如何发挥软硬件强耦合充分发挥硬件优势算力芯片应用软件软件层下沉应用层提供更完整解决方案行业应用软件从消费到数据基建再到AI完整领域生产力数字孪生元宇宙社会效益游戏应用层数据中心自动驾驶算法经历超半世纪发展主流模型逐步成熟专业视觉英伟达硬件层的三芯战略已逐步成型:GPU解决AI大规模并行运算痛点,DPU解决AI训练推理中设备网络通信与耦合设计构造完整AI解决方案,NVlink+NVSwitch+ConnectX突破芯片直连和设备网络连接限制,GPUDirectStorage技术实现高性能存储和数据业对英伟达的粘性。CUDA从底层代码出发发挥GPU并行运BlueFieldDPU身定做软件开发平台,复刻GPU+CUDA的强耦合成功路径,Omniverse初试工业共享虚拟空间,现以AI开发AI资料来源:长江证券研究所参数指标描述视频解码支持H参数指标描述视频解码支持H.265/H.264/VP9/AVS2/AVS/JPEG/MPEG4等主流格式;2D图形生成功能支持DirectFB1.7.7;支持OpenVG1.1矢量图形加速;3D图形生成功能支持OpenGL4.0、OpenCL3.0、Vulkan1.1、OpenGLES3.2;像素填充率8GPixels/s;32位单精度浮点性能512GFlops;内核性能内核时钟频率1GHz(支持动态调频);总线接口PCIE4.0X8显存带宽256GB/s显存容量8GB显示接口支持2路独立的图形显示控制器,支持2路HDMI2.0、1路eDP1.2、1路VGA输出;支持平台支持X86、ARM、MIPS处理器和Linux、中标麒麟、银河麒麟、统信软件、翼辉、天脉等操作系统;功耗˂15WGPU形成了核心技术优势。公司以JM5400研发成功为起点,不断研发更为先进且适用更为广泛的一系列GPU芯片,随着公司JM7200和JM9系列图形处理芯片的景嘉微JM9图形显示卡功能参数d景嘉微Wind一致预期情况关键指标2019A2020A2021A2022E2023E2024E营业收入(百万)530.79653.771,093.201,147.801,776.922,490.38增长率(%)33.6323.1767.214.9954.8140.15归母净利润(百万)175.97207.63292.74288.88423.34577.48增长率(%)23.6717.9940.99-1.3246.5436.41EPS(摊薄)0.580.690.970.630.931.27基准股本(百万股)301.27301.25301.24455.13455.13455.13ROE(摊薄)(%)7.468.2010.229.3612.3514.78ROA(%)7.037.379.207.979.6211.07100.30101.43156.62178.11121.5489.10PEG4.245.643.82-135.202.612.4502沐曦:顶级团队布局全栈解决方案UGPUIP知识产权的指令集和架构,配以兼容主流GPU生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案,是“双碳”背景下推动数据设和产业数字化、智能化转型升级的算力基石。曦思N100人工智能推理GPU曦思N100已完成百度飞桨I级兼容性测试02壁仞科技:训推一体化剑指全球龙头计算芯片的突破。BR100系列通用GPU芯片AHBR100系列产品与英伟达H100、A100产品参数对比BR100-OAMBR104-300WPCIeNVIDIAH100SXM5NVIDIAH100PCleNVIDIAA100PCle产品形态TF (TF32)双FHFLPCleTFLOPS (TensorCore) (TensorCore)LOPS48TFLOPSOPSTFLOPSOPS (TF32)400TFLOPS (TF32) (TF32)SOPSS00TFLOPSFLOPS (FP16)TOPSTOPSTOPSBHBMEBMEGBHMB3GBHBM2EGBHBM2E口CXL2.0CXL2.0宽s00GB/s0GB/s0GB/s最大热设计功耗 (TDP)00W02芯原股份:GPU+NPU的IP卖水人eNPUIPVivanteNPUIP本效益的优质神经网络加速引擎解决方案,芯原业界领先的NPU在过去几年已经向60多个客户交,被应用于110多个系统级芯片(SoC)中。➢值得重视的是,芯原代理了全球高速SerdesIP的龙头厂商Alphawave在大中华区的销售和芯片定制设计应用,高速Serdes接口或将成为算力以外最为关键芯原VivanteGPUIP芯原VivanteNPUIP产品线及其应用U864207X1X使用FPGA数量对QUERYU864207X1X使用FPGA数量对QUERYPerformance影响13X4X124相关性能SDP过NIC(网络接口控制器)和PCIe连接到存储设备。搭配XilinxVersalACAP速度的巨大提升。以生命科学公司lllumina基因组计算为例,Xilinx的加速组件为其基因安全性,并通过将网络堆栈从CPU卸载到SmartNIC来加数据中心中FPGA可配合多种芯片实现性能的大幅提升计算加速用于illumine用于TWITCHVP9网络直播的视频转码技术基因组数据分析90X1X30用于illumine用于TWITCHVP9网络直播的视频转码技术基因组数据分析90X1X30X1XGAGAGA1100X20XCPUCPUCPU 1XCPUCPUCPU02040608010001002040608010001020304002国产FPGA替代先锋——紫光同创➢紫光国微民用可重构系统芯片业务由参股子公司深圳紫光同创电子承担。紫光同创是中国FPGA领导厂商,总投资超过20亿元,主要从事可编程逻辑器件 发展历程紫光同创FPGA开发软件平台02边缘计算:云-端-边的下一个发展方向力部署方案是必然趋势,部分中低功耗的边缘端AI芯片有望成为行业下一个发展的关键趋势,如AISoC在智能音箱、智能家居、智能穿戴、智慧安防等领域的应用。用错配,需要边缘算力支撑02Chiplet:芯片集成的新形态,规避限制的关键技术➢目前,主流系统级单芯片(SoC)都是将多个负责不同类型计算任务的计算单元,通过光刻的形式制作到同一块晶圆上。比如,目前旗舰级的智能手机的SoC➢而Chiplet技术是SoC集成发展到一定程度之后的一种新的芯片设计方式,它通过将SoC分成较小的裸片(Die),然后每个单元选择最适合的工艺制程进行制造,再将这些模块化的小芯片(裸片)互联起来,采用新型封装技术,将不同功能不同工艺制造的小芯片封装在一起,成为一个异构集成芯片。基于Chiplet的异构架构应用处理器的示意图Chiplet可灵活实现集成各类功能的芯片设计来源:芯原股份业绩说明会,长江证券研究所02Chiplet实现的方式:SIP/2.5D/3DposerighdensityFanoutICHBMChipletSIP.5D/3D封装来源:SiP与先进封装技术,长江证券研究所互联网络是小芯片以外最为重要的组成02下游需求加速扩围,产业链价值重构➢拓宽下游产业链加速Chiplet生态发展。预计至2024年,每个EPYC➢拓宽下游产业链加速Chiplet生态发展。预计至2024年,每个EPYC处理包括4个Zeppelindie,使用2DMCM(Multi-chipmodule)封装。Zeppelindie包全球基于Chiplet的器件市场规模可达到59亿美元左右。高端智能手机等将在未来几年成为Chiplet的主要应用EPYC(Naples)含2个corecomplex-CCX。单独看,每个Zeppelindie都包括单独的memory、EPYC(Naples)infinityFabric的控制与接口;从公司层面看,对于研发成本,一个Zeppelindie可以覆盖服务器和 桌面两个市场,收益明显。AMD有一个中央集中式I/O和内存控制器die,而且这个集中IOD仍然有14nm工艺,CCD仍然保持8个核EPYC(Rome)的设计。8个CCDdie,一个IOD,最高核数为64个。每个CCD上的核数可以根据良率变化,每个全球基于Chiplet的器件市场规模(分下游应用,百万美元)SKU上的Chiplet数目也可以选择。Ryzen(Matisse)Ryzen产品线重用了EYPCRome的CCD。只是单独配了一个ClientIOD。对于产品线复杂的公司,Ryzen(Matisse)AlteraStratix10FPGAStratix10是Intel第一款使用EMIB的设计,中心是FPGAdie,周围是6个Chiplet。4个高速transceiverChiplet和2个高带宽memoryChiplet。这6个Chiplet是来自三个不同fab的6个不同工艺Chiplet,证明了不同fab之间的强大互操作性。IntelLakefieldSoCLakefield使用3D封装,运用不同核的混合架构和Chiplet设计,一个computedie,一个basedie。Basedie主要是I/O功能,性能不敏感,因此可以用22nm工艺,而混合了大小CPU核、IPU、GPUcomputedie,会持续演进,用7-5nm工艺。BarefoottheTofino2chip7nm+ChipletswitchASICEthernetSwitch市场的第一款分离为Chiplet的设计。SwitchASIC长期以来都是把模拟和逻辑部分放在一起设计的,模拟部分其实和逻辑部分演进的时间表完全不同。如果是单芯片设计,模拟部分也不得不随着逻辑部分的工艺演进前进。如果采用Chiplet分离设计,逻辑部分可采用最新工艺,模拟部分可保留传统工艺。Chiplet带动模拟部分的工艺节省,而且还可以通过不同的Chiplet配置来提供不同的SKU。AppleM1Max苹果将两枚M1Max芯片通过Chiplet技术拼接。M1Ultra芯片采用了UltraFusion封装架构,通过两枚M1Max晶粒的内部互连。架构上,M1Ultra采用了20核中央处理器,由16个高性能核心和4个高能效核心组成。Xlinix2011Virtex-72000T4个die的Chiplet设计。MarvellMochiMarvell提出Mochi概念,最大的驱动力是降低成本,模块化芯片设计,像LEGO那样,提高模块的重用性。借助基本模块的重用,还能在保持灵活性的同时,加快新产品的上市时间。Hisilicon晟腾9108个Chiplet设计,融合了HBMdie,逻辑部分与I/O部分分离,两个dummydie,超大总diesize等特点。BRGPUnmChipletDCoWoS球领先水平,相较实现3倍以上的性能提升➢基于7nm制程工艺,思元370是寒武纪首款采用chiplet(芯粒)技术的AI芯片,集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品。凭借寒武纪最新智能芯片架构MLUarch03,思元370实测性能表现更为优秀。思元370也是国内第一款公开发布支持LPDDR5内存的云端AI片,内存带宽是上一代产品的3倍,访存能效达GDDR6的1.5倍。搭载MLU-Link™多芯互联技术,在分布式训练或推理任务中为多颗思元370芯片提供高同能力。全新升级的寒武纪基础软件平台,新增推理加速引擎MagicMind,实现训推一体,大幅提升了开发部署的效率,降低用户的学习成本、开发成本BR100系列通用GPU芯片思元370芯片e2021-2027E全球先进封装市场规模(百万美元)2021年全球先进封装企业营收排名(取$1B+企业,百万美元)03知、技术供应商在AI落地的方法论与实践方面日趋成熟。随着人工智能产业化应GPU的AI服务器年出货量占整体服务器比重近1%;2023年预计在ChatBot相关应用加持下,预估出货量同比增长可达8%;2022-2026年复合增长率将达020~

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论