版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
证券研究报告2024年3月12日AI系列:光是通信的必由之路,OCS已
成功应用摘要◼
谷歌大模型持续迭代,亟需算力支撑:2023年12月,谷歌推出自身首个多模态大模型Gemini
1.0,其中高性能版本Gemini
Ultra可对标GPT-4,2024年2月16日,谷歌Gemini模型Pro版迭代出1.5版本,该模型在长语境理解方面取得突破,显著增加可处理信息量;2024年2月22日,谷歌推出新型开源模型系列“Gemma”。谷歌不断加速迭代大模型,大模型性能提升除了软件层面优化,更需强大算力支撑◼
谷歌自研TPU性能不足,引入OCS光交换机提升计算集群性能:根据公开数据,谷歌训练Gemini
Ultra所使用芯片为TPU
v4、TPU
v5e,性能无法与英伟达H100相比,TPU
v5e峰值算力只有英伟达三年前发布的
A100的六成,最新版本TPU
v5p峰
值算力不到H100的三成,在此
背
景下,谷歌引入OCS光交换机提升整体计算集群性能,可降低功耗和延迟◼
谷歌TPU集群的大规模采用将给OCS光交换机产业链公司带来机遇:谷歌TPU集群除谷歌自用外,已在Salesforce和Lightrick等客户大模型训练实现商用,带动OCS光交换机放量,OCS光交换机中的核心部件:MEMS阵列、发射/接收模组及其光学器件、光模块、环形器、850nm光源、光纤及连接器、铜缆等供应商均将受益◼
光连接是AI高速传输的必由之路,关注更广泛的光连接产业链:计算设备之间通过光模块和光纤光缆实现连接和数据格式转换,关注光模块产业链(包括上游的光芯片、电芯片、光学器件以及光模块)和光纤光缆产业链◼
建
议
关注:1)OCS光交换机产业链核心标的:✓
环形器/波分复用器/光学器件:【腾景科技】✓
MEMS阵列代工:【赛微电子】✓
光模块:【中际旭创】✓
铜缆:长芯盛(【博创科技】收购)✓
连接器:【太辰光】✓
光源:【光迅科技】、【长光华芯】、纵慧芯光(【华西股份】投资)◼
2)广泛的光连接产业,建议关注:✓
光芯片:源杰科技、仕佳光子、长光华芯✓
光器件:天孚通信、腾景科技、太辰光、光库科技✓
光模块:中际旭创、新易盛、光迅科技、博创科技、联特科技、华工科技、立讯精密✓
光纤光缆:长飞光纤、亨通光电、中天科技、烽火通信◼
风险提示:大模型商业化进程不及预期、全球数据中心资本开支不及预期、全球电信运营商资本开支不及预期、国内外宏观经济下行风险、相关公司国际供应链风险、相关数据更新不及时风险2目
录一、使用光交换机能够显著提升AI超算集群效率二、光交换机产业链增量明显,相关标的受益三、光是AI时代高速传输的必由之路四、投资建议及风险提示3谷歌为何要发展OCS光交换机:提升计算集群性能支撑大模型◼
2023年12月7日,谷歌推出自身首个多模态大模型Gemini
1.0,其中高性能版本Gemini
Ultra可对标GPT-4◼
2024年2月16日,谷歌Gemini模型Pro版迭代出1.5版本:✓
该模型在长语境理解方面取得突破,显著增加可处理信息量,持续运行多达100万个tokens,是迄今为止基础模型中最长的上下文窗口✓
Gemini
1.5
Pro可一次处理大量的信息——包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库✓
谷歌透露其在研究中还成功测试了多达1000万个tokens◼
2024年2月22日,谷歌推出新型开源模型系列“Gemma”:该开源模型基于Gemini研究和技术开发,与Gemini相比,Gemma展示了更高的效率和轻量化设计,同时免费提供全套模型权重,并明确允许商业使用◼
谷歌不断加速迭代大模型,大模型性能提升除了软件层面优化,更需强大算力支撑,算力一方面来自底层的芯片性能,另一方面则来自计算集群效率,为了高效地将多个计算芯片连接起来,谷歌在通用解决方案基础上,创造性地引入OCS光交换机(Palomar)软件层面优化模型优化依靠:谷歌优势不明显,不及英伟达AI大模型竞争激烈芯片本身性能计算集群性能如何提升算力?算力硬件支撑利用OCS提高数据交换速率注:Palomar是谷歌对OCS光交换机的命名4:谷歌官网,中泰证券研究所谷歌大模型
Gemini快
速
迭代,亟需算力支撑◼
谷歌大模型的迭代动作加快:✓
2023年初推出聊天机器人Bard:2023年2月6日,谷歌宣布将推出一款聊天机器人Bard,2023年3月21日,谷歌向公众开放Bard的访问权限✓
2023年12月推出首个多模态大模型Gemini
1.0:模型共分为Ultra、Pro、Nano三个版本,同时将聊天机器人Bard背后的模型从PaLM
2换成了Gemini
Pro,其中高性能版本Gemini
Ultra可对标GPT-4,Gemini
Ultra
在大型语言模型
(LLM)
研发中使用的32
个广泛使用的学术基准中,有30个的性能超过了当前最先进的结果✓
2024年2月16日,Gemini
1.0
Pro迭代至1.5:在文本、代码、图像、音频和视频评估达到了与Gemini
1.0
Ultra相
当
的
质量,但减少了计算资源✓
2024年2月22日,谷歌推出新型开源模型系列“Gemma”表:Gemini
1.0三版本对比表:Gemini
1.0
Ultra、1.5
Pro和GPT-4文本能力对比
表:Gemini
1.0
Ultra、1.5
Pro和GPT-4图/音/视频能力对比模型规模模型描述能力基准越高越好描述Gemini1.0
UltraGPT-4Gemini1.5
Pro能力基准越高越好描述Ge
mini1.0UltraGPT-4Ge
mini1.5图像MMMU多学科挑战性推理59.4%56.8%58.5%通用MMLU:大规模多任
性问题务语言理解57个学科的代表90.0%86.4%81.9%Ultra参数最大,性能最强,可以在各种高度复杂的任务中提供最先进的性能,包括推理和多模态任务。由于采用
Gemini
架构,VQAv2自然图像理解图像文本识别文件理解77.8%82.3%90.9%80.3%77.2%78.0%88.4%75.1%73.2%73.5%86.5%72.7%推理Big-BenchHard需多步骤推理的各种挑战性任务83.6%83.1%84.0%TextVQADocVQA它可以在
TPU高效地大规模运行上DROP综合阅读82.480.978.9InfographicVQA信息图理解HellaSwag日常任务的综合推理87.8%95.3%92.5%Pro参数比
Ultra
版本少,在成本和延迟方面进行性能优化,现在已经应用于Google
聊天机器人
BardMathVista视觉环境数学推理53.0%49.9%52.1%数学编程GSM8KMATH基本算术运算94.4%53.2%74.4%92.0%52.9%67.0%91.7%58.5%71.9%挑战性数学难题Python编码生成视频音频VATEX英文视频字幕视频问题回答62.756.063.0-Nano专门为移动设备训练的模型。针对不同内存的设备,训练了两个版本,参数量分别是
18
亿(Nano
1)和
32.5
亿(Nano
2)HumanEvalPerceptionTest
MCQA54.7%46.3%Natural2code无线Python编程生成74.9%73.9%77.7%CoVoST
2FLEURS21种语音翻译40.129.140.162种语音翻译7.6%17.6%6.6%(越低越好):谷歌官网/谷歌技术文档,中泰证券研究所谷歌自研TPU单芯片性能不足,提高计算集群效率是破局关键◼
谷歌2016年涉足ASIC芯片,截止目前已推出6代版本:✓
2015年谷歌首次发布了第一代TPU,正式涉足定制ASIC芯片,2017年发布第二代TPU
v2,2018年发布第三代TPU
v3,第四代TPU
v4于2021年5月正式推出,此次迭代间隔三年,并于2023
年8月推出第五代TPU
v5e,
以及2023年12月6日最新发布TPU
v5p◼
单芯片性能不足,提高计算集群效率(POD)是同英伟达竞争的关键:谷歌训练
Gemini
Ultra所使用芯片为TPU
v4、TPU
v5e,性能无法与英伟达H100相比,TPU
v5e峰
值算力只有英伟达三年前发布的A100的六成,最新版本TPU
v5p峰值算力不到H100的三成,且英伟达将于2024年推出更高性能的B100产品表:谷歌历代TPU迭代情况表:谷歌近两代TPU与英伟达近两代产品性能对比版本TPU
v1201528nm-TPU
v2201716nm16TPU
v3201816nm32TPU
v420217nmTPU
v5e2023TPU
v5p2023版本H200SXMH10080
GPCIeA10040
GPCIeTPUv4TPUv5eTPUv5p发布时间制程发布时间20231412022802020202332202316202195未公布16未公布95HBM内存(GB)32HBM内存(GB)40HBM内存带宽(GB/S)34-70046900123-1200275-81919739416002562765459峰值算力(BF16,tflops)HBM内存带宽(GB/S)4800395820003200155562412008203942750918峰值算力(int8,tops)92--918峰值算力(int8,tops)-单芯片ICI带宽(GB/S)1984256262410242400409648008960集群芯片数-注:单芯片ICI带宽,指的是板卡上每个TPU芯片之间信息传输速率6:谷歌/英伟达官网,Ten
Lessons
From
Three
Generations
Shaped
Google’s
TPUv4i,中泰证券研究所既有网络架构使用电交换机,相比光交换机延迟和功耗较高◼
传统三层架构:包括接入层、汇聚层和核心层,对应位置均采用电交换机,一台下层交换机会通过两条链路与两台上层交换机互连,实际承载流量的只有一条,其它上行链路,只用于备份,一定程度上造成了带宽的浪费,因此传统网络架构有网络带宽阻塞,上层带宽小于下层带宽和◼
叶脊拓扑结构:相比于传统网络的三层架构,叶脊网络进行了扁平化,变成了两层架构,叶交换机相当于传统三层架构中的接入交换机,脊交换机,相当于核心交换机◼
胖
树
架构和英伟达Infiniband架构:✓
传统三层架构存在网络带宽阻塞,在叶脊架构中,视各家具体方案不同,汇聚层或核心层也存在网络带宽阻塞,胖树架构下,自下而上不存在网络带宽阻塞,英伟达infiniband架构采用两层的胖树架构,即叶脊和胖树的结合◼
以上网络架构中,各层交换机均采用电交换机,与光交换机相比存在一些不足:首先耗电量较大,同时因为需要对数据包进行编解码导致延迟较高,另外在摩尔定律下,电交换机相关芯片迭代速率较快,电交换机2-3年迭代一版,频繁迭代下资本支出较大图:传统三层网络架构和叶脊架构对比图:传统树形有阻塞三层架构和胖树架构7:物联网技术,中泰证券研究所TPU
v4时
期
首次引入Palomar
OCS提升计算集群性能◼
谷歌从TPU
v2版本开始构建超级计算机集群:谷歌在2017年发布TPU
v2的同时,宣布计划研发可扩展云端超级计算机TPU
Pods,通过新的计算
机
网络将64块Cloud
TPU相结合◼
TPU
v3集群(Pod):2018年与TPU
v3芯片一同推出,每个Pod最多拥有1024个芯片◼
TPU
v4集群首次引入OCS:首次引入Palomar
OCS(Optical
Circuit
Switches,光交换机),一个集群总共有4096个TPU,是TPU
v3的4倍◼
TPU
v5p集
群:每集群TPU数量达到8960个,每集群可用
FLOP总数是TPU
v4的4
倍
,
每秒浮点运算数(FLOPS)比TPU
v4
提
高
一倍,每Pod芯片数量增加一倍,可以提高训练速度的相对性能;TPU
v5p集群同样使用了Palomar光交换机◼
短时间内,谷歌在单颗芯片性能上超过英伟达难度较大,通过其擅长的软硬件集成,提高计算集群效率,在支撑自身大模型训练的基础上,可以通过出售算力资源获取收入,Salesforce
和
Lightrick
等客户已经在使用Google
Cloud的
TPU
v5p
超
级
计算机来训练大模型图:谷歌TPU
v5p参数及v5p集群芯片数量图:谷歌历代TPU集群集成的芯片数量1000090008000700060005000400030002000100008960首次引入Palomar
OCS4096102464v2v3v4v5p8:谷歌官网,中泰证券研究所并且将Palomar光
交
换机引入数据中心迭代Jupiter架构◼
谷歌数据中心早期架构
:2004年推出,被称为4-Post架构,由
4
个
大
容量交换机和512台ToR交换机连接组成,每台ToR
交换机与
40台服务器相连,从而形成了一个512×40,约
2
万台服务器的集群。这种架构缺点是可扩展性差,不适用于大带宽应用场景◼
2005年~2012年:2005年推出第一代自研架构
Firehose,通过定制软硬件构建集群,经历五代演进,2015年Jupiter可实现3万台服务器组网表:谷歌历代数据中心网络网络架构演进网络架构Four-Post
CRs2004Fire
House
1.0Fire
House
1.12006Watchtower2008Saturn2009Jupiter2012发布时间2005商用交换芯片Vendor8×10G8×10G16×10G24×10G16×40G40×10G(ToR)ToR交换机配置汇聚层交换机配置Spine层交换机配置网络速率48×1G2×10G上行24×1G下行4×10G上行48×1G下行4×10G上行48×1G下行24×10G16×40G-2×32×10G(有阻塞)64×10G(有阻塞)4×128×10G(非阻塞)4×288×10G(非阻塞)8×128×40G(有阻塞)-32×10G(非阻塞)32×10G(非阻塞)128×10G(非阻塞)288×10G(非阻塞)128×40G(非阻塞)10G1G2T10G1G10G1G10G10G10/40G服务器端口速率网络带宽n×1G82Tn×10G207Tn×10G/n×40G10T10T1.3P9:谷歌论文Jupiter
Rising:
A
Decade
of
Clos
Topologies
and
Centralized
Control
in
Goog
le’s
Datacenter
Network,中泰证券研究所引入Paloma
r光交换机降低计算集群功耗、延迟和生命周期成本◼
早期Jupiter采用
“Clos”拓扑:也称为脊叶配置:spine
and
leaf
configuration,机架装有【CPU、GPU、FPGA、存储和/或
ASIC
】,然后该机架连接到叶(leaf,汇聚层)或架顶交换机,然后通过各种聚合层连接到主干(spine)◼
Clos拓扑下电交换机的资本开支和功耗较大:Clos拓扑中,主干层使用电交换机
(EPS:Electronic
Packet
Switch),通常由
Broadcom、Cisco、Marvell
等提供,EPS耗电量大,此外,每
2
到
3
年网络速度翻一番,需升级现有spine层EPS,每一代更新都会带来巨大的资本支出◼
2022年谷歌引入光交换机替代主干层电交换机降低功耗、延迟和资本开支:引入光交换机取代Spine层传统电交换机,主干层功耗显著下降,同时由于不必解码数据包导致延迟显著降低,且主干层交换设备无须再进行设备代际更新,使用寿命增加,节约全生命周期资本开支;◼
引入光交换机也存在一些缺点:1)尽管全生命周期成本下降,但前期资本开支较大;2)信号插入损耗:光要多次反射折射才能到达接收端,存在信号功率损失;3)重新配置时间:光交换机的光路是提前设置好的,如果要与不同的端口通信,光开关必须重新配置这些镜像;◼
谷歌数据中心网络和TP
U超级计算集群引入Palomar光交换机,未来随着其自身算力需求的不断扩大,以及外部客户的采购,光交换机产业链有望持续放量,迎来投资机会图:早期谷歌Jupiter架构采用Clos拓扑图:引入光交换机取代主干层的电交换机10:谷歌论文Mission
Apollo:
Landing
Optical
Circuit
Switching
at
Datacenter
Scale,中泰证券研究所目
录一、使用光交换机能够显著提升AI超算集群效率二、光交换机产业链增量明显,相关标的受益三、光是AI时代高速传输的必由之路四、投资建议及风险提示11TPU
v4集
群
:总共4096个TPU互联◼
TPU
v4集群:谷歌目前训练大模型的主要集群,一个集群共有4096个TPU互联,未来升级到TPU
v5p集群,届时将有8960个TPU互联,由于目前最新资料是基于TPU
v4,本文后续将基于TPU
v4论文进行OCS架构和产业链分析◼
TPU
v4集群中4096个TPU芯片的构成:一个集群有64个机架,每个机架16个tray盘,每个tray盘上4个TPU,共计4096个芯片单台机架示意图图:TPU
v4集群:64(机架)×16(tray盘)×4(TPU)=4096个TPU4边角上的HBM+中间一块计算单元4个PCIe连接器一个集群共6
4个rac
k(机架)16个OSFP连接器(在板子背面)TPU
V4一个tray盘上包含4个TP
U,4个PCIe连接器,16个OSFP连接器,红黄绿色的管子是液冷管一
个
机架有16个tray盘(
板
卡),左右两列各8个注:OSFP连接器为采用OSFP封装的光模块,
PCIe为接口芯片,均用于tray盘间的信息传输12:谷歌论文TPU
v4:
An
Optically
Reconfigurable
Supercomputer
for
Machine
Learning
with
Hardware
Support
forEmbeddings,中泰证券研究所TPU
v4集群:64个机架之间通过48个OCS光交换机互联64个机架之间通过48个光交换机互联,光交换机内部不需要转化成电再处理目前每个机架内部的64个T
PU之间是通过电芯片(PCIe和OSFP)和电缆连接,未来随着T
PU算力提升,有可能升级到光互联13:谷歌论文TPU
v4:
An
Optically
Reconfigurable
Supercomputer
for
Machine
Learning
with
Hardware
Support
forEmbeddings,中泰证券研究所TPU
v4集
群
:为什么是48个OCS光交换机3D环面结构:一台机架内的64个T
PU互联,其连接方式可以抽象成一个4*4*4的立方体(cube),每个立方体工6个面,每个面伸出来4×4=16条线与机架外部的光交换
机
连接,6个面总共6×16=96条线,理论上对应96个光交换机,但对立面上的两个点连同一台交换机,96÷2=48,实际上需要48个交换机单台机架示意图把一台机架内的64个TPU互联方式抽象成右图的逻辑图(cube)14:谷歌论文TPU
v4:
An
Optically
Reconfigurable
Supercomputer
for
Machine
Learning
with
Hardware
Support
forEmbeddings,中泰证券研究所TPU
v4集
群
:使用OCS光交换机对光模块用量的影响单台机架示意图把一台机架内的64个TPU互联方式抽象成右图的逻辑图(cube)◼
光
模
块用量:每个cube(即每个机架)伸出来对立面上的2根线与每个光交换机互联,一共64个机架,所以每个光交换机需要有64×2=128个端口,所以每个集群总共有有48个交换机*128端口=6114个端口,所以在整个集群中TPU数量与端口数量之比为4096:6114=1:1.5,与英伟达胖
树
架构的1:2.5相比,光模块用量变少了◼
论
文
中表示每个交换机有136个端口,其中8个端口是检测校准和监控的,不实际传递信号15:谷歌论文TPU
v4:
An
Optically
Reconfigurable
Supercomputer
for
Machine
Learning
with
Hardware
Support
forEmbeddings,中泰证券研究所TPU
v4集群:OCS光交换机架构后半部分实物图(后视)前半部分实物图(俯视)12个高压驱动器发射模组摄像头模组4个风扇二色向分光器和组合器准直器两个供电电源CPU板MEMS阵列光模块,定制800G光模块,当中集成了环形器,环形器可帮助实现双向通信,即同一根光纤既可以输入也可以输出16:谷歌论文Mission
Apollo:
Landing
Optical
Circuit
Switching
at
Datacenter
Scale,中泰证券研究所TPU
v4集群:OCS光交换机架构(内部俯视)图:OCS光交换机工作机理摄像头模组发射模组二色向分光器和组合器准直器MEMS阵列信号的运动路径:图:OCS光交换机内部实物结构1、带内光信号(绿色)通过准直器阵列和MEMS反射镜进入MEMS阵列2、反射镜被驱动并倾斜以将光信号切换到相应的输入/输出准直器光纤3、监控信号从发射模组发出(红色,850nm光源),通过MEMS反射镜和MEMS阵列反射后由匹配的相机模块接收,用于校准MEMS芯片4、监控信号和带内信号重叠,有助于MEMS反射镜的调谐17:谷歌论文Mission
Apollo:
Landing
Optical
Circuit
Switching
at
Datacenter
Scale,中泰证券研究所TPU
v4集群:OCS光交换机内MEMS阵列介绍图:封装后的MEMS阵列实物形态图:OCS光交换机内部实物结构176个芯粒摄像头模组发射模组二色向分离器和组合器准直器MEMS阵列MEMS芯粒热力效应图MEMS阵列:1、每个交换机有两个陶瓷封装的MEMS阵列,每个阵列内部有176个芯粒2、每个芯粒上有高反射金涂层,可最大限度减少光学损失3、每个MEMS芯粒周围有4个控制轴来接收高压驱动器的信号4、控制轴可以控制每个MEMS芯粒的旋转每个MEMS芯粒周围有4个控制轴来接收高压驱动器的信号18:谷歌论文Mission
Apollo:
Landing
Optical
Circuit
Switching
at
Datacenter
Scale,中泰证券研究所TPU
v4集群:OCS光交换机核心单元供应商交换机之外,机架的内部电互联的铜缆:有源发射/接收模组:每个约1000美元,4个共4000美元,
由电缆预计150美元1套,长芯盛(【博创科技】收购)拥有相关产品,后续机架内部可能会切到AOC光连接(预计400美元/套以上)lumentum和coherent提供,其中光学器件占比15%,600美元。国内方面,【腾景科技】与lumentum、Finisar(现为
Coherent
的一部分)建立了合作关系850nm光源:lumentum和Finisar供应VCSEL光源,国内方面,【光迅科技、长光华芯、纵慧芯光(华西股份投资)】拥有相关产品MEMS阵列:约1500美元一个,2个3000美元,谷歌自研,外部代工,工艺要求较高。国内方面,【赛微电子】公告称全资子公司瑞典Silex以MEMS工艺为某客户制造的OCS完成了工艺及性能验证,并于2023年12月22日收到该客户发出的批量采购订单,瑞典Silex开始进行MEMS-OCS的商业化规模量产光模块:用量下降,技术要求提高,其中关键的波分复用器一个约18美元,国内方面,【中际旭创】拥有光模块相关产品,
【腾景科技】拥有波分复用器相关产品光纤和连接器:每个交换机256个光纤和连接器,每个预计20美元,其中光纤约18
美元,连接器约2美元。国内方面,【太辰光】拥有相关的连接器产品环形器:集成在光模块里,一个约25美元,【腾景科技】拥有相关产品全部交换机系统预计5-6万美元19:专家访谈,腾景科技/赛微电子半年报,中际旭创/太辰光等公司官网,中泰证券研究所目
录一、使用光交换机能够显著提升AI超算集群效率二、光交换机产业链增量明显,相关标的受益三、光是AI时代高速传输的必由之路四、投资建议及风险提示20从网络架构看光连接的驱动力:从电信到数通◼
电
信
市场:FTTx(光纤到任意终端)不断拓展、5G网络建设推进,整个电信网络各级光传输节点的数量和端口速率要求明显提升◼
数
通
市场:AI对算力的需求持续提升,数据中心、机架、服务器、计算芯片之间的互联架构变革,更多地使用光连接,且速率要求不断提升◼
从整个网络架构的演进来看,随着数据交换速率的需求持续提升,光连接对应的线缆、组件、芯片需求不断提升电信网络传输跨数据中心传输数据中心内部21:Yo
le,中泰证券研究所光连接成为解决AI时代高速传输的必由之路◼
光所连接的节点的距离不断下沉,速率不断提高,同时伴随着CPO等新技术的不断涌现,成为AI时代的必由之路:✓
数
据
中心之间:目前使用400G
ZR传输技术以及对应的光模块,2025年将主要使用800G
ZR传输及对应光模块,均主要使用硅光技术✓
核心层和主干层之间:目前使用800G
LR8传输技术以及对应的光模块,2025年将使用1.6T
LR4/LR8传输及对应光模块✓
主干层和叶交换机之间:目前使用800G
DR8/FR8传输技术以及对应的光模块,2025年将使用1.6T
DR8/2FR4/FR8传输及对应光模块,其中800G
DR8、1.6T
DR8均主要使用硅光技术,CPO(共封装光学)技术将在后续进行规模化应用,应用在这一层级✓
叶交换机和架顶交换机之间:目前使用800G
SR8传输技术以及对应的光模块,2025年将使用1.6T
SR8和1.6T
DR8传输及对应光模块,集成的VCSEL芯片升级为硅基光子芯片(Si
PIC)✓
架顶交换机和服务器之间:目前使用200G电缆(DAC)或光缆(AOC),2025年将使用400G
DAC/AOC✓
服务器之间:将越来越多使用光接口芯片(OIO)进行CPU、GPU乃至Chiplet间连接,取代传统的电IO方案,芯片输入输出的IO变为光信号图:光连接技术的应用场景22:Yo
le,中泰证券研究所光连接产业链概览◼
光连接:利用光模块、光通信设备和光纤光缆,将用户终端、基站、数据中心、数据中心内部各级节点、乃至CPU/GPU间连接起来,实现数据的传输◼
产业链概览:上游为光芯片、电芯片、光器件等基础器件供应商,中游包括光模块、光纤光缆、光通信设备等,下游应用市场包括电信市场和数通市场图:光连接产业链及主要玩家光芯片光模块光通信设备电信市场✓✓✓✓✓Coherent、Lumentum博通、Inphi、Finisar源杰科技、光迅科技仕佳光子、长光华芯华工科技、敏芯半导体✓
Lumentum、博通✓
Inphi、Finisar✓
中际旭创、新易盛✓
光迅科技、华工科技✓
博创科技、联特科技✓✓✓✓✓中国电信中国联通中国移动通讯✓
烽火通信✓
思科✓
诺基亚✓
爱立信数通市场光器件光纤光缆✓✓✓✓✓谷歌亚马逊微软阿里巴巴腾讯✓
天孚通信、太辰光✓
腾景科技、光库科技✓
康宁、古河电工✓
长飞光纤、中天科技✓
亨通光电、烽火通信✓
富通信息、住友电工✓
普睿司曼、藤仓衍生新技术:、CPO
OIO电芯片✓
Marvell、博通✓
Credo、英飞凌✓海思、傲科光电23:源杰科技、天孚通信、中际旭创、长飞光纤等各环节重要公司招股书及公告,中泰证券研究所目
录一、使用光交换机能够显著提升AI超算集群效率二、光交换机产业链增量明显,相关标的受益三、光是AI时代高速传输的必由之路四、投资建议及风险提示24关注OCS光交换机和广泛的光连接产业链机遇◼
OCS光交换机产业链,建议关注:✓
环形器/波分复用器/光学器件:【腾景科技】✓
MEMS阵列代工:【赛微电子】✓
光模块:【中际旭创】✓
铜缆:长芯盛(【博创科技】收购)✓
连接器:【太辰光】✓
光源:【光迅科技】、【长光华芯】、纵慧芯光(【华西股份】投资)◼
广泛的光连接产业,建议关注:✓
光芯片:源杰科技、仕佳光子、长光华芯✓
光器件:天孚通信、腾景科技、太辰光、光库科技✓
光模块:中际旭创、新易盛、光迅科技、博创科技、联特科技、华工科技、立讯精密✓
光纤光缆:长飞光纤、亨通光电、中天科技、烽火通信25赛微电子:MEMS全球代工龙头,受益光连接爆发◼
MEMS全
球
代
工龙头:2016
年公司收购瑞典Silex,2022年完全剥离非半导体业务,目前公司以MEMS代工半导体业务为主,2023上半年MEMS晶圆制造占收入58.4%、MEMS工艺开发占收入32.5%。根据Yole,瑞典Silex在2019-2022年连续4年蝉联全球MEMS代工第一,作为全球MEMS代工龙头,公司业务遍及全球,服务客户包括国际知名的光刻机、DNA/RNA
测序仪、红外热成像、计算机网络及系统、元宇宙、硅光子、AI
计算、ICT、新型医疗设备巨头厂商以及各细分行业的领先企业,涉及产品范围覆盖了通讯、生物医疗、工业汽车、消费电子等诸多应用领域。◼
MEMS代
工
多
点开花,增长点众多:公司瑞典线2023年上半年完成收购产线所在的半导体产业园区,为业务扩展提供了可预期的空间条件,北京FAB3已陆续实现硅麦克风、电子烟开关、BAW滤波器、MEMS微振镜的量产,已实现MEMS气体传感器、生物芯片,加速度计、陀螺仪的的风险试产,同时对于压力、温湿度、硅光子、振荡器等MEMS器件,正积极从工艺开发向验证、试产、量产阶段推进,未来增长点众多。◼
瑞典线OCS器件工艺量产,未来有望受益光连接爆发:2023年12月,公司全资子公司瑞典以MEMS工艺为某客户制造的OCS(光链路交换器件)完成了工艺及性能验证,该工艺开发与试产的总耗费时间超过7年,2023年12月22日收到该客户发出的批量采购订单,瑞典线正式开始进行MEMS-OCS的商业化规模量产,该MEMS-OCS基于8英寸MEMS工艺和设计技术制造,结构复杂精密,是一组由指定数量平面镜所构成的微镜阵列,可用于精确调节光链路的折射方向,实现光链路之间的信号切换与双向传播,提高运算系统的整体性能及稳定性,同时降低系统成本与功耗,可在数据中心网络、超算系统集群等场景中得到广泛应用。◼
国内方面持续推进OCS器件工艺开发:境内
MEMS
产线已执行不同阶段的工艺开发合同,制造工艺正在持续积累迭代中,公司持续关注硅光芯片在下游光通信、光互联与光计算领域的应用,努力为境内外客户和相关产业创造价值。26:赛微电子2023半年报等相关公告,中泰证券研究所赛微电子:MEMS全球代工龙头,受益光连接爆发表:公司国内外两条产线产能及产能利用率(截止2023上半年)晶圆产线产品制程总体产能(片晶圆/年)84,000期间产能(片晶圆)42,000产能利用率46.79%生产良率69.39%70.52%瑞典8英寸MEMS产线(FAB1
&FAB2)北京8英寸MEMS产线
(FAB3)0.25um-1um0.25um-1um120,00060,00014.22%表:公司核心工艺及技术水平状况核心工艺模块产品制程效果/作用技术水平硅通孔技术SilVia®TSV硅通孔金属层MetVia®TSV玻璃通孔MetVia®TGV深反应离子刻蚀D
RIE国际领先国际领先国际领先国际领先芯
片
互
连
、
CMOS-MEMS集成、先进封装在先进的三维集成电路中实现多层芯片之间的互联,能够在三维方向使得堆叠度最大而外形尺寸最小,提升芯片速度和低功耗性能刻蚀在硅衬底上刻蚀深沟槽和深孔将晶圆相互结合,使表面原子相互反应,产生共价键合,让其表面间的键合能达到一定强度,使晶片间无需媒介物而纯由原子键结为一体晶圆键合Wafer
Bonding键合与退火国际领先压电材料Piezo
material材料应用利用压电材料受压力作用在两端面间出现电压的特性,实现机械能和电能的互相转换磁性材料内部由于磁化状态的改变而引起长度变化,实现磁能和电能的互相转换相对领先相对领先MEMS磁性材料MagMEMS
材料应用聚合物材料Polymer材料应用无铅焊锡电镀Plating
solders
电镀聚合物增强了断裂强度、具有低杨氏模量、延长断裂时间和相对低成本,其具有惰性和生物相容的特点,适于生物和化学应用相对领先利用电解作用使金融或其他材料的表面附着一层金属膜,从而防止腐蚀,并提高耐磨性、导电性、反光性等相对领先封帽Capping圆片封盖密封形成机械结构所需的真空空间并保护晶圆避免受到机械刮伤、高温破坏相对领先27:赛微电子2023半年报,中泰证券研究所腾景科技:光模块核心零部件供应商,受益AI算
力需求释放◼
供应光模块核心光学元件,受益AI算力需求释放:公司40-50%收入来自光通信,与下游行业的知名厂商均建立了合作关系,可提供滤光片、棱镜、透镜、合分束器、光栅、波分组件(Z-blcok)等光学零部件,应用于数据中心用粗波分复用器(CWDM)、波长选择开关(WSS)等光通信核心模块,其中波分组件(Z-blcok)
、滤光片等可应用于400/800G等高速率光模块产品。随着AI行业发展,数据高速传输需求大幅提升带动高速率光模块出货量增长,公司有望逐渐获取海内外客户相关订单,为24年带来不错收入贡献。◼
精密光学元件逐渐突破,受益半导体设备加速成功进入半导体微电子设备厂供应链,同时积极开发高端光学模组,并已取得销售订单的增长。公司凭借技术优势、客户资源优势,有望显著受益国内半导体设备加速◼
新兴业务多点布局,光纤激光器有望缓慢复苏:
公司目前仍有40%多收入来自光纤激光器领域,随着下游需求逐渐好转,以及在
诉求和品类拓展助力下,光纤激光器业务有望逐渐复苏。同时,公司积极布局医疗、AR/VR、:据公司2022年报,公司多波段合分束器已完成产品开发,。车载光学等新兴应用,目前在医疗方面,相关产品已应用于内窥镜系统、流式细胞仪、DNA测序仪、拉曼光谱仪、眼科
OCT
等生物医疗器械和设备。图:公司光通信主要产品布局图:公司分束器原理图28:腾景科技公告,中泰证券研究所源杰科技:大陆领先的IDM光芯片玩家◼
聚焦光芯片,打造IDM全流程业务体系:公司成立于2013年,主营聚焦光芯片的研发、设计、生产与销售,目前主要产品为各类光芯片,主要应用于电信、数据中心、车载激光25G、50G以及更高速率的DFB、EML激光器系列产品,以及大功率硅光光源产品,主要应用于光纤接入、4G/5G移动通信网络和数据中心等领域;在车载激光
领域,产品涵盖1550波段车载激光激光器芯片等产品。另外经等市场。光通信领域主要产品包括2.5G、10G、过多年研发积累,公司已建立包括芯片设计、晶圆制造、芯片加工和测试的IDM全流程业务体系,拥有多条覆盖MOCVD外延生长、光栅工艺、光波导制作、金属化工艺、端面镀膜、自动化芯片测试、芯片高频测试、可靠性测试验证等全流程自主可控的生产线◼
进入海内外知名客户体系,相关产品出货量大陆领先:根据C&C数据,2020年在磷化铟半导体激光器芯片产品对外销售的国内厂商中,公司收入排名第一,其中10G、25G激光器芯片系列产品的出货量在国内同行业公司中均排名第一,2.5G激光器芯片系列产品的出货量在国内同行业公司中排名领先。2020年,凭借2.5G
1490nm
DFB激光器芯片,公司成为客户A该领域的主要芯片供应商;凭借10G
1270nm
DFB激光器芯片,公司在出口海外10G-PON(XGS-PON)市场中已实现批量供货;凭借25G
MWDM
12波段
DFB激光器芯片,公司成为满足中国移动相关5G建设方案批量供货的厂商。目前公司已实现向客户A1、海信宽带、中际旭创、博创科技、铭普光磁等国际前十大及国内主流光模块厂商批量供货,产品用于客户A、通讯、诺基亚等国内外大型通讯设备商,并最终应用于中国移动、中国联通、中国电信、AT&
T等国内外知名运营商网络中29:源杰科技招股书,2023半年报,中泰证券研究所源杰科技:大陆领先的IDM光芯片玩家表:公司主要产品布局应用领域光纤接入
EPON速率产品类型2.5G2.5G2.5G2.5G10G10G25G50G10G10G10G25G25G25G25G25G25G25G50G25G2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考语文复习看图议论技巧
- 中考语文复习句型运用真题应用
- 阅读理解细节解析及做法
- 中考复习古诗词和电视剧艺术
- 中考语文复习考试经验总结
- 美妆-面膜-化妆品-直播策划脚本方案
- 电力工程基础复习提纲
- 集团公司绩效考核管理办法
- 律所实习证明模板
- 兽药代理协议书
- GB/T 21661-2008塑料购物袋
- 硝酸腐蚀速率汇编
- 《野蜂飞舞》阅读测试题及答案
- 【神经外科-课件-】神经外科临床诊疗进展
- 2022年中电金信数字科技集团有限公司招聘笔试试题及答案解析
- 高二化学期中考试质量分析
- 推拿学62-第五章骨伤科疾病·颈椎病·急性腰扭伤·梨状肌综合征课件
- 粘土湿型砂及其质量控制课件
- 区域检验中心项目构建书-定稿
- 实验室内温湿度记录表
- 2022年全国中学生生物学联赛试题及答案解析
评论
0/150
提交评论