国泰君安证券:算力需求高增 AI ASIC解围在即
投资提倡:ASIC针对特定场景操办,有配套的通讯互联和软件生态,天然现在单颗ASIC算力比拟早先进的GPU仍有差距,但总共ASIC集群的算力运用成果可能会优于可比的GPU,同期还具备彰着的价钱、功耗上风,有望更无为地应用于AI推理与锻练。咱们看好ASIC的大限制应用带来云厂商ROI进步,同期也提倡保重定制芯片产业链关联方向。
AI ASIC具备功耗、老本上风,现在仍处于发展初期,阛阓限制有望高速增长。现在ASIC在AI加快探究芯片阛阓占有率较低,预测增速快于通用加快芯片。据Marvell预测, 2023年,定制芯片仅占数据中心加快探究芯片的16%,其限制约66亿好意思元,预测2028年数据中心定制加快探究芯片限制有望超400亿好意思元。
ASIC单卡算力与GPU仍有差距,但单卡性价比和集群算力成果优秀。ASIC中算力相对较高的谷歌TPU v6和微软Maia 100算力约为H100非零碎算力的90%、80%,同期ASIC的单价显耀低于GPU,故而在推理场景呈现更高的性价比;ASIC的芯片互联以PCIe公约为主,处于追逐景色,NVLink公约更具上风;在办事器互联方面,黄金期货交易ASIC主要收受以太网,正追平英伟达的IB网络,现在H100集群不错作念到10万卡限制,ASIC中谷歌TPU相对更为跨越,TPU v5p单个Pod可达8960颗芯片,借助软件智商,TPUv5e可拓展至5万卡集群,且保持线性加快。由于ASIC专为特定场景操办,且云厂商对软件生态掌合手经由也较高,ASIC集群的算力运用率实质可能高于GPU(如TPU、MTIA等)。
软件生态亦然影响AI探究智商的攻击身分,面前CUDA生态占据主导,ASIC软件生态有望逐步完善。云厂商大齐具备较强的研发智商,均为AI ASIC研发了配套的全栈软件生态,开拓了一系列的编译器、底层中间件等,进步ASIC在特定场景下的探究成果。此外,一些商用芯片厂商也推出了开源平台,如ROCm和oneAPI,当年ASIC的软件生态将会愈发老练、绽开。
风险辅导:AI算法时代风险、生态系统诞生不足预期、芯片研发不足预期、AI产业发展不足预期。