八巨头抱团挑战英伟达 AI芯片市集风浪再起
本报记者李玉洋上海报说念
若问最佳的生成式AI算力供应商是谁,英伟达会是一个版块谜底。它用以拳头居品GPU为代表的硬件居品和以CUDA为基础的软件管束决策,筑起了沉稳的AI系统生态。
于是,“卖铲东说念主”英伟达赚得盆满钵满。当地时辰6月5日,英伟达(Nasdaq:NVDA)收涨5.16%,一语气三个交游日刷新股价新高,总市值已达3.01万亿好意思元,在苹果、微软之后,成为全球第三个市值极端3万亿好意思元的公司,刻下则是市值仅次于微软的全球第二大上市公司。
在此布景之下,友商英特尔、AMD、微软、Meta、OpenAI等公司在夙昔两年争相初始自研AI芯片也就不错交融了。如今,在挣扎英伟达AI芯片“霸权”的说念路上,巨头们又有了新动作。
近日,谷歌、Meta、微软、AMD、英特尔、博通、想科、惠普八大科技巨头告示建树新定约,旨在鼓舞一个叫作Ultra Accelerator Link(UALink,超等加快链路)的行业圭臬。据悉,该圭臬撑持多个AI加快器互联、内存结构新圭臬以及超以太网笼罩,大有协谋挣扎英伟达之意。
《中国筹办报》预防到,UALink不仅仅在名字上对标英伟达的NVLink,在本事道路上一样亦然。约略杀青GPU到GPU高速通讯的NVLink、用于推广pod除外的Infiniband以及用于连续到更芜俚基础设施的以太网,这些本事让雄伟客户在夙昔数年间越来越倾向于购买英伟达的GPU。
最新音问线路,英伟达首创东说念主兼CEO黄仁勋在2024年中国台北国外电脑展上公开了翌日几年的GPU发展道路图,包括2025年的Blackwell Ultra、2026年的新架构Rubin以及2027年的Rubin Ultra。这意味着英伟达冲破了以往两年更新一代的节拍,驶入一年一更新的快车说念。
需要指出的是,英伟达的NVLink并不向行业敞开,且NVLink已成为英伟达东说念主工智能数据中心系统的标配。“UALink定约企业正在戮力创建一个敞开、高性能和可推广的加快器结构,这关于AI的翌日至关贫困。”AMD数据中心管束决策行状部现实副总裁兼总司理Forrest Norrod示意。
据了解,UALink大家组将制定用于管束数据中心中不同GPU之间连续的圭臬,并预测于2024年第三季度将这些圭臬提供给加入UALink定约的公司。而博通据传已初始坐蓐 UALink交换机。“谷歌、Meta、微软、AMD等对英伟达NVLink的足下还是忍耐很久。”商酌机构Omdia AI行业首席分析师苏廉节对记者示意,UALink的出现会减少业界对英伟达通讯条约的需求,只不外对英伟达的龙头地位影响不大,但如实对业界是很贫困的。
NVLink:将系统推广为超算
简短而言,NVLink是英伟达开辟的一种总线及通讯条约,采取点对点结构、串传记输,既可用于连续中央处理器(CPU)与图形处理器(GPU),也可用于多个GPU之间互相连续的本事圭臬。
比较于传统的PCIe,该本事可杀青多个GPU之间的高速数据传输和协同使命。2018年,英伟达初度向公众推出NVLink本事,其架构包括NVLink桥接器和NVLink交换机。
记者通过英伟达中国官网了解到,其NVLink本事组成多元,既包含软件条约,又有芯片这么的硬件。
凭据英伟达中国的界说,NVLink由一个深广的软件条约组成,一般通过印在电路板上的多对导线杀青,不错让处理器以闪电般的速率收发分享内存池中的数据。据了解,NVLink着手动作NVIDIA P100 GPU的互联通说念推出,之后便与每一代新的NVIDIA GPU架构同步发展。
比较于传统x86办事器的互联通说念PCIe,NVLink主打的即是速率快、能效低。比如,第四代NVLink连续主机和加快处理器的速率高达每秒900GB,是PCIe 5.0带宽的7倍多,而每传输1字节数据仅徒然1.3皮焦,NVLink的能效是PCIe 5.0的5倍。
另外,NVLink所包含的NVIDIA NVLink-C2C则是一种板级互联本事,它能在单个封装中将两个处理器连续成一块超等芯片,Grace Hopper超等芯片即是NVIDIA NVLink-C2C将Grace CPU和Hopper GPU连续而成。
关于NVLink的作用,英伟达中国用了一个形象比方:“NVLink就像是乐高积木的凸粒和凹槽。”在2024年的GTC大会上,英伟达已对外公布了第五代NVLink,其总带宽达到1.8兆字节/秒(TB/s),是上一代居品的2倍。
英伟达中国指出,NVLink是一项要津的本事,它不错让用户将模块化的NVIDIA DGX系统推广成为一个AI超等规画机。
诓骗DGX里面的NVLink网罗与两者之间的NVIDIA Quantum-2 InfiniBand交换以太网,用户就不错将32个DGX系统模块连续成一台AI超算。举例,问道优配一台NVIDIA DGX H100 SuperPOD包含256个H100 GPU,可提供最高1 EXAFLOP的峰值AI性能。
记忆来看,NVLink、交换以太网联接在一说念让英伟达把200多块GPU连续起来,成为一个AI性能“爆炸”的超算系统。为什么英伟达要去作念GPU除外的硬件居品?其实这里面还有一个趣事。早在10多年前,英伟达首席科学家Bill Dally找黄仁勋谈面向HPC开辟networking本事的问题,黄仁勋问他:“咱们为什么要作念networking?咱们不是一家开辟GPU的公司吗?”
黄仁勋天然有疑问,但其后如故全力撑持该本事的开辟。“但他那时的质疑是通力合作的。这个问题延迟来可能还囊括了英伟达为什么要收购Mellenox?为什么要作念DPU(数据处理器)?为什么要作念交换芯片和交换机?为什么要商酌封装之间的光通讯本事这些问题。”资深产业不雅察东说念主士黄烨锋示意。
在本年GTC大会上,英伟达声称Blackwell架构的GPU的推明智商比较于前代Hopper,有了30倍的普及。“这里的30倍天然不是芯片层面的,摩尔定律、超越摩尔或任何摩尔都作念不到隔代30倍性能普及;特定数据方式的撑持强化,以及更贫困的NVLink互联本事升级、NVSwitch芯片引入,才是GB200 NVL72所有这个词这个词系统在多模态模子推理上达成30倍性能普及的要津。”黄烨锋以为,这些都是“底层硬件”,只不外是推广到了系统层面,互联、存储、解热都是其中要津。
“管束跨节点通讯的瓶颈,赫然是生成式AI时间最要津的组成部分之一。这些东西对英伟达来说都属于生态,亦然好多在PPT上吊打英伟达的竞争敌手难以越过的防碍。”黄烨锋示意。
而UALink的亦步亦趋,阐发了微软、谷歌等巨头们从造芯之后,追逐英伟达的要领又往前迈了一步。这也反过来讲解,英伟达从作念GPU初始向外拓伸开辟互联本事、以太网等的本事旅途是允洽行业发展趋势的。
UALink:对业界很贫困
凭据UALink的筹划,首个UALink 1.0版块将允许AMD的Instinct GPU或英特尔的Gaudi等专用处理器之间的径直数据传输,从而提高AI规画的性能和服从。
“现在要是要用英伟达的GPU,就必须用其NVLink。”苏廉节示意,谷歌、Meta、微软是云大厂,遥庞杂限制化地部署GPU,AMD、英特尔则是AI芯片供应商,而博通、想科和惠普崇拜数据中心连续,“他们对英伟达NVLink的足下还是忍很真切”。
值得一提的是,在2023年7月,诸多云办事提供商、芯片制造商、系统供应商就连合组建了超等以太网定约UEC,盼愿构建基于以太网的无缺通讯栈架构,用于高性能网罗,主要为了适配AI和HPC。
以太网或InfiniBand的主要作用,是连续包含GPU的办事器。一样,英伟达也莫得加入超等以太网定约。2019年3月收购Mellanox后,英伟达基本独占了高性能InfiniBand互联市集。
UALink定约的8家发起厂商指出,建树一个敞开行业圭臬机构来制定干系本事法式,以促进新使用模式所需的突破性性能,同期撑持数据中心加快工具敞开生态系统的发展。“行业法式关于修复下一代AI数据中心圭臬化以及实施AI、机器学习、HPC(高性能规画)和云应用法子的接口至关贫困。”他们在一份声明中如斯示意。
据悉,UALink定约的中枢于2023年12月就还是修复。UALink定约成员示意,系统制造商将创建使用UALink的机器,并允许客户将来自许多参与者的加快器放入系统中。比如,用户不错把来自AMD、英特尔或其他第三方的GPU(AI加快器)连续在一说念。UALink1.0版法式预测将于2024年第三季度推出,并向插足超等加快器链定约的公司敞开。
“UALink动作一个行业敞开圭臬,将有助于鼓舞东说念主工智能数据中心的发展。通过杀青更高效的数据传输和通讯,它将蜕变GPU网罗的举座性能。”深度科技商酌院院长张孝荣示意,该定约天然可能会对英伟达NVLink组成一定威逼,然则否约略取获到手,还存在好多未知身分,比如能否达到预测的恶果、市集接受流程等都需要时辰来不雅察。苏廉节也示意,天然这个定约关于英伟达真是没影响,但对业界很贫困。
事实上,对标英伟达的NVLink,由于其是软硬件一体的,那UALink定约成员会毁掉已有的软硬件居品开辟而按照该圭臬开辟新的居品吗?
对此,电子翻新网CEO张国斌示意:“一般就末端风险而言,群众会两手执。现在来看,这些公司更有可能选拔一种夹杂战术,而不是皆备毁掉已有的软硬件居品开辟。这意味着他们将连续撑持和发展现存的居品,同期安稳适宜并整合新的敞开圭臬。”
而凭据UALink团队的对外发声,将UALink圭臬落地成居品2024年还太早,2026年将是一个快速实施的时辰点。