当AI行业开始讨论万亿参数模型时,竞争的焦点已经不只是GPU。
英伟达宣布与SK海力士达成多年技术合作,双方将围绕下一代HBM(高带宽存储器)以及定制化存储方案展开深度协作,目标直指AI工厂时代最棘手的问题之一——如何让越来越庞大的模型跑得更快,同时让系统不会被数据搬运效率拖垮。
过去两年,资本市场习惯将AI硬件竞争简单理解为“谁拥有更多GPU”。但真正参与大模型训练和部署的企业都清楚,算力只是系统的一部分。随着参数规模从千亿级迈向万亿级,内存带宽、数据吞吐能力以及存储架构的重要性正在迅速上升。
一个越来越明显的现实是,很多AI服务器并非卡在计算能力上,而是卡在数据传输环节。
GPU运算速度持续提升,但如果无法及时获取数据,再强大的计算单元也只能等待。业内常将这种现象称为“内存墙”(Memory Wall)。这也是为什么HBM逐渐成为AI时代最稀缺的半导体资源之一。
在过去几年里,SK海力士几乎成为这场HBM竞赛最大的受益者。作为全球最主要的HBM供应商之一,其产品广泛应用于英伟达H100、H200以及Blackwell系列平台。市场需求爆发后,HBM甚至出现长期供不应求的局面,订单能见度被拉长至数年。
如今双方合作升级,释放出的信号已经不只是简单的供应关系。
如果说过去的合作更偏向芯片采购,那么此次强调“共同开发”和“联合创新”,意味着英伟达希望将内存设计更深度地纳入自身AI基础设施体系。对于AI工厂而言,未来的竞争不再是单个芯片性能比较,而是整个系统架构的效率比拼。
AI工厂这个概念本身也在发生变化。
早期数据中心主要承担云计算任务,服务器之间相对独立。进入生成式AI时代后,大规模GPU集群需要像超级计算机一样协同工作。模型训练、推理、缓存、数据交换形成持续流动的数据洪流。内存不再只是配件,而是决定系统效率的核心组成部分。
尤其是在推理阶段。
相比训练任务,推理业务需要长期在线运行,并且面对海量用户请求。随着企业开始部署AI Agent、智能搜索、实时视频生成等应用,推理需求增长速度甚至超过训练需求。万亿参数模型如果完全依赖传统存储架构,成本和延迟都会迅速上升。
这也是英伟达不断强调“AI工厂”的原因。
它希望出售的不只是GPU,而是一整套能够持续生产AI Token的基础设施。从网络交换芯片、服务器系统到软件平台,再到存储和内存架构,英伟达正在复制过去大型主机时代IBM所建立的生态控制力。
对于SK海力士而言,这场合作同样具有战略意义。
当前HBM市场虽然火热,但竞争者正在加速追赶。三星电子持续加码HBM研发,美光也借助HBM3E产品争夺市场份额。单纯依靠产能优势很难长期维持领先地位,更深层次地参与客户架构设计,反而能够提高未来产品的绑定程度。
某种意义上看,AI产业链正在进入新的整合阶段。
过去市场关注的是GPU短缺,如今行业开始重新审视服务器内部每一个环节。网络芯片、先进封装、电源管理、高速存储、液冷散热,都在成为影响AI性能的重要变量。
算力竞赛仍在继续,但决定下一轮胜负的,未必只是更多晶体管。
在万亿参数模型时代,数据如何流动、如何存储、如何被快速调用,正在成为与计算本身同样关键的问题。而英伟达与SK海力士这场长期合作,本质上是在提前争夺这一层基础设施的话语权。