IDC在中国ICT市场趋势论坛上抛出的几个数字,表面看是行业预测,细看更像一条正在发生的结构迁移线索。
IDC中国副总裁周震刚提到,到2027年,推理将占智能算力需求的70%以上。这个比例变化比绝对规模更关键,它意味着算力消费结构正在从“训练驱动”切向“持续调用驱动”。训练阶段像一次性资本支出,而推理更接近长期运营成本,钱开始持续往后端流。
过去几年AI叙事的核心是“更大模型+更多参数”,但当模型进入应用阶段之后,真正决定商业模型是否成立的,是单位调用成本,也就是所谓Token成本。这一指标并不性感,但它直接决定一个AI产品能不能从Demo变成现金流业务。
边缘基础设施的增长被单独拎出来强调,也不是偶然。推理往前走,意味着算力不再完全集中在少数超大数据中心,而是向靠近用户侧的节点分散。自动驾驶、工业控制、实时交互类应用,都不可能完全依赖远端云端延迟,这会把一部分计算压力推向边缘侧。
IDC给出的另一个数字是全球加速计算服务器市场在2029年将超过1万亿美元,年复合增长率超过30%。这个增长曲线本身并不新鲜,真正的变化在于驱动力正在变形:早期是模型训练拉动GPU需求,现在则是推理规模化带来的持续算力消耗。
换句话说,AI基础设施正在从“建一次用很久”变成“持续消耗型系统”。这也解释了为什么市场开始越来越频繁讨论成本结构,而不是单纯讨论能力上限。
一个容易被忽略的转折在最后一句:竞争优势已经从算力规模,转向如何以最低Token成本把AI变成可持续业务能力。
这句话其实已经把行业分层说清楚了。上游芯片厂商解决的是单位算力成本问题,中游云厂商解决的是调度和规模效率问题,下游应用公司面对的则是如何把Token成本压到商业模型能承受的区间。
同一套模型,在不同成本结构下可以是亏损产品,也可以是高毛利服务。差别不在能力,而在效率。
市场现在正在进入一个更现实的阶段。模型能力差距在收敛,基础设施持续扩张,但真正拉开公司之间差距的,可能会越来越集中在两个变量上:推理效率,以及每一次调用背后的真实成本控制能力。
AI的故事还在继续,只是叙事重心从“能不能做出来”,慢慢变成“做出来之后,能不能算得过账”。