2026-06-25
币链网 loading...

AI算力竞赛转向推理侧:Token成本成为新分水岭

摘要
IDC在中国ICT市场趋势论坛上抛出的几个数字,表面看是行业预测,细看更像一条正在发生的结构迁移线索。

IDC在中国ICT市场趋势论坛上抛出的几个数字,表面看是行业预测,细看更像一条正在发生的结构迁移线索。

IDC中国副总裁周震刚提到,到2027年,推理将占智能算力需求的70%以上。这个比例变化比绝对规模更关键,它意味着算力消费结构正在从“训练驱动”切向“持续调用驱动”。训练阶段像一次性资本支出,而推理更接近长期运营成本,钱开始持续往后端流。

过去几年AI叙事的核心是“更大模型+更多参数”,但当模型进入应用阶段之后,真正决定商业模型是否成立的,是单位调用成本,也就是所谓Token成本。这一指标并不性感,但它直接决定一个AI产品能不能从Demo变成现金流业务。

边缘基础设施的增长被单独拎出来强调,也不是偶然。推理往前走,意味着算力不再完全集中在少数超大数据中心,而是向靠近用户侧的节点分散。自动驾驶、工业控制、实时交互类应用,都不可能完全依赖远端云端延迟,这会把一部分计算压力推向边缘侧。

IDC给出的另一个数字是全球加速计算服务器市场在2029年将超过1万亿美元,年复合增长率超过30%。这个增长曲线本身并不新鲜,真正的变化在于驱动力正在变形:早期是模型训练拉动GPU需求,现在则是推理规模化带来的持续算力消耗。

换句话说,AI基础设施正在从“建一次用很久”变成“持续消耗型系统”。这也解释了为什么市场开始越来越频繁讨论成本结构,而不是单纯讨论能力上限。

一个容易被忽略的转折在最后一句:竞争优势已经从算力规模,转向如何以最低Token成本把AI变成可持续业务能力。

这句话其实已经把行业分层说清楚了。上游芯片厂商解决的是单位算力成本问题,中游云厂商解决的是调度和规模效率问题,下游应用公司面对的则是如何把Token成本压到商业模型能承受的区间。

同一套模型,在不同成本结构下可以是亏损产品,也可以是高毛利服务。差别不在能力,而在效率。

市场现在正在进入一个更现实的阶段。模型能力差距在收敛,基础设施持续扩张,但真正拉开公司之间差距的,可能会越来越集中在两个变量上:推理效率,以及每一次调用背后的真实成本控制能力。

AI的故事还在继续,只是叙事重心从“能不能做出来”,慢慢变成“做出来之后,能不能算得过账”。

币安是全球货币交易所龙头

提供200+种加密货币交易,24小时交易量超过300亿美元

欧易是领先的数字交易平台

支持400+交易对,提供现货、合约、理财等多种服务

声明:文章不代表本网观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
回顶部