过去两年,AI 产业的核心竞争集中在“训练”层面——谁能构建更强的大模型,谁就占据优势。从 GPT-4 到多模态模型的持续迭代,本质上是围绕“模型能力上限”的竞争。
然而,在 NVIDIA GTC 2026 上,Jensen Huang 明确提出:AI 的核心战场正在从训练(Training)转向推理(Inference)。
这一转变背后反映的是商业逻辑的变化:训练是一次性投入,而推理是持续发生的需求。
具体而言:
训练决定模型“能做什么”
推理决定模型“能赚多少钱”
这意味着 AI 正从“技术驱动产业”演进为“需求驱动产业”,从一次性资本开支(CapEx)转向持续性运营收入(Recurring Revenue)。
“数据中心是 Token 工厂”并不是一个营销口号,而是一种新的产业范式。在传统互联网时代:
数据中心承担计算与存储任务
收入来源于广告、订阅或交易
计算与收入之间没有直接映射关系
但在 AI 时代,这一逻辑被彻底重构:
每一次模型调用都会消耗算力
每一次计算都会生成 Token
每一个 Token 都可以被计费
这使得数据中心首次具备了“生产单位”的属性。
一个完整的闭环由此形成:算力投入 → 推理计算 → Token 生成 → 收入实现
在这一体系下,NVIDIA 提出的 AI Factory(AI 工厂)概念,实际上是在用工业体系重新定义 AI 基础设施:
输入层:电力 + 数据
中间层:GPU 算力与调度系统
输出层:Token + AI 服务
换句话说,数据中心不再只是服务器集群,而是类似“发电厂”或“制造工厂”的存在。
AI 时代的生产函数可以被重新表达为:

Revenue = Token × Price,Cost = Compute Cost
因此利润可以简化为 Profit = Token × (Price - Cost per Token)
这带来三个关键变化:
收入与算力直接绑定:算力越强 → Token 产出越高 → 收入越高
成本结构高度集中:算力成本成为最大支出
效率成为核心竞争力:企业竞争的关键变为每单位算力能产出多少 Token
推理需求之所以被认为将爆发,主要来自三个结构性变化。
从简单生成到复杂推理:
多步推理
长上下文
多模态融合
每一次调用的计算成本显著上升。
AI 正从短文本处理转向:
10 万 token
甚至百万级上下文
这直接放大了计算需求。
AI Agent 可以:
自动执行任务
持续调用模型
形成“无限推理循环”
这使得 AI 的计算需求从“线性增长”变为“指数增长”。
在 NVIDIA GTC 2026 上,NVIDIA 还隐含提出了 AI 服务分层的逻辑,本质是算力的“分级定价”。
这一体系类似云计算的分层模型:
高端层:高性能 GPU + 实时推理(高价格)
中端层:标准推理服务(中等价格)
低端层:批处理或延迟容忍任务(低价格)
不同场景对应不同 Token 单价:
实时对话 → 高价值 Token
数据分析 → 中等价值 Token
离线处理 → 低价值 Token
最终竞争的关键在于:谁能以更低成本生产 Token,并以更高价格出售。
Jensen Huang 预测,到 2027 年,AI 芯片与基础设施市场规模可能达到 1 万亿美元。
这一预测的核心意义在于:AI 正在成为“基础设施级产业”,类似于:
电力系统
云计算平台
互联网网络
这一趋势将带来三方面变化:
资本将从应用层,重新流向底层基础设施:
数据中心
AI 芯片
能源系统
新的核心玩家将包括:
芯片厂商(如 NVIDIA)
云服务商
AI 平台公司
Agent 生态开发者
AI 不再只是软件问题,而是:
电力资源竞争
数据中心选址
国家级算力战略
如果说 Token 是商品,那么 Agent 就是“需求生成器”。传统互联网的需求来自用户,而在 AI 时代:
Agent 本身就可以创造需求。例如:
自动交易 Agent 持续分析市场
企业 Agent 自动处理流程
开发 Agent 自动生成与优化代码
这意味着:AI 经济中首次出现“非人类需求主体”。因此可以进一步推导:Agent 的规模 = 推理需求的上限
这也是为什么当前 AI 竞争正在向:
Agent 框架
自动化系统
AI Workflow 平台
快速转移。
尽管“Token 工厂”叙事极具吸引力,但市场仍存在明显分歧。
GPU 成本高企
电力成本上升
数据中心建设投入巨大
如果 Token 价格下降,利润空间将被压缩。
企业是否愿意持续支付推理费用?
Agent 是否真的能创造稳定需求?
当前很多 AI 应用仍处于试验阶段。
更高效模型可能减少算力需求
边缘计算可能分流数据中心
开源模型可能压低 Token 定价
这些因素都可能影响 Token 经济的长期稳定性。
如果将当前趋势抽象,可以发现一个重要对应关系:
电力 → AI 的能源基础
数据 → 原材料
算力 → 生产设备
Token → 产品
Agent → 自动化系统
这一结构高度类似工业革命时期的生产体系。这意味 AI 正在从“软件行业”转变为“算力驱动的工业体系”。
在 NVIDIA GTC 2026 上,Jensen Huang 提出的“Token 工厂”概念,并非简单比喻,而是对 AI 产业底层逻辑的重新定义:
Token 成为生产单位
推理成为生产过程
算力成为核心生产资料
随着 Agent 经济的兴起和推理需求的爆发,AI 基础设施市场正迈向万亿美元规模。
如果这一趋势持续,未来的企业竞争,将不再只是比拼产品或用户规模,而是:谁拥有更高效的 Token 生产能力。





