Jensen Huang × All-In：收购Groq、$50万工程师必须消耗$25万Token、AI工厂的操作系统

62 万播放的深度圆桌。Jensen 直接给了一个让全场震惊的管理命令：「如果你的工程师年薪 50 万，但一年只花了 5000 块 token，我会非常非常不高兴。」

콘텐츠 카드를 불러오는 중…

🗓 访谈信息

2.5 年前 Jensen 就在 GTC 上演示了「AI 工厂操作系统」的概念，叫 Dynamo——拆解推理管道（disaggregated inference），让不同类型的计算放到最适合的芯片上跑。

收购 Groq 是这个逻辑的延伸：prefill 阶段（处理输入上下文）和 decode 阶段（逐步生成输出）对算力需求截然不同。Groq 的 LPU 在 decode 阶段吞吐量极高，和 NVIDIA 的 GPU 搭配可以让整个推理管道效率大幅提升。

他的建议：数据中心里，约 25%的 Vera Rubin 节点应该搭配 Groq LPU 跑 decode。

「$500 亿数据中心的 token 成本，可以远低于$250 亿的数据中心——你不能只看硬件采购价格，要看生产出来的 token 成本。」

这是他当天讲的最清楚的一个比喻：

你有一个年薪 50 万的工程师。一年后你问他用了多少 token——他说 5000 块。

Jensen 的回应：「我会非常不高兴。」

逻辑是：如果 AI 能让这个工程师的产出变成 10 倍，那他消耗的计算资源值 25 万——这是他年薪的 50%，是合理的杠杆比例。就像汽车设计工程师不用手画图纸、用 Synopsys/Cadence 设计芯片一样，不用 AI 工具的工程师等于在降低自己的产出上限。

未来 2-3 年，他预计每个工程师会管理 100 个 AI agent——不是被 AI 替代，而是用 agent 乘以自己。

他给了一条清晰的计算量演化线：

两年内，计算量总体增加了约10000 倍。

原因：从「给我个答案」变成了「帮我干活」。人会为信息付费，但更愿意为完成的工作付费。Anthropic 在 2026 年 2 月单月收入达到约 50 亿，Jensen 认为这个曲线才刚刚开始——「消费量还没有真正开始 scale」。

当有人质疑企业 ROI 时，他的回答很直接：Anthropic 当月收入 50 亿，「你觉得这是泡沫吗？」

美国 AI 在本土的公众支持率只有 17%。Jensen 说这让他想起核能：技术上完全没有问题，但被末日叙事彻底摧毁了，最后是「我们关停了自己的核电站，现在中国在建 100 个核聚变反应堆」。

他对 AI 业界的请求是：说清楚这是什么，别让极端叙事左右政策制定者。

AI 不是生物体，不是外星人，不是有意识的东西——是计算机软件。对它不了解不等于它不可理解。

「我们这些技术领袖说的话现在有分量了，我们必须更温和，更平衡，更有节制。」

Jensen 不是在给 AI 做广告，他是在告诉企业：你每一个工程师都在少花应该花的那笔 token。

来源：All-In Podcast YouTube 频道，2026 年 3 月 19 日