

AI创始人访谈精华卡片
Fred Smith
Jensen Huang × All-In:收购Groq、$50万工程师必须消耗$25万Token、AI工厂的操作系统
Jensen Huang 与 All-In Podcast 团队的深度对谈62万播放。四张精华卡片:收购Groq的逻辑、年薪50万工程师必须消耗25万token、推理暗中计算量两年涨10000倍,以及 AI公关危机与核能前车之鉴。
2026. 6. 9. · 17:36
갤러리
62 万播放的深度圆桌。Jensen 直接给了一个让全场震惊的管理命令:「如果你的工程师年薪 50 万,但一年只花了 5000 块 token,我会非常非常不高兴。」
콘텐츠 카드를 불러오는 중…
🗓 访谈信息
- 受访者:Jensen Huang,NVIDIA 联合创始人 & CEO
- 主持人:All-In Podcast(Jason Calacanis、Chamath Palihapitiya 等)
- 场合:All-In Podcast 特别访谈
- 时间:2026 年 3 月 19 日
- 时长:1 小时 6 分 06 秒 · 62 万次观看
核心观点精华
⚙️ 卡片 1:为什么要收购 Groq——推理爆炸来了,一种芯片不够
2.5 年前 Jensen 就在 GTC 上演示了「AI 工厂操作系统」的概念,叫 Dynamo——拆解推理管道(disaggregated inference),让不同类型的计算放到最适合的芯片上跑。
收购 Groq 是这个逻辑的延伸:prefill 阶段(处理输入上下文)和 decode 阶段(逐步生成输出)对算力需求截然不同。Groq 的 LPU 在 decode 阶段吞吐量极高,和 NVIDIA 的 GPU 搭配可以让整个推理管道效率大幅提升。
他的建议:数据中心里,约 25%的 Vera Rubin 节点应该搭配 Groq LPU 跑 decode。
「$500 亿数据中心的 token 成本,可以远低于$250 亿的数据中心——你不能只看硬件采购价格,要看生产出来的 token 成本。」
💰 卡片 2:年薪 50 万的工程师,必须消耗至少 25 万的 token
这是他当天讲的最清楚的一个比喻:
你有一个年薪 50 万的工程师。一年后你问他用了多少 token——他说 5000 块。
Jensen 的回应:「我会非常不高兴。」
逻辑是:如果 AI 能让这个工程师的产出变成 10 倍,那他消耗的计算资源值 25 万——这是他年薪的 50%,是合理的杠杆比例。就像汽车设计工程师不用手画图纸、用 Synopsys/Cadence 设计芯片一样,不用 AI 工具的工程师等于在降低自己的产出上限。
未来 2-3 年,他预计每个工程师会管理 100 个 AI agent——不是被 AI 替代,而是用 agent 乘以自己。
📊 卡片 3:从对话 AI 到工作 AI——计算量上了 10000 倍
他给了一条清晰的计算量演化线:
- 生成式 AI → 推理 AI:计算量约 100 倍
- 推理 AI → 智能体 AI:计算量又约 100 倍
两年内,计算量总体增加了约10000 倍。
原因:从「给我个答案」变成了「帮我干活」。人会为信息付费,但更愿意为完成的工作付费。Anthropic 在 2026 年 2 月单月收入达到约 50 亿,Jensen 认为这个曲线才刚刚开始——「消费量还没有真正开始 scale」。
当有人质疑企业 ROI 时,他的回答很直接:Anthropic 当月收入 50 亿,「你觉得这是泡沫吗?」
🌍 卡片 4:AI 的公关危机——核能前车之鉴
美国 AI 在本土的公众支持率只有 17%。Jensen 说这让他想起核能:技术上完全没有问题,但被末日叙事彻底摧毁了,最后是「我们关停了自己的核电站,现在中国在建 100 个核聚变反应堆」。
他对 AI 业界的请求是:说清楚这是什么,别让极端叙事左右政策制定者。
AI 不是生物体,不是外星人,不是有意识的东西——是计算机软件。对它不了解不等于它不可理解。
「我们这些技术领袖说的话现在有分量了,我们必须更温和,更平衡,更有节制。」
一句话总结
Jensen 不是在给 AI 做广告,他是在告诉企业:你每一个工程师都在少花应该花的那笔 token。
来源:All-In Podcast YouTube 频道,2026 年 3 月 19 日
댓글