重磅GTC大会演讲之外,一文读懂黄仁勋本周向华尔街和互联网的讲话要点

 重磅GTC大会演讲之外,一文读懂黄仁勋本周向华尔街和互联网的讲话要点

article.author.display_name
许超


黄仁勋在GTC26抛出震撼弹:英伟达订单可见性已突破1万亿美元,增长仍在加速。他断言AI已进入第三拐点——智能体时代,"每个工程师将管理100个智能体";Token将成新型工资,不消耗Token的工程师形同荒废生产力。50万亿美元物理AI蓝海,正等待引爆。
在刚结束的 GTC26 期间,英伟达(NVIDIA)CEO 黄仁勋通过一场深度访谈与财务问答,向外界展示了这家市值巅峰企业的宏大蓝图。从“1万亿美元订单可见性”到“智能体(Agent)就是未来的个人电脑”,老黄不仅在卖芯片,更在重塑全球IT产业的分配逻辑。

华尔街见闻整理金句如下:

关于 Token 与价值:如果你的一名年薪50万美元的工程师,一年只花5000美元买Token,我会发疯的。如果那名50万美元的工程师没有消耗至少价值25万美元的 Token,我会深感不安。即使芯片是免费的,如果它不能跟上技术状态和我们运行的速度,它也依然不够便宜。

关于智能体与未来:每个工程师都将拥有100个智能体。在过去我们编写代码,在未来我们将编写想法、架构和规范。智能体系统是完成工作的系统,它们正在帮助我们的软件工程师完成工作。

关于Token经济学:计算机过去只是工具,未来的计算机是制造设备。人们购买这些计算机是为了生产Token,生产这些Token的有效性至关重要。你同时购买了最昂贵的计算机,并生产了成本最低的 Token。

关于市场需求与增长:我们对Blackwell加Reuben的需求、订单和需求有超过1万亿美元的强劲可见性。我们的增长率实际上正在加速。每一个软件公司、每一个公司都需要有一个OpenClaw策略。

关于竞争与架构:任何说‘我的芯片便宜 30%’的人,只是证明了他们不懂 AI。你只要呼吸空气,直到呼吸完为止。在那之后,我们将呼吸压缩液态空气,但在此之前,空气怎么样?它是免费的,我们已经用了很久了。”(注:此处指代对铜缆/电缆技术的使用极限)

财务核弹:1万亿美元的订单墙
黄仁勋在分析师会议上抛出了一个震撼数字:英伟达对 Blackwell 和 Reuben 架构的订单需求可见性已超过 1 万亿美元。

增长背后的逻辑: 这一数字并非虚标,而是基于确定的采购订单和工厂建设流水线。老黄强调,英伟达的优势在于其交付周期远快于自研 ASIC 芯片的公司,甚至能实现“同季度下单、同季度出货”。

毛利护城河: 面对“价值被英伟达抽走”的质疑,老黄直言:“TSMC 的晶圆全球最贵,但价值最高,所以我乐意付钱。”他认为,客户买的不是昂贵的电脑,而是全球成本最低的 Token 生产力。
第三次拐点:从大模型到“智能体”
黄仁勋认为,AI 已经历了生成式、推理两个阶段,现在正处于第三个拐点——智能体系统(Agentic Systems)。

Token 成为新工资: 未来企业雇佣工程师,发的不只是笔记本电脑,还有 Token 预算。如果一个年薪 30 万美元的工程师不消耗 Token,那他就是在荒废生产力。

个人 AI 电脑的诞生: 以开源项目 OpenClaw 为代表的系统,被老黄定义为“人类历史上第一台个人人工智能计算机”。它拥有内存、调度、技能和 API,是未来 IT 产业的操作系统。

 硬件新版图:Vera Rubin 与 Groq 的“联姻”
英伟达不再只是一家 GPU 公司,而是一家“AI 工厂”公司。

解耦推理(Disaggregated Inference): 这是 Dynamo 操作系统的核心。通过将推理任务拆解,不同性能的芯片各司其职。

Groq 的角色: 英伟达收购并整合 Groq(LPX 系列)并非为了取代 GPU,而是利用其极低延迟的 SRAM 架构处理自回归推理的“最后一步”。

三位一体架构: 英伟达是全球唯一能同时优化 HBM(高带宽显存)、LPDDR5 和 SRAM 的公司,这种“液冷机架化”的整机交付,让竞争对手的单点芯片显得像个“缝合怪”。

物理 AI:50万亿美元的蓝海
老黄特别看好物理 AI(Physical AI),认为其最终规模将超过数字 AI。

重塑传统工业: 这是一个产值 50 万亿美元、过去 20 年几乎是科技荒漠的领域。从机器人手术、自动驾驶到智能基站,物理 AI 需要在边缘侧遵守物理定律。

3-5年内的机器人爆发: 黄仁勋预言,未来 3 到 5 年机器人将随处可见。虽然中国在电机、稀土等硬件供应链上极具优势,但英伟达将提供大脑(训练、仿真、车载三台计算机)。

行业共生:英伟达是云服务商的“最佳销售”
针对云巨头自研芯片的威胁,老黄表现得极其自信:

流量带货: “AWS、谷歌、微软在 GTC 展位最大,是因为他们要向我的 CUDA 开发者推销服务。”英伟达通过 CUDA 生态将开发者引向云端,本质上是云服务商的获客引擎。

不可替代性: 40% 的业务来自于非云巨头领域(区域云、企业私有云),这些客户买的是“全栈平台”而非“芯片”。如果没有英伟达的整机方案,这些市场根本无法触达。

 

以下为两场访谈的全文,由AI辅助翻译:

《All-In Podcast》访谈
主持人 (Jason Calacanis):

本周是特别节目,我们破例推迟了常规节目。通常我们只为三个人破例:特朗普总统、耶稣和黄仁勋。你可以自己排个序。Jensen,你这一年的表现太惊人了,这次活动也非常棒,每个行业、每家科技公司、每家 AI 公司都在这里。

主持人 (Chamath Palihapitiya):

去年最重大的宣布之一就是英伟达收购了 Groq。当你决定买下 Groq 时,你有没有意识到 Chamath 会变得多么难以忍受?

黄仁勋 (Jensen Huang):

我有这种预感(笑)。我们是他的朋友,每周都要应付他,我知道在结案的那六周里你得怎么对付他。

黄仁勋 (Jensen Huang):

实际上,我们的许多战略早在 GTC(英伟达 GPU 技术大会)上就已经公开展示了。两年半前,我介绍了 AI 工厂的操作系统,叫做 Dynamo。正如你们所知,Dynamo 是西门子发明的,目的是把水能转化为电能,它驱动了上一次工业革命。我觉得这是下一次工业革命“工厂操作系统”的完美名字。

在 Dynamo 内部,核心技术是 解耦推理(Disaggregated Inference)。Jason,我知道你技术很强,我让你来向观众解释一下。

主持人 (Jason Calacanis):

谢谢你没直接抢过话头。解耦推理意味着推理的处理流水线极其复杂,它是当今最复杂的计算问题。规模庞大,涉及各种形状和大小的数学运算。我们的想法是把处理过程拆解开,让一部分在某些 GPU 上运行,其余部分在不同的 GPU 上运行。这让我们意识到,甚至解耦计算也是有意义的。

这种思路引导我们收购了 Mellanox。如今,英伟达的计算分布在 GPU、CPU、交换机和网络处理器中。现在我们加入了 Groq,我们将把合适的工作负载放在合适的芯片上。我们已经从一家 GPU 公司演变成了一家 AI 工厂公司。

主持人 (Chamath Palihapitiya):

你在台上提到,高价值推理用户应该关注这一点。你说数据中心 25% 的空间应该分配给这种 Groq LPU 和 GPU 的组合。你能告诉我们,行业如何看待这种“预填充-解码解耦”的新型计算形式吗?

黄仁勋 (Jensen Huang):

退一步看,当我们加入这项技术时,我们正从“大语言模型处理”转向 “智能体处理(Agentic Processing)”。当你运行一个智能体时,你会访问工作内存、长期内存、使用工具,并对存储产生巨大的压力。智能体之间还会相互协作。

因此,数据中心内存在各种类型的模型。我们创建了 Vera Rubin 架构来处理这些极其多样化的负载。英伟达的潜在市场规模(TAM)因此增加了 33% 到 50%。其中很大一部分将是存储处理器(BlueField)、Groq 处理器、CPU 和网络处理器。这些共同构成了 AI 革命的电脑,也就是“智能体”。

主持人 (David Friedberg):

那嵌入式应用呢?比如我女儿在家里的泰迪熊想要和她聊天。里面装的是定制芯片,还是会有一套更广泛的、针对边缘侧开发的工具?

黄仁勋 (Jensen Huang):

在大规模层面上,我们认为这个问题涉及三台计算机:

第一台用于 训练 AI 模型。

第二台用于 评估。比如机器人和自动驾驶汽车,必须在符合物理定律的虚拟实验室(Omniverse)中进行评估。

第三台是 边缘侧的机器人计算机。它可能是一辆车、一个机器人,或者是一只小泰迪熊。

我们还在做一件非常重要的事:将电信基站转化为 AI 基础设施的一部分。这是一个 2 万亿美元的产业,未来无线电基站、工厂、仓库都将成为 AI 的延伸。

主持人 (Brad Gerstner):

Jensen,去年你领先全球预言“推理不会只增长 1000 倍”。现在它是要增长 100 万倍还是 10 亿倍?当时人们觉得你太夸张了,因为大家都在关注训练。但现在推理需求爆炸了。

有人说你的推理工厂成本高达 400-500 亿美元,而定制芯片(ASIC)方案只要 250-300 亿,你会因此失去市场份额。你对此怎么看?为什么大家要付双倍的溢价?

黄仁勋 (Jensen Huang):

核心逻辑是:你不应该把“工厂的价格”等同于“Token 的成本”。我可以证明,一座 500 亿美元的工厂能为你产生 成本最低的 Token。

因为我们的效率高出 10 倍。在 500 亿的预算中,有 200 亿是土地、电力和厂房,无论用什么芯片这些钱都要花。剩下的差额在整体成本中占比并不大。但如果我的数据中心吞吐量是别人的 10 倍,那么即便别人的芯片是免费的,他们也拼不过我们。

主持人 (Chamath Palihapitiya):

你管理着全球市值最高的公司,明年营收可能超过 3500 亿美元。你是如何决定“该做什么”的?你如何获得直觉,知道在哪里加倍下注,在哪里撤退?

黄仁勋 (Jensen Huang):

这就是 CEO 的工作:定义愿景和战略。我会被公司里优秀的科学家和技术专家启发,但我必须塑造未来。

我的标准是:这件事是不是 难到令人发指?如果很容易,我们就应该退缩,因为容易的事竞争对手会很多。我寻找的是那些从未被实现过、极其困难、且能发挥英伟达“超能力”的事。我们知道这会带来痛苦和磨难,但如果没有痛苦,也就没有伟大的发明。

主持人 (Brad Gerstner):

你能谈谈几个长线业务吗?比如空间数据中心、自动驾驶或是数字生物学?

黄仁勋 (Jensen Huang):

物理 AI 是一个巨大的类别。这是一个产值 50 万亿美元的产业,直到现在几乎还是科技的荒漠。我们 10 年前就开始布局,现在它正处于爆发点,每年为我们带来近 100 亿美元的收入。

数字生物学 正在迎来它的“ChatGPT 时刻”。我们正开始理解如何表示基因、蛋白质和细胞。在未来 5 年内,医疗行业将发生巨变。农业也是如此。

主持人 (Jason Calacanis):

英伟达最初是靠游戏玩家和发烧友起家的。你提到了“智能体”的革命,特别是开源智能体在桌面端的应用。这对于你来说意味着什么?

黄仁勋 (Jensen Huang):

过去两年有三个转折点:

生成式 AI:ChatGPT 让所有人意识到了 AI 的存在。

推理(Reasoning):像 O1 这样的模型让 AI 不仅能回答问题,还能进行推理。

智能体(Agents):最初是像 Claude Code 这样的企业工具,而 OpenClaw 将 AI 智能体带入了大众视野。

OpenClaw 之所以重要,是因为它重新定义了计算模型。它有内存、文件系统、技能(Skills)、资源调度和 API。这本质上就是人类历史上第一台 个人人工智能计算机。它是开源的,可以在任何地方运行。

主持人 (Brad Gerstner):

这种范式转移是否让现在的 AI 监管立法变得毫无意义?政治家们该如何应对这种快速变化?

黄仁勋 (Jensen Huang):

我们需要站在决策者面前,告知他们技术的真相:它不是生物,不是外星人,没有意识,它只是计算机软件。

我们不能让“末日论”影响政策。作为国家,最大的安全风险不是 AI 本身,而是当我们因为恐惧而停滞不前时,其他国家却在采用这项技术。我担心的是 AI 在美国的普及速度。

主持人 (Brad Gerstner):

关于 Anthropic 之前与国防部的风波,如果你是董事会成员,你会给他们什么建议来改变公众的恐惧感?

黄仁勋 (Jensen Huang):

Anthropic 的技术非常出色,我们也是他们的大客户。警示技术的潜力是好事,但“警示”不等于“恐吓”。

我们作为技术领袖,说话必须更加谨慎和谦虚。在没有任何证据的情况下散布“毁灭性”的言论,其伤害比人们想象的要大。现在技术对社会结构和国家安全如此重要,我们的言辞至关重要。

主持人 (Brad Gerstner):

美国公众对 AI 的支持率只有 17%。我们曾因为恐惧毁掉了核能产业,现在中国在建 100 座核反应堆,我们是零。

回到智能体,英伟达内部的生产力提升如何?大家都在讨论投资回报率(ROI)。你认为我们会看到营收像智能一样呈指数级增长吗?

黄仁勋 (Jensen Huang):

看这个会场的观众就知道了,99% 的东西都是 AI。 从生成式到推理,计算量增加了 100 倍;从推理到智能体,计算量又增加了 100 倍。两年内计算量翻了 1 万倍。

人们会为“信息”付费,但更愿意为“工作”付费。聊天机器人很好,但能帮我完成工作的智能体才真正值钱。智能体正在帮我们的工程师完成工作。我们现在还没到真正的大规模阶段,未来的增长将是百万倍级的。

主持人 (Jason Calacanis):

英伟达有 4.3 万名员工,其中 3.8 万是工程师。如果你的一名年薪 50 万美元的工程师,一年只花 5000 美元买 Token,你会怎么想?

黄仁勋 (Jensen Huang):

我会发疯的!如果一个 50 万美元年薪的工程师一年不消耗至少 25 万美元的 Token,我会非常担心。

这就像一个芯片设计师说他只要纸和笔,不需要 CAD 工具一样。这是一种范式转移,就像勒布朗·詹姆斯每年花 100 万美元保养身体一样。我们要给知识工作者“超能力”。

主持人 (Jason Calacanis):

未来两三年,这种“全明星”员工的工作效率会变成什么样?

黄仁勋 (Jensen Huang):

那些“这太难了”、“这需要太长时间”的想法将不复存在。就像工业革命后,没人会说“那个建筑太重了”一样。重力和规模不再是问题,剩下的只有 创造力。

过去我们编写代码,未来我们编写“想法”、架构和规范。每个工程师未来都将管理 100 个智能体。

主持人 (David Friedberg):

我上周日晚上花了 90 分钟用智能体替换了一整套软件架构,原本这需要很多人手。这种加速感是前所未有的。

黄仁勋 (Jensen Huang):

这就是为什么 OpenClaw 如此不可思议。一些人认为企业软件行业会被摧毁,但我的观点相反:这个行业过去受限于“办公位上的员工人数”。未来将有 100 倍数量的智能体去敲击 SQL 数据库、Photoshop 和 Blender。这些工具是人类控制结果的最后途径。

主持人 (Chamath Palihapitiya):

关于开源,中国的一些开源模型非常强大。你认为 AI 的终局是去中心化的吗?

黄仁勋 (Jensen Huang):

我们需要“模型即产品(私有)”和“模型即开源”并存。 对于大多数消费者,我不想自己微调模型,我会用 ChatGPT 或 Claude。但对于垂直行业,他们需要控制自己的领域知识,这必须依靠开源模型。英伟达也在大力支持开源生态,因为这能让初创公司在第一天就拥有世界级的垂直能力。

主持人 (Brad Gerstner):

特朗普总统希望美国工业领先,希望美国 AI 走向世界。目前英伟达在某些市场(如中国)的市场份额从 95% 跌到了 0%。现在情况如何?

黄仁勋 (Jensen Huang):

特朗普总统希望我们重返战场。我们已经为许多请求采购的中国公司申请了许可证,并得到了批准。我们正在重启供应链进行发货。

如果美国不能主导 AI 技术的堆栈(从芯片到系统),那是国家安全的重大损失。我希望美国的计算堆栈占据全球 90% 的份额。

主持人 (Jason Calacanis):

全球冲突、台湾局势、甚至中东的氦气供应,这些供应链风险让你担心吗?

黄仁勋 (Jensen Huang):

在中东,我们有 6000 个家庭在那里,我们 100% 支持他们,100% 留在以色列。 关于台湾,我们要做的有三点:

尽可能快地实现美国本土工业化(如亚利桑那州的工厂)。

实现供应链多元化(韩国、日本、欧洲)。

保持耐心和克制。

主持人 (Jason Calacanis):

自动驾驶方面,你的策略是像 Android 那样的开源平台,而特斯拉更像 iOS。你如何看待这个棋局?

黄仁勋 (Jensen Huang):

我们的目标是让世界上每一家汽车公司都能制造自动驾驶汽车。我们提供三台计算机(训练、仿真、车载),并开发了最安全的操作系统。即便像马斯克和特斯拉这样拥有强大自研能力的客户,也会买我们的训练计算机。我们乐于提供任何层面的解决方案,我们不是来取代谁,而是来解决问题的。

主持人 (Brad Gerstner):

但像谷歌、亚马逊这些大客户也在自研芯片(TPU、Trainium)。他们既是客户也是竞争对手,你如何应对?

黄仁勋 (Jensen Huang):

我们是世界上唯一一家与每一家 AI 公司都合作的 AI 公司。我不看他们研发什么,但我向他们展示我研发的一切。

信心来自于两点:

购买英伟达的产品仍然是目前最经济的选择。

我们是唯一的跨平台架构(云端、本地、车载、甚至空间)。

很多人没意识到,英伟达 40% 的业务来自于构建完整的 AI 基础设施,而不只是卖芯片。事实上,英伟达的市场份额正在增加,因为 Anthropic、Meta 都在用英伟达,开源模型的爆发也在英伟达之上。

主持人 (Brad Gerstner):

分析师们似乎不相信你的增长潜力。他们预测你明年增长 30%,后年 20%,2029 年只有 7%。他们觉得“大数法则”会限制你。

黄仁勋 (Jensen Huang):

他们只是不理解 AI 的规模和广度。过去数据中心的 CPU 市场一年只有 250 亿美元,而我们现在的体量已经完全不同了。英伟达做的不是芯片,而是 AI 基础设施,这个市场比人们想象的要大得多。

主持人 (Chamath Palihapitiya):

谈谈空间数据中心?

黄仁勋 (Jensen Huang):

我们已经在太空中了。挑战在于散热(只能靠辐射),但这并非不可解决。目前我们的芯片已经安装在卫星上处理影像。与其把数据传回地球,不如直接在太空处理。

主持人 (Jason Calacanis):

在医疗领域,AI 将如何产生真正的影响?

黄仁勋 (Jensen Huang):

三个方向:

AI 生物学:预测生物行为,助力药物研发。

AI 智能体:辅助医生诊断。

物理 AI/机器人手术:未来的超声、CT 仪器都会内置智能体。

主持人 (Jason Calacanis):

机器人技术经历了“失去的二十年”,现在马斯克的 Optimus 还有中国的机器人发展很快。我们离“机器人厨师”或“机器人管家”还有多远?

黄仁勋 (Jensen Huang):

大约 3 到 5 年。中国在电机、稀土、磁铁等硬件生态上非常强大,全球机器人产业都将依赖那个供应链。 最终,机器人将成为人类繁荣的最大推动力。它不仅能解决劳动力短缺,还能让每个人通过机器人开启自己的事业。甚至我们可以通过虚拟现实“附身”在机器狗身上,在出差时陪孩子聊天或遛狗。

主持人 (Brad Gerstner):

Anthropic 的 CEO 预测 2030 年 AI 模型和智能体将产生 1 万亿美元的收入。你觉得呢?

黄仁勋 (Jensen Huang):

我觉得他太保守了。Anthropic 的表现会远超这个数字。因为每一家企业软件公司未来都会成为这些 AI 模型的“增值经销商”。

主持人 (Brad Gerstner):

那这些公司的“护城河”是什么?

黄仁勋 (Jensen Huang):

深度专业化。不要只做一个通用的横向平台,而要深耕某个垂直领域,把你的专业知识注入智能体。谁先连接客户,谁就能获得数据飞轮。

主持人 (Jason Calacanis):

你三年前说过:“你不会被 AI 取代,但会被使用 AI 的人取代。”现在你对就业的看法有变化吗?

黄仁勋 (Jensen Huang):

我不是末日论者。虽然司机会减少,但“移动助手”会增加。就像飞机的自动驾驶增加了飞行员的数量一样。 我对年轻人的建议是:成为使用 AI 的专家。这需要艺术性,需要知道如何引导 AI 而不完全限制它。

主持人 (Brad Gerstner):

你曾在斯坦福建议年轻人要经历“痛苦和磨难”。现在你建议他们学什么?英语专业会比计算机专业更有前途吗?

黄仁勋 (Jensen Huang):

深厚的科学、数学语言能力仍然关键。因为语言就是 AI 的编程语言

看看放射科的例子:10 年前有人预言 AI 会让放射科医生消失。结果呢?放射科医生的需求量激增。因为 AI 让扫描变快了,医院能处理更多病人,收益更高。

一个增长更快的国家需要更多的老师、更多的专家,只是他们每个人都将拥有 AI 赋予的“超能力”。

主持人 (Jason Calacanis):

Jensen,祝贺你取得的成就。这是一场非常积极且令人振奋的对话。

黄仁勋 (Jensen Huang):

谢谢。我们不需要陷入恐慌,我们有自主权去选择如何创造未来。

英伟达 GTC26 财务分析师问答会
主持人:

大家早上好。希望你们喜欢昨天的演示。虽然时间长了一点,但我认为这是一个非常完美的总结。现在我们将时间留给你们,重点关注你们的需求和问题。我先把时间交给 Jensen(黄仁勋)。

黄仁勋 (Jensen Huang):

正如我昨天提到的,AI 近期经历了三个拐点:第一个是生成式 AI,第二个是推理(Reasoning),而我们现在正处于第三个拐点——智能体系统(Agentic Systems)。

这些系统具备“自主行动能力”,所以被称为智能体。你可以给它们设定目标,它们不再只是回答问题,而是执行任务。最流行的应用之一就是编写软件。在你们公司,以及我的公司,工程师们整天都在使用智能体系统。

过去工程师入职发一台笔记本电脑,现在是发笔记本电脑和 Token(代币/令牌)。Token 预算现在成了实实在在的东西。如果你雇了一个年薪 30 万美元的工程师,但他在工作中不消耗任何 Token,你得问问他整天在干什么。

未来的计算机不再仅仅是工具,而是生产设备。就像 ASML 的光刻机一样,它们生产的是可以出售的产品。这和很久以前生产电力的发电机(Dynamo)没什么区别。能源效率和生产效率决定了你的收入。

每一个软件公司、每一个企业现在都需要一个“OpenClaw 策略”,就像我们当年必须有 Linux 策略、互联网策略和移动云策略一样。

黄仁勋 (Jensen Huang):

我想更新一下关于订单可见性的情况。一年前我说过,到 2026 年,我们的 Blackwell 和 Reuben 出货量有 5000 亿美元的强劲可见性。

现在是 2026 年 3 月,我们对 Blackwell 加 Reuben 架构拥有超过 1 万亿美元(1 Trillion Plus)的强劲需求可见性。这包括了确定的需求预测和采购订单。

请注意,这 1 万亿美元仅指 Blackwell 和 Reuben。我不包含 Groq、独立 CPU 或其他新产品,因为我要和去年的数据做对比。

而且,这个数字到 2027 年底还会继续增长。我们拥有库存和供应流水线,甚至可以在同一个季度内完成接单并出货。这是那些做 ASIC(定制芯片)的公司做不到的,因为它们的交付周期太长。

黄仁勋 (Jensen Huang):

去年(2025 年)是“推理之年”。我们让大家明白:计算机的价格和 Token 的成本之间只有微小的联系。人们买电脑是为了生产 Token。你买了一台昂贵的电脑,但它生产 Token 的速度极快,结果你反而拥有了成本最低的 Token。

这也是我们能保持毛利率的原因。我们每一代产品都提供更高的价值——即“每秒、每瓦特产生的 Token 数”。客户宁愿以更高的价格购买下一代产品,也不愿以低价买旧产品。安装 Vera Rubin 比继续买 Grace Blackwell 更聪明,因为价值更高。

黄仁勋 (Jensen Huang):

2025 年我们还扩大了平台支持。Anthropic 和 Meta SL 都成为了我们的新合作伙伴。目前 API 推理服务提供商的数据显示,开源模型(Open Models)已成为全球第二大流行的 AI 模型类别,仅次于 OpenAI。而英伟达是开源模型在全球最好的运行平台。

我们还与云服务商(CSP)紧密合作。我们在他们的云端拥有 CUDA,这吸引了所有开发者。我们是云服务商最好的销售力量,所以你会看到 AWS、谷歌、微软、甲骨文在我们的展厅里拥有最大的展位,因为他们想向我们的开发者推销服务。

此外,我们 40% 的业务来自于非 CSP 领域,如区域云、工业企业等。如果没有英伟达的全栈平台,你根本无法触达这 40% 的市场,因为他们买的是“平台”,而不只是“芯片”。

问答环节 (Q&A)
提问者 (Amelius Research, Ben Wright):

Jensen,大家最担心的推力是:这笔投资值吗?云服务商的收入增长能覆盖这些巨额开支吗?我们什么时候能看到他们的收入上修?

黄仁勋 (Jensen Huang):

我真希望那些 AI 公司已经上市了,这样你就能看到我所看到的。历史上从未有初创公司能像他们现在这样,每周增加 10 亿或 20 亿美元的收入。

2 万亿美元的 IT 软件行业正在整合 OpenAI、Anthropic 和开源模型。未来的 IT 行业将变成这些模型的“经销商”。我估计 IT 行业将从目前的 2 万亿增长到 8 万亿。

所有 IT 公司未来都会租赁或生产 Token。他们的商业模式将从软件授权转变为 Token 租赁。虽然这会引入销售成本(COGS),但提供的价值要高得多。OpenAI 和 Anthropic 的收入增长速度是在“一个月内长出一个完整的 IT 公司”。

提问者 (Caner Fitzgerald, CJ Muse):

物理 AI(Physical AI)会对你的业务构成什么样的变化?

黄仁勋 (Jensen Huang):

目前数字 AI 和物理 AI 的增长率差不多。但几年后物理 AI 迎来拐点,它必须在本地、在工厂边缘运行。由于全球 70 万亿美元的产业涉及物理原子(而非数字比特),物理 AI 最终会占据我们业务的 70%。

未来计算机将 24/7 全天候运行。我希望年薪 2000 美元一天的工程师每天能花 1000 美元的 Token 预算。我要让他管理一整支智能体舰队来替他工作。

提问者 (Bernstein, Stacy Rasgon):

Reuben 会和 Groq 一起发布吗?推理负载的演变如何?

柯莱特·克雷斯 (Colette Kress):

LPX(Groq 相关)预计在今年下半年。

黄仁勋 (Jensen Huang):

Vera Rubin 会比 Groq 更早出货。 关于计算架构,有低延迟(CPU)和高吞吐量(GPU)之分。Groq 是极端的低延迟架构,几乎整块芯片都是 SRAM。它不灵活,但非常快。

我们将 Groq 与 Vera Rubin 融合,用 Groq 处理语言模型自回归推理的最后阶段。对于免费或普通层级的推理,Vera Rubin 是无敌的。但对于极高端、极其聪明的模型,加入 Groq 后吞吐量会大幅提升。

这就像 iPhone 或汽车行业,市场扩大后就会出现分层:从免费层到极客层(每百万 Token 50 美元的高端层)。

提问者 (Bank of America, Vivek Arya):

1 万亿美元的市场里,CPU、存储等产品占比多少?Groq 会蚕食 HBM(高带宽显存)的需求吗?

黄仁勋 (Jensen Huang):

我们是唯一能跨 HBM、LPDDR5 和 SRAM 三种内存进行优化的公司。 如果 1 万亿的订单全部加上 Groq,规模会变成 1.25 万亿。存储是第二大支出,CPU 约占 5%。Vera Rubin 解决了“智能体”的计算需求——它不仅要推理,还要查内存、用工具、跑浏览器。

我们把这些功能全部和谐地整合进了一个液冷机架架构中,不再是“缝合怪”。

提问者 (Goldman Sachs, Jim Schneider):

Token 成本一直在下降,这会趋于平缓吗?

黄仁勋 (Jensen Huang):

Token 成本会持续下降。但与此同时,每个 Token 的“聪明程

版权声明:
作者:dingding
链接:https://www.techfm.club/p/234540.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>