必发·bifa(中国集团)唯一官方网站_必发888官网登录入口_bifa刚刚！黄仁勋GTC演讲全文！1万亿营收、LPU|sun138|、太空芯片

bifa刚刚！黄仁勋GTC演讲全文！1万亿营收、LPU|sun138|、太空芯片

发布时间：2026-04-09 来源：必发·bifa特种线缆

　　2026年3月16日ღ★✿，英伟达GTC 2026大会正式开幕ღ★✿，英伟达创始人兼CEO黄仁勋发表了主题演讲ღ★✿。

　　在这场被视为“AI行业年度朝圣”的大会上ღ★✿，黄仁勋阐述了英伟达从一家“芯片公司”向“AI基础设施和工厂公司”的蜕变ღ★✿。面对市场最关心的业绩持续性与增长空间问题ღ★✿，黄仁勋详细拆解了驱动未来增长的底层商业逻辑——“Token工厂经济学”ღ★✿。（阿里动作或于此有关）

　　过去两年ღ★✿，全球AI计算需求呈指数级爆炸ღ★✿。随着大模型从“感知”ღ★✿、“生成”进化到“推理”与“行动（执行任务）”ღ★✿，算力的消耗量急剧攀升ღ★✿。针对市场高度关注的订单与营收天花板ღ★✿，黄仁勋给出了极为强劲的预期ღ★✿。

　　去年这个时候ღ★✿，我说过ღ★✿，我们看到了5000亿美元的高确信度需求ღ★✿，覆盖Blackwell和Rubin直到2026年ღ★✿。现在ღ★✿，就在此时此地ღ★✿，我看到到2027年至少有1万亿美元的需求（at least $1 trillion）ღ★✿。

　　这合理吗？这就是我接下来要讲的ღ★✿。事实上必发bf88ღ★✿，ღ★✿，我们甚至会供不应求ღ★✿。我确定ღ★✿，实际的计算需求会比这高得多ღ★✿。

　　黄仁勋指出ღ★✿，如今的英伟达系统已经证明了自己是全球“成本最低的基础设施”ღ★✿。由于英伟达能运行几乎所有领域的AI模型ღ★✿，这种通用性使得客户投入的这1万亿美元能够被充分利用并保持长久的生命周期ღ★✿。

　　目前ღ★✿，英伟达60%的业务来自排名前五的超大型云服务商ღ★✿，而另外40%的业务则广泛分布于主权云ღ★✿、企业ღ★✿、工业ღ★✿、机器人和边缘计算等各个领域ღ★✿。

　　为了解释这1万亿需求的合理性ღ★✿，黄仁勋向全球企业CEO展示了一套全新的商业思维ღ★✿。他指出ღ★✿，未来的数据中心不再是存储文件的仓库ღ★✿，而是生产Token（AI生成的基本单位）的“工厂”ღ★✿。

　　每一座数据中心ღ★✿、每一座工厂ღ★✿，从定义上来说都是受电力限制的ღ★✿。一座1GW（吉瓦）的工厂永远不会变成2GWღ★✿，这是物理和原子的定律ღ★✿。在固定的功率下ღ★✿，谁的每瓦Token吞吐量最高ღ★✿，谁的生产成本就最低ღ★✿。

　　他指出ღ★✿，随着模型越来越大ღ★✿、上下文越来越长ღ★✿，AI会变得更聪明ღ★✿，但Token的生成速率会降低ღ★✿。黄仁勋表示ღ★✿：

　　黄仁勋强调英伟达的架构能够让客户在免费层实现极高的吞吐量ღ★✿，同时在最高价值的推理层级上ღ★✿，将性能提升惊人的35倍ღ★✿。

　　在这个物理极限的约束下ღ★✿，英伟达介绍其有史以来最复杂的AI计算系统ღ★✿，Vera Rubinღ★✿。黄仁勋表示ღ★✿：

　　过去提到Hopperღ★✿，我会举起一块芯片bifaღ★✿，那很可爱ღ★✿。但提到Vera Rubinღ★✿，大家想到的是整个系统ღ★✿。在这个100%液冷ღ★✿、完全消灭了传统线缆的系统中ღ★✿，过去需要两天安装的机架ღ★✿，现在只需两小时ღ★✿。

　　黄仁勋指出ღ★✿，通过极致的端到端软硬件协同设计ღ★✿，Vera Rubin在同一座1GW数据中心里创造了惊人的数据跨越ღ★✿：

　　在短短两年时间内ღ★✿，我们将Token的生成速率从2200万提升到了7亿ღ★✿，实现了350倍的增长ღ★✿。摩尔定律在同时期仅能带来约1.5倍的提升ღ★✿。

　　为了解决极速推理（如1000 Tokens/秒）条件下的带宽瓶颈ღ★✿，英伟达给出了整合被收购公司Groq的最终方案ღ★✿：非对称式的分离推理ღ★✿。黄仁勋解释ღ★✿：

　　这两款处理器的特点截然不同ღ★✿。Groq芯片拥有500MB的SRAMღ★✿，而一颗Rubin芯片拥有288GB的内存ღ★✿。

　　黄仁勋指出ღ★✿，英伟达通过Dynamo软件系统ღ★✿，将需要海量计算和显存的“预填充（Pre-fill）”阶段交给Vera Rubinღ★✿，将对延迟极度敏感的“解码”阶段交给Groqღ★✿。黄仁勋还对企业算力配置给出了建议ღ★✿：

　　如果你的工作主要是高吞吐ღ★✿，100%使用Vera Rubinღ★✿；如果你有大量高价值的编程级别的Token生成需求ღ★✿，拿出25%的数据中心规模给Groqღ★✿。

　　据透露ღ★✿，由三星代工的Groq LP30芯片已在量产ღ★✿，预计第三季度出货ღ★✿，而首个Vera Rubin机架已在微软Azure云上运行ღ★✿。

　　此外ღ★✿，针对光互联技术bifaღ★✿，黄仁勋展示了全球首款量产的共封装光学（CPO）交换机Spectrum Xღ★✿，并平息了市场对于“铜退光进”的路线之争ღ★✿：

　　除了硬件壁垒ღ★✿，黄仁勋把大量篇幅留给了AI软件和生态的革命ღ★✿，特别是Agent（智能体）的爆发ღ★✿。

　　他将开源项目OpenClaw形容为“人类历史上最受欢迎的开源项目”ღ★✿，称其仅用几周时间就超越了Linux在过去30年取得的成就ღ★✿。黄仁勋直言ღ★✿，OpenClaw本质上就是Agent计算机的“操作系统”ღ★✿。

　　每一个SaaS（软件即服务）公司都将变成AaaS（Agent-as-a-Serviceღ★✿，智能体即服务）公司ღ★✿。毫无疑问ღ★✿，为了让这种具备访问敏感数据和执行代码能力的智能体安全落地ღ★✿，英伟达推出了企业级的NeMo Claw参考设计ღ★✿，增加了策略引擎和隐私路由器ღ★✿。

　　在未来ღ★✿，我们公司的每一位工程师都需要一个年度Token预算ღ★✿。他们的基础年薪可能是几十万美元ღ★✿，我会在此基础上再拿出大约一半的金额作为Token额度给他们ღ★✿，让他们实现10x的效率提升ღ★✿。这已经是硅谷的新招聘筹码了ღ★✿：你的offer里带多少Token？

　　演讲最后ღ★✿，黄仁勋还“剧透”了下一代计算架构Feynmanღ★✿，它将首次实现铜线与CPO的共同水平扩展ღ★✿。更引人遐想的是ღ★✿，英伟达正在研发部署在太空的数据中心计算机“Vera Rubin Space-1”ღ★✿，彻底打开了AI算力向地球之外延伸的想象空间ღ★✿。

　　欢迎来到GTCღ★✿。我想提醒大家ღ★✿，这是一场技术大会ღ★✿。能看到这么多人一大早排队入场ღ★✿，能看到在座的各位ღ★✿，我感到非常高兴ღ★✿。

　　在GTCღ★✿，我们将聚焦三大主题ღ★✿：技术ღ★✿、平台和生态系统ღ★✿。英伟达目前拥有三大平台ღ★✿：CUDA-X平台ღ★✿、系统平台ღ★✿，以及我们最新推出的AI工厂平台ღ★✿。

　　在正式开始之前ღ★✿，我要感谢我们的预热环节主持人——Conviction的Sarah Guoღ★✿、红杉资本的Alfred Lin（英伟达的第一位风险投资人）ღ★✿，以及英伟达的第一位主要机构投资人Gavin Bakerღ★✿。这三位对技术有深刻的洞见ღ★✿，在整个技术生态系统中拥有极广的影响力ღ★✿。当然ღ★✿，我还要感谢今天所有我亲自邀请出席的贵宾们ღ★✿。感谢这支全明星团队ღ★✿。

　　我同样要感谢今天到场的所有企业ღ★✿。英伟达是一家平台公司ღ★✿，我们拥有技术ღ★✿、平台和丰富的生态系统ღ★✿。今天到场的企业代表了价值100万亿美元行业中几乎全部的参与者ღ★✿，共有450家公司赞助了本次活动ღ★✿，在此深表感谢ღ★✿。

　　本次大会共设有1,000场技术论坛ღ★✿、2,000位演讲嘉宾ღ★✿，将覆盖人工智能五层蛋糕架构的每一个层级——从土地ღ★✿、电力与机房等基础设施ღ★✿，到芯片ღ★✿、平台ღ★✿、模型ღ★✿，以及最终推动整个行业腾飞的各类应用ღ★✿。

　　二十年来ღ★✿，我们始终致力于这一架构的研发ღ★✿。CUDA是一项革命性的发明——SIMT（单指令多线程）技术允许开发者以标量代码编写程序ღ★✿，并将其扩展为多线程应用sun138ღ★✿，其编程难度远低于此前的SIMD架构ღ★✿。我们最近还新增了Tiles功能ღ★✿，帮助开发者更便捷地编程张量核心（Tensor Core）ღ★✿，以及当今人工智能所依赖的各类数学运算结构ღ★✿。目前ღ★✿，CUDA已拥有数千种工具ღ★✿、编译器ღ★✿、框架和库ღ★✿，在开源社区中存在数十万个公开项目ღ★✿，并已深度集成到每一个技术生态系统之中ღ★✿。

　　这张图表揭示了英伟达100%的战略逻辑ღ★✿，我从最初就一直在讲这张幻灯片ღ★✿。其中最难实现ღ★✿、也是最核心的要素ღ★✿，是图表底部的装机量ღ★✿。历经二十年ღ★✿，我们已在全球范围内积累了数亿块运行CUDA的GPU和计算系统ღ★✿。

　　我们的GPU覆盖所有云平台ღ★✿，服务于几乎所有计算机厂商和行业ღ★✿。CUDA庞大的装机量ღ★✿，正是这个飞轮不断加速的根本原因ღ★✿。装机量吸引开发者ღ★✿，开发者创造新算法并取得突破ღ★✿，突破催生全新市场ღ★✿，新市场形成新生态并吸引更多企业加入ღ★✿，进而扩大装机量——这个飞轮正在持续加速ღ★✿。

　　英伟达库的下载量正以惊人的速度增长ღ★✿，规模庞大且增速不断提升ღ★✿。这个飞轮使我们的计算平台能够支撑海量应用和层出不穷的新突破ღ★✿。

　　更重要的是ღ★✿，它还赋予了这些基础设施极长的使用寿命ღ★✿。原因显而易见ღ★✿：NVIDIA CUDA上可运行的应用极为丰富ღ★✿，涵盖AI生命周期的每个阶段ღ★✿、各类数据处理平台ღ★✿，以及各种科学原理求解器ღ★✿。因此ღ★✿，一旦安装了英伟达GPUღ★✿，其实际使用价值极高ღ★✿。这也是为何我们六年前发布的Ampere架构GPUღ★✿，其云端价格反而在上涨ღ★✿。

　　这一切的根本原因在于ღ★✿：装机量庞大ღ★✿，飞轮强劲ღ★✿，开发者生态广泛ღ★✿。当这些因素共同发挥作用ღ★✿，加之我们持续更新软件ღ★✿，计算成本便会不断下降ღ★✿。加速计算在大幅提升应用性能的同时ღ★✿，随着我们长期维护和迭代软件ღ★✿，用户不仅能在初期获得性能跃升ღ★✿，还能持续享受计算成本的下降ღ★✿。我们愿意为全球每一块GPU提供长期支持ღ★✿，因为它们在架构上完全兼容ღ★✿。

　　我们之所以愿意这样做ღ★✿，是因为装机量如此庞大——每发布一次新的优化ღ★✿，便能惠及数百万用户ღ★✿。这种动态组合ღ★✿，使得英伟达架构在持续扩大覆盖范围ღ★✿、加速自身成长的同时ღ★✿，不断压低计算成本ღ★✿，最终刺激新的增长ღ★✿。CUDA是这一切的核心ღ★✿。

　　GeForce——相信在座有很多人是伴随着GeForce长大的ღ★✿。GeForce是英伟达最成功的市场推广项目ღ★✿。我们从你们还买不起产品的时候就开始培养未来的客户——是你们的父母代替你们成为了英伟达最早的用户ღ★✿，年复一年地购买我们的产品ღ★✿，直到有一天ღ★✿，你们成长为优秀的计算机科学家ღ★✿，成为真正意义上的客户和开发者ღ★✿。

　　这是二十五年前GeForce奠定的基业ღ★✿。二十五年前ღ★✿，我们发明了可编程着色器——这是让加速器实现可编程化的一项显而易见却意义深远的发明ღ★✿，也是世界上第一款可编程加速器ღ★✿，即像素着色器ღ★✿。这五年后ღ★✿，我们创造了CUDA——这是我们有史以来最重要的投资之一ღ★✿。当时公司财力有限ღ★✿，但我们将绝大部分利润押注于此ღ★✿，致力于将CUDA从GeForce延伸到每一台计算机ღ★✿。我们之所以如此坚定ღ★✿，是因为我们深信其潜力ღ★✿。尽管初期历经艰辛ღ★✿，公司坚守这一信念长达13代ღ★✿、整整二十年ღ★✿，如今CUDA已无处不在ღ★✿。

　　正是像素着色器推动了GeForce的革命ღ★✿。而大约八年前ღ★✿，我们推出了RTX——为现代计算机图形时代对架构进行了全面革新ღ★✿。GeForce将CUDA带给了全世界ღ★✿，也正因如此ღ★✿，让Alex Krizhevskyღ★✿、Ilya Sutskeverღ★✿、Geoffrey Hintonღ★✿、Andrew Ng等众多学者发现ღ★✿，GPU可以成为加速深度学习的利器ღ★✿，由此点燃了十年前人工智能的大爆炸ღ★✿。

　　十年前sun138ღ★✿，我们决定将可编程着色与两个全新理念相融合ღ★✿：一是硬件光线追踪（Ray Tracing）ღ★✿，这在技术上极具挑战ღ★✿；二是一个当时颇具前瞻性的想法——大约十年前ღ★✿，我们就预见到AI将彻底变革计算机图形ღ★✿。正如GeForce将AI带给了全世界ღ★✿，AI如今也将反过来重塑整个计算机图形的实现方式ღ★✿。

　　今天ღ★✿，我要向大家展示未来ღ★✿。这是我们的下一代图形技术ღ★✿，我们称之为神经渲染（Neural Rendering）——3D图形与人工智能的深度融合ღ★✿。这就是DLSS 5ღ★✿，请看ღ★✿。

　　我们做了什么？我们将可控的3D图形（虚拟世界的真实基础）与其结构化数据相结合ღ★✿，再融入生成式AI和概率计算ღ★✿。一个完全确定性ღ★✿，另一个概率性却高度逼真——我们将这两种理念融为一体ღ★✿，通过结构化数据实现精准可控ღ★✿，同时进行实时生成ღ★✿。最终ღ★✿，内容既美观惊艳ღ★✿，又完全可控ღ★✿。

　　结构化信息与生成式AI融合这一理念ღ★✿，将在一个又一个行业中不断复现ღ★✿。结构化数据是可信AI的基石ღ★✿。

　　在AI时代ღ★✿，我们需要让AI来使用结构化数据ღ★✿，并对其实现极致加速ღ★✿。过去ღ★✿，加速结构化数据处理是为了让企业更高效地运转ღ★✿。而未来ღ★✿，AI将以远超人类的速度使用这些数据结构ღ★✿，AI智能体也将大量调用结构化数据库ღ★✿。

　　非结构化数据方面ღ★✿，向量数据库ღ★✿、PDFღ★✿、视频ღ★✿、音频等构成了世界上绝大多数的数据形态——每年生成的数据中ღ★✿，约90%是非结构化数据ღ★✿。过去ღ★✿，这些数据几乎完全无法被利用ღ★✿：我们读取它们ღ★✿，存入文件系统ღ★✿，仅此而已ღ★✿。我们无法查询ღ★✿，也难以检索ღ★✿，原因在于非结构化数据缺乏简单的索引方式ღ★✿，必须理解其含义与语境ღ★✿。而现在ღ★✿，AI可以做到这一点——借助多模态感知与理解技术ღ★✿，AI能够读取PDF文档ღ★✿、理解其含义ღ★✿，并将其嵌入可供查询的更大结构之中ღ★✿。

　　今天ღ★✿，我们宣布与多家企业达成合作ღ★✿。IBM——SQL语言的发明者ღ★✿，将使用cuDF加速其WatsonX Data平台ღ★✿。Dell与我们联合打造了Dell AI数据平台ღ★✿，整合cuDF与cuVSღ★✿，并在NTT Data的实际项目中实现了大幅性能提升ღ★✿。Google Cloud方面ღ★✿，我们现在不仅加速Vertex AIღ★✿，还加速BigQueryღ★✿，并与Snapchat合作将其计算成本降低了近80%ღ★✿。

　　加速计算带来的好处是三位一体的ღ★✿：速度ღ★✿、规模ღ★✿、成本ღ★✿。这与摩尔定律的逻辑一脉相承——通过加速计算实现性能飞跃ღ★✿，同时持续优化算法ღ★✿，让所有人都能享受到持续下降的计算成本ღ★✿。

　　英伟达构建了加速计算平台ღ★✿，其上汇聚了众多库ღ★✿：RTXღ★✿、cuDFღ★✿、cuVS等等ღ★✿。这些库整合进全球云服务和OEM体系ღ★✿，共同触达全球用户ღ★✿。

　　AWSღ★✿：我们加速EMRღ★✿、SageMaker和Bedrockღ★✿，与AWS有着深度集成ღ★✿。今年令我格外兴奋的是ღ★✿，我们将把OpenAI引入AWSღ★✿，这将大幅推动AWS云计算的消耗增长ღ★✿，帮助OpenAI扩展区域部署和计算规模ღ★✿。

　　Microsoft Azureღ★✿：英伟达100 PFLOPS超算是我们构建的第一台超级计算机ღ★✿，也是第一台部署在Azure上的超算ღ★✿，这奠定了与OpenAI合作的重要基础ღ★✿。我们加速Azure云服务和AI Foundryღ★✿，合作推进Azure区域扩展ღ★✿，并在Bing搜索上深度协作bifaღ★✿。值得一提的是ღ★✿，我们的**保密计算（Confidential Computing）**能力——确保即便是运营商也无法查看用户数据和模型——英伟达GPU是全球首批支持保密计算的GPUღ★✿，可支持OpenAI和Anthropic模型在全球各地区云环境中的保密部署ღ★✿。以Synopsys为例ღ★✿，我们加速其全部EDA和CAD工作流ღ★✿，并部署于Microsoft Azureღ★✿。

　　Oracleღ★✿：我们是Oracle的第一个AI客户ღ★✿，我为能够第一次向Oracle解释AI云的概念感到自豪ღ★✿。此后他们发展迅猛ღ★✿，我们也为其引入了Cohereღ★✿、Fireworksღ★✿、OpenAI等众多合作伙伴ღ★✿。

　　CoreWeaveღ★✿：全球第一家AI原生云ღ★✿，专为GPU托管和AI云服务而生ღ★✿，拥有出色的客户群sun138ღ★✿，增长势头强劲ღ★✿。

　　Palantir + Dellღ★✿：三方联合打造了全新的AI平台ღ★✿，基于Palantir的本体论平台（Ontology Platform）和AI平台ღ★✿，可在任何国家ღ★✿、任何气隙隔离环境下ღ★✿、完全本地化地部署AI——从数据处理（向量化或结构化）到AI的完整加速计算栈ღ★✿，无所不包ღ★✿。

　　英伟达与全球云服务商建立了这种特殊的合作关系——我们将客户引入云端ღ★✿，这是一种互利共赢的生态ღ★✿。

　　这一模式的必要性非常简单ღ★✿：加速计算不是芯片问题ღ★✿，也不是系统问题ღ★✿，其完整表述应为应用加速ღ★✿。CPU可以让计算机整体运行得更快ღ★✿，但这条路已走到瓶颈ღ★✿。未来ღ★✿，唯有通过应用或领域特定的加速ღ★✿，才能持续带来性能飞跃和成本下降ღ★✿。

　　这正是英伟达必须深耕一个又一个库ღ★✿、一个又一个领域ღ★✿、一个又一个垂直行业的原因ღ★✿。我们是一家垂直整合的计算公司ღ★✿，没有其他路可走ღ★✿。我们必须理解应用ღ★✿，理解领域ღ★✿，深刻理解算法ღ★✿，并能够将其部署在任何场景下——数据中心ღ★✿、云端ღ★✿、本地ღ★✿、边缘乃至机器人系统ღ★✿。

　　同时ღ★✿，英伟达保持横向开放ღ★✿，愿意将技术整合进任何合作伙伴的平台ღ★✿，让全世界都能享受到加速计算的红利ღ★✿。

　　本届GTC的参会者结构充分体现了这一点ღ★✿。本次参会者中ღ★✿，金融服务行业的比例最高——希望来的是开发者ღ★✿，不是交易员ღ★✿。我们的生态系统覆盖了上游和下游供应链ღ★✿。无论是成立50年ღ★✿、70年还是150年的企业ღ★✿，去年都迎来了历史最佳年份ღ★✿。我们正处于某件非常ღ★✿、非常重大的事情的起点ღ★✿。

　　金融服务ღ★✿：量化投资正从人工特征工程转向超级计算机驱动的深度学习ღ★✿，迎来其Transformer时刻

　　医疗健康ღ★✿：正在迎来属于自己的ChatGPT时刻ღ★✿，涵盖AI辅助药物发现ღ★✿、AI智能体支持诊断ღ★✿、医疗客服等方向

　　机器人ღ★✿：深耕十余年ღ★✿，三大计算机架构（训练计算机ღ★✿、仿真计算机ღ★✿、机载计算机）齐备ღ★✿，本次展会共有110款机器人亮相

　　电信ღ★✿：约2万亿美元规模的行业ღ★✿，基站将从单一通信功能演进为AI基础设施平台ღ★✿，相关平台名为Aerialღ★✿，与诺基亚ღ★✿、T-Mobile等企业均有深度合作

　　以上所有领域的核心ღ★✿，正是我们的CUDA-X库——这是英伟达作为算法公司的根本所在ღ★✿。这些库是公司最核心的资产ღ★✿，让计算平台得以在各个行业发挥实际价值ღ★✿。

　　其中最重要的库之一ღ★✿，是cuDNN（CUDA深度神经网络库）ღ★✿，它彻底革新了人工智能ღ★✿，引发了现代AI的大爆炸ღ★✿。

　　大家刚才看到的一切都是仿真——包括基于物理原理的求解器ღ★✿、AI代理物理模型ღ★✿，以及物理AI机器人模型ღ★✿。一切均为仿真ღ★✿，没有任何手工动画或关节绑定ღ★✿。这正是英伟达的核心能力所在ღ★✿：通过对算法的深刻理解与计算平台的有机结合ღ★✿，解锁这些机遇ღ★✿。

　　你们刚才看到了沃尔玛ღ★✿、欧莱雅ღ★✿、摩根大通ღ★✿、罗氏ღ★✿、丰田等定义当今社会的行业巨头ღ★✿，也有一大批大家从未听说过的公司——我们称之为AI原生企业ღ★✿。这份名单极为庞大ღ★✿，里面有OpenAIღ★✿、Anthropicღ★✿，以及众多服务于不同垂直领域的新兴企业bifaღ★✿。

　　过去两年ღ★✿，这一行业经历了惊人的腾飞ღ★✿。风险投资流入初创企业的资金规模达到1,500亿美元ღ★✿，创人类历史之最ღ★✿。更重要的是ღ★✿，单笔投资规模首次从数百万美元跃升至数亿乃至数十亿美元ღ★✿。原因只有一个ღ★✿：这是史上第一次ღ★✿，每一家此类公司都需要大量计算资源和大量tokenღ★✿。这个行业正在创造ღ★✿、生成tokenღ★✿，或者为来自Anthropicღ★✿、OpenAI等机构的token增值ღ★✿。

　　正如PC革命ღ★✿、互联网革命ღ★✿、移动云革命各自孕育出一批划时代的企业ღ★✿，这一代计算平台变革同样将诞生一批极具影响力的公司ღ★✿，成为未来世界的重要力量ღ★✿。

　　它不仅能感知和理解ღ★✿，还能生成独特内容bifaღ★✿。我展示了生成式AI与计算机图形的融合ღ★✿。生成式AI从根本上改变了计算的方式——计算从检索式转变为生成式ღ★✿，这深刻影响着计算机架构ღ★✿、部署方式和整体意义ღ★✿。

　　推理能力使AI能够自我反思ღ★✿、规划ღ★✿、分解问题——将它无法直接理解的问题拆解为可处理的步骤ღ★✿。o1让生成式AI变得可信ღ★✿，能够依据真实信息进行推理ღ★✿。为此ღ★✿，输入context的token量和用于思考的输出token量大幅增加ღ★✿，计算量随之显著提升sun138ღ★✿。

　　它能读取文件ღ★✿、编写代码ღ★✿、编译ღ★✿、测试ღ★✿、评估并迭代ღ★✿。Claude Code彻底革新了软件工程——英伟达100%的工程师都在使用Claude Codeღ★✿、Codex和Cursor中的一种或多种ღ★✿，没有一位软件工程师不借助AI助力ღ★✿。

　　这是一个全新的拐点——你不再是询问AI是什么ღ★✿、在哪里ღ★✿、怎么做ღ★✿，而是让它创建ღ★✿、执行ღ★✿、构建ღ★✿，让它主动使用工具ღ★✿、读取文件ღ★✿、分解问题ღ★✿、付诸行动ღ★✿。AI从感知ღ★✿，到生成ღ★✿，到推理ღ★✿，再到如今真正能够完成工作ღ★✿。

　　过去两年ღ★✿，推理所需的计算量增长了约10,000倍ღ★✿，使用量增长了约100倍ღ★✿。我一直认为ღ★✿，过去两年计算需求增长了100万倍——这是所有人的共同感受ღ★✿，是OpenAI的感受ღ★✿，是Anthropic的感受ღ★✿。如果能获得更多算力ღ★✿，就能生成更多tokenღ★✿，收入就会提升ღ★✿，AI就会变得更智能sun138ღ★✿。推理拐点已然到来ღ★✿。

　　去年此时ღ★✿，我在这里表示ღ★✿，我们对Blackwell和Rubin在2026年之前的需求和采购订单有高度信心ღ★✿，规模约为5,000亿美元ღ★✿。今天ღ★✿，在GTC一年之后ღ★✿，我站在这里告诉大家ღ★✿：展望到2027年ღ★✿，我看到的数字至少是1万亿美元ღ★✿。而且我确信ღ★✿，实际的计算需求将远不止于此ღ★✿。

　　2025年是英伟达的推理年（Year of Inference）ღ★✿。我们希望确保ღ★✿，在训练和后训练之外ღ★✿，也能在AI生命周期的每个阶段都保持卓越ღ★✿，使已投资的基础设施能够持续高效运转ღ★✿，且有效使用寿命越长ღ★✿，单位成本越低ღ★✿。

　　与此同时ღ★✿，Anthropic和Meta正式加入NVIDIA平台ღ★✿，与此共同代表了全球三分之一的AI算力需求ღ★✿。开源模型已接近前沿水平ღ★✿，无处不在ღ★✿。

　　英伟达是目前全球唯一一个能够运行所有AI领域——语言ღ★✿、生物学ღ★✿、计算机图形ღ★✿、计算机视觉ღ★✿、语音ღ★✿、蛋白质与化学ღ★✿、机器人等——所有AI模型的平台ღ★✿，无论边缘还是云端ღ★✿，无论何种语言ღ★✿。英伟达架构对所有这些场景均具备通用性ღ★✿，这使我们成为成本最低ღ★✿、置信度最高的平台ღ★✿。

　　目前ღ★✿，英伟达60%的业务来自全球前五大超大规模云服务商ღ★✿，剩余40%遍布区域云ღ★✿、主权云sun138ღ★✿、企业ღ★✿、工业ღ★✿、机器人ღ★✿、边缘计算等各个领域ღ★✿。AI的覆盖广度本身就是其韧性所在——这毫无疑问是一次全新的计算平台变革ღ★✿。

　　在Hopper架构还处于鼎盛时期bifaღ★✿，我们就决定彻底重新架构系统ღ★✿，将NVLink从8路扩展为NVLink 72ღ★✿，对计算系统进行全面分解重构ღ★✿。Grace Blackwell NVLink 72是一次巨大的技术押注ღ★✿，对所有合作伙伴而言都不容易ღ★✿，在此向所有人表示诚挚感谢ღ★✿。

　　同时ღ★✿，我们推出了NVFP4——不只是普通的FP4ღ★✿，而是一种全新类型的张量核心和计算单元ღ★✿。我们已经证明ღ★✿，NVFP4可以在无精度损失的情况下实现推理ღ★✿，同时带来巨大的性能提升和能效提升ღ★✿，并且同样适用于训练ღ★✿。此外ღ★✿，Dynamo和TensorRT-LLM等一系列新算法相继问世ღ★✿，我们甚至为优化内核而专门投入数十亿美元建造了一台超级计算机ღ★✿，称之为DGX Cloudღ★✿。

　　结果证明ღ★✿，我们的推理性能令人瞩目ღ★✿。来自Semi Analysis的数据——这是迄今为止最全面的AI推理性能评测——显示英伟达在每瓦token数和每token成本两个维度上均遥遥领先ღ★✿。原本摩尔定律可能给H200带来1.5倍的性能提升ღ★✿，但我们做到了35倍ღ★✿。Semi Analysis的Dylan Patel甚至说ღ★✿：黄仁勋保守了ღ★✿，实际上是50倍ღ★✿。他说得没错ღ★✿。

　　英伟达的每token成本是全球最低ღ★✿，目前无人能及ღ★✿。原因正在于极致协同设计（Extreme Co-design）ღ★✿。

　　以Fireworks为例ღ★✿，在英伟达更新全套软件和算法之前ღ★✿，其平均token速度约为每秒700个ღ★✿；更新后接近每秒5,000个ღ★✿，提升约7倍ღ★✿。这就是极致协同设计的力量ღ★✿。

　　数据中心过去是存储文件的地方ღ★✿，现在它是生产token的工厂ღ★✿。每一家云服务商ღ★✿、每一家AI公司ღ★✿，未来都将以token工厂效率作为核心经营指标ღ★✿。

　　横轴ღ★✿：交互速度（Token Speed）——每次推理的响应速度ღ★✿，速度越快ღ★✿，可使用的模型越大ღ★✿、context越长ღ★✿，AI越智能

　　与Hopper相比ღ★✿，Grace Blackwell在最高价值层提升了35倍吞吐量ღ★✿，并引入全新层级ღ★✿。以简化模型估算ღ★✿，将25%功率分别分配给四个层级ღ★✿，Grace Blackwell可比Hopper多产生5倍的收入ღ★✿。

　　Vera Rubin是一个完整的ღ★✿、端到端优化的系统ღ★✿，专为智能体（Agentic）工作负载设计ღ★✿：

　　全新Vera CPUღ★✿：专为极高单线程性能设计ღ★✿，采用LPDDR5内存ღ★✿，兼具卓越能效ღ★✿，是全球唯一使用LPDDR5的数据中心CPUღ★✿，适合AI智能体工具调用

　　存储系统ღ★✿：BlueField 4 + CX 9ღ★✿，面向AI时代的全新存储平台ღ★✿，全球存储行业100%加入

　　Kyber机架ღ★✿：全新机架系统ღ★✿，支持144块GPU组成单一NVLink域ღ★✿，前端计算bifabifa·必发ღ★✿，ღ★✿、后端NVLink交换ღ★✿，形成一台巨型计算机

　　Rubin Ultraღ★✿：下一代超算节点ღ★✿，竖插式设计ღ★✿，配合Kyber机架ღ★✿，支持更大规模NVLink互联

　　Vera Rubin已100%液冷ღ★✿，安装时间从两天缩短至两小时ღ★✿，采用45°C热水冷却ღ★✿，大幅降低数据中心冷却压力sun138ღ★✿。这次Satya（纳德拉）已发文确认ღ★✿，首台Vera Rubin机架已在微软Azure上线运行ღ★✿，我为此深感振奋ღ★✿。

　　我们收购了Groq团队并获得其技术授权ღ★✿。Groq是一种确定性数据流处理器（Deterministic Dataflow Processor）ღ★✿，采用静态编译和编译器调度ღ★✿，拥有大量SRAMღ★✿，专为推理单一工作负载优化ღ★✿，具备极低延迟和极高token生成速度ღ★✿。

　　然而ღ★✿，Groq的内存容量有限（500MB片上SRAM）ღ★✿，难以独立承载大模型的参数和KV Cacheღ★✿，限制了其大规模应用ღ★✿。

　　解决方案正是Dynamo——一套推理调度软件ღ★✿。我们通过Dynamo将推理管线解聚（Disaggregate）ღ★✿：

　　两者通过以太网紧密耦合ღ★✿，借助特殊模式将延迟减少约一半ღ★✿。在Dynamo这一AI工厂操作系统的统一调度下ღ★✿，整体性能提升35倍ღ★✿，并开辟了NVLink 72此前无法触及的全新推理性能层级ღ★✿。

　　将此前技术进步量化ღ★✿：在2年时间内ღ★✿，1吉瓦AI工厂的token生成速率将从2,200万token/秒提升至7亿token/秒ღ★✿，提升350倍ღ★✿。这就是极致协同设计的力量ღ★✿。

　　路线图明确ღ★✿：铜缆扩展ღ★✿、光学扩展（Scale-Up）ღ★✿、光学扩展（Scale-Out）三条路线并行推进ღ★✿，我们需要所有合作伙伴在铜缆ღ★✿、光纤和CPO方面持续扩产ღ★✿。

　　AI工厂越来越复杂ღ★✿，但组成它的各类技术供应商过去从未在设计阶段相互协作ღ★✿，直到在数据中心才相遇——这显然不够ღ★✿。

　　为此ღ★✿，我们创建了Omniverseღ★✿，以及基于其上的NVIDIA DSX平台——一个供所有合作伙伴在虚拟世界中共同设计和运营吉瓦级AI工厂的平台ღ★✿。DSX提供ღ★✿：

　　保守估计ღ★✿，这套系统可将能源利用效率提升约2倍ღ★✿，在我们谈论的规模上ღ★✿，这是非常可观的收益ღ★✿。Omniverse从数字地球开始ღ★✿，将承载各种规模的数字孪生ღ★✿，我们正与全球合作伙伴共同构建人类历史上最大的计算机ღ★✿。

　　此外ღ★✿，英伟达正在进军太空ღ★✿。Thor芯片已通过辐射认证ღ★✿，正在卫星中运行ღ★✿。我们正与合作伙伴开发Vera Rubin Space-1ღ★✿，用于建设太空数据中心ღ★✿。在太空中只能依靠辐射散热ღ★✿，热管理是核心挑战ღ★✿，我们正集结顶尖工程师攻关ღ★✿。

　　Peter Steinberger开发了一款名为OpenClaw的软件ღ★✿。这是人类历史上最受欢迎的开源项目ღ★✿，在短短几周内便超越了Linux三十年的成就ღ★✿。

　　管理资源ღ★✿，访问工具ღ★✿、文件系统和大型语言模型ღ★✿；执行调度ღ★✿、定时任务ღ★✿；将问题逐步分解ღ★✿，并调用子智能体ღ★✿；支持任意模态的输入输出（语音ღ★✿、视频ღ★✿、文字ღ★✿、邮件等）ღ★✿。

　　用操作系统的语法来描述88BIFAAPP官网ღ★✿，ღ★✿，它确实就是一个操作系统——智能体计算机的操作系统ღ★✿。Windows让个人计算机成为可能ღ★✿，OpenClaw让个人智能体成为可能ღ★✿。

　　每一家企业都需要制定自己的OpenClaw战略ღ★✿，正如我们都需要Linux策略ღ★✿、HTML策略ღ★✿、Kubernetes策略一样ღ★✿。

　　OpenClaw之前的企业ITღ★✿：数据和文件进入系统ღ★✿，流经工具和工作流ღ★✿，最终变成供人类使用的工具ღ★✿。软件公司创建工具ღ★✿，系统集成商（GSI）和咨询公司帮助企业使用这些工具ღ★✿。

　　OpenClaw之后的企业ITღ★✿：每一家SaaS公司都将转变为AaaS（Agentic as a Serviceღ★✿，智能体即服务）公司——不只是提供工具ღ★✿，而是提供专精特定领域的AI智能体ღ★✿。

　　但这里有一个关键挑战ღ★✿：企业内部的智能体可以访问敏感数据ღ★✿、执行代码ღ★✿、与外部通信ღ★✿。这在企业环境中必须得到严格管控bifaღ★✿。

　　NeMo Claw（参考设计）ღ★✿：基于OpenClaw的企业级参考框架ღ★✿，集成NVIDIA的全套智能体AI工具包

　　Open Shield（安全层）ღ★✿：已集成至OpenClawღ★✿，提供策略引擎ღ★✿、网络护栏ღ★✿、隐私路由ღ★✿，确保企业数据安全

　　这是企业IT的文艺复兴ღ★✿，一个原本2万亿美元规模的产业ღ★✿，即将成长为数万亿美元规模ღ★✿，从提供工具转向提供专业化的AI智能体服务ღ★✿。

　　我完全可以预见ღ★✿：未来ღ★✿，公司里的每一位工程师都将拥有年度token预算ღ★✿。他们年薪可能是几十万美元ღ★✿，我会额外给他们相当于薪资一半的token配额ღ★✿，让他们的产出放大10倍ღ★✿。入职附带多少token配额已经成为硅谷的新晋招聘话题ღ★✿。

　　每一家企业未来都将既是token的使用者（供工程师使用）ღ★✿，也是token的生产者（为其客户提供服务）ღ★✿。OpenClaw的意义不可低估ღ★✿，它和HTMLღ★✿、Linux一样重要ღ★✿。

　　我们在每一个领域都处于技术前沿ღ★✿，并承诺持续迭代——Nemotron 3之后有Nemotron 4ღ★✿，Cosmos 1之后有Cosmos 2ღ★✿，Groq也将迭代到第二代ღ★✿。

　　Nemotron 3在OpenClaw中名列全球三大最佳模型之列ღ★✿，处于前沿水平ღ★✿。Nemotron 3 Ultra将成为有史以来最强的基础模型ღ★✿，支持各国构建主权AIღ★✿。

　　数字智能体在数字世界中行动——撰写代码ღ★✿、分析数据ღ★✿；而物理AI则是具身化的智能体ღ★✿，也就是机器人ღ★✿。

　　本次GTC共有110款机器人亮相ღ★✿，几乎囊括了全球所有机器人研发企业ღ★✿。英伟达提供三台计算机（训练计算机ღ★✿、仿真计算机ღ★✿、机载计算机）和完整的软件栈及AI模型ღ★✿。

　　自动驾驶方面ღ★✿，自动驾驶的ChatGPT时刻已经到来ღ★✿。今天ღ★✿，我们宣布四家新合作伙伴加入英伟达RoboTaxi Ready平台ღ★✿：比亚迪ღ★✿、现代ღ★✿、日产ღ★✿、吉利ღ★✿，合计年产量1,800万辆ღ★✿。加上此前的奔驰ღ★✿、丰田ღ★✿、通用ღ★✿，阵容进一步壮大ღ★✿。我们同时宣布与Uber达成重大合作ღ★✿，将在多个城市部署并接入RoboTaxi Ready车辆ღ★✿。

　　工业机器人方面ღ★✿，ABBღ★✿、Universal Roboticsღ★✿、KUKA等众多机器人企业与我们合作ღ★✿，将物理AI模型与仿真系统相结合ღ★✿，推动机器人在全球制造产线的落地ღ★✿。

　　电信方面ღ★✿，卡特彼勒（Caterpillar）和T-Mobile也在其列ღ★✿。未来ღ★✿，无线基站将不再只是一个通信节点ღ★✿，而是一个NVIDIA Aerial AI RAN——能够实时感知流量ღ★✿、调整波束成形ღ★✿，实现节能增效的智能化边缘计算平台ღ★✿。

　　黄仁勋ღ★✿：这正是因为物理仿真——基于NVIDIA Warp运行的Newton求解器ღ★✿，这是我们与Disney和DeepMind联合开发的ღ★✿，让你能够适应真实的物理世界ღ★✿。

　　黄仁勋ღ★✿：你能想象吗？未来的迪士尼乐园——所有这些机器人角色在园区里自由漫步ღ★✿。不过说实话ღ★✿，我以为你会更高一些ღ★✿。我从没见过这么矮的雪人ღ★✿。

　　推理拐点的到来ღ★✿：推理已成为AI最核心的工作负载ღ★✿，token是新的大宗商品ღ★✿，推理性能直接决定收入

　　AI工厂时代ღ★✿：数据中心已从文件存储设施演变为token生产工厂ღ★✿，未来每家公司都将以AI工厂效率来衡量自身竞争力

　　OpenClaw智能体革命ღ★✿：OpenClaw开启了智能体计算时代ღ★✿，企业IT正在从工具时代走向智能体时代ღ★✿，每家企业都需要制定OpenClaw战略

　　物理AI与机器人ღ★✿：具身智能正在规模化落地ღ★✿，自动驾驶ღ★✿、工业机器人ღ★✿、人形机器人共同构成物理AI的下一个重大机遇

　　深科技是聚焦人工智能与机器人领域的新兴专业科技媒体ღ★✿，凭借敏锐行业洞察力深耕技术创新与产业落地ღ★✿。业务覆盖前沿动态报道ღ★✿、核心技术解析及应用场景深度分析ღ★✿，重点聚焦人形机器人ღ★✿、AI 算力等热点赛道ღ★✿。以兼具深度与时效性的内容矩阵为核心ღ★✿，为行业从业者ღ★✿、投资者提供精准资讯与专业洞察ღ★✿，助力用户快速把握行业趋势与技术风口ღ★✿，是 AI 与机器人领域极具潜力的新兴信息服务平台ღ★✿。

640 (9)

必发·bifa(中国集团)唯一官方网站|http://www.yunchuangxiaowang.com

上一篇： 88bifa (中国区)官方网站|网络红人扒皮|2026年韩国人工智能及机器人展

下一篇： 7790cnm必发集团南方核|余生请多指教32集泄露版沃疆|心竞争混合

必发·bifa(中国集团)唯一官方网站

021-37100188