当前位置:首页 > 财经新闻 > 英伟达下场“养虾” 全力押注万亿级AI推理时代

英伟达下场“养虾” 全力押注万亿级AI推理时代

2026年03月18日63021

  全球算力巨头正在从芯片巨头转型AI工厂,押注推理市场的机遇。在3月17日开幕的2026年度英伟达GTC大会(GPU技术大会)上,英伟达首席执行官黄仁勋大幅上调新一代收入预期,剑指1万亿美元目标,并正式推出下一代硬件平台,以及发布支持“养虾”的软件栈等产品。

英伟达下场“养虾” 全力押注万亿级AI推理时代
图片来源于网络,如有侵权,请联系删除

  业内人士感叹,今年GTC释放出的一个强烈信号便是推理时代正在加速到来。同时,英伟达新型计算架构将引领散热、封装材料等产业领域变革。

英伟达下场“养虾” 全力押注万亿级AI推理时代
图片来源于网络,如有侵权,请联系删除

  加码AI推理

  在本次GTC大会上,英伟达强调,面向的新阶段,推理将成为AI基础设施竞争的核心,公司正式推出下一代计算平台Vera Rubin和Groq3 LPU(语言处理单元)芯片。

  “过去提到Hopper,我会举起一块芯片;但提到Vera Rubin,大家想到的是整个系统。”英伟达创始人兼首席执行官黄仁勋预估,过去几年里,计算需求增长了100万倍,并预计2025到2027年期间,该需求增长将至少为公司带来1万亿美元收入。

  本次亮相的英伟达Vera Rubin平台包含7款芯片、5套机架级系统,以及一台面向代理式AI的超级,包括全新Vera CPU与Blue Field-4S TX存储架构。相比上一代Blackwell平台,新平台训练大型混合专家模型所需GPU数量仅为其四分之一,推理吞吐量/瓦特提升高达10倍。

  会上,黄仁勋重点介绍了推理芯片Groq 3 LPU,解密了2月份业绩说明会上预留的“彩蛋”。这款芯片源自英伟达去年12月以约200亿美元收购Groq核心技术资产,定位为Rubin GPU的“推理协处理器”,扛起了英伟达推理战略布局的大旗。

  黄仁勋表示,在AI智能体时代,推理需求正加速分化。面对需要极高交互性、超短响应时间的任务,传统GPU架构存在性能冗余。为此,英伟达引入了专注于“极致低延迟Token生成”的LPU架构,与GPU形成分工协作。其中,Vera Rubin负责需要海量计算的“预填充”阶段,而 LPU则负责对延迟极度敏感的“解码”阶段,在这种混合架构下,系统的推理吞吐量与功耗比最高可提升35倍。

  “AI推理时代要拼的,不再只是峰值参数,而是能否围绕真实负载做更细颗粒度的异构优化,把每一份算力都尽可能用在刀刃上。”云天励飞相关负责人向记者表示,推理时代要追求极致性价比,越来越需要异构计算,针对推理计算过程中计算负载的特征进行细分,让不同硬件分别承担更适合的工作,从而把系统整体效率推到更高。英伟达此次展示的思路正是如此。云天励飞等国内AI芯片企业在围绕GPNPU、PD分离、3D堆叠存储等方面持续推进推理架构创新,实际上也正在沿着同一条产业方向前进。

  革新AI智能体

  OpenClaw作为开源的自主AI代理(AI Agent)平台,在全球掀起了“养虾”热。在本届GTC大会上,黄仁勋盛赞OpenClaw,称其“为所有人开启了AI的下一个前沿领域,并成为历史上发展最快的开源项目”,启动了个人智能体创建时代。

  英伟达打算下场“养虾”,宣布推出英伟达Nemo Claw软件栈,适用于OpenClaw智能体平台,让用户只需一个命令就能够安装,并提升AI智能体安全管理,以及可信度、可扩展性和易用性。

  本次大会上,英伟达还强化了软件合作,宣布与Cadence、西门子和等全球领先工业软件厂商合作,以及将英伟达CUDA-X、Omniverse软件平台以及GPU加速的工业软件与工具引入本田、捷豹路虎、三星、SK海力士和等企业,以加速工业设计、工程开发与制造流程。

  黄仁勋说:“一场新的工业革命已经拉开序幕,物理AI和自主AI智能体正在从根本上重塑全球的设计、工程与制造方式。通过与全球生态系统中的软件巨头、云服务提供商和OEM厂商通力合作,英伟达正提供一个全栈式加速计算平台,赋能各行各业以前所未有的规模和速度将这一愿景变为现实。”

  在本次发布会首日,英伟达股价上涨1.65%,股价报收于183.22美元/股;但在同日,A股英伟达产业链指数则出现回调,光模块概念领跌,下跌约10%,下跌3.33%,AI 龙头下跌约3%。

  引领新一代算力基建

  英伟达持续引领AI产业链变革。随着英伟达AI Fab架构日趋复杂,功耗飙升,传统风冷技术彻底触及物理极限。本次推出的Rubin机柜采用了100%全液冷设计,意味着液冷核心部件将成为新一代算力基建的核心刚需。

  本次大会上,控股子公司立敏达作为英伟达Vera Rubin架构Manifold(分水器)生态中唯一的中国大陆供应商亮相。作为液冷循环系统的核心关键环节,分水器与快接头的技术性能直接决定整个散热系统的效率与稳定性。

  另外,英伟达最新Rubin架构也可能催生封装材料变革。

  “由于Rubin架构对散热和信号传输的极端要求,的商业化进程被大幅提前。”深盟产业分析师卢兵表示,在极端的算力密度下,传统的有机基板(ABF)面临着严重的物理瓶颈。

  国内外厂商正处于从“技术验证”向“早期量产”跨越的关键节点。根据Yole Group等机构的预测,2026年是玻璃基板进入小批量商业化出货的节点,而在HBM(高带宽存储)与逻辑芯片封装领域,玻璃材料需求的复合年增长率预计高达33%。

  卢兵指出,国内拥有全球最完整的产业链和庞大的消费市场。利用这一规模优势,国内企业在部分材料与设备环节(如激光微孔设备)已有望率先取得突破,在AI算力芯片的底层供应链中占据核心席位。

(文章来源:证券时报)

扫描二维码推送至手机访问。

版权声明:本文由财界探秘发布,如需转载请注明出处。

“英伟达下场“养虾” 全力押注万亿级AI推理时代” 的相关文章

海国志丨美国史上第三尴尬!哈里斯确认特朗普赢得大选

海国志丨美国史上第三尴尬!哈里斯确认特朗普赢得大选

图片来源于网络,如有侵权,请联系删除   当地时间1月6日,美国副总统哈里斯主持国会参众两院联席会议,点数选举人票,正式确认前总统、共和党总统候选人特朗普当选总统。图片来源于网络,如有侵权,请联系删除   按照1887年通过的美国《选举计数法》,由副总统兼参议院议长主持国会两院联席会议...

抖音电商九项扶持新策,为新商家中小商家保驾护航

抖音电商九项扶持新策,为新商家中小商家保驾护航

  在电商行业快速发展的进程中,平台与商家之间的共赢共生关系,始终是推动行业蓬勃发展的不竭动力。随着市场竞争的日益激烈,如何降低经营成本、提升利润空间,成为了电商从业者不得不面对的难题。尤其是对于那些初入市场的新商家和规模有限的中小商家而言,如何在资源有限的情况下实现快速成长,更是一个亟待解决的难题...

央行12月末黄金储备7329万盎司 连续两个月扩大黄金储备

央行12月末黄金储备7329万盎司 连续两个月扩大黄金储备

  中国人民1月7日发布数据,中国2024年12月末外汇储备32023.57亿美元,环比减少635.03亿美元;12月末黄金储备1913.4亿美元,共7329万盎司,连续两个月扩大黄金储备。图片来源于网络,如有侵权,请联系删除   外汇局解读   国家外汇管理局公布2024年12月末外汇储...

AI同屏丨未来产业新地标“打卡”2025

AI同屏丨未来产业新地标“打卡”2025

2025年图片来源于网络,如有侵权,请联系删除你最想去的地方在哪里?图片来源于网络,如有侵权,请联系删除会遇见什么样的新风景? 地标是奔向新一年最好的“打卡点”向“新”出发走近中国未来产业新地标感受科技赋能的2025年以及更远未来 深空探测实验室 由国家航天局、安徽省、中国...

打通数字经济3.0“任督二脉”

打通数字经济3.0“任督二脉”

  仅40人的模具厂,却能年产3000万元,成为众多外资大厂的优质供应商;一个对中国市场并不熟悉的外国品牌,两三个月便能线上多渠道布局销售;初试东南亚市场的国内消费电子新品牌,借助当地节日热点快速提升本地知名度实现“种草”……这些以小博大、善用巧劲的商业故事各有精彩,但发力的关键点却很一致——数字化...

北京出租汽车暨汽车租赁协会与高德签署《聚合生态示范区2.0合作协议》

北京出租汽车暨汽车租赁协会与高德签署《聚合生态示范区2.0合作协议》

1月13日,北京出租汽车暨汽车租赁协会与高德聚合平台在北京签署《聚合生态示范区2.0合作协议》,推动巡游车与网约车的协同发展、行业高质量发展,保障从业人员权益,构建更加和谐、安全、高效的数字出行环境。图片来源于网络,如有侵权,请联系删除数字经济的发展,使得网约车行业逐渐成为城市交通的重要组成部分。北...