中国已经成功打造出无需依赖 Nvidia 芯片的大型人工智能模型。如今,OpenAI 也宣布,通过创新手段可大幅减少对 Nvidia 芯片的需求,将推理成本削减逾一半。尽管如此,Nvidia 股价依然上涨。
这为市场带来了新的疑问。OpenAI 是 Nvidia($NVDA)的核心客户之一,但即便其减少了对芯片的需求,Nvidia 股价仍然走高。
OpenAI 两大维度同步降低推理成本
首先是在软件层面。《The Information》报道称,OpenAI 工程师通过全新的优化方法,将模型推理成本大幅削减逾一半。目前,OpenAI 尚未公开详细技术细节。
降本手段有望大幅减少部分 ChatGPT 业务对 Nvidia 芯片的需求,同时也为 OpenAI 降低产品价格或提高用户调用上限提供了空间。
其次是硬件层面。6 月 24 日,OpenAI 与 Broadcom($AVGO)联合发布了自主研发的 Jalapeño 芯片(首款定制芯片)。OpenAI 称,初期测试显示,Jalapeño 的每瓦性能远超当前主流芯片,而其研发周期仅为 9 个月。
该芯片预计将于 2026 年底实现吉瓦级大规模部署,微软为首批重要合作伙伴。尽管如此,Nvidia 依然承担着 OpenAI 绝大多数推理任务的硬件支撑,哪怕 OpenAI 正在持续加码与 Broadcom 的芯片研发合作和资金投入。
科技巨头自研芯片竞赛加速
OpenAI 绝非独行者。早在 2016 年,Google 就已自主研发张量处理器(TPU),亚马逊也紧随其后推出自有芯片方案。市场调研机构 TrendForce预测,到 2026 年,ASIC 专用芯片服务器出货量将占 AI 服务器总发货量的 27.8%,创 2023 年以来新高。
据 TrendForce 统计,定制芯片的增速首次有望超过英伟达(Nvidia)GPU。博通(Broadcom)、Marvell 等供应商正在成为关键的定制芯片制造商,推动产业布局加速演进。
在中国,制裁同样加速了这一趋势。美团近期在国产芯片上成功训练了规模达 1.6 万亿参数的 LongCat-2.0 大模型,未使用任何英伟达硬件。
英伟达股价为何持续攀升?
挑战虽然真实存在,但数据展现出市场的冷静。6 月 30 日,英伟达股价单日上涨近 2%,公司市值已逼近 4.8 万亿美元。最新一季财报显示,数据中心业务单季营收创新高,达到 623 亿美元,同比暴涨 75%。
目前,主要压力集中在推理环节,而非训练阶段。在模型训练领域,英伟达依靠 2006 年上线的 CUDA 软件生态持续锁定开发者地位,定制芯片在灵活性上仍难以匹敌。
对于被质疑失守的推理市场,英伟达也在积极应对。在 GTC 大会上,英伟达宣布即将推出的 Rubin 平台,将单 Token 的推理成本较 Blackwell 降低多达 10 倍。推理成本下降有望进一步带动模型使用和整体算力需求提升。
当然,并非所有投资者都买账。一些资金已转向竞争对手芯片股,押注推理业务格局或将加速变化。然而,英伟达最新财季指引中,并未计入中国销售额,仍预期全球需求再创新高。
目前,英伟达生产的每一颗芯片依然被市场抢购一空。未来的真正考验在于——它的最大客户能否在市场扩张速度超过自身的被“去英伟达化”。









