中国正式发布首个完全“去英伟达化”的大型 AI 模型。美团推出开放源代码的大语言模型 LongCat-2.0,参数规模高达 1.6 万亿。作为国内首家开展此类项目的企业,美团全程采用国产硬件进行训练与推理。
这一重大突破,正重塑全球 AI 行业对中国科技自主进程的认知。
LongCat-2.0 为全球 AI 竞争增添哪些新变量?
大语言模型是基于海量数据集训练的人工智能系统,能够在多个领域理解、生成和推理自然语言。LongCat-2.0 拥有 1.6 万亿参数和 100 万上下文窗口,跻身全球顶级规模之列。
美团此次发布正值 中国持续推动关键算力自主化 的关键时期。据美团介绍,LongCat-2.0 是业内首个全流程在国产硬件上实现训练及推理的超万亿参数大模型,这标志着国产 AI 技术迈出重要一步。
关注我们的 X 账号,第一时间获取最新动态。
这一差异尤为关键。DeepSeek 的 V4-pro 仅在模型推理阶段(即模型答复用户问题时)采用国产芯片。
相比之下,LongCat-2.0 在训练和推理两个核心环节均实现国产化,尤其是在技术壁垒更高的预训练阶段。
美团介绍,本次集群方案以大规模 ASIC 超级节点为核心,这类芯片针对特定计算任务专门定制。同时,团队还借助华为自研的 HCCL(华为分布式通信库)实现芯片间大规模协作,类似于英伟达 NCCL 之于 GPU 集群的作用。
“……这让我想起 Jensen Huang 在 Dwarkesh 播客中的观点:禁止英伟达 GPU 出口并不会阻止中国,反而会加速基于中国芯片的 AI 发展进程。”分析师 Yuchen Jin 在 X 平台表示。
LongCat-2.0 的全球意义何在?
LongCat-2.0 在多项权威测评上展现强劲表现。在 Terminal-Bench 2.1 和 SWE-Bench Pro 测试中,其能力已超越 Google 旧版本 Gemini 3.1 Pro。
不过,面对全球最顶尖的前沿模型,如 OpenAI 的 GPT-5.5 和 Anthropic 的 Opus 4.8,LongCat-2.0 在智能代理和复杂推理等高难度场景下仍存在一定差距。
业内观点迅速做出反应。科技分析师 TP Huang 表示,此次发布有力回应了外界对华为 Atlas-950 超级算力集群的疑虑。此外,莱希大学研究员孙瀚池指出,这是首个在 5 万颗国产加速器上实现接近前沿性能训练的模型。
“……如果中国能够在本土芯片上实现这一规模的前沿训练,算力竞赛将全面升级、格局更加开放。”创投合伙人 Alvin Foo 指出。
不过,整个中国 AI 技术栈仍面临不小挑战。美团坦言,其软件生态系统距离 NVIDIA 成熟的 GPU 社区还有差距。此外,预训练阶段的核心瓶颈在于内存限制,目前国产加速器单卡搭载的内存容量仍低于已被禁售的 NVIDIA H800 芯片。
本次成果在结构性上意义重大。美团的突破验证了中国本土硬件已具备支撑前沿大模型训练的可行性。
由此来看,中国开源大模型与西方封闭式顶级模型之间的差距,或许将比市场此前预期更快缩小。









