出品/未来科技界
作者/张永堃
编辑/李彦
头图/截自品牌官网
LongCat-2.0持续刷榜OpenRouter平台,由国产算力训推的万亿大模型终于来了。
4月29日,一个名为“Owl Alpha”的匿名模型悄然登上OpenRouter平台。在无人知晓其背景的情况下,这个模型月处理Token量超过10万亿,总调用量一度冲进平台前三,仅次于Claude系列等头部模型。
直到6月30日,美团正式发布LongCat-2.0,这个持续数月霸榜的匿名模型终于揭开面纱:Owl Alpha正是LongCat此前用于真实环境测试的版本。
作为一个生活服务平台,外界并不会将美团与AI大模型强绑定,但美团不仅做出了一个能在OpenRouter持续刷榜的模型,更关键的是,它还是首个由国产算力完成训练和推理的万亿参数规模大模型。放在当下AI竞赛的大环境里,这无疑为行业提供了一个新的观察样本。
同样是握有海量用户的平台,阿里、字节和美团在AI上的切入点并不相同。阿里B端C端都想要,一方面依靠开源模型连接开发者和企业客户,另一方面推广千问App,意在把握AI时代的新流量入口;而有着“App工厂”之称的字节,推出了可能是国民度最高的AI应用——豆包,并且在图片、视频等多模态模型持续发力。那么,为什么美团做的大模型,是LongCat这一形态?
第一个因素,就是场景。
用户打开美团时,需求通常高度明确:点一份外卖、预订一家餐厅、叫一辆网约车、购买一张电影票……这些场景的共同特征是决策链路短、交易导向强、停留时间有限。对美团而言,用户的核心行为并不是内容消费或长时间互动,而是在明确需求驱动下快速完成服务匹配与交易闭环。
也正因如此,美团并不天然具备承载长期AI对话的内容生态,用户也缺少为了“聊天”而主动打开美团的心智。相比通用聊天助手,美团更适合让AI嵌入具体交易场景,提升需求理解、服务推荐和履约效率。
这种场景属性,决定了LongCat从诞生之初就不是聊天机器人,而是业务的大脑——它已在商家经营决策、智能客服、代码研发等场景落地,并具备向配送调度、AI Agent等领域延伸的能力。
第二个因素,是基因。
美团是一个极其讲究效率的公司,因此LongCat从技术设计来看,几乎每一个特点也是围绕着“效率”这个目标展开。
LongCat-2.0采用MoE(混合专家)架构,总参数达到1.6万亿,但单次推理仅激活约480亿参数,在保证模型能力的同时显著降低计算成本。支持100万Token超长上下文,使模型能够一次处理大量信息,更适合复杂任务规划和Agent协同。
在近期部分Agent能力评测中,LongCat在工具调用、复杂任务执行等维度表现突出。这与美团的整体定位一致:重心不在对话交互的自然度,而在任务完成的可靠性。
最后一个因素,是战略和成本的平衡。
美团的战略选择与其整体投资风格高度一致。王兴在2026年6月的股东大会上曾明确表示,美团在AI上的投入“会比较理性、有财务纪律地去投入”。这句话背后,其实是美团对AI商业价值的清醒判断:对于一家交易平台而言,AI不是用来陪用户聊天的流量入口,而是用来缩短决策链路、提升履约效率、降低运营成本的底层工具。与其烧钱再造一个消费级AI应用,不如让AI直接嵌入现有业务流程,用更可控的投入撬动更确定的效率回报。
这种务实,也延伸到了LongCat-2.0的算力选择上。LongCat-2.0另一个引人关注的标签,是其训练和推理过程完全建立在国产算力基础之上。放在当前国产AI基础设施的语境下,这是关乎工程效率、供应安全和长期成本的现实选择。
当前国产算力替代面临的一个普遍痛点,是训练和推理分属不同硬件体系所带来的迁移成本。部分企业在训练阶段依赖英伟达,推理阶段再尝试国产替代,最典型的就是DeepSeek-V4。模型上线前往往要经历算子重写、性能调优、精度对齐等一系列工程适配。这个过程不仅耗时,也会拉高模型落地的不确定性。
LongCat-2.0选择在昇腾生态内完成“训推一体化”,则绕开了这道迁移关卡。训练、推理运行在同一硬件和软件生态中,意味着模型从研发到上线的链路更短,适配成本更低,工程可控性也更强。
从安全维度看,国产算力自主可控对美团有现实意义。外卖、到店、酒旅、打车等核心业务对系统稳定性要求极高,算力层面的供应波动可能直接影响数亿用户的日常消费。在当前全球半导体供应链不确定性上升的背景下,这一考量权重正在提升。一旦供应链出现波动,美团不需要在“训练用A、推理用B”的额外适配中消耗资源,技术自主可控的程度更高。
成本控制同样不能忽视。过去几年,国际高端芯片采购价格持续走高,供应渠道也日趋收紧。对于需要长期投入大模型训练和推理的平台型公司来说,持续依赖进口算力,很难形成稳定、可预期的成本结构。国产芯片虽然在单卡性能上与国际领先产品仍有差距,但随着集群规模扩大、软件生态完善和工程调优能力提升,整体部署成本正在下降,性价比优势开始显现。结合美团当下与淘宝闪购、京东外卖的用户抢夺战还未完全结束,有着业绩压力的美团在成本控制方面无疑会更加严格。
据美团官方披露,LongCat在5万卡昇腾集群上的实践表明,通过弹性扩缩容、自动故障恢复等技术优化,月均日故障率下降约70%,训练算力利用率提升约1.5倍,实现了用更少资源完成更多训练任务,这意味着在同等投入下,国产方案已经能够支撑起万亿参数模型的训练和日常推理。
这些成果并非一蹴而就。据美团官方消息报道,美团自2023年起便开始围绕国产算力展开适配,从千卡集群逐步推进通信优化、算子适配等基础工作。这一持续投入,如今成为LongCat快速迭代的基础条件之一。
过去一年,行业讨论最多的是谁拥有更强的通用能力。但LongCat的出现让另一个趋势浮出水面:大模型的下半场,比拼的不再是单纯的参数军备竞赛,而是深入真实产业场景的落地速度。美团用“万亿参数”与“国产算力”交出的这幅答卷证明,不烧钱做消费级流量入口,将AI化为底层工具去缩短决策链路、提升履约效率,同样能跑出一条高性价比的突围之路。在通用红利逐渐见顶的当下,这种将技术彻底扎进产业土壤的务实选择,不失为AI商业化闭环的典型样本。
24小时热榜
热门视频
