美团开源AI模型LongCat-Flash系列:挑战GPT-5的中国力量‌

美团开源AI模型LongCat-Flash系列:挑战GPT-5的中国力量‌

中国领先的生活服务电商平台美团在人工智能领域迈出重要一步,其最新开源的大型语言模型家族LongCat-Flash系列正引发全球AI社区广泛关注。这个包含基础模型LongCat-Flash和推理专用模型LongCat-Flash-Thinking的开源项目,以其5600亿参数的混合专家架构(MoE)和突破性的推理能力,被业界视为可与OpenAI旗舰产品GPT-5抗衡的重要竞争者。

美团从外卖巨头向AI先锋的转型始于2025年8月30日,当时公司首次发布了开源基础模型LongCat-Flash。该模型采用创新的混合专家架构,虽然总参数量高达5600亿,但通过动态激活机制,每个token实际仅激活186-313亿参数(平均约270亿),在保持强大性能的同时显著提升了计算效率。模型融合了多项前沿技术:MoE块中的零计算专家机制可根据需求智能分配计算资源;采用快捷连接MoE结构缓解扩展瓶颈;引入PID控制的专家偏置技术确保token激活稳定性;以及包括超参数迁移、确定性计算防护和精细化初始化策略在内的高效训练机制。在MMLU、MATH500和GPQA-diamond等基准测试中,LongCat-Flash-Chat版本展现出与商业闭源系统相当的竞争力,推理速度更突破每秒100个token,为实际部署提供了性能与效率的完美平衡。

仅仅两天后的9月1日,美团又发布了基于SGLang的规模化部署技术报告,解决了大型MoE模型在吞吐量与延迟之间的传统矛盾。关键技术突破包括:PD解耦技术分离预填充和解码阶段,缩短交互场景的首token响应时间;单批次重叠四阶段执行流水线,将通信密集型操作与密集计算重叠进行;宽专家并行技术通过增加并行度和批量大小来抵消通信开销;多步重叠调度将多个前向传递融合到单个调度周期;以及采用轻量级密集头和融合验证内核的多token预测技术。这些创新使得LongCat-Flash在NVIDIA H800集群上运行时,每个token的成本比部分小型模型降低一半以上,为需要高效响应的大规模应用场景提供了理想解决方案。

2025年9月23日,美团再次推出该系列的里程碑作品LongCat-Flash-Thinking,这是专为复杂推理任务优化的开源模型。其训练过程分为两个关键阶段:冷启动推理训练采用课程学习方法构建思维链推理能力,并在逻辑、数学和代理任务丰富的数据集上进行监督微调;大规模强化学习阶段则运用DORA框架实施领域并行训练方案,先在STEM、编程和代理任务上分别优化子模型,再融合为接近帕累托最优的完整系统。基准测试显示,Flash-Thinking在数学推理方面达到MATH500测试99.2%的惊人准确率,与GPT-5持平;在生物医学知识推理测试VitaBench上以29.5分微弱优势超越GPT-5;在定理证明任务MiniF2F中更以81.6%的通过率远超GPT-5的51.2%,创造了开源模型的新纪录。编程能力方面,LiveCodeBench测试79.4%的成绩仅比GPT-5低1分,而安全性能表现尤为突出,有害内容过滤和错误信息检测分别达到93.7%和93.0%,显著优于主流商业模型。特别值得注意的是,该模型在AIME-25等任务中实现了64.5%的token节约,平均token消耗从19653降至6965而不损失准确性。

为促进开发者生态建设,美团同步推出了宽松的API访问政策:每日免费配额从10万token提升至50万,经申请可扩展至500万;提供Claude代码配置集成支持;并完善了包括快速入门指南、变更日志和FAQ在内的文档体系。模型权重已在Hugging Face和GitHub开源,采用允许修改和商业使用的MIT许可协议。这一系列举措形成了从基础研究、工程优化、专业训练到开放接入的完整创新链条。

美团作为中国领先的本地生活服务平台,拥有7.7亿年交易用户和1450万商户的庞大规模。面对激烈的市场竞争和利润压力,公司公开承诺将投入”数十亿”资金发展AI和芯片能力。LongCat系列的推出不仅标志着其技术战略的重大转型,也展现了中国企业在全球AI竞赛中的创新实力。技术决策者特别关注该模型在三个方面带来的价值:对AI工程师而言,推理效率提升可大幅降低基础设施成本;对流程编排专家来说,领域并行强化学习带来了更可预测的专业任务表现;而数据和安全团队则看重其卓越的结构化任务处理能力与内置安全防护机制。

随着LongCat生态系统日趋成熟,美团正从外卖配送巨头蜕变为兼具前沿技术实力的AI创新者。这一转型不仅重塑着企业自身的发展轨迹,也为全球开源社区提供了对抗商业闭源模型的重要选择,预示着AI技术民主化进程的新阶段。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/mei-tuan-kai-yuan-ai-mo-xing-longcatflash-xi-lie-tiao-zhan

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年9月27日
Next 2025年9月28日

相关推荐

发表回复

Please Login to Comment