阿里巴巴的“Qwen团队”再次取得突破

阿里巴巴的“Qwen团队”再次取得突破

继前几天免费开源发布全球性能最强的非推理大语言模型Qwen3-235B-A22B-2507后,该研究团队又推出了一款重磅模型——专注于软件开发辅助的开源大语言模型Qwen3-Coder-480B-A35B-Instruct。这款新模型能够处理复杂的多步骤编码工作流,并能在数秒或数分钟内创建完整可用的应用程序。该模型旨在与Claude Sonnet-4等专有产品在代理编码任务中竞争,并在开源模型中创下了新的基准分数。

与Claude等专有模型不同,Qwen3-Coder采用Apache 2.0开源许可,企业可免费下载、修改、部署并用于商业应用。该模型在第三方基准测试和AI高级用户的“氛围编码”使用中表现优异,以至于LLM研究员Sebastian Raschka在X平台上表示:“这可能是目前最好的编码模型。通用模型很酷,但如果你想要最好的编码能力,专业化才是王道。”

Qwen3-Coder采用混合专家(MoE)架构,总参数量达4800亿,每查询激活350亿参数,从160个专家中激活8个。它原生支持256K令牌上下文长度,通过YaRN技术可扩展至100万令牌。这种能力使模型能够一次性理解和操作整个代码库或长篇文档。作为因果语言模型,它具有62层,96个查询注意力头和8个键值对注意力头,专为高效令牌的指令跟随任务优化。

在多项代理评估套件中,Qwen3-Coder在开源模型中表现领先:SWE-bench Verified达到67.0%(标准)和69.6%(500轮),优于GPT-4.1的54.6%和Gemini 2.5 Pro Preview的49.0%,接近Claude Sonnet-4的70.4%。该模型在代理浏览器使用、多语言编程和工具使用等任务中也表现优异。视觉基准显示,在代码生成、SQL编程、代码编辑和指令跟随等类别中,训练迭代带来了持续改进。

除了模型本身,Qwen还开源了从Gemini Code分叉而来的CLI工具Qwen Code。该接口支持函数调用和结构化提示,便于将Qwen3-Coder集成到编码工作流中。Qwen Code支持Node.js环境,可通过npm或源码安装。Qwen3-Coder还能与Claude Code、Cline、Ollama、LMStudio、MLX-LM、llama.cpp和KTransformers等开发者平台集成。

在7.5万亿令牌(70%为代码)的预训练基础上,Qwen3-Coder还受益于先进的训练后技术:代码强化学习(Code RL)强调在多样化、可验证的代码任务上进行高质量、执行驱动的学习;长视野代理强化学习(Long-Horizon Agent RL)训练模型在多轮交互中进行规划、使用工具和适应。为此,Qwen在阿里云上构建了包含20,000个环境的系统,为评估和训练模型处理复杂工作流提供了必要规模。

对企业而言,Qwen3-Coder提供了强大且开放的选择。其在编码执行和长上下文推理方面的优异表现特别适合:代码库级理解——理解大型仓库、技术文档或架构模式;自动化拉取请求工作流——其跨轮次规划和适应能力适合自动生成或审查拉取请求;工具集成和编排——通过原生工具调用API和函数接口,模型可嵌入内部工具和CI/CD系统。作为开源模型,企业可自主部署Qwen3-Coder,避免供应商锁定并更直接地管理计算使用。

为优化使用Qwen3-Coder,Qwen团队建议:采样设置temperature=0.7、top_p=0.8、top_k=20、repetition_penalty=1.05;输出长度可达65,536令牌;Transformers版本需4.51.0或更高。API和SDK示例使用OpenAI兼容的Python客户端提供,开发者可定义自定义工具并让Qwen3-Coder在对话或代码生成任务中动态调用。

Qwen3-Coder-480B-A35B-Instruct在AI研究人员、工程师和开发者中获得了积极反响。除Raschka的高度评价外,EllamindAI的AI工程师Wolfram Ravenwolf在X平台上分享了他将模型与Claude Code集成的体验,称“这无疑是目前最好的”。教育工作者Kevin Nelson在使用该模型进行模拟任务后也表示“Qwen 3 Coder处于另一个水平”。Twitter联合创始人Jack Dorsey也发帖称赞该模型与他的开源AI代理框架Goose的结合效果。

虽然本次发布聚焦于最强大的4800亿参数版本,但Qwen团队表示正在开发更多规模的模型,以降低部署成本,扩大可及性。未来工作还包括探索自改进,研究代理模型能否通过实际使用迭代提升自身性能。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/a-li-ba-ba-de-qwen-tuan-dui-zai-ci-qu-de-tu-po

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年7月24日
Next 2025年7月24日

相关推荐

发表回复

Please Login to Comment