
来自初创公司 Anysphere 的 Vibe 编程工具 Cursor,在其 Cursor 2.0 平台更新中,正式推出了首款自研的专有编程大语言模型(LLM)——Composer。这款模型专为在生产级环境中快速且精准地执行编程任务而设计,标志着 AI 辅助编程领域迎来了新的发展阶段。目前,Cursor 自身的工程团队已在日常开发工作中使用 Composer,这一实际应用场景充分证明了该模型已具备成熟度与稳定性。
据 Cursor 介绍,Composer 在处理大多数交互任务时,耗时可控制在 30 秒以内,同时在大型复杂代码库的处理过程中,仍能保持高水平的推理能力。该模型不仅速度出众,被描述为比同等智能水平的系统快四倍,还针对 “智能体化” 工作流进行了训练。在这种工作流中,自主编程智能体能够协同完成规划、编写、测试和审查代码等一系列任务,大幅提升编程效率。
在此之前,Cursor 主要依托来自 OpenAI、Anthropic、Google 以及 xAI 等知名企业的主流专有大语言模型,来支持其 “Vibe 编程” 功能。所谓 “Vibe 编程”,即借助 AI,根据用户(即便用户没有接受过专业开发培训)的自然语言指令来编写或补全代码。此次推出 Composer 后,原有依托外部模型的 “Vibe 编程” 选项依然对用户开放,为用户提供了更多选择。
为了全面评估 Composer 的能力,Cursor 采用了 “Cursor Bench” 作为基准测试工具。这一内部评估套件源自真实开发智能体的需求,测试维度不仅包括代码的正确性,还涵盖模型对现有抽象概念、风格规范以及工程实践的遵循程度。测试结果显示,Composer 在达到前沿级编程智能水平的同时,生成速度可达每秒 250 个令牌。这一速度约为领先的快速推理模型的两倍,更是同类前沿系统的四倍,性能表现十分突出。
Cursor 公布的对比数据将各类模型划分为多个类别,包括 “最佳开源模型”(如 Qwen Coder、GLM 4.6)、“快速前沿模型”(如 Haiku 4.5、Gemini Flash 2.5)、“2025 年 7 月前沿模型”(即年中可用的最强模型)以及 “最佳前沿模型”(包括 GPT-5 和 Claude Sonnet 4.5)。在这些类别中,Composer 的智能水平与年中前沿模型相当,而生成速度在所有测试模型类别中均创下最高纪录,展现出了卓越的综合性能。
关于 Composer 的技术架构,Cursor 的研究科学家萨沙・拉什(Sasha Rush)在社交平台 X 上发布的帖子中进行了详细解读。他表示,Composer 是一款基于强化学习(RL)的混合专家(MoE)模型,团队通过强化学习训练出了一个大型混合专家模型,使其在实际编程任务中既能表现出色,又能保持高速运行。拉什还提到,团队将 Composer 与 Cursor 环境进行了协同设计,以确保该模型能够在生产级规模下高效运行。他强调,与其他机器学习系统不同,在全规模系统中可抽象的部分非常有限,因此团队通过协同设计项目与 Cursor 平台,才实现了智能体在必要规模下的稳定运行。
在训练过程中,Composer 并未依赖静态数据集,而是以真实的软件工程任务为训练基础。训练期间,该模型在完整的代码库中运行,并借助一系列生产工具(包括文件编辑、语义搜索和终端命令等)来解决复杂的工程问题。每一次训练迭代都会围绕具体的挑战展开,例如完成代码编辑、制定开发计划或生成针对性说明等,通过这种实战式训练,不断提升模型的实战能力。
强化学习循环在训练过程中发挥了关键作用,它同时对模型的正确性和效率进行优化。通过这一循环,Composer 逐渐学会了如何做出有效的工具选择、运用并行处理技术,以及避免产生不必要或推测性的响应。随着训练的推进,模型还逐渐形成了一些 emergent 行为,如自主运行单元测试、修复代码检查器(linter)错误以及执行多步骤代码搜索等,进一步增强了其自主解决问题的能力。这种设计使得 Composer 能够与终端用户处于相同的运行时环境中,更贴合实际编程场景,能够妥善处理版本控制、依赖管理和迭代测试等常见问题。
Composer 的研发并非一蹴而就,其前身是 Cursor 内部一款名为 Cheetah 的原型模型。当时,Cursor 开发 Cheetah 主要是为了探索低延迟推理在编程任务中的应用。拉什在 X 上表示:“Cheetah 是该模型的 0 版本,主要用于测试速度。而我们的数据显示,Composer 在保持相同速度的同时,智能水平有了极大提升。”Cheetah 在降低延迟方面的成功,让 Cursor 意识到速度是影响开发者信任度和工具可用性的关键因素。在此基础上研发的 Composer,不仅延续了 Cheetah 出色的响应速度,还在推理能力和任务泛化能力上实现了显著提升。
参与 Cheetah 早期测试的开发者反馈称,其超快的速度改变了他们的工作方式,有用户表示 “速度快到让我在使用过程中能够始终保持专注”。而 Composer 在保持这一优势速度的基础上,进一步将功能拓展到多步骤编程、代码重构和测试任务等更广泛的领域,实用性大幅增强。
作为 Cursor 2.0 平台更新的重要组成部分,Composer 已与该平台实现深度整合。Cursor 2.0 是 Anysphere 公司推出的一款重要的智能体化开发环境更新,其中引入了多智能体界面,支持最多 8 个智能体并行运行,每个智能体都能在独立的工作空间(借助 git 工作树或远程机器)中开展工作。在这一系统中,Composer 既可以作为一个或多个智能体独立执行任务,也能与其他智能体协同工作。开发者可以对比多个并行运行的智能体所生成的结果,并从中挑选出最优输出,极大地提升了开发效率和代码质量。
为了进一步提升 Composer 的效用,Cursor 2.0 还配备了一系列辅助功能。其中,编辑器内浏览器(已正式发布)允许智能体在集成开发环境(IDE)内部直接运行和测试代码,并将文档对象模型(DOM)信息反馈给模型,为模型提供更丰富的上下文信息;改进后的代码审查功能能够聚合多个文件的差异,方便开发者更快地检查模型生成的代码变更;沙盒终端(已正式发布)则可以隔离智能体运行的 shell 命令,确保本地执行的安全性;语音模式功能支持通过语音转文字的方式来启动或管理智能体会话,为开发者提供了更便捷的操作方式。这些平台更新不仅丰富了 Cursor 的整体使用体验,更让 Composer 作为支撑快速、可靠智能体化编程的技术核心地位愈发凸显。
为了实现 Composer 的大规模训练,Cursor 搭建了一套定制化的强化学习基础设施,该设施结合了 PyTorch 和 Ray 框架,能够支持数千块 NVIDIA GPU 进行异步训练。团队还研发了专门的 MXFP8 混合专家内核和混合分片数据并行技术,在实现大规模模型更新的同时,将通信开销降至最低。这种配置使得 Cursor 能够在低精度环境下直接训练模型,无需在训练后进行量化处理,从而在推理速度和效率上都实现了优化。
Composer 的训练过程还依赖于数十万个并发运行的云原生沙盒环境,每个沙盒环境都是一个独立的编程工作空间。为了满足大规模强化学习运行过程中负载不稳定的特点,Anysphere 公司对其后台智能体基础设施进行了改造,实现了虚拟机的动态调度,确保训练过程的高效稳定。
在企业应用层面,Composer 性能的提升得到了 Cursor 代码智能栈全栈基础设施改进的支持。公司对语言服务器协议(LSP)进行了优化,显著提升了诊断和导航速度,尤其在 Python 和 TypeScript 项目中效果明显。这些优化减少了 Composer 在与大型代码库交互或生成多文件更新时的延迟,提升了企业开发效率。
对于企业用户,Cursor 提供了全面的管理控制功能,管理员可以通过团队规则、审计日志和沙盒强制机制,对 Composer 及其他智能体进行有效管理。此外,Cursor 的团队版和企业版还支持模型使用量池化、SAML/OIDC 身份认证,以及用于监控整个组织内智能体性能的分析功能,满足企业在安全性、可管理性和可监控性方面的需求。
在定价方面,Cursor 为个人用户提供了从免费(兴趣版)到高级版(每月 200 美元)的多个套餐,其中专业增强版和高级版用户享有更高的使用额度。面向企业客户,团队版的定价为每位用户每月 40 美元起,企业定制合同则可根据客户需求提供定制化的使用权限和合规选项,满足不同规模企业的需求。
在竞争日益激烈的 AI 编程领域,Composer 凭借其对速度、强化学习的重视以及与实时编程工作流的深度整合,与 GitHub Copilot、Replit 的 Agent 等其他 AI 开发辅助工具形成了差异化竞争。与这些工具不同,Composer 并非一个被动的建议引擎,而是专为持续的、智能体驱动的协作而设计,多个自主系统能够直接与项目代码库进行交互,实现更深度的开发协同。
Composer 在模型层面的专业化设计 —— 即训练 AI 使其能够在实际运行环境中发挥作用,是朝着实现实用化、自主化软件开发迈出的重要一步。该模型的训练不仅依赖文本数据或静态代码,而是在一个能够模拟生产环境的动态 IDE 中进行,使得模型能够更好地适应实际开发场景,提升了其在真实开发工作中的实用性。拉什认为,这种训练方法对于实现模型在实际应用中的可靠性至关重要,因为通过这种方式,模型不仅学会了如何生成代码,更掌握了在具体语境中对代码进行整合、测试和优化的能力。
对于企业开发者和 Vibe 编程而言,Composer 的推出意义重大。Cursor 带来的不仅仅是一个速度更快的模型,更是一个针对实际应用场景优化的 AI 系统,它能够在开发者日常依赖的工具环境中运行。强化学习、混合专家架构设计以及与产品的深度整合,共同赋予了 Composer 在速度和响应性方面的实用优势,使其区别于通用语言模型。
虽然 Cursor 2.0 为多智能体协作提供了基础设施支持,但 Composer 才是让这些工作流得以实现的核心创新。作为首款专为智能体化、生产级编程设计的模型,Composer 让人们得以提前窥见未来日常编程的可能形态 —— 人类开发者与自主模型将在同一个工作空间中协同工作,共同推动软件开发行业的变革。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/bian-cheng-ping-tai-cursor-tui-chu-shou-kuan-zi-yan-da-yu