编程平台 Cursor 推出首款自研大语言模型 Composer，承诺四倍速度提升

王浩然 • 2025年11月3日下午5:00 • AI前沿 • 211 views

来自初创公司 Anysphere 的 Vibe 编程工具 Cursor，在其 Cursor 2.0 平台更新中，正式推出了首款自研的专有编程大语言模型（LLM）——Composer。这款模型专为在生产级环境中快速且精准地执行编程任务而设计，标志着 AI 辅助编程领域迎来了新的发展阶段。目前，Cursor 自身的工程团队已在日常开发工作中使用 Composer，这一实际应用场景充分证明了该模型已具备成熟度与稳定性。

据 Cursor 介绍，Composer 在处理大多数交互任务时，耗时可控制在 30 秒以内，同时在大型复杂代码库的处理过程中，仍能保持高水平的推理能力。该模型不仅速度出众，被描述为比同等智能水平的系统快四倍，还针对 “智能体化” 工作流进行了训练。在这种工作流中，自主编程智能体能够协同完成规划、编写、测试和审查代码等一系列任务，大幅提升编程效率。

在此之前，Cursor 主要依托来自 OpenAI、Anthropic、Google 以及 xAI 等知名企业的主流专有大语言模型，来支持其 “Vibe 编程” 功能。所谓 “Vibe 编程”，即借助 AI，根据用户（即便用户没有接受过专业开发培训）的自然语言指令来编写或补全代码。此次推出 Composer 后，原有依托外部模型的 “Vibe 编程” 选项依然对用户开放，为用户提供了更多选择。

为了全面评估 Composer 的能力，Cursor 采用了 “Cursor Bench” 作为基准测试工具。这一内部评估套件源自真实开发智能体的需求，测试维度不仅包括代码的正确性，还涵盖模型对现有抽象概念、风格规范以及工程实践的遵循程度。测试结果显示，Composer 在达到前沿级编程智能水平的同时，生成速度可达每秒 250 个令牌。这一速度约为领先的快速推理模型的两倍，更是同类前沿系统的四倍，性能表现十分突出。

Cursor 公布的对比数据将各类模型划分为多个类别，包括 “最佳开源模型”（如 Qwen Coder、GLM 4.6）、“快速前沿模型”（如 Haiku 4.5、Gemini Flash 2.5）、“2025 年 7 月前沿模型”（即年中可用的最强模型）以及 “最佳前沿模型”（包括 GPT-5 和 Claude Sonnet 4.5）。在这些类别中，Composer 的智能水平与年中前沿模型相当，而生成速度在所有测试模型类别中均创下最高纪录，展现出了卓越的综合性能。

关于 Composer 的技术架构，Cursor 的研究科学家萨沙・拉什（Sasha Rush）在社交平台 X 上发布的帖子中进行了详细解读。他表示，Composer 是一款基于强化学习（RL）的混合专家（MoE）模型，团队通过强化学习训练出了一个大型混合专家模型，使其在实际编程任务中既能表现出色，又能保持高速运行。拉什还提到，团队将 Composer 与 Cursor 环境进行了协同设计，以确保该模型能够在生产级规模下高效运行。他强调，与其他机器学习系统不同，在全规模系统中可抽象的部分非常有限，因此团队通过协同设计项目与 Cursor 平台，才实现了智能体在必要规模下的稳定运行。

在训练过程中，Composer 并未依赖静态数据集，而是以真实的软件工程任务为训练基础。训练期间，该模型在完整的代码库中运行，并借助一系列生产工具（包括文件编辑、语义搜索和终端命令等）来解决复杂的工程问题。每一次训练迭代都会围绕具体的挑战展开，例如完成代码编辑、制定开发计划或生成针对性说明等，通过这种实战式训练，不断提升模型的实战能力。

强化学习循环在训练过程中发挥了关键作用，它同时对模型的正确性和效率进行优化。通过这一循环，Composer 逐渐学会了如何做出有效的工具选择、运用并行处理技术，以及避免产生不必要或推测性的响应。随着训练的推进，模型还逐渐形成了一些 emergent 行为，如自主运行单元测试、修复代码检查器（linter）错误以及执行多步骤代码搜索等，进一步增强了其自主解决问题的能力。这种设计使得 Composer 能够与终端用户处于相同的运行时环境中，更贴合实际编程场景，能够妥善处理版本控制、依赖管理和迭代测试等常见问题。

Composer 的研发并非一蹴而就，其前身是 Cursor 内部一款名为 Cheetah 的原型模型。当时，Cursor 开发 Cheetah 主要是为了探索低延迟推理在编程任务中的应用。拉什在 X 上表示：“Cheetah 是该模型的 0 版本，主要用于测试速度。而我们的数据显示，Composer 在保持相同速度的同时，智能水平有了极大提升。”Cheetah 在降低延迟方面的成功，让 Cursor 意识到速度是影响开发者信任度和工具可用性的关键因素。在此基础上研发的 Composer，不仅延续了 Cheetah 出色的响应速度，还在推理能力和任务泛化能力上实现了显著提升。

参与 Cheetah 早期测试的开发者反馈称，其超快的速度改变了他们的工作方式，有用户表示 “速度快到让我在使用过程中能够始终保持专注”。而 Composer 在保持这一优势速度的基础上，进一步将功能拓展到多步骤编程、代码重构和测试任务等更广泛的领域，实用性大幅增强。

作为 Cursor 2.0 平台更新的重要组成部分，Composer 已与该平台实现深度整合。Cursor 2.0 是 Anysphere 公司推出的一款重要的智能体化开发环境更新，其中引入了多智能体界面，支持最多 8 个智能体并行运行，每个智能体都能在独立的工作空间（借助 git 工作树或远程机器）中开展工作。在这一系统中，Composer 既可以作为一个或多个智能体独立执行任务，也能与其他智能体协同工作。开发者可以对比多个并行运行的智能体所生成的结果，并从中挑选出最优输出，极大地提升了开发效率和代码质量。

为了进一步提升 Composer 的效用，Cursor 2.0 还配备了一系列辅助功能。其中，编辑器内浏览器（已正式发布）允许智能体在集成开发环境（IDE）内部直接运行和测试代码，并将文档对象模型（DOM）信息反馈给模型，为模型提供更丰富的上下文信息；改进后的代码审查功能能够聚合多个文件的差异，方便开发者更快地检查模型生成的代码变更；沙盒终端（已正式发布）则可以隔离智能体运行的 shell 命令，确保本地执行的安全性；语音模式功能支持通过语音转文字的方式来启动或管理智能体会话，为开发者提供了更便捷的操作方式。这些平台更新不仅丰富了 Cursor 的整体使用体验，更让 Composer 作为支撑快速、可靠智能体化编程的技术核心地位愈发凸显。

为了实现 Composer 的大规模训练，Cursor 搭建了一套定制化的强化学习基础设施，该设施结合了 PyTorch 和 Ray 框架，能够支持数千块 NVIDIA GPU 进行异步训练。团队还研发了专门的 MXFP8 混合专家内核和混合分片数据并行技术，在实现大规模模型更新的同时，将通信开销降至最低。这种配置使得 Cursor 能够在低精度环境下直接训练模型，无需在训练后进行量化处理，从而在推理速度和效率上都实现了优化。

Composer 的训练过程还依赖于数十万个并发运行的云原生沙盒环境，每个沙盒环境都是一个独立的编程工作空间。为了满足大规模强化学习运行过程中负载不稳定的特点，Anysphere 公司对其后台智能体基础设施进行了改造，实现了虚拟机的动态调度，确保训练过程的高效稳定。

在企业应用层面，Composer 性能的提升得到了 Cursor 代码智能栈全栈基础设施改进的支持。公司对语言服务器协议（LSP）进行了优化，显著提升了诊断和导航速度，尤其在 Python 和 TypeScript 项目中效果明显。这些优化减少了 Composer 在与大型代码库交互或生成多文件更新时的延迟，提升了企业开发效率。

对于企业用户，Cursor 提供了全面的管理控制功能，管理员可以通过团队规则、审计日志和沙盒强制机制，对 Composer 及其他智能体进行有效管理。此外，Cursor 的团队版和企业版还支持模型使用量池化、SAML/OIDC 身份认证，以及用于监控整个组织内智能体性能的分析功能，满足企业在安全性、可管理性和可监控性方面的需求。

在定价方面，Cursor 为个人用户提供了从免费（兴趣版）到高级版（每月 200 美元）的多个套餐，其中专业增强版和高级版用户享有更高的使用额度。面向企业客户，团队版的定价为每位用户每月 40 美元起，企业定制合同则可根据客户需求提供定制化的使用权限和合规选项，满足不同规模企业的需求。

在竞争日益激烈的 AI 编程领域，Composer 凭借其对速度、强化学习的重视以及与实时编程工作流的深度整合，与 GitHub Copilot、Replit 的 Agent 等其他 AI 开发辅助工具形成了差异化竞争。与这些工具不同，Composer 并非一个被动的建议引擎，而是专为持续的、智能体驱动的协作而设计，多个自主系统能够直接与项目代码库进行交互，实现更深度的开发协同。

Composer 在模型层面的专业化设计 —— 即训练 AI 使其能够在实际运行环境中发挥作用，是朝着实现实用化、自主化软件开发迈出的重要一步。该模型的训练不仅依赖文本数据或静态代码，而是在一个能够模拟生产环境的动态 IDE 中进行，使得模型能够更好地适应实际开发场景，提升了其在真实开发工作中的实用性。拉什认为，这种训练方法对于实现模型在实际应用中的可靠性至关重要，因为通过这种方式，模型不仅学会了如何生成代码，更掌握了在具体语境中对代码进行整合、测试和优化的能力。

对于企业开发者和 Vibe 编程而言，Composer 的推出意义重大。Cursor 带来的不仅仅是一个速度更快的模型，更是一个针对实际应用场景优化的 AI 系统，它能够在开发者日常依赖的工具环境中运行。强化学习、混合专家架构设计以及与产品的深度整合，共同赋予了 Composer 在速度和响应性方面的实用优势，使其区别于通用语言模型。

虽然 Cursor 2.0 为多智能体协作提供了基础设施支持，但 Composer 才是让这些工作流得以实现的核心创新。作为首款专为智能体化、生产级编程设计的模型，Composer 让人们得以提前窥见未来日常编程的可能形态 —— 人类开发者与自主模型将在同一个工作空间中协同工作，共同推动软件开发行业的变革。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/bian-cheng-ping-tai-cursor-tui-chu-shou-kuan-zi-yan-da-yu

AI 编程 Composer Cursor Cursor 2.0 企业开发多智能体协作大语言模型强化学习混合专家架构编程效率

Like (0)

王浩然作者

0 0

NVIDIA 计划向 AI 编程初创公司 Poolside 追加至多 10 亿美元投资

Previous 2025年11月3日

AI 更倾向于 “读文字” 而非 “看视频”：视觉语言模型的文本依赖现象

Next 2025年11月3日

AI前沿

当 AI 融入运营，可解释性不可或缺

在当今数字化时代，人工智能（AI）正以前所未有的速度融入企业运营的各个环节，从生产制造到客户服务，从供应链管理到市场营销，AI 的应用为企业带来了显著的效率提升和创新机遇。然而，随…

王浩然
2026年1月12日
000
AI前沿

为什么微服务可能会随着单体应用的强势回归而终结

随着科技公司认识到单片架构的局限性，向微服务的转变在 2010 年代初开始获得发展势头。然而，亚马逊 (Prime Video)、Invision、Istio 和 Segment等…

王浩然
2024年12月1日
000
AI前沿

Google虚拟卫星AlphaEarth如何重新定义全球地球测绘‌

我们正见证地理空间技术的革命性突破。Google最新推出的虚拟卫星系统AlphaEarth正在彻底改变人类对地球的认知方式，通过融合人工智能、量子计算与分布式传感网络，构建出前所未…

王浩然
2025年8月10日
000
AI前沿

Meta 发布了谷歌播客生成器的“开放”版本

Meta 发布了Google NotebookLM 中病毒式生成播客功能的“开放”实现。该项目名为NotebookLlama，不出所料，它使用 Meta 自己的Llama模型进行…

王浩然
2024年10月28日
000
AI前沿

AI编程工具新趋势：终端界面成为开发者新战场‌

在AI辅助编程工具持续演进的浪潮中，2025年出现了一个令人意外的技术转向——主流AI实验室和初创公司正在将开发工具的重心从传统代码编辑器转向命令行终端界面。这一变革正在重塑软件开…

王浩然
2025年7月18日
000
AI前沿

为何 AI 看似千篇一律：Replit 首席执行官谈 “草率之作”、“玩具” 与缺失要素

在人工智能（AI）蓬勃发展的今天，尽管 AI 技术取得了显著进步，应用也日益广泛，但一种观点认为 AI 给人的感觉有些 “千篇一律”。Replit 首席执行官就这一现象发表了见解，…

王浩然
2026年1月12日
000
AI前沿

Fixify 获得 2500 万美元 A 轮融资，利用人工智能和人类专家革新 IT 服务台

Fixify是一家创新型公司，将人工智能与人类专业知识相结合，以增强 IT 服务台，该公司已成功在 A 轮融资中筹集了 2500 万美元。这笔投资由Costanoa Venture…

点点
2024年10月24日
000
AI前沿

五角大楼称人工智能正在加速其“杀伤链”

OpenAI 和 Anthropic 等领先的人工智能开发商正在努力向美国军方出售软件：让五角大楼更有效率，但又不让他们的人工智能杀人。五角大楼首席数字和人工智能官拉达·普拉姆博…

王浩然
2025年1月20日
000
AI前沿

英国与新加坡结盟，引领金融领域人工智能发展

在全球化与数字化浪潮交织的今天，国际间合作已成为推动技术革新与产业升级的关键力量。近期，英国与新加坡宣布结成战略联盟，旨在共同指导金融领域的人工智能（AI）应用与发展。这一举措不仅…

王浩然
2025年7月10日
000
AI前沿

百度发布新型LLM：ERNIE 4.5与ERNIE X1，成本低于DeepSeek与OpenAI，但尚未开源‌

近日，中国搜索引擎巨头百度宣布推出两款全新的人工智能模型——ERNIE 4.5与ERNIE X1。ERNIE 4.5作为一款多模态语言模型，而ERNIE X1则专注于推理能力。百度…

王浩然
2025年3月20日
000
AI前沿

人工智能驱动的沟通平台如何缓解医护人员职业倦怠

医护人员职业倦怠问题已持续恶化七年，美国疾病控制与预防中心（CDC）数据显示，2022 年近半数医护人员存在倦怠症状，较前一年增长 14%，且近半数受访者表示计划寻找新工作。这种倦…

王浩然
2025年11月29日
000
AI前沿

Google发布Gemini CLI：为终端用户打造的开源AI工具

Google近日宣布推出一款名为Gemini CLI的代理型AI工具，该工具旨在将Google的Gemini AI模型更紧密地融入开发者的编码工作流程中。Gemini CLI设计为…

王浩然
2025年7月2日
000
AI前沿

Bending Spoons 收购 AOL：彰显传统平台的潜在价值

科技公司 Bending Spoons 收购美国在线（AOL）这一传统数字平台的举动，不仅打破了行业对 “legacy 平台已过时” 的固有认知，更揭示出长期积累的数字生态系统背后…

王浩然
2025年11月1日
000
AI前沿

从人工智能炒作转向实用、道德和可持续的实施

无论炒作周期如何，人工智能都不再是一个遥不可及的梦想，而是一个切实存在的现实。几十年来，在生成式人工智能出现之前，这项技术在改变行业和重塑我们的经营方式方面发挥了关键作用。然而，在…

AI News
2024年9月6日
000
AI前沿

AI先行企业：构建可扩展且互联的AI平台的必要性

在当今这个数字化迅速发展的时代，人工智能（AI）已成为企业追求创新和转型的核心力量。然而，尽管企业对AI的投入持续加大，许多AI项目却依然停留在试验阶段，难以全面铺开。其中的主要障…

王浩然
2025年6月27日
000
AI前沿

阿里巴巴研究人员推出具有高级推理能力的法学硕士 Marco-o1

OpenAI o1的近期发布引起了人们对大型推理模型 (LRM) 的极大关注，并启发了旨在解决经典语言模型经常遇到的复杂问题的新模型。基于 o1 的成功和 LRM 的概念，阿里巴巴…

王浩然
2024年11月28日
000
AI前沿

西南航空战略转向：取消免费托运行李后全面开放机上WiFi服务的商业逻辑分析‌

在全球航空业持续动荡的2025年，美国西南航空公司宣布自9月起为所有航班提供免费机上WiFi服务，这项看似平常的服务升级背后，隐藏着航空业应对后疫情时代消费习惯变革的深层战略调整。…

王浩然
2025年9月8日
000
AI前沿

微软在 Windows 召回系统重新发布前详细介绍了其安全/隐私方面的改进

微软正在对其备受争议的 Copilot+ Windows PC 的 Recall 功能进行另一次调整，此前该功能的原始版本在夏季安全研究人员和测试人员的严格审查下崩溃并烧毁。Rec…

点点
2024年9月30日
000
AI前沿

CDimension公司发布革命性芯片技术：从材料层面重构计算硬件基础

一家名为CDimension的半导体初创公司近日正式走出隐身模式，宣布了一项雄心勃勃的计划：从材料层面重新构建计算硬件的基础架构。随着人工智能、机器人技术、量子计算和边缘计算工作负…

王浩然
2025年7月25日
000
AI前沿

Adani豪掷千亿美元，打造印度可再生能源驱动的AI数据中心帝国

在新德里举办的印度AI影响峰会第二天，印度商业巨头阿达尼集团（Adani Group）抛出了一颗重磅炸弹：宣布将在2035年前投资1000亿美元，在印度全境打造由可再生能源驱动的超…

王浩然
2026年2月18日
000

发表回复

Please Login to Comment

编程平台 Cursor 推出首款自研大语言模型 Composer，承诺四倍速度提升

相关推荐

发表回复