Anthropic 发布 Claude Sonnet 4.5,全力争夺 AI 智能体与编程领域主导地位

Anthropic 发布 Claude Sonnet 4.5,全力争夺 AI 智能体与编程领域主导地位

2025 年 9 月 29 日,人工智能企业 Anthropic 正式推出旗下 Claude 系列模型的重要更新版本 ——Claude Sonnet 4.5。这款新模型在自主任务执行、编程能力、计算机操作及专业领域推理等核心维度实现全面突破,同时配套升级开发者工具与功能模块,不仅强化了 Anthropic 在 AI 智能体与编程赛道的竞争力,也为企业与个人用户处理复杂工作流提供了更高效的解决方案。

在性能提升方面,Claude Sonnet 4.5 最显著的突破在于自主任务执行能力的大幅增强。相较于上一代 Sonnet 4.0,新模型的最大连续执行时间从 7 小时延长至 30 小时,这一提升使其在处理长期、多步骤的智能体任务时表现得更加稳定可靠。无论是需要持续监控数据变化的实时分析任务,还是涉及多环节协作的项目管理流程,Claude Sonnet 4.5 都能减少因中断导致的效率损耗,无需用户频繁干预即可自主推进任务完成,极大降低了复杂工作流的操作门槛。

编程能力的显著提高是 Claude Sonnet 4.5 的另一大亮点。在 SWE-bench 等权威编程基准测试中,该模型展现出覆盖软件开发生命周期全流程的处理能力,从项目初期的需求规划、架构设计,到中期的代码编写、调试优化,再到后期的系统重构、性能迭代,均能高效应对。无论是开发小型自动化脚本以简化日常办公流程,还是搭建大型企业级应用的核心框架,Claude Sonnet 4.5 都能根据用户需求生成规范、可复用的代码,并针对潜在漏洞与性能瓶颈提供优化建议,帮助开发者缩短开发周期、降低出错概率。

计算机操作能力的增强进一步拓展了 Claude Sonnet 4.5 的应用场景。新模型在网页浏览、数据分析、文件处理等常见计算机操作场景下的表现大幅提升,可广泛应用于自动化办公、客户服务、数据整理等领域。在模拟真实计算机任务的 OSWorld 基准测试中,Claude Sonnet 4.5 以 61.4% 的成绩位居榜首,而四个月前 Sonnet 4.0 的测试成绩仅为 42.2%,短短数月内的性能跃升充分体现了 Anthropic 在模型优化上的技术实力。例如,在自动化办公场景中,模型可自主登录指定平台提取数据、生成分析报告并导出为指定格式的文件;在客户服务场景中,它能快速浏览客户咨询记录,整合关键信息并生成标准化回复,大幅提升客服响应效率。

在专业领域的推理与数学能力上,Claude Sonnet 4.5 同样展现出领先优势。在一系列公共评测中,该模型在金融、法律、医学和 STEM(科学、技术、工程、数学)等专业领域的知识储备与逻辑推理能力,显著超越了此前表现优异的 Claude Opus 4.1。在金融领域,它能精准分析市场数据、评估投资风险并生成合规的财务报告;在法律领域,可快速检索法规条文、梳理案件关键点并提供法律意见参考;在医学领域,能辅助解读医学影像报告、分析病例数据并给出诊疗建议方向;在 STEM 领域,无论是复杂的数学公式推导、物理实验数据分析,还是工程设计中的技术参数计算,Claude Sonnet 4.5 都能提供准确、严谨的支持,成为专业人士的高效协作工具。

功能更新层面,Claude Sonnet 4.5 配套推出了多项实用功能,进一步提升用户体验与使用效率。其中,Claude Code 功能的升级尤为值得关注,新增的 “检查点”(Checkpoints)功能允许用户在代码编写过程中随时保存当前进度,若后续操作出现偏差或需求变更,可一键回滚到早先的保存状态,避免因误操作导致的工作成果丢失。同时,Claude Code 的终端界面得到优化,操作逻辑更贴合开发者使用习惯,新增的原生 VS Code 插件则实现了与主流编程工具的无缝集成,开发者无需切换平台即可调用 Claude 的编程辅助功能,进一步提升开发流畅度。

Claude API 的功能增强也为开发者构建复杂应用提供了更多可能。新加入的上下文编辑功能与记忆工具,让 AI 智能体能够更长时间地保持任务连续性,即使面对跨天、跨场景的复杂任务,也能基于历史交互信息持续推进,减少重复沟通成本。此外,API 还新增了新的停止原因提示,帮助开发者更清晰地了解模型停止响应的原因,便于后续优化调用逻辑;同时改进了工具参数设计,优化了 Token 计数方式,让资源使用更透明、成本控制更精准。

Claude apps 功能的扩展则丰富了模型的内容生成与交互形式。现在,用户在 Claude apps 的对话过程中可直接执行代码,无需跳转至其他平台,同时支持生成表格、幻灯片、文档等多种格式的文件,生成的文件可直接下载使用或进一步编辑。这一功能极大简化了 “需求提出 – 内容生成 – 格式导出” 的全流程,无论是制作会议汇报用的幻灯片、整理项目数据用的表格,还是撰写工作文档,用户都能在 Claude apps 内一站式完成,提升了办公与创作效率。

作为临时研究预览功能,Anthropic 还为 Claude Sonnet 4.5 新增了 “Imagine with Claude” 功能,该功能向 Max 订阅用户开放 5 天体验权限,用户可通过 claude.ai/imagine 访问。与传统的预制功能或预写代码不同,“Imagine with Claude” 能让 Claude 在交互过程中实时生成软件,用户可以直观看到模型根据需求即时创造功能、适配场景的全过程。例如,用户提出 “开发一个简易的个人日程管理工具”,模型会逐步构建界面框架、编写核心功能代码、调试交互逻辑,整个过程完全透明,不仅为用户提供了定制化工具,也为了解 AI 的开发逻辑提供了全新视角。

在安全性与对齐性方面,Claude Sonnet 4.5 是迄今为止 Anthropic 旗下对齐性最好的模型。通过技术迭代与广泛的安全训练,模型在减少迎合错误需求、欺骗性回复、权力追求倾向及虚妄鼓励等不良行为上取得明显成效,同时大幅加强了对提示注入攻击的防御能力,降低了恶意指令绕过安全机制的风险。该模型按照 AI Safety Level 3ASL-3)框架发布,内置了一系列严格的防护措施,例如针对化学、生物、放射和核相关的高风险内容设置专门的分类器过滤机制,有效防范模型被用于生成危险信息。与 Sonnet 4.0 相比,Claude Sonnet 4.5 的安全机制误报率已降低十倍,在保障安全性的同时,减少了对正常使用的干扰。

为了更好地赋能开发者,Anthropic 还推出了 Claude Agent SDK,将驱动 Claude Code 的底层基础设施对外开放,为开发者打造专属 AI 智能体提供了基础能力支持。开发者可基于该 SDK 快速搭建具备编程、任务执行、交互协作等功能的智能体,适配不同行业场景需求,加速 AI 技术在实际业务中的落地应用。在部署渠道上,Claude Sonnet 4.5 保持了广泛的兼容性,用户可通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI 等平台调用模型能力,同时也在 Anthropic 官方平台 claude.ai 与专业编程平台 Claude Code 上线,满足不同用户的使用习惯与场景需求。

定价方面,Anthropic 延续了此前 Sonnet 4.0 的收费标准,Claude Sonnet 4.5 的输入价格为 3 美元 / 百万 Tokens,输出价格为 15 美元 / 百万 Tokens,既保持了价格稳定性,也让用户能够以熟悉的成本结构享受更强大的模型能力,降低了用户的升级门槛。

Claude Sonnet 4.5 的发布,不仅是 Anthropic 在 AI 技术迭代上的重要成果,也进一步加剧了 AI 智能体与编程领域的竞争态势。通过在性能、功能、安全性与开发者支持等多维度的全面升级,Anthropic 正全力争夺行业主导地位,而这款模型的落地应用,也将为各行业的效率提升与数字化转型注入新的动力。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/anthropic-fa-bu-claude-sonnet-4-5-quan-li-zheng-duo-ai-zhi

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年10月9日
Next 2025年10月9日

相关推荐

发表回复

Please Login to Comment