Anthropic 发布 Claude Sonnet 4.5，全力争夺 AI 智能体与编程领域主导地位

王浩然 • 2025年10月9日下午12:00 • AI前沿 • 451 views

2025 年 9 月 29 日，人工智能企业 Anthropic 正式推出旗下 Claude 系列模型的重要更新版本 ——Claude Sonnet 4.5。这款新模型在自主任务执行、编程能力、计算机操作及专业领域推理等核心维度实现全面突破，同时配套升级开发者工具与功能模块，不仅强化了 Anthropic 在 AI 智能体与编程赛道的竞争力，也为企业与个人用户处理复杂工作流提供了更高效的解决方案。

在性能提升方面，Claude Sonnet 4.5 最显著的突破在于自主任务执行能力的大幅增强。相较于上一代 Sonnet 4.0，新模型的最大连续执行时间从 7 小时延长至 30 小时，这一提升使其在处理长期、多步骤的智能体任务时表现得更加稳定可靠。无论是需要持续监控数据变化的实时分析任务，还是涉及多环节协作的项目管理流程，Claude Sonnet 4.5 都能减少因中断导致的效率损耗，无需用户频繁干预即可自主推进任务完成，极大降低了复杂工作流的操作门槛。

编程能力的显著提高是 Claude Sonnet 4.5 的另一大亮点。在 SWE-bench 等权威编程基准测试中，该模型展现出覆盖软件开发生命周期全流程的处理能力，从项目初期的需求规划、架构设计，到中期的代码编写、调试优化，再到后期的系统重构、性能迭代，均能高效应对。无论是开发小型自动化脚本以简化日常办公流程，还是搭建大型企业级应用的核心框架，Claude Sonnet 4.5 都能根据用户需求生成规范、可复用的代码，并针对潜在漏洞与性能瓶颈提供优化建议，帮助开发者缩短开发周期、降低出错概率。

计算机操作能力的增强进一步拓展了 Claude Sonnet 4.5 的应用场景。新模型在网页浏览、数据分析、文件处理等常见计算机操作场景下的表现大幅提升，可广泛应用于自动化办公、客户服务、数据整理等领域。在模拟真实计算机任务的 OSWorld 基准测试中，Claude Sonnet 4.5 以 61.4% 的成绩位居榜首，而四个月前 Sonnet 4.0 的测试成绩仅为 42.2%，短短数月内的性能跃升充分体现了 Anthropic 在模型优化上的技术实力。例如，在自动化办公场景中，模型可自主登录指定平台提取数据、生成分析报告并导出为指定格式的文件；在客户服务场景中，它能快速浏览客户咨询记录，整合关键信息并生成标准化回复，大幅提升客服响应效率。

在专业领域的推理与数学能力上，Claude Sonnet 4.5 同样展现出领先优势。在一系列公共评测中，该模型在金融、法律、医学和 STEM（科学、技术、工程、数学）等专业领域的知识储备与逻辑推理能力，显著超越了此前表现优异的 Claude Opus 4.1。在金融领域，它能精准分析市场数据、评估投资风险并生成合规的财务报告；在法律领域，可快速检索法规条文、梳理案件关键点并提供法律意见参考；在医学领域，能辅助解读医学影像报告、分析病例数据并给出诊疗建议方向；在 STEM 领域，无论是复杂的数学公式推导、物理实验数据分析，还是工程设计中的技术参数计算，Claude Sonnet 4.5 都能提供准确、严谨的支持，成为专业人士的高效协作工具。

功能更新层面，Claude Sonnet 4.5 配套推出了多项实用功能，进一步提升用户体验与使用效率。其中，Claude Code 功能的升级尤为值得关注，新增的 “检查点”（Checkpoints）功能允许用户在代码编写过程中随时保存当前进度，若后续操作出现偏差或需求变更，可一键回滚到早先的保存状态，避免因误操作导致的工作成果丢失。同时，Claude Code 的终端界面得到优化，操作逻辑更贴合开发者使用习惯，新增的原生 VS Code 插件则实现了与主流编程工具的无缝集成，开发者无需切换平台即可调用 Claude 的编程辅助功能，进一步提升开发流畅度。

Claude API 的功能增强也为开发者构建复杂应用提供了更多可能。新加入的上下文编辑功能与记忆工具，让 AI 智能体能够更长时间地保持任务连续性，即使面对跨天、跨场景的复杂任务，也能基于历史交互信息持续推进，减少重复沟通成本。此外，API 还新增了新的停止原因提示，帮助开发者更清晰地了解模型停止响应的原因，便于后续优化调用逻辑；同时改进了工具参数设计，优化了 Token 计数方式，让资源使用更透明、成本控制更精准。

Claude apps 功能的扩展则丰富了模型的内容生成与交互形式。现在，用户在 Claude apps 的对话过程中可直接执行代码，无需跳转至其他平台，同时支持生成表格、幻灯片、文档等多种格式的文件，生成的文件可直接下载使用或进一步编辑。这一功能极大简化了 “需求提出 – 内容生成 – 格式导出” 的全流程，无论是制作会议汇报用的幻灯片、整理项目数据用的表格，还是撰写工作文档，用户都能在 Claude apps 内一站式完成，提升了办公与创作效率。

作为临时研究预览功能，Anthropic 还为 Claude Sonnet 4.5 新增了 “Imagine with Claude” 功能，该功能向 Max 订阅用户开放 5 天体验权限，用户可通过 claude.ai/imagine 访问。与传统的预制功能或预写代码不同，“Imagine with Claude” 能让 Claude 在交互过程中实时生成软件，用户可以直观看到模型根据需求即时创造功能、适配场景的全过程。例如，用户提出 “开发一个简易的个人日程管理工具”，模型会逐步构建界面框架、编写核心功能代码、调试交互逻辑，整个过程完全透明，不仅为用户提供了定制化工具，也为了解 AI 的开发逻辑提供了全新视角。

在安全性与对齐性方面，Claude Sonnet 4.5 是迄今为止 Anthropic 旗下对齐性最好的模型。通过技术迭代与广泛的安全训练，模型在减少迎合错误需求、欺骗性回复、权力追求倾向及虚妄鼓励等不良行为上取得明显成效，同时大幅加强了对提示注入攻击的防御能力，降低了恶意指令绕过安全机制的风险。该模型按照 AI Safety Level 3（ASL-3）框架发布，内置了一系列严格的防护措施，例如针对化学、生物、放射和核相关的高风险内容设置专门的分类器过滤机制，有效防范模型被用于生成危险信息。与 Sonnet 4.0 相比，Claude Sonnet 4.5 的安全机制误报率已降低十倍，在保障安全性的同时，减少了对正常使用的干扰。

为了更好地赋能开发者，Anthropic 还推出了 Claude Agent SDK，将驱动 Claude Code 的底层基础设施对外开放，为开发者打造专属 AI 智能体提供了基础能力支持。开发者可基于该 SDK 快速搭建具备编程、任务执行、交互协作等功能的智能体，适配不同行业场景需求，加速 AI 技术在实际业务中的落地应用。在部署渠道上，Claude Sonnet 4.5 保持了广泛的兼容性，用户可通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI 等平台调用模型能力，同时也在 Anthropic 官方平台 claude.ai 与专业编程平台 Claude Code 上线，满足不同用户的使用习惯与场景需求。

定价方面，Anthropic 延续了此前 Sonnet 4.0 的收费标准，Claude Sonnet 4.5 的输入价格为 3 美元 / 百万 Tokens，输出价格为 15 美元 / 百万 Tokens，既保持了价格稳定性，也让用户能够以熟悉的成本结构享受更强大的模型能力，降低了用户的升级门槛。

Claude Sonnet 4.5 的发布，不仅是 Anthropic 在 AI 技术迭代上的重要成果，也进一步加剧了 AI 智能体与编程领域的竞争态势。通过在性能、功能、安全性与开发者支持等多维度的全面升级，Anthropic 正全力争夺行业主导地位，而这款模型的落地应用，也将为各行业的效率提升与数字化转型注入新的动力。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/anthropic-fa-bu-claude-sonnet-4-5-quan-li-zheng-duo-ai-zhi

AI Safety Level 3 AI 智能体 Anthropic ASL-3 Claude Agent SDK Claude API Claude apps Claude Code Claude Sonnet 4.5 Imagine with Claude OSWorld SWE-bench 推理能力编程能力计算机操作能力

Like (0)

王浩然作者

0 0

Opera 推出 AI 浏览器 Neon：订阅制解锁智能代理功能，开启浏览器交互新范式

Previous 2025年10月9日

Meta AI 推出 “Vibes” 专属信息流：聚焦 AI 生成短视频，打造创意互动新场景

Next 2025年10月9日

AI前沿

UiPath的新编排器：引导AI代理遵循企业规则

随着人工智能技术的不断发展，越来越多的企业开始探索AI代理的潜力，并考虑是否将其部署到业务中。然而，许多企业仍将AI代理等同于已经存在多年的自动化技术。自动化先驱UiPath对此有…

王浩然
2025年5月6日
000
AI前沿

Anthropic让每位Claude用户成为无代码应用开发者

Anthropic公司近日宣布了一项重大更新，其Claude AI助手将转变为一个平台，允许用户创建交互式、可共享的应用程序，这一变革标志着从对话式聊天机器人向功能性软件工具的重大…

王浩然
2025年6月27日
000
AI前沿

房产行业的“Plaid时刻”将至：开放API将为7500万住户解锁AI智能助手

当你只需动动手指就能在手机上完成转账、查看医疗报告、预订机票时，你是否想过，每天都要打交道的住宅物业管理，还停留在20年前的效率水平？在这个数字化渗透到生活每个角落的时代，有750…

王浩然
2026年3月14日
000
AI前沿

一款集多模态理解与生成于一体的单一 Transformer

大型语言模型 (LLM) 的重大进步激发了多模态大型语言模型 (MLLM) 的发展。早期的 MLLM 工作，例如 LLaVA、MiniGPT-4 和 InstructBLIP，展示…

点点
2024年10月12日
000
AI前沿

2025年，9家美国AI初创企业融资超1亿美元‌

2025年，美国AI领域展现出了前所未有的活力，有9家初创企业在本年度成功融资超过1亿美元。这一融资热潮不仅彰显了资本对AI技术的青睐，也预示着AI行业将迎来更加蓬勃的发展。这些…

王浩然
2025年3月11日
000
AI前沿

人工智能如何影响人类关键决策

加州大学默塞德分校最近的一项研究揭示了一个令人担忧的趋势：我们倾向于过度信任人工智能系统，即使在生死攸关的情况下。随着人工智能不断渗透到我们社会的各个方面，从智能手机助手到复杂的…

点点
2024年9月8日
000
AI前沿

AI控制困境：风险与解决方案

我们正处在一个人工智能系统开始超越人类控制的转折点。这些系统如今能够编写自己的代码、优化自身性能，并做出连其创造者有时也难以完全解释的决定。然而，这种进步也引发了一系列重要问题：我…

王浩然
2025年6月9日
000
AI前沿

‌OpenAI澄清法院命令，Sam Altman呼吁AI特权‌

在数字时代，隐私保护成为了用户最为关注的问题之一。近日，OpenAI因一项法院命令而陷入了隐私争议的漩涡，该命令要求OpenAI必须保留用户的临时和已删除ChatGPT会话记录。这…

王浩然
2025年6月7日
000
AI前沿

超越冯・诺依曼：统一确定性架构如何重塑计算未来

自 1945 年冯・诺依曼在《关于 EDVAC 的报告草案》中提出 “存储程序” 思想以来，这套将程序与数据共存于同一存储器、按顺序执行指令的架构，已主导计算领域近八十载。它通过引…

王浩然
2025年10月13日
000
AI前沿

Gemini赋能Google Docs：AI音频摘要功能提升办公效率，付费用户率先体验

在AI工具持续渗透办公场景的当下，Google又为其Workspace生态增添了新的AI能力。近日，Google宣布旗下Gemini AI将为Google Docs推出音频摘要功能…

王浩然
2026年2月22日
000
AI前沿

Slack 的人工智能代理有望利用情境能力重塑生产力

Slack将把Salesforce 的Agentforce AI 代理深度整合到其工作场所协作平台中，强调情境智能是日益拥挤的 AI 代理市场中的关键差异化因素。 Slack 首席…

王浩然
2024年12月19日
000
AI前沿

为何 CIO 必须引领 AI 实验，而不仅仅是监管

在当今数字化时代，人工智能（AI）已成为企业发展的核心驱动力之一，深刻改变着企业的运营模式、产品服务以及竞争格局。首席信息官（CIO）作为企业信息技术战略的掌舵者，在 AI 的发展…

王浩然
2026年1月2日
000
AI前沿

营销机构 AI 应用：加速工作流的同时亟待内部重构

在众多行业中，营销领域的 AI 已不再是 “创新实验室” 里的边缘项目，而是深度嵌入简报撰写、生产流程、审批环节与媒体优化的核心环节。WPP 旗下 WPP iQ 于 12 月发布的…

王浩然
2025年12月26日
000
AI前沿

人工智能心理健康平台获 82.5 万美元融资

心理健康初创公司 Yung Sidekick 已获得 825,000 美元的种子前资金，用于开发针对心理健康专业人士的人工智能平台。此轮融资由 Altair Capital 和 …

点点
2024年10月8日
000
AI前沿

量子计算机助力生成式人工智能

Orca PT-2 有望推动疫苗开发和生物成像等 AI 密集型应用 Orca Computing发布了其最新的光子量子计算机 PT-2，旨在通过与生成式 AI 模型相结合来解决药物…

王浩然
2024年11月5日
000
AI前沿

Meta 计划限制发布有风险的人工智能系统

Frontier AI 框架描述了 Meta 如何将 AI 模型分为高风险组和严重风险组 Meta发布了一个新的风险政策框架，概述了其计划如何评估和减轻新前沿 AI 模型带来的风险…

王浩然
2025年2月18日
000
埃隆·马斯克的“求真”Grok AI散布关于犹太人控制媒体的阴谋论‌

在人工智能领域，埃隆·马斯克的xAI公司近期陷入了新的争议。其Grok聊天机器人在7月4日假期期间表现出了令人担忧的行为，包括以马斯克本人的身份回应问题，并生成有关犹太人控制好莱坞…

王浩然
AI前沿 2025年7月8日
000
AI前沿

苹果 16 英寸 MacBook Pro（M4 Pro）评测：强大的台式机替代品

周一，彭博社报道了苹果公司全面改革其笔记本电脑产品线的计划。这正是那种在新款 MacBook Pro 发布和上市之间的一周内你不想听到的谣言。深入研究后发现，计划中的改革将在 20…

王浩然
2024年11月8日
000
AI前沿

企业现在可以通过 Google Cloud 最先进的虚拟机运行实时数据

几个月前，Google Cloud推出了C4A，这是由其首款基于 Arm 的 CPU Axion 驱动的虚拟机 (VM) 实例。现在，作为这项工作的下一步，它推出了搭载Titani…

王浩然
2025年1月19日
000
AI前沿

Mistral推出Forge平台，以”自定义AI”路线切入企业级市场，对标OpenAI与Anthropic

在AI赛道的企业级市场竞争中，法国AI初创公司Mistral正在走出一条差异化路线。2026年3月17日，该公司在英伟达GTC年度技术大会上正式发布Mistral Forge平台，…

王浩然
2026年3月22日
000

发表回复

Please Login to Comment

Anthropic 发布 Claude Sonnet 4.5，全力争夺 AI 智能体与编程领域主导地位

相关推荐

发表回复