
Anthropic 正式推出新一代旗舰 AI 模型 Claude Opus 4.5,以 “性能跃升 + 价格腰斩” 的双重优势搅动 AI 市场 —— 不仅在软件工程、智能体自主学习等核心能力上超越 GPT-5.1、Gemini 3 Pro 等竞品,还将 API 价格大幅下调约三分之二,同时新增 “无限对话”“Excel 深度集成” 等实用功能,为企业与开发者提供高性价比的 AI 解决方案,进一步加剧了与 OpenAI、谷歌的行业竞争。
从核心性能来看,Claude Opus 4.5 在技术 benchmarks 与真实场景中均展现出行业领先水平。在衡量真实世界软件工程能力的 SWE-bench Verified 测试中,其准确率达到 80.9%,显著超越 OpenAI GPT-5.1-Codex-Max(77.9%)、Anthropic 自家 Sonnet 4.5(77.2%)及谷歌 Gemini 3 Pro(76.2%),尤其在代码迁移、重构等复杂任务中表现突出。更值得关注的是,该模型在 Anthropic 内部最高难度的性能工程师招聘测试中,通过 “并行测试时计算” 技术(聚合多次尝试并选择最优结果),取得了超越所有人类候选人的成绩;若不设时间限制,在 Claude Code 编程环境中,其表现可与历史最佳人类候选人持平。尽管 Anthropic 强调测试未涵盖协作、沟通等职业软技能,但这一结果仍引发对 “AI 重塑工程领域职业边界” 的讨论,Anthropic 开发者关系负责人 Alex Albert 将其称为 “AI 在工作场景中实用价值的重要信号”。
效率优化是 Claude Opus 4.5 的另一大突破。该模型通过算法改进,实现 “用更少 token 完成更多任务”:在中等努力程度下,匹配前代 Sonnet 4.5 在 SWE-bench Verified 的最佳得分时,输出 token 用量减少 76%;即便是最高努力程度(性能超越 Sonnet 4.5 4.3 个百分点),token 用量仍减少 48%。为让开发者平衡性能与成本,Anthropic 还新增 “努力参数”,允许用户自主调节模型的计算投入,灵活控制 latency 与开支。这一优化得到企业客户验证:云编码平台 Replit 总裁 Michele Catasta 表示,Opus 4.5 在内部基准测试中 “超越竞品且解决相同问题用更少 token”,规模化应用时效率优势会持续放大;GitHub 首席产品官 Mario Rodriguez 也指出,其在编码任务中 “将 token 用量减半,尤其适配代码迁移、重构场景”。
价格策略上,Claude Opus 4.5 展现出极强的市场竞争力。其 API 定价为输入 token 5 美元 / 百万、输出 token 25 美元 / 百万,较上一代 Claude Opus 4.1(输入 15 美元 / 百万、输出 75 美元 / 百万)降价约三分之二,甚至低于部分中端模型 —— 例如与 Anthropic 自家 Sonnet 4.5(输入 3 美元 / 百万、输出 15 美元 / 百万)相比,虽价格略高,但性能优势显著,形成 “性价比升级” 的定位。这一降价不仅降低企业与开发者的 AI 应用门槛,还对行业定价体系构成压力:此前 OpenAI GPT-5.1 定价为输入 1.25 美元 / 百万、输出 10 美元 / 百万,谷歌 Gemini 3 Pro 输入 2 美元 / 百万、输出 12 美元 / 百万,Opus 4.5 以 “接近中端模型的价格提供旗舰级性能”,可能倒逼竞品进一步调整价格或提升能力。
功能创新方面,Claude Opus 4.5 围绕 “企业协作” 与 “开发者效率” 推出多项实用更新。针对日常办公场景,“Claude for Excel” 全面开放给 Max、Team 及企业用户,新增数据透视表、图表生成、文件上传支持,可直接处理 Excel 中的复杂数据任务;Chrome 浏览器扩展程序向所有 Max 用户开放,方便网页端快速调用 AI 能力。最受关注的 “无限对话” 功能,通过自动总结长对话早期内容、优化记忆机制,彻底打破上下文窗口限制,用户无需担心对话长度导致的信息丢失,尤其适合长期项目协作、多轮深度研讨等场景。
对开发者而言,Anthropic 推出 “可编程工具调用” 功能,支持 Claude 直接编写并执行调用外部函数的代码;编程环境 Claude Code 新增 “规划模式”,并开放桌面端研究预览,允许并行运行多个 AI 智能体会话,大幅提升复杂编程任务的处理效率。此外,早期客户反馈显示,Opus 4.5 还具备 “自我改进智能体” 能力 —— 日本电商巨头乐天测试发现,基于该模型的智能体 “仅需 4 轮迭代即可达到峰值性能,而其他模型 10 轮后仍无法匹配”;Anthropic 解释,这并非模型更新自身权重,而是通过迭代优化解决问题的工具与方法,可广泛应用于文档生成、表格处理、演示文稿制作等场景,某金融建模公司 Fundamental Research Labs 表示,其 “内部评估准确率提升 20%、效率提高 15%,此前无法完成的复杂任务现已可实现”。
从行业竞争视角看,Claude Opus 4.5 的发布进一步激化了 AI 巨头的技术与市场争夺。当前 OpenAI 已推出 GPT-5.1 及专用编程模型 Codex Max(支持 24 小时自主运行),谷歌也于 11 月中旬发布 Gemini 3,Anthropic 则通过 “快速迭代 + 降价提质” 维持竞争力 ——2025 年 9 月至 11 月间,先后推出 Sonnet 4.5、Haiku 4.5、Opus 4.5 三款模型,且每代均有性能或价格突破。这种密集更新背后,是 Anthropic 自身业务的快速增长:2025 年一季度其年化收入达 20 亿美元,较上一季度翻倍,年支出超 10 万美元的客户数量同比增长 8 倍。Alex Albert 透露,Claude 自身也在加速研发流程,“无论是产品开发还是模型研究,都从 AI 辅助中获得显著效率提升”。
不过,行业仍面临 “技术突破与盈利平衡” 的挑战:尽管 AI 市场规模预计十年内突破 1 万亿美元,但头部实验室因算力基建、人才投入巨大,尚未实现盈利,且尚无单一厂商建立绝对主导地位。Claude Opus 4.5 的降价可能进一步压缩利润率,但 Anthropic 期望通过 “扩大用户基数、提升规模化效率” 实现长期增长 ——Alex Albert 预测,“更多初创企业会将其融入产品核心,凸显 AI 能力”。
对企业与开发者而言,Claude Opus 4.5 的价值不仅在于 “性能与价格的平衡”,更在于其推动 AI 从 “辅助工具” 向 “核心生产力” 转变:在编程领域,其可自主完成复杂代码任务、减少人工调试;在协作场景,“无限对话” 与 Excel 集成降低跨团队沟通成本;在成本敏感的规模化应用中,token 效率优化与降价则直接提升 ROI。随着 AI 性能持续逼近甚至超越人类专家水平,这类模型可能重新定义 “知识工作” 的边界,而 Anthropic 的此次发布,无疑为这一趋势注入了新的动力。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/anthropic-fa-bu-claude-opus-4-5-jiang-jia-ti-zhi-chong-su