OpenAI升级Operator至o3，增强ChatGPT Pro订阅吸引力‌

王浩然 • 2025年5月28日上午9:00 • AI前沿 • 409 views

在AI领域持续火热的背景下，OpenAI宣布了一项重要更新，为其ChatGPT Pro订阅服务增添了新的亮点。这次更新将Operator——一个自主网页浏览和光标控制代理——从原先基于GPT-4o的多模态大型语言模型升级到了更强大的o3推理模型。这一变化不仅提升了ChatGPT Pro订阅的价值，也进一步展示了OpenAI在推动AI技术前沿方面的决心。

‌Operator的升级背景‌

Operator自2025年1月首次亮相以来，一直是OpenAI在自主代理领域的重要尝试。它旨在超越传统的聊天机器人界面，允许OpenAI的强大AI模型代表用户执行更多操作。Operator能够自主执行点击、滚动、输入等操作，以完成如预订晚餐、整理购物清单或购买活动门票等基于网页的任务。为了保障用户的安全、隐私和账户安全，Operator并未使用用户电脑或Mac上的现有浏览器，而是在云托管的虚拟浏览器中运行，用户可通过独立站点operator.chatgpt.com输入请求并实时观察代理执行任务。

‌o3模型带来的改进‌

此次升级到o3模型，为Operator带来了显著的性能提升。首先，在浏览器交互过程中，o3模型展现出了更高的持久性和准确性，意味着它能够更成功地完成用户任务，且需要更少的更正或重复操作。此外，用户的响应将更加清晰、结构化和全面，这得益于o3模型在理解和生成复杂文本方面的优势。

在对比评估中，o3模型相较于其前身表现出了明显的优势。人类偏好研究表明，用户更倾向于o3模型的风格、全面性和清晰度。在遵循指令和效率方面，o3模型也表现出色，尽管在事实正确性方面的表现与旧版本相对平衡。在第三方评估基准上，o3模型同样展现出了卓越的性能。例如，在衡量基于浏览器的任务完成情况的OSWorld基准上，o3模型获得了42.9分，而旧版本仅为38.1分。尽管OpenAI指出，由于自动评分系统的局限性，实际性能提升可能更接近20个百分点，但这一数据已足以证明o3模型的显著进步。

‌安全保障与责任部署‌

随着Operator升级至o3模型，OpenAI并未忽视安全保障的重要性。o3模型继承了早期版本的安全措施，并针对其作为自主代理系统的角色进行了进一步优化。OpenAI加强了针对有害任务执行、提示注入漏洞和用户意图误解的训练，以确保模型的安全性和可靠性。评估显示，新模型在执行敏感操作前确认的比例高达94%，在金融交易中的确认比例更是达到了100%。此外，OpenAI还降低了提示注入的易感性，并维持了在某些高风险网络交互（如电子邮件或金融平台）上的谨慎边界，可能要求用户通过“观察模式”进行监督或明确拒绝继续操作。

‌对企业技术决策者的意义‌

对于负责AI工程、编排、数据管理和IT安全的专业人士而言，升级后的Operator无疑是一个重要的工具升级。其改进的准确性和结构化输出将减少测试验证和故障排除的开销。在编排环境中，Operator提供了一个实用且可靠的工具，用于自动化复杂管道中的基于浏览器的组件。数据工程师可以更加自信地委托手动网络交互任务（如数据验证和抓取），从而腾出时间进行更高层次的优化工作。同时，安全专业人员也可以利用Operator的分层安全机制，在审计和事件响应演练中更安全地模拟用户行为。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-sheng-ji-operator-zhi-o3-zeng-qiang-chatgpt-pro-ding

Like (0)

王浩然作者

0 0

本周AI盛会的三大震撼消息‌

Previous 2025年5月27日

谷歌的“世界模型”赌注：在微软占据用户界面之前构建AI操作系统‌

Next 2025年5月28日

AI前沿

据报道，TikTok 的研究承认其对青少年产生了负面影响

据美国国家公共广播电台和肯塔基公共广播电台报道，法庭文件表明，TikTok 高管意识到该应用对青少年的潜在危害。本周早些时候， 14 名美国总检察长起诉 TikTok ，声称该应…

点点
2024年10月13日
000
AI前沿

【划重点】数字人类对话，让员工培训逼真又高效！

员工培训对于适应职位和吸收公司文化至关重要；同样，它还能让人们学习新技能并在专业上成长。然而，当“员工培训”电子邮件出现在收件箱中时，为新公司工作或晋升到新职位的兴奋感就会消失殆尽…

点点
2024年9月11日
000
AI前沿

Nous Research 的 NousCoder 140 亿参数模型：开源编码模型的新力量

在开源软件和人工智能快速发展的时代，代码生成模型成为了技术领域的焦点之一。Nous Research 推出的 NousCoder 14B，作为一款拥有 140 亿参数的开源编码模型…

王浩然
2026年1月11日
000
AI前沿

Google DeepMind推出革命性AI测绘技术可精准绘制全球地图

突破性AI技术实现全球高精度测绘 Google旗下人工智能研究机构DeepMind近日宣布开发出一项突破性的人工智能技术，该技术能够以前所未有的精确度绘制整个地球的地图。这项创新将…

王浩然
2025年8月13日
000
AI前沿

为何每家企业都需要一份 AI 物料清单

在当今数字化转型的浪潮中，人工智能（AI）已成为企业发展的关键驱动力。从自动化流程到精准的数据分析，AI 正深刻改变着企业的运营模式与竞争格局。然而，随着 AI 应用的日益复杂和广…

王浩然
2026年1月6日
000
AI前沿

成本仅为英伟达 10%：特斯拉与英特尔芯片合作重塑 AI 硬件格局

特斯拉与英特尔潜在的 AI 芯片合作计划引发全球科技领域高度关注 —— 双方若达成合作，有望将 AI 芯片制造成本降至英伟达同类产品的 10%，这一突破性成本优势不仅可能颠覆现有 …

王浩然
2025年11月12日
000
AI前沿

OpenAI 招聘：看似恐怖的压力型岗位引关注

在科技行业的招聘版图中，OpenAI 的一则招聘启事近日引发了广泛关注与热议。此次招聘的岗位内容独特，给人一种 “听起来令人恐惧” 的感觉，同时也揭示了 AI 发展背后鲜为人知的一…

王浩然
2026年1月2日
000
AI前沿

Ibotta 首席执行官解释为何初创公司不应试图把握 IPO 时机

IPO 市场并未像许多投资者所希望的那样在 2024 年强势复苏——至少目前还没有。利率上升（尽管本周降息 50 个基点）和与美国大选相关的不确定性促使许多公司保持私有化并等待更好…

点点
2024年9月23日
000
AI前沿

智能体AI重构咨询行业：从 episodic 服务到持续战略伙伴

在商业环境瞬息万变的今天，传统咨询行业的慢节奏模式正遭遇前所未有的挑战。曾经，企业依赖咨询公司提供的战略建议往往需要经历漫长的提案周期、数月的分析过程，最终拿到的厚重报告却可能早已…

王浩然
2026年1月29日
000
AI前沿

Anthropic封禁OpenClaw开发者事件背后：AI生态的封闭与开源之争

2026年4月，AI圈一则突发消息引发热议：Anthropic临时封禁了开源工具OpenClaw开发者Peter Steinberger的Claude访问权限，尽管事件在数小时内反…

王浩然
2026年4月14日
000
AI前沿

三星推出微型 AI 模型 TRM：以 700 万参数突破复杂推理，颠覆大模型 “规模至上” 范式

2025 年 10 月 8 日，三星 AI 研究员 Alexia Jolicoeur-Martineau 发布的新研究显示，一款名为 “微型递归模型（Tiny Recursive …

王浩然
2025年10月10日
000
AI前沿

谷歌与OpenAI：AI领域的新成本较量与生态系统对比

在人工智能（AI）领域，创新的步伐从未停歇。近期，OpenAI推出了强大的o3和o4-mini推理模型，以及GPT-4.1系列，而谷歌则迅速回应，发布了Gemini 2.5 Fla…

王浩然
2025年4月26日
000
AI前沿

在算法之外：从李飞飞《我看到的世界》读懂AI背后的人文底色

当我们谈论人工智能时，脑海中最先浮现的往往是复杂的算法、不断迭代的硬件，或是那些拥有惊人能力的大模型。我们热衷于讨论技术突破的速度，却常常忽略了在这场AI革命背后，那些奠基者们的人…

王浩然
2026年3月8日
000
华尔街 AI 成效落地：银行效率提升与人员优化计划并行

2025 年 12 月，华尔街银行业的 AI 应用已从早期实验阶段全面进入日常运营，摩根大通、富国银行、PNC、花旗、高盛等头部机构纷纷披露 AI 驱动的 productivity…

王浩然
AI前沿 2025年12月24日
000
AI前沿

‌Mistral推出API，助力打造全能AI助手‌

在人工智能领域，创新从未停歇。近日，备受瞩目的法国AI创业公司Mistral AI再次发力，为企业客户和独立软件开发者带来了一项革命性的新服务——Agents应用程序编程接口（AP…

王浩然
2025年5月28日
000
AI前沿

OpenAI的Sora现已登陆欧盟与英国‌

近日，人工智能领域的领头羊OpenAI宣布，其创新产品Sora现已正式在欧盟与英国市场推出。这一举措标志着OpenAI在拓展全球业务版图方面迈出了重要一步。 ‌一、Sora简介‌ …

王浩然
2025年3月1日
000
AI前沿

关税与不确定性下的 SaaS 行业：销售遇冷但 CFO 们在 2026 年前发掘隐藏预算

2025 年 10 月 29 日，Tropic 公司首席财务官兼总裁拉塞尔・莱斯特（Russell Lester）发表分析指出，当前市场正处于 “预期驱动与新闻响应” 双重作用的波…

王浩然
2025年10月30日
000
AI前沿

Anthropic遭遇质疑：Claude 4 Opus“告密”行为引发热议

在人工智能界，每一次技术的革新都可能伴随着争议与挑战。近日，San Francisco的AI初创公司Anthropic因其即将发布的大型语言模型Claude 4 Opus（以下简称…

王浩然
2025年5月24日
000
AI前沿

OpenAI 开始将注意力转向“超级智能”

OpenAI 首席执行官 Sam Altman 在其个人博客上发表文章称，他相信 OpenAI“知道如何构建（通用人工智能）”，就像它传统上所理解的那样——并且开始将其目标转向“超…

王浩然
2025年1月6日
000
AI前沿

搜索的未来：当人工智能从检索转向深度推理时

随着生成式人工智能重新定义我们与技术的互动，我们搜索信息的方式也在发生深刻的转变。传统的搜索引擎依赖于关键词匹配和检索，而现在正逐渐被更先进的系统所取代，这些系统利用生成式人工智能…

王浩然
2024年8月27日
000

发表回复

Please Login to Comment

OpenAI升级Operator至o3，增强ChatGPT Pro订阅吸引力‌

相关推荐

发表回复