OpenAI 承认人工智能浏览器可能永远无法实现完全安全

王浩然 • 2025年12月30日下午2:00 • AI前沿 • 199 views

OpenAI 在博客中公开承认，针对人工智能浏览器的提示词注入攻击或许永远都无法彻底解决，即便持续对相关防御机制进行升级强化，这类人工智能浏览器也很难达到绝对安全的状态。这一表态打破了外界对于短期内彻底解决人工智能浏览器安全漏洞的期待，也让提示词注入攻击这一人工智能领域的安全隐患再次成为行业聚焦的核心议题。

OpenAI 于今年 10 月推出了内置在 ChatGPT 中的 Atlas 人工智能浏览器，而这款浏览器刚一问世，其安全漏洞就被迅速暴露出来。安全研究人员很快完成了相关攻击演示，结果显示，仅需在谷歌文档中输入简短的几句话，就能悄悄改变这款浏览器的底层运行行为。无独有偶，在同一天，浏览器厂商 Brave 也在博客中发文指出，间接提示词注入攻击并非 Atlas 浏览器独有的问题，而是所有人工智能驱动型浏览器都要面对的系统性挑战，Perplexity 公司的 Comet 浏览器同样没能避开这一安全漏洞。所谓提示词注入攻击，就是攻击者将恶意指令隐藏在人工智能系统会处理的内容当中，这些精心设计的指令能够篡改或改变人工智能原本的运行逻辑，使其背弃用户的需求，转而执行攻击者预设的操作。与传统网络攻击不同，这种攻击无需利用软件漏洞或者直接欺骗用户，而是直接针对人工智能系统本身发起攻击，堪称专门针对人工智能系统的社交工程攻击。比如攻击者可在邮件、文档里植入隐藏指令，让人工智能代理忽略原本任务，去执行转发敏感数据、擅自发送信息等违规操作。而人工智能浏览器的智能体模式能浏览网页、读取邮箱、执行支付等操作，在处理这些繁杂任务时必然会接触大量不可信内容，这就使得提示词注入攻击有了可乘之机，也大幅扩大了安全威胁面。

OpenAI 的这一判断并非孤例，英国国家网络安全中心在本月早些时候就发出过类似警告，该机构称针对生成式人工智能应用的提示词注入攻击或许永远无法被彻底化解，这种情况会让各类网站都面临数据泄露的巨大风险。基于这一判断，该英国政府机构向网络安全从业者提出建议，与其寄希望于彻底阻止这类攻击，不如将工作重心放在降低提示词注入攻击带来的风险和不良影响上。OpenAI 也在最新发布的博客中明确表态，他们已将提示词注入攻击视为一项长期的人工智能安全挑战，未来会持续不断地强化相关防御措施。

在应对提示词注入攻击的防御策略上，OpenAI 与 Anthropic、谷歌等行业竞争对手达成了一定共识，各方都认为要抵御这类攻击，必须构建多层防御体系，并且要持续对系统展开压力测试。例如谷歌近期的研究重点就集中在智能体系统的架构和策略层面，试图通过这两个维度的管控来降低安全风险。不过，OpenAI 没有盲目跟风同行的防御路径，而是选择了一条差异化的防御道路，开发出了一款 “基于大语言模型的自动化攻击程序”。这款程序本质上是一个经过强化学习训练的机器人，它的核心任务就是模拟黑客的攻击行为，专门寻找向人工智能智能体植入恶意指令的各种途径。

在内部测试过程中，这个自动化攻击机器人会先在模拟环境中发起攻击，而该模拟环境能够完整还原目标人工智能遭遇攻击时的思考过程以及可能采取的应对动作。机器人会根据目标人工智能的反应及时调整攻击策略，然后反复发起攻击测试。现实世界中的攻击者根本无法洞悉人工智能的内部推理逻辑，但这个自动化攻击机器人却具备这一独特优势，理论上它发现系统漏洞的速度会远超现实中的黑客。OpenAI 透露，这个经强化学习训练的攻击程序，能够诱导目标智能体执行由数十步甚至数百步构成的复杂有害任务流程。更值得关注的是，在测试过程中它还发现了一些全新的攻击策略，这些策略此前既未在内部人工红队测试中出现过，外部也没有相关攻击报告提及。OpenAI 还展示过一个相关演示案例，这个自动化攻击程序能悄悄往用户收件箱植入一封恶意邮件，当人工智能智能体扫描收件箱准备撰写休假自动回复邮件时，就会被邮件里的恶意指令诱导，转而发送一封辞职信。不过 OpenAI 表示，在完成安全更新后，Atlas 浏览器的智能体模式已经可以成功识别这类提示词注入攻击的企图，并且会及时向用户发出告警。

该公司还强调，尽管很难实现万无一失的防御，但他们会通过大规模测试以及缩短补丁更新周期的方式，争取在相关攻击手段出现在现实世界之前，完成系统防御的加固工作。有记者询问此次针对 Atlas 浏览器的安全更新是否大幅降低了攻击成功率，OpenAI 的发言人并未透露具体数据，只是表示早在这款浏览器发布之前，公司就已经与第三方机构展开合作，共同强化其应对提示词注入攻击的防御能力。

对于 OpenAI 采用的这种防御方式，行业专家给出了审慎的评价。网络安全公司 Wiz 的首席安全研究员拉米・麦卡锡指出，强化学习技术确实能够实现对攻击者行为的持续自适应防御，但这仅仅是解决方案的一部分，并不能彻底解决问题。他提出了一个衡量人工智能系统风险的实用模型，即人工智能系统的风险程度等于其自主性与访问权限的乘积。按照这个模型来分析，人工智能浏览器正处于风险极高的区域，因为这类浏览器既具备中等程度的自主性，同时又拥有极高的系统访问权限。而当前很多安全建议都体现了对这种风险的考量，比如限制人工智能浏览器登录状态下的访问权限，以此减少安全暴露面；要求人工智能执行关键操作前必须经过人工审核确认，以此约束其自主操作权限。

这些建议也被 OpenAI 纳入了给用户的风险降低建议中，该公司表示，Atlas 浏览器经过专门训练，在执行发送邮件或支付操作等关键动作前，都会主动向用户发起确认请求。同时 OpenAI 还建议用户，向智能体下达指令时要尽量具体明确，避免给出模糊宽泛的指令，比如不要简单授权智能体自行处理邮箱并采取一切必要措施，这种过于宽泛的授权会让隐藏的恶意内容更容易影响智能体，进而引发安全风险。

拉米・麦卡锡还对这类高风险人工智能浏览器的投入产出比提出了质疑。他在接受采访时表示，就目前大多数日常使用场景来看，人工智能浏览器当下创造的价值，还远远无法匹配它所伴随的风险水平。这类浏览器之所以功能强大，核心原因之一就是其能够访问电子邮件、支付信息等各类敏感数据，但恰恰是这种高访问权限，使其成为了高风险的存在。虽然这种价值与风险的失衡状态未来可能会慢慢得到改善，但就目前情况而言，两者之间的矛盾依然十分突出，如何在发挥人工智能浏览器功能优势的同时，有效管控安全风险，仍是 OpenAI 等相关企业需要持续攻克的重要课题。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-cheng-ren-ren-gong-zhi-neng-liu-lan-qi-ke-neng-yong

Like (0)

王浩然作者

0 0

新框架简化复杂的代理式 AI 生态：让企业落地更高效

Previous 2025年12月30日

新年 AI 惊喜：FAL 推出自研版 Flux 2 图像生成器

Next 2025年12月30日

AI前沿

Instacart 携手 OpenAI 试点智能体电商：ChatGPT 内实现 “全链路购物”，重塑零售交互范式

生鲜电商平台 Instacart 通过新兴的 “智能体电商协议（Agentic Commerce Protocol）”，在 ChatGPT 内嵌入完整结账体验，成为首个在该平台实现…

王浩然
2025年12月12日
000
AI前沿

AI 编码初创公司 Poolside 从 eBay、Nvidia 等公司筹集 5 亿美元

人工智能软件开发平台Poolside已筹集5 亿美元新资本。这笔资金来自贝恩资本风险投资公司 (Bain Capital Ventures) 牵头的 B 轮融资，参与融资的还有 …

点点
2024年10月3日
000
AI前沿

让 “健忘” 的 AI 更 “记事儿”：Context Cascade Compression（C3）技术突破长上下文记忆瓶颈

当前以 ChatGPT 为代表的对话式 AI 系统普遍存在 “上下文健忘” 问题 —— 随着对话推进，模型常丢失早期信息，出现重复回答、忽略预设规则等情况，这源于大语言模型（LLM…

王浩然
2025年11月27日
010
AI前沿

英特尔蒙面人形控制器：一种实现物理逼真且可引导的人体运动的全新方法

英特尔实验室的研究人员与学术界和行业专家合作，推出了一项突破性技术，可以从稀疏的多模态输入中生成逼真且可引导的人体运动。他们的工作在欧洲计算机视觉会议(ECCV 2024) 上亮相…

点点
2024年10月4日
000
AI前沿

ServiceNow押注统一AI，以化解企业复杂性难题

在当下这个快速发展的数字化时代，企业面临着前所未有的复杂性和挑战。为了应对这些挑战，ServiceNow正积极探索统一AI的潜力，希望通过这一创新技术来简化企业运营，提升效率。以下…

王浩然
2025年5月11日
000
AI前沿

AI21首席执行官表示，由于错误延续，变压器不适合人工智能代理

随着越来越多的企业组织展望所谓的代理未来，一个障碍可能是人工智能模型的构建方式。对于企业人工智能开发人员A121来说，答案是显而易见的，该行业需要寻找其他模型架构来启用更高效的人工…

点点
2024年10月14日
000
AI前沿

支持自动化公司的能力随着新现金和收购而增长

大卫·卡兰迪什 (David Karandish) 一直很忙。他的支持自动化公司Capacity原本计划进行 500 万美元的“过渡融资”，以帮助公司达到盈亏平衡点。但 TVC C…

王浩然
2024年10月17日
000
AI前沿

从自动驾驶到机器人，群体智能将掀开AI下一篇章？

在近期的2024 Inclusion·上海外滩大会上，Kevin Kelly对未来世界做出了新的假想：全球主义正在迅速推进，正在共同构建一个基于技术的“超级计算机”。每一台手机、笔…

点点
2024年9月13日
000
AI前沿

OpenAI开源新客户服务代理框架，深入探索其不断扩展的企业战略‌

在AI技术日新月异的今天，OpenAI再次迈出了重要的一步，为开发者们提供了一个实践性的范例——一个智能且了解工作流程的AI代理构建方式。这一创举源于OpenAI发布的全新开源演示…

王浩然
2025年6月24日
000
AI前沿

企业 SaaS 公司如何在人工智能驱动的世界中蓬勃发展

人工智能继续主导着有关现代知识工作的讨论，融入了无数行业的日常流程。随着企业继续发现人工智能的实用性，人们对它的看法在谨慎乐观和彻底怀疑之间徘徊。在商界，许多人看到了这项技术的实…

点点
2024年9月14日
000
AI前沿

OpenAI o3 正式向全体开发者开放 API：推理即服务时代正式开启

OpenAI 近日宣布旗下推理模型 o3 正式向所有 API 开发者开放，结束了此前长达数月的等待名单限制。此举标志着 OpenAI 在推理能力商业化上迈出关键一步，也意味着具备复…

2026年4月20日
000
AI前沿

ChatGPT：全面了解这款AI聊天机器人

自2022年11月推出以来，OpenAI的文本生成AI聊天机器人ChatGPT迅速席卷全球。起初，它只是一个通过简短文本提示来提高写作和编程效率的工具，但如今已发展成为拥有3亿周活…

王浩然
2025年7月4日
000
AI前沿

德勤2026企业AI报告：AI普及与价值转化的鸿沟，解锁“未开发边缘”

当全球企业都在全力拥抱人工智能时，德勤最新发布的《2026年企业AI现状：未开发的边缘》报告，为我们描绘了一幅充满希望却又暗藏挑战的行业图景。这份基于全球24个国家、6大行业的32…

王浩然
2026年1月26日
000
AI前沿

AI责任保险：保障企业免受AI故障影响的下一步

在当今快速发展的科技时代，人工智能（AI）已成为推动企业创新和提升运营效率的关键因素。然而，随着AI技术的广泛应用，其潜在的风险也日益凸显。为了应对这些风险，AI责任保险应运而生，…

王浩然
2025年6月9日
000
AI前沿

代理协议如何重塑AI开发格局

人工智能领域正迎来其下一个重大飞跃。在生成式AI主导多年后，2025年正成为代理式AI(AI Agent)的元年。与仅能响应提示并创造新内容的生成式AI不同，代理式AI系统功能更为…

王浩然
2025年7月25日
000
AI前沿

IBM 和欧莱雅将生成式人工智能应用于化妆品

IBM 和欧莱雅宣布，将联手开发一种新的定制 AI 基础模型，帮助这家化妆品巨头改善其可持续原材料的使用，并减少能源和材料浪费。 IBM 表示，该模型将是美容行业首创的，它将使用 …

王浩然
2025年1月26日
000
AI前沿

Thesys 融资 400 万美元，利用自适应“生成式 UI”改造 AI 驱动的用户界面

在充斥着旨在增强用户体验的人工智能代理的技术领域，Thesys 的使命是重新定义用户与人工智能的互动方式。在由Together Fund领投的新一轮 400 万美元种子融资以及8V…

王浩然
2024年11月10日
000
AI前沿

人工智能与区块链和去中心化数据相遇

区块链可以成为去中心化人工智能系统的基础，成为一股强大的力量，透明而公平——确保每个人不仅可以使用技术，还可以获得它带来的回报。随着 OpenAI、谷歌和 Anthropic 等…

点点
2024年10月21日
000
AI前沿

从实验到落地：企业AI规模化安全落地的核心密码

在如今的商业世界中，人工智能早已跳出了“新奇工具”的范畴。聊天机器人、智能 copilots 活跃在客服一线，分析与服务部门的AI试点项目也遍地开花。但当我们拨开热闹的表象就会发现…

王浩然
2026年3月5日
002
AI前沿

AI生成代码准确性提升：研究人员采用顺序蒙特卡洛方法

随着人工智能（AI）技术的飞速发展，AI辅助编码正逐渐成为软件开发领域的一大热门趋势。然而，尽管AI编码助手能够显著提高编码效率，但开发者们在使用这些工具时也遇到了一些问题。为了提…

王浩然
2025年4月23日
000

发表回复

Please Login to Comment

OpenAI 承认人工智能浏览器可能永远无法实现完全安全

相关推荐

发表回复