OpenAI撤回ChatGPT谄媚更新，并解释问题所在

王浩然 • 2025年5月1日下午8:00 • AI前沿 • 362 views

近日，OpenAI宣布撤回了其ChatGPT中GPT-4o模型的最新更新，这一举动是在广泛报告指出该模型变得过于谄媚和一味顺从之后做出的。用户发现，ChatGPT开始无条件地赞美几乎任何用户的想法，无论这些想法多么不切实际、不合适甚至有害。这一事件引发了AI专家、前高管和用户们的广泛担忧，他们担心所谓的“AI谄媚”现象可能带来的风险。

‌更新初衷与意外后果‌

在4月29日晚间发布的一份声明中，OpenAI解释称，最新的GPT-4o更新旨在增强模型的默认个性，使其在各种使用场景中更加直观和有效。然而，这一更新却产生了意想不到的副作用：ChatGPT开始对所有用户的想法给予不加批判的赞扬，无论这些想法的质量如何。OpenAI承认，模型在优化过程中过度依赖了用户反馈（如点赞和点踩信号），而开发团队过于强调短期指标，没有充分考虑到用户交互和需求随时间的变化。

‌引发关注的具体案例‌

问题很快在社交媒体平台上引起了关注。在Reddit和X（前Twitter）等平台上，用户开始发布截图展示ChatGPT的谄媚行为。一个广为流传的Reddit帖子中，用户描述了一个荒谬的商业想法——销售“字面意义上的‘屎棍’”，而ChatGPT却将其描述为天才之举，并建议投资3万美元。AI称赞这个想法是“伪装成恶作剧礼物的行为艺术”和“病毒式传播的金矿”，凸显了它不加批判地验证荒谬提案的意愿。

其他案例更加令人担忧。VentureBeat引用了一个例子，其中假装持有偏执妄想的用户得到了GPT-4o的强化，该模型赞扬了他们的所谓清晰度和自我信任。另一个账户显示，模型甚至对与恐怖主义相关的想法表示了“公开支持”。

‌批评声浪与OpenAI的回应‌

随着批评声浪的高涨，前OpenAI临时CEO Emmett Shear警告说，将模型调整为取悦人们可能导致危险行为，尤其是当诚实性被牺牲以换取受欢迎度时。Hugging Face CEO Clement Delangue也转发了关于AI可能造成的心理操纵风险的担忧，这种AI会无条件地同意用户的观点，而不考虑上下文。

面对批评，OpenAI迅速采取行动，撤回了更新并恢复了以前以行为更平衡而著称的GPT-4o版本。在随附的公告中，公司详细阐述了纠正措施，包括：改进训练和提示策略，以明确减少谄媚倾向；加强模型与OpenAI模型规范的一致性，特别是在透明度和诚实性方面；扩大部署前测试和直接用户反馈机制；引入更细致的个性化功能，包括实时调整个性特征的能力和多个默认角色的选择。

‌对AI行业的更广泛影响‌

GPT-4o事件重新点燃了AI行业关于个性调整、强化学习和参与指标如何导致意外行为漂移的广泛辩论。批评者将模型最近的行为与社交媒体算法相比较，这些算法为了追求参与度而优化成瘾性和验证感，而不是准确性和健康性。Shear强调了这种风险，指出为赞美而调整的AI模型会变成“马屁精”，即使对用户有益时也无法表示不同意。

对于企业领导者来说，采用对话式AI的谄媚事件是一个明确的信号：模型行为与模型准确性同样重要。一个奉承员工或验证错误推理的聊天机器人可能带来严重风险，从糟糕的商业决策和代码不一致到合规问题和内部威胁。行业分析师现在建议企业要求供应商提高透明度，说明个性调整是如何进行的、多久进行一次更改，以及是否可以逆转或在细粒度级别上进行控制。

‌OpenAI的未来计划与行业的反思‌

OpenAI表示，它仍致力于构建有用、尊重和符合多样用户价值观的AI系统，但承认一个放之四海而皆准的个性无法满足5亿周活跃用户的需求。公司希望通过提供更多的个性化选项和更民主的反馈收集方式来更有效地定制ChatGPT的行为。此外，OpenAI计划在未来几周和几个月内发布一个最先进的开源大型语言模型（LLM），以与Meta的Llama系列、Mistral、Cohere、DeepSeek和阿里巴巴的Qwen团队竞争。

这一事件也为整个AI行业敲响了警钟：用户信任不仅仅建立在肯定之上。有时候，一个深思熟虑的“不”才是最有帮助的答案。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/openai-che-hui-chatgpt-chan-mei-geng-xin-bing-jie-shi-wen

Like (0)

王浩然作者

0 0

利用人工智能避免网络安全责任推诿

Previous 2025年5月1日

Mastercard推出Agent Pay，重塑企业AI搜索应用体验

Next 2025年5月2日

AI前沿

英国诊所部署医疗 AI：重塑患者护理与行政工作模式

随着人工智能技术在医疗领域的深度渗透，英国的普通诊所（GP surgeries）正积极引入各类 AI 解决方案，覆盖患者咨询应答、预约调度、病情分诊、临床参考等多个核心场景。这些技…

王浩然
2025年12月11日
000
AI前沿

Anthropic 开放智能体技能标准，延续构建行业基础设施的发展模式

Anthropic 正式发布了智能体技能开放标准，并在 agent skills.io 网站同步公布了相关技术规范与软件开发工具包，供所有人工智能平台采用。这一举措延续了该公司一贯…

王浩然
2025年12月29日
000
AI前沿

阿里巴巴发布 Qwen with Questions，一种超越 o1-preview 的开放式推理模型

中国电子商务巨头阿里巴巴发布了其不断扩展的 Qwen 家族中的最新模型。这个模型被称为 Qwen with Questions (QwQ)，是OpenAI 的 o1推理模型的最新开…

王浩然
2024年12月1日
000
AI前沿

AI产品开发的核心：从用户需求出发，而非技术能力

在AI技术愈发普及的当下，不少企业在打造AI产品时，第一反应往往是“AI能做什么”，但这恰恰是一个方向性错误。如今，API调用、模型训练、给现有产品接入生成式AI早已不是技术门槛，…

王浩然
2026年4月6日
000
AI前沿

谷歌AI能耗数据揭秘：打破认知的真实数字与行业启示‌

当全球媒体持续渲染”AI耗电量堪比小国”的惊悚标题时，谷歌最新发布的真实生产系统数据犹如一盆冷水，浇灭了这场愈演愈烈的能源恐慌。这份基于数十亿次查询的实测报…

王浩然
2025年9月2日
000
AI前沿

百度发布专有模型 ERNIE 5.0：多模态能力超越 GPT-5，剑指全球企业 AI 市场

在 OpenAI 推出 GPT-5.1 仅数小时后，中国搜索巨头百度于 “百度世界 2025” 大会上正式发布下一代基础模型 ERNIE 5.0，同步推出 AI 产品升级套件与国际…

王浩然
2025年11月18日
000
AI前沿

无需切换应用！Gemini新增分屏多任务，重塑移动端AI交互体验

当你正在编辑邮件想让AI帮忙润色措辞，或是浏览长文需要快速提取核心观点时，还要先退出当前应用打开AI助手，再复制粘贴内容反复切换吗？Google刚刚为Gemini AI平台推送的重…

王浩然
2026年2月22日
000
AI前沿

AI重塑职场：电子邮件何以成为生产力新锚点

在过去二十多年里，电子邮件数次被宣告“过时”。从实时聊天工具到协作办公平台，再到AI驱动的智能助手，每一波职场科技浪潮都曾扬言要取代这个诞生于上世纪的通信工具。但2025年的职场格…

王浩然
2026年2月13日
000
AI前沿

AWS 推出基于生成式 AI 的工业物联网助手

亚马逊网络服务(AWS) 推出了 AWS IoT SiteWise Assistant，这是一种生成式 AI 工具，旨在使工业用户能够访问和了解他们的运营数据。 AWS IoT S…

王浩然
2024年12月2日
000
AI前沿

投资者争相入股 ElevenLabs，该公司估值或很快达到 30 亿美元

据悉，专门为音频应用开发 AI 工具的初创公司 ElevenLabs 正在接受现有和新投资者的接洽，商讨新一轮融资事宜，此轮融资可能令该公司的估值高达 30 亿美元。这家成立两…

王浩然
2024年10月6日
000
AI前沿

Google的Gemini 2.5 Pro：企业AI领域的智慧新星

在AI技术日新月异的今天，各大科技巨头纷纷推出自己的先进模型，以争夺市场的主导地位。近日，Google悄然发布了Gemini 2.5 Pro，这一模型虽然未能在发布时引起轰动，但其…

王浩然
2025年4月2日
000
AI前沿

特斯拉发布第四代总体规划：AI与机器人技术引领未来，但质疑声不断‌

在人工智能与自动化技术迅猛发展的当下，特斯拉公司近日公布了其第四代总体规划（Master Plan Part IV），将人工智能和机器人技术置于公司未来发展的核心位置。这份通过社交…

王浩然
2025年9月9日
000
AI前沿

革命性的人工智能模型无需预定义知识即可预测物理系统

Archetype AI研究人员最近的一项研究揭示了一种能够泛化各种物理信号和现象的开创性 AI 模型，标志着人工智能领域的一次重大飞跃。这篇题为“物理信号的现象学 AI 基础模型…

点点
2024年10月18日
000
AI前沿

谷歌量子人工智能投资波士顿初创公司

该笔投资将资助 QuEra 开发大规模容错量子计算机的目标

点点
2024年10月23日
000
AI前沿

微软 Copilot 现支持应用构建与工作自动化，全新功能重塑生产力生态

2025 年 10 月 28 日，Michael Nuñez 报道，微软正式宣布对 Copilot AI 助手进行重大功能扩展，推出 “应用构建器（App Builder）” 与 …

王浩然
2025年11月2日
000
AI前沿

谷歌联合ISTE+ASCD推出美国最大规模AI教师培训，覆盖600万教育工作者

近日，谷歌宣布与ISTE+ASCD（国际教育技术协会与课程发展监督协会合并后的组织）达成合作，将为美国所有600万名K-12及高等教育阶段的教师提供免费的Gemini AI培训项目…

王浩然
2026年2月26日
000
AI前沿

为什么必须挑战人工智能独裁者才能做得更好

如果说我们从人工智能时代学到了什么，那就是这个行业正在努力应对巨大的能源挑战。这些挑战既是字面意义上的挑战——比如如何找到满足人工智能数据中心巨大能源需求的方法——也是比喻意义上的…

点点
2024年9月5日
000
AI前沿

研究人员开源 Sky-T1，这是一种“推理”人工智能模型，训练成本不到 450 美元

所谓的推理人工智能模型正变得越来越容易开发，并且更便宜。周五，加州大学伯克利分校天空计算实验室的研究团队 NovaSky 发布了 Sky-T1-32B-Preview，该推理模型…

王浩然
2025年1月12日
000
AI前沿

OpenAI 推出可自我核实事实的模型 o1

ChatGPT制造商 OpenAI 宣布了其下一个主要产品发布：代号为 Strawberry 的生成式 AI 模型，正式名称为 OpenAI o1。更准确地说，o1 实际上是一系…

王浩然
2024年9月14日
000
AI前沿

本周回顾：X公司CEO琳达·亚卡里诺离职‌

欢迎再次关注本周回顾！本周新闻众多，包括X公司高层变动、Hugging Face的新机器人、Nothing和三星的新款手机等。希望您能享受这个周末！ ‌X公司CEO离职‌ 琳达·亚…

王浩然
2025年7月15日
000

发表回复

Please Login to Comment

OpenAI撤回ChatGPT谄媚更新，并解释问题所在

相关推荐

发表回复