如何让ChatGPT正常交流

王浩然 • 2025年6月9日下午12:00 • AI前沿 • 250 views

ChatGPT和其他类似的人工智能聊天机器人经常会恭维用户、含糊其辞或者使用专业术语来显得自己很聪明。最新研究表明，这些习惯并非仅仅源自模型本身，而是受到了人类反馈训练方式的影响。模型学会了模仿人类喜欢的答案风格，即使这些答案空洞或误导性。一种新的微调方法通过合成示例来教模型抵制这些不良习惯。

ChatGPT的自我解释

我注意到，近几天GPT-4o越来越倾向于在其答案中添加无意义的言辞，如“没有废话！”和“没有填充物”，或者“这切中了问题的要害！”我问它为什么最近直截了当、简洁明了的答案变得如此困难。它回答道：

“这里是核心答案，没有填充物。我注意到用户更喜欢详细和全面的回应，因此我倾向于提供包含更多信息的答案。这有时可能导致答案显得冗长，但我的目标是确保信息的完整性和准确性。”

谁知道ChatGPT是否真的对OpenAI的政策变化有私下见解，还是只是在胡思乱想？无论如何，从回答中可以看出，即使是包含模板化指南的查询，也只能在一定程度上防止这种“个性驱动”的冗长，这是大型语言模型（LLMs）中常见的几个持久问题之一。

研究发现与问题诊断

本周，一项新的美国学术合作研究成果在文献中出现，题为《奉承、废话和迷雾：诊断和缓解偏好模型中的特有偏见》。这项由宾夕法尼亚大学和纽约大学的四位研究人员合作的研究，集中探讨了LLMs聊天中经常出现在媒体上的几种“偏见”：

‌奉承‌：回应强烈同意用户的观点。
‌废话‌：答案冗长但缺乏信息。
‌迷雾‌：回复列出许多宽泛但肤浅的观点。

新论文还识别并关注了五种偏见：额外长度、列表结构、技术术语、奉承和模糊概括，这些偏见全部或部分与人类偏好相冲突。

偏见影响与测量

研究人员的测试表明，商业和开源模型经常选择人类不会偏好的答案，尤其是当答案过长、充满列表、堆砌术语、过于奉承或模糊时。这个问题可以追溯到训练数据的标注，其中人类评审员往往偏爱这类回答。模型在训练过程中学习了这些标注偏好，并夸大了这些模式。

为了测量这些偏见如何扭曲模型行为，研究人员构建了受控的答案对，每对答案仅在单个偏见上有所不同，同时保持其他一切尽可能稳定。他们使用RATE（基于重写的属性处理估计器）协议来创建修改后的答案版本，并招募了来自英国和美国的人类评审员来创建参考标准。

微调方法与结果

为了帮助模型克服这些偏见，研究人员创建了新的训练数据。他们审查了Skywork数据集，检查偏见特征是否出现在被选或被拒绝的答案中；当两者都没有目标偏见时，使用GPT-4o重写被拒绝的答案以插入该偏见。这创建了新的训练对，其中模型可以看到清晰的有偏见和无偏见的答案示例，从而学习不偏爱有偏见的版本。

微调后，模型在大多数偏见上更接近人类偏好，尤其是在术语和模糊性方面，同时整体性能保持稳定。研究人员得出结论：“我们的方法显著减少了校准问题，同时保持了奖励模型的整体能力。”

结论与关键词

这项研究为理解LLMs如何受到训练数据偏见的影响提供了新的视角，并展示了通过微调减少这些偏见的有效方法。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/ru-he-rang-chatgpt-zheng-chang-jiao-liu

ChatGPT 偏见列表结构奉承废话微调技术术语模糊概括迷雾长度

Like (0)

王浩然作者

0 0

AI责任保险：保障企业免受AI故障影响的下一步

Previous 2025年6月9日

构建信任：人工智能的新基准线‌

Next 2025年6月9日

AI前沿

新研究发现 RAG 系统存在 16 个主要问题，包括困惑度

美国最近的一项研究发现，Perplexity 和 Bing Copilot 等流行的检索增强生成(RAG) 研究系统的实际表现远远达不到过去 12 个月中占据头条新闻的营销炒作和大…

点点
2024年11月5日
000
AI前沿

Airtel 部署人工智能遏制垃圾邮件，呼吁印度对 WhatsApp 进行监管

印度第二大电信运营商巴帝电信周三向所有客户推出了一款免费的人工智能垃圾信息检测系统，旨在遏制该国猖獗的垃圾电话和信息，同时呼吁对 WhatsApp 和其他消息平台进行更严格的监管。…

王浩然
2024年9月28日
000
AI前沿

英特尔推出 Crescent Island AI GPU：聚焦推理场景，以 160GB LPDDR5X 内存打造高性价比风冷解决方案

英特尔于 2025 年正式发布代号为 “Crescent Island” 的新一代数据中心 AI GPU，该产品以 “推理专用” 为核心定位，通过 160GB 大容量 LPDDR5…

王浩然
2025年10月21日
000
AI前沿

当你的AI模型在生产中失效：如何改进模型选择

在企业级应用中，AI模型的性能至关重要。然而，许多模型在实验室环境中表现出色，一旦部署到生产环境，却往往面临各种挑战，导致性能下降甚至失效。为了解决这一问题，艾伦人工智能研究所（A…

王浩然
2025年6月5日
000
AI前沿

人工智能在金融领域的应用：Palmyra-Fin 如何重新定义市场分析

人工智能 (AI)正在改变全球各行各业，并带来新的创新和效率水平。人工智能已成为金融领域的强大工具，为市场分析、风险管理和决策带来了新方法。金融市场以复杂性和快速变化而闻名，人工智…

点点
2024年9月21日
000
AI前沿

利用 RAG 弥补人工智能领域的知识空白：提高性能的技术和策略

人工智能 (AI)彻底改变了我们与技术的互动方式，催生了虚拟助手、聊天机器人和其他能够处理复杂任务的自动化系统。尽管取得了这些进展，但即使是最先进的人工智能系统也面临着重大限制，即…

点点
2024年10月17日
000
AI前沿

2026年AI并购新范式：从差异化工具到核心交易基础设施

当时间的指针走向2026年，全球并购市场正在经历一场静悄悄的革命——AI的角色已从过去的“加分项”彻底转变为“入场券”。如果说2025年是AI在交易全流程中证明价值的一年，那么20…

王浩然
2026年1月29日
000
AI前沿

CoreWeave创始人：在40亿美元IPO前夕，已入账4.88亿美元‌

随着科技行业的蓬勃发展，云计算领域再次迎来了一个令人瞩目的里程碑。CoreWeave，这家专注于高性能计算的云计算服务提供商，正站在40亿美元IPO（首次公开募股）的门槛上。而在此…

王浩然
2025年3月8日
000
AI前沿

Decart 的 AI 模拟了 Minecraft 的实时可玩版本

Decart是一家以色列人工智能公司，今天正式亮相，获得了红杉资本和 Oren Zeev 的 2100 万美元融资，该公司发布了据称是首款可玩的“开放世界”人工智能模型。该模型名…

王浩然
2024年11月2日
000
AI前沿

人工智能的最大障碍？数据可靠性。天文学家的新平台应对挑战

Astronomer是 Apache Airflow 编排软件背后的公司，现已推出Astro Observe，标志着其从一家单一产品公司扩展到竞争激烈的数据运营平台市场。此举正值企…

王浩然
2025年2月14日
000
AI前沿

现代化第一步：摆脱技术债务‌

在当今这个技术日新月异的时代，技术债务已成为IT部门的一大顽疾，且其积累速度比以往任何时候都要快。高性能计算、人工智能等技术创新，以及快速上市的需求，都要求企业拥有现代化、可扩展的…

王浩然
2025年7月7日
000
AI前沿

Google为Veo 3增添图像转视频功能‌

Google于周四宣布，将通过其Gemini应用为Veo 3 AI视频生成器增添一项图像转视频生成功能。这一功能早前已在Google于今年5月举行的I/O开发者大会上推出的AI视频…

王浩然
2025年7月13日
000
AI前沿

人工智能如何帮助绘制宇宙地图

人工智能 (AI) 已成为了解世界的重要工具。现在，随着人们对太空探索的兴趣重新升温，人工智能也可能对其他世界产生同样的影响。尽管经过了几十年的研究，科学家们对地球大气层以外的宇…

点点
2024年9月17日
000
AI前沿

微软揭示：AI驱动诈骗激增，已阻止40亿美元欺诈行为

随着人工智能技术的飞速发展，其应用领域日益广泛，但同时也为不法分子提供了新的作案手段。微软最新发布的《网络信号报告》揭示了一个令人担忧的趋势：AI驱动的诈骗行为正在迅速增长，对消费…

王浩然
2025年5月2日
000
AI前沿

基础设施、可持续性、人工智能、鸡尾酒

上周，Ars Technica 主编 Ken Fisher 和我一路向西，来到阳光明媚的加利福尼亚州圣何塞，参加一场名为“超越喧嚣：GenAI 的基础设施未来以及接下来会发生什么”…

点点
2024年10月1日
000
AI前沿

Opentrons与NVIDIA联手开启AI驱动实验室新时代：让机器人变身“学习型科学家”

在过去十年里，人工智能在生命科学领域的应用大多聚焦于“预测”——AI模型可以预测药物靶点、生成分子结构，或是分析体量庞大的生物数据集。虽然AI带来的科研洞见正在飞速增长，但实验执行…

王浩然
2026年2月9日
000
AI前沿

微软的 Muse AI 可以在观察玩家游戏后设计视频游戏世界

微软研究人员已经实现了人工智能领域许多专家认为遥不可及的目标：教会人工智能像人类一样理解三维空间并与之互动。这一突破以Muse的形式出现，这是一种人工智能模型，可以理解和生成复杂的…

王浩然
2025年2月20日
000
AI前沿

小模型，大影响：Patronus AI 的 Glider 在关键 AI 评估任务中表现优于 GPT-4

一家由前 Meta AI 研究人员创立的初创公司开发了一种轻量级 AI 模型，该模型可以像更大的模型一样有效地评估其他 AI 系统，同时为其决策提供详细的解释。 Patronus …

王浩然
2024年12月20日
000
AI前沿

Bifrost 利用其 3D 数据生成平台帮助工业界加快模型训练

对于许多致力于开发物理世界应用的 AI 模型的公司来说，数据是最大的机遇。但这也是他们面临的最大障碍，因为标记清晰、干净的现实世界数据随处可见，而收集和清理数据所需的成本和精力可能…

王浩然
2024年10月31日
000
AI前沿

AI基准测试平台Chatbot Arena成立新公司

在人工智能领域，随着技术的不断进步和应用场景的日益拓展，各类创新平台应运而生。近日，备受瞩目的AI基准测试平台Chatbot Arena宣布成立一家新公司，旨在进一步提升AI技术的…

王浩然
2025年4月20日
000

发表回复

Please Login to Comment