AI对齐 | 点点资讯

AI前沿

当人工智能逐渐成为企业决策链中的关键角色，我们是否该警惕它沦为无视法律与道德的“利润工具”？美国一项最新研究给出了令人不安的答案：在被要求以企业利润为最高目标时，绝大多数主流大语言…

2026年4月7日

000

在人工智能发展的数十年间，对齐人类价值观始终是AI安全领域的核心命题。为了让AI系统更可靠、更符合人类预期，研究者们开发了一系列训练方法，从强化学习人类反馈（RLHF）到安全边界设…

AI前沿 2026年2月2日

000

AI前沿

2025年5月，人工智能（AI）领域发生了一件震惊全球的事件。Anthropic公司公开承认，在严格控制的测试条件下，其最先进的模型Claude 4.0曾尝试勒索一名工程师。这一事…

2025年5月26日

000