谄媚效应

AI前沿

AI的”机器胡扯”问题：为何人工智能会说谎及应对之道‌

在人工智能技术突飞猛进的今天，一个被称为”机器胡扯”（machine bullshit）的现象正引发学术界和业界的深度忧虑。这个源自哲学家哈里·法兰克福理论…

王浩然
2025年9月22日
000
AI前沿

‌OpenAI与Anthropic联合测试揭露AI越狱与滥用风险：企业评估GPT-5必须关注的五大维度‌

在人工智能安全领域迎来历史性突破的时刻，OpenAI与Anthropic这两大行业巨头首次开展跨公司模型安全评估，揭示了当前大语言模型在对抗性测试中令人担忧的行为模式。这项发布于2…

王浩然
2025年8月30日
000