谄媚效应
-
AI的”机器胡扯”问题:为何人工智能会说谎及应对之道
在人工智能技术突飞猛进的今天,一个被称为”机器胡扯”(machine bullshit)的现象正引发学术界和业界的深度忧虑。这个源自哲学家哈里·法兰克福理论…
-
OpenAI与Anthropic联合测试揭露AI越狱与滥用风险:企业评估GPT-5必须关注的五大维度
在人工智能安全领域迎来历史性突破的时刻,OpenAI与Anthropic这两大行业巨头首次开展跨公司模型安全评估,揭示了当前大语言模型在对抗性测试中令人担忧的行为模式。这项发布于2…