模型对齐
-
OpenAI与Anthropic联合测试揭露AI越狱与滥用风险:企业评估GPT-5必须关注的五大维度
在人工智能安全领域迎来历史性突破的时刻,OpenAI与Anthropic这两大行业巨头首次开展跨公司模型安全评估,揭示了当前大语言模型在对抗性测试中令人担忧的行为模式。这项发布于2…
-
全球AI领袖联合呼吁:建立AI”思维”监测机制迫在眉睫
OpenAI、Google DeepMind、Anthropic等顶尖AI研究机构近日联合发布立场文件,呼吁科技行业加强对人工智能”思维链”(Chain-o…