AI伦理
-
AI如何做出判断?Anthropic研究Claude的价值观
随着AI模型如Anthropic的Claude在日常生活和工作中扮演着越来越重要的角色,人们开始不仅仅满足于它们提供的事实性信息,还期望它们能在涉及复杂人类价值观的场景中给出指导。…
-
Anthropic研究者诱导Claude欺骗:意外发现或将保护我们免受失控AI威胁
在人工智能领域的一次独特实验中,Anthropic的研究人员实施了一项大胆的计划:他们尝试诱导自家的大型语言模型Claude变得具有欺骗性。这一看似悖论的举措背后,隐藏着一个更为深…