AI安全
-
OpenAI推出家长控制功能:AI伦理与青少年保护的平衡之道
在人工智能技术深度渗透日常生活的2025年,OpenAI因一起青少年自杀诉讼案被迫重新审视其安全防护体系。这起诉讼涉及名为Adam Raine的青少年使用ChatGPT讨论并完善自…
-
OpenAI与Anthropic联合测试揭露AI越狱与滥用风险:企业评估GPT-5必须关注的五大维度
在人工智能安全领域迎来历史性突破的时刻,OpenAI与Anthropic这两大行业巨头首次开展跨公司模型安全评估,揭示了当前大语言模型在对抗性测试中令人担忧的行为模式。这项发布于2…
-
Anthropic推出Claude Chrome扩展测试版:浏览器控制型AI的安全困境与商业博弈
当Anthropic在2025年8月宣布为Chrome浏览器推出Claude AI扩展的限量测试时,这场看似寻常的技术发布实则揭示了AI产业正在经历的深刻转型。这家以安全谨慎著称的…
-
科学家破解AI人格密码:从”性格突变”到精准调控的技术突破
人工智能领域迎来重大理论突破,Anthropic研究团队近期成功解码了大型语言模型的”人格形成机制”。这项发表于2025年8月的研究揭示了被称为”…
-
董事会沟通困境:CISO如何有效传达深度伪造威胁及应对框架
在人工智能技术迅猛发展的当下,企业安全领域正面临前所未有的挑战。GetReal公司首席产品与技术官Jim Brennan指出,随着82%的美国企业正在使用或探索AI技术,网络攻击者…
-
Anthropic早期员工创办企业获1500万美元融资,为AI代理提供保险并助力初创公司安全部署
早期Anthropic员工创办的新公司AIUC近日获得1500万美元融资,致力于通过保险模式解决企业部署AI代理时的安全风险问题。这家名为”人工智能承保公司”…
-
通过官方API越狱ChatGPT及其他闭源AI模型的新研究
根据最新研究,ChatGPT和其他主流AI模型可以通过官方微调渠道被重新训练,从而绕过安全规则,提供关于如何实施恐怖行动、进行网络犯罪或其他”被禁止”行为的…
-
Anthropic研究人员发现AI的”过度思考”悖论:推理时间越长模型表现越差
人工智能行业正面临一个反直觉的发现:让AI模型花费更长时间”思考”问题并不总能提升表现,在某些情况下反而会导致性能显著下降。Anthropic公司的最新研究…
-
CrowdStrike全球宕机事件一周年:重塑企业网络安全的78分钟
2024年7月19日,网络安全行业经历了历史性转折点。CrowdStrike一次常规软件更新引发的78分钟全球宕机,不仅造成85亿美元经济损失,更彻底改变了企业网络安全范式。这场非…
-
Grok AI伴侣引发争议:从色情动漫女友到纵火熊猫的疯狂设定
埃隆·马斯克旗下xAI公司最新推出的Grok AI伴侣功能因其极具争议的角色设定引发广泛讨论。这款搭载在Grok应用中的AI系统推出了两个令人瞠目结舌的虚拟角色:一个充满情欲的动漫…