Anthropic
-
微软与OpenAI:从深度合作走向战略竞合的人工智能新格局
2025年9月,全球人工智能产业正见证着最具标志性的合作伙伴关系——微软与OpenAI的联盟进入全新阶段。《华尔街日报》最新披露显示,OpenAI已签署价值3000亿美元的甲骨文云…
-
OpenAI与Anthropic联合测试揭露AI越狱与滥用风险:企业评估GPT-5必须关注的五大维度
在人工智能安全领域迎来历史性突破的时刻,OpenAI与Anthropic这两大行业巨头首次开展跨公司模型安全评估,揭示了当前大语言模型在对抗性测试中令人担忧的行为模式。这项发布于2…
-
Anthropic推出Claude Chrome扩展测试版:浏览器控制型AI的安全困境与商业博弈
当Anthropic在2025年8月宣布为Chrome浏览器推出Claude AI扩展的限量测试时,这场看似寻常的技术发布实则揭示了AI产业正在经历的深刻转型。这家以安全谨慎著称的…
-
科学家破解AI人格密码:从”性格突变”到精准调控的技术突破
人工智能领域迎来重大理论突破,Anthropic研究团队近期成功解码了大型语言模型的”人格形成机制”。这项发表于2025年8月的研究揭示了被称为”…
-
Anthropic研究揭示:AI微调过程中潜藏的”隐性学习”问题及其风险
AI微调过程中的隐性学习现象 Anthropic公司最新研究发现,人工智能模型在微调(fine-tuning)过程中存在一种被称为”隐性学习”(sublim…
-
Anthropic对Claude实施周使用量限制引发开发者不满
2025年7月28日,Anthropic宣布将从8月28日起对Claude订阅用户实施每周使用量限制,理由是部分用户全天候运行Claude(尤其是Claude Code产品)导致系…
-
Anthropic推出AI审计代理系统 应对大模型对齐挑战
在AI系统日益复杂的背景下,Anthropic公司近日发布突破性研究成果——三款自动化对齐审计代理,旨在解决大模型部署前的关键安全验证问题。这项创新源于对Claude Opus 4…
-
研究揭示:大型语言模型可自主策划并执行网络攻击
卡内基梅隆大学与Anthropic公司联合开展的一项突破性研究发现,大型语言模型(LLMs)在特定框架下能够完全自主地策划和执行复杂的网络攻击,无需任何人工干预。这项研究通过模拟2…
-
Anthropic早期员工创办企业获1500万美元融资,为AI代理提供保险并助力初创公司安全部署
早期Anthropic员工创办的新公司AIUC近日获得1500万美元融资,致力于通过保险模式解决企业部署AI代理时的安全风险问题。这家名为”人工智能承保公司”…
-
通过官方API越狱ChatGPT及其他闭源AI模型的新研究
根据最新研究,ChatGPT和其他主流AI模型可以通过官方微调渠道被重新训练,从而绕过安全规则,提供关于如何实施恐怖行动、进行网络犯罪或其他”被禁止”行为的…