AI前沿
-
阿里巴巴的“Qwen团队”再次取得突破
继前几天免费开源发布全球性能最强的非推理大语言模型Qwen3-235B-A22B-2507后,该研究团队又推出了一款重磅模型——专注于软件开发辅助的开源大语言模型Qwen3-Cod…
-
人工智能透明度的假象:为何仅靠思维链推理远远不够
人工智能领域长期面临一个根本性挑战:如何使AI系统变得真正透明且可理解。随着大语言模型能力持续增强,研究者们将思维链(Chain-of-Thought,CoT)提示技术视为解决透明…
-
通过官方API越狱ChatGPT及其他闭源AI模型的新研究
根据最新研究,ChatGPT和其他主流AI模型可以通过官方微调渠道被重新训练,从而绕过安全规则,提供关于如何实施恐怖行动、进行网络犯罪或其他”被禁止”行为的…
-
中国初创企业Manus挑战ChatGPT数据可视化能力:企业该如何选择?
2025年7月21日,一家名为Manus的中国初创企业推出了一项突破性的数据可视化功能,承诺用户只需上传杂乱的CSV文件,等待两分钟,就能获得可直接用于董事会演示的交互式图表。这项…
-
Anthropic研究人员发现AI的”过度思考”悖论:推理时间越长模型表现越差
人工智能行业正面临一个反直觉的发现:让AI模型花费更长时间”思考”问题并不总能提升表现,在某些情况下反而会导致性能显著下降。Anthropic公司的最新研究…
-
Intuit为中型企业推出智能AI代理 每月可节省17-20小时工作时间
中型企业市场正面临一个技术悖论:它们已经超越了小型企业工具的适用范围,但又往往规模太小而难以采用传统企业级解决方案。Intuit将这类年收入在250万至1亿美元之间的公司定义为中型…
-
开源工具MCPEval实现了协议级智能体测试的即插即用
企业正逐步采用模型上下文协议(MCP),主要用于辅助识别和指导智能体工具的使用。然而,Salesforce的研究人员发现了MCP技术的另一项应用——评估AI智能体本身。他们推出了M…
-
CrowdStrike全球宕机事件一周年:重塑企业网络安全的78分钟
2024年7月19日,网络安全行业经历了历史性转折点。CrowdStrike一次常规软件更新引发的78分钟全球宕机,不仅造成85亿美元经济损失,更彻底改变了企业网络安全范式。这场非…
-
谷歌DeepMind创造历史:AI首获国际数学奥赛金牌
在人工智能发展史上,2025年7月21日注定成为里程碑式的日子。谷歌DeepMind宣布,其Gemini人工智能的高级版本在国际数学奥林匹克竞赛(IMO)中达到金牌级表现,成功解答…
-
人工智能个性化陷阱:编织现实还是扭曲现实?
人工智能正经历着人类历史上最伟大的认知卸载过程。我们曾将记忆卸载给文字,将计算卸载给计算器,将导航卸载给GPS。如今,我们开始将判断、综合甚至意义构建卸载给那些会说我们语言、学习我…