长上下文处理
-
马斯克 xAI 推出 Grok 4.1:网页与应用端幻觉率大幅降低,暂不开放 API 访问
埃隆・马斯克旗下的 AI 初创公司 xAI 在谷歌 Gemini 3 发布前夕,抢先推出新一代大语言模型 Grok 4.1,旨在分流谷歌的关注度。这款模型目前已在Grok.com、…
-
英伟达发布Rubin CPX GPU:专为大规模AI推理工作负载打造的革命性架构
2025年9月,图形计算巨头英伟达再次以颠覆性产品震撼人工智能硬件市场。公司正式推出全新Rubin CPX GPU系列,这款专为处理视频、音频和文本等长上下文数据优化的加速器,标志…
-
MCP-Universe基准测试揭示GPT-5在现实世界任务编排中的局限性:过半企业级场景表现不及预期
Salesforce AI研究院最新发布的开源基准测试MCP-Universe对当前主流大语言模型进行了全面评估,结果显示即使是OpenAI最新发布的GPT-5,在模拟企业真实工作…
-
英伟达发布可切换推理模式的开源小模型Nemotron-Nano-9B-v2:重新定义边缘AI计算边界
在全球AI算力竞赛转向效率优化的背景下,英伟达于2025年8月18日推出革命性的Nemotron-Nano-9B-v2语言模型。这款仅90亿参数的开源模型凭借独特的推理开关功能、混…