实时数据交互
-
MCP-Universe基准测试揭示GPT-5在现实世界任务编排中的局限性:过半企业级场景表现不及预期
Salesforce AI研究院最新发布的开源基准测试MCP-Universe对当前主流大语言模型进行了全面评估,结果显示即使是OpenAI最新发布的GPT-5,在模拟企业真实工作…
Salesforce AI研究院最新发布的开源基准测试MCP-Universe对当前主流大语言模型进行了全面评估,结果显示即使是OpenAI最新发布的GPT-5,在模拟企业真实工作…