AI 智能体测试
-
Terminal-Bench 2.0 与 Harbor 框架同步发布:构建 AI 智能体容器化测试新体系
面向自主 AI 智能体性能评估的基准测试套件 Terminal-Bench 推出 2.0 版本,同时配套发布容器化测试框架 Harbor。这一组合发布旨在解决 AI 智能体(尤其面…
面向自主 AI 智能体性能评估的基准测试套件 Terminal-Bench 推出 2.0 版本,同时配套发布容器化测试框架 Harbor。这一组合发布旨在解决 AI 智能体(尤其面…