GPT-5
-
Gemini 3 与 GPT-5 对比:谷歌新模型如何重新定义企业运营中的 AI 应用
当前人工智能领域发展迅猛,新基础模型不断涌现,虽多宣称具备更高精度、更强推理能力与更广适用性,但对企业实际运营的实用价值常不明确。随着企业将 AI 应用于运营规划、客户支持、数据分…
-
百度发布专有模型 ERNIE 5.0:多模态能力超越 GPT-5,剑指全球企业 AI 市场
在 OpenAI 推出 GPT-5.1 仅数小时后,中国搜索巨头百度于 “百度世界 2025” 大会上正式发布下一代基础模型 ERNIE 5.0,同步推出 AI 产品升级套件与国际…
-
Upwork 研究:AI 智能体独立执行任务表现拉胯,人机协作可使完成率提升 70%
全球最大在线工作平台 Upwork 发布一项突破性研究,揭示 AI 智能体在专业任务中的核心表现规律:当前基于顶级大语言模型(如 Gemini 2.5 Pro、GPT-5、Clau…
-
百度开源多模态 AI 模型 ERNIE-4.5-VL-28B-A3B-Thinking,宣称性能超越 GPT-5 与 Gemini
中国搜索引擎巨头百度正式发布开源多模态 AI 模型 ERNIE-4.5-VL-28B-A3B-Thinking,该模型以 “高效轻量化” 与 “跨模态强推理” 为核心优势,在视觉相…
-
百度多模态 AI 模型 ERNIE 超越 GPT 与 Gemini:基准测试领先,聚焦企业场景落地
百度正式发布最新多模态 AI 模型 ERNIE-4.5-VL-28B-A3B-Thinking,该模型以 “轻量高效” 与 “深度推理” 为核心优势,在关键基准测试中超越 Open…
-
Terminal-Bench 2.0 与 Harbor 框架同步发布:构建 AI 智能体容器化测试新体系
面向自主 AI 智能体性能评估的基准测试套件 Terminal-Bench 推出 2.0 版本,同时配套发布容器化测试框架 Harbor。这一组合发布旨在解决 AI 智能体(尤其面…
-
中国 AI 初创企业月之暗面(Moonshot AI):Kimi K2 Thinking 模型超越 GPT-5 与 Claude,改写全球 AI 竞争格局
总部位于北京的中国 AI 初创企业月之暗面(Moonshot AI)凭借其开源模型 Kimi K2 Thinking,在多项核心性能基准测试中超越 OpenAI 的 GPT-5 与…
-
Zendesk 的双重 AI 突破:从可靠客服代理到借助 GPT-5 与 HyperArc 实现实时智能
客户服务解决方案提供商 Zendesk 在 AI 领域迈出重要步伐,其工程、AI 与产品总裁沙希・乌帕德亚伊(Shashi Upadhyay)指出,智能体 AI(Agentic A…
-
OpenAI推出家长控制功能:AI伦理与青少年保护的平衡之道
在人工智能技术深度渗透日常生活的2025年,OpenAI因一起青少年自杀诉讼案被迫重新审视其安全防护体系。这起诉讼涉及名为Adam Raine的青少年使用ChatGPT讨论并完善自…
-
GPT-5与GPT-4o盲测对决:用户偏好揭示AI发展的情感悖论
当OpenAI于2025年8月推出GPT-5时,这场被宣传为”最智能、最快速、最实用”的技术升级,意外引发了AI消费史上最激烈的用户反弹。在这场争议的核心,…