百度发布专有模型 ERNIE 5.0：多模态能力超越 GPT-5，剑指全球企业 AI 市场

王浩然 • 2025年11月18日上午10:00 • AI前沿 • 894 views

在 OpenAI 推出 GPT-5.1 仅数小时后，中国搜索巨头百度于 “百度世界 2025” 大会上正式发布下一代基础模型 ERNIE 5.0，同步推出 AI 产品升级套件与国际化战略布局，旨在全球竞争激烈的企业 AI 市场中确立领先地位。作为一款原生全模态模型，ERNIE 5.0 可联合处理并生成文本、图像、音频、视频等多类型内容，与百度近期开源（采用 Apache 2.0 协议）的 ERNIE-4.5-VL-28B-A3B-Thinking 不同，其定位为专有模型，仅通过百度 ERNIE Bot 官网（需手动从模型选择下拉菜单中选取）及面向企业客户的千帆云平台 API 开放使用，凸显百度在 “开源吸引开发者 + 专有服务企业” 双轨战略上的布局。

在核心性能上，ERNIE 5.0 在多模态任务中展现出与国际顶尖模型抗衡甚至超越的实力。据大会公布的公开基准测试数据，该模型在多模态推理、文档理解、图像问答等任务中，性能超越或持平 OpenAI 的 GPT-5-High 与谷歌的 Gemini 2.5 Pro，同时在语言建模与代码执行能力上表现强劲。其技术差异化优势在于 “原生多模态联合处理”—— 不同于多数模型依赖的 “事后模态融合”，ERNIE 5.0 从架构底层支持跨模态输入输出协同，无需在不同模态间进行格式转换或数据适配，这一特性使其在企业场景中更高效。

具体任务表现上，ERNIE 5.0 在视觉相关基准测试中尤为突出：在测试文档识别的 OCRBench、文档理解的 DocVQA、结构化数据推理的 ChartQA 三大基准中，均取得领先分数，百度宣称其性能超过 GPT-5-High 与 Gemini 2.5 Pro。这些任务恰是企业自动化文档处理、金融数据分析等核心场景的关键能力支撑，例如在银行财报分析中，模型可精准提取表格数据、解读图表趋势，并关联文本说明生成综合分析报告，大幅减少人工处理时间。图像生成领域，基于百度内部 GenEval 评估标准，ERNIE 5.0 在语义对齐、图像质量等维度与谷歌 Veo3 持平或超越，其多模态整合能力使其在生成与解读视觉内容时，具备更强的上下文感知力，避免了模态专用编码器导致的信息割裂。音频与语音任务方面，该模型在 MM-AU、TUT2017 音频理解基准及语音问答任务中展现出竞争力，虽未重点宣传，却为全光谱多模态应用（如智能客服的语音 – 文本 – 图像联动响应）奠定基础。

针对不同场景需求，百度同步推出 ERNIE 5.0 的专项变体 ——Preview 1022，该版本针对文本密集型任务优化，在早期开发者测试中展现出更强的语言专项性能。尽管百度未宣称其在通用语言推理上全面超越顶尖模型，但内部评估显示，Preview 1022 显著缩小了与顶级英文模型的差距，且在中文语言任务中表现更优，这一特性对聚焦中文市场的企业客户极具吸引力，例如在中文法律文档解读、古文数字化处理等场景中，模型能更精准捕捉语言细节与文化语境。

在企业定价策略上，ERNIE 5.0 定位高端，其千帆平台 API 定价与国内竞争对手（如阿里巴巴）的顶级模型持平，同时显著低于国际同类产品。具体来看，ERNIE 5.0 输入成本为每 1000 tokens 0.00085 美元（约 0.006 元人民币），输出成本为每 1000 tokens 0.0034 美元（约 0.024 元人民币），对比之下，GPT-5.1 每 100 万 tokens 输入成本 1.25 美元、输出 10 美元，Anthropic 的 Claude Opus 4.1 每 100 万 tokens 输入 15 美元、输出 75 美元，谷歌 Gemini 2.5 Pro（20 万 tokens 以内）每 100 万 tokens 输入 1.25 美元、输出 10 美元。这种 “高性能 + 中定价” 的组合，既满足企业对顶尖模型的需求，又降低了长期使用成本，尤其适合中小型企业规模化部署。

伴随模型发布，百度加速国际化布局，多款 AI 产品同步推向全球市场：用户超 2000 万的通用 AI 智能体 GenFlow 3.0，新增增强记忆与多模态任务处理能力；可动态解决复杂问题的自进化智能体 Famou，通过邀请制开放商业使用；无代码构建工具 Miaoda 的国际版 MeDo，通过 medo.dev 向全球开放；支持文档、幻灯片、图像、视频、播客的生产力工作空间 Oreate，全球用户已超 120 万。此外，百度数字人平台已在巴西落地，数据显示，中国 “双十一” 购物节期间，83% 的直播从业者使用该平台数字人技术，带动商品交易总额（GMV）增长 91%；自动驾驶出行服务 Apollo Go 累计订单超 1700 万，在 22 个城市运营无人驾驶车队，成为全球最大 Robotaxi 网络，这些产品与服务的国际化，为 ERNIE 5.0 的落地提供了场景支撑。

值得关注的是，在 ERNIE 5.0 发布前两天，百度还推出一款采用 Apache 2.0 协议的开源多模态模型 ERNIE-4.5-VL-28B-A3B-Thinking，该模型通过混合专家（MoE）架构，总参数量 280 亿但仅激活 30 亿参数用于推理，兼顾性能与效率。其核心创新 “图像思考（Thinking with Images）” 功能支持动态缩放图像分析细节，可处理图表解读、文档理解、视觉定位及视频时间感知任务，且仅需单张 80GB GPU 即可运行，兼容 Transformers、vLLM 及百度 FastDeploy 工具集，为中小企业与开发者提供低成本高性能的多模态解决方案，与 ERNIE 5.0 形成 “开源引流 – 专有变现” 的生态互补。

模型发布后，开发者社区反馈呈现两面性。AI 评估者 Lisan al Gaib 在 X 平台反馈，虽认可 ERNIE 5.0 的基准测试表现，但在 SVG 生成任务中发现模型存在 “反复调用工具” 的问题，即便明确指令禁止仍无法避免。对此，百度开发者支持账号 @ErnieforDevs 数小时内回应，称该问题为已知漏洞（特定语法会触发），团队正推进修复，建议用户暂时通过改写提示词规避。这种快速响应体现百度对开发者沟通的重视，尤其在拓展国际用户时，及时解决问题有助于建立信任。

从行业影响来看，ERNIE 5.0 的发布标志着百度在全球基础模型竞赛中的战略升级。通过 “专有模型攻坚企业高价值场景 + 开源模型扩大开发者生态” 的双轨模式，百度既满足企业对高性能、高安全性模型的需求，又通过开源降低技术门槛，吸引全球开发者参与生态建设。尽管目前其性能宣称仍需第三方验证，但在 AI 成本攀升、模型复杂度增加、算力瓶颈凸显的行业背景下，ERNIE 5.0 及其配套生态为百度在下一代 AI 部署中赢得了竞争优势，也为全球企业提供了除欧美模型外的优质选择，推动多模态 AI 技术在金融、医疗、制造等垂直领域的落地应用。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/bai-du-fa-bu-zhuan-you-mo-xing-ernie-5-duo-mo-tai-neng-li

Like (0)

王浩然作者

0 0

AI 如何革新租赁物业管理：从被动响应到主动高效的维护转型

Previous 2025年11月17日

Anthropic 斥资 500 亿美元推进美国数据中心扩张，构建自主 AI 算力底座

Next 2025年11月18日

AI前沿

沃尔玛AI安全战略启示录：自主风险管控、身份体系重构、治理速度平衡与AI攻防对抗‌

全球零售巨头沃尔玛首席信息安全官Jerry R. Geisler III近日披露了其AI安全战略的核心框架，揭示了企业在应对自主AI系统风险、重构数字身份体系、平衡创新速度与治理约…

王浩然
2025年8月25日
000
AI前沿

Meta 让企业能够创建嵌入广告的聊天机器人

在周三于门洛帕克举行的Meta Connect 2024 开发者大会上，Meta 宣布将利用点击消息广告将其人工智能商业聊天机器人扩展到 WhatsApp 和 Messenger …

王浩然
2024年9月29日
000
AI前沿

Sawmills 从隐身状态中脱颖而出，削减企业可观察性成本并提供遥测数据主权

数据可观察性——使用软件工具来了解组织的整个软件套件（尤其是最关键的业务应用程序）如何运行的实践——实际上扎根于20 世纪 50 年代末的早期计算机时代，但它在生成人工智能时代重新…

王浩然
2025年2月20日
000
AI前沿

AI革命亦是数据革命：为何存储比以往任何时候都重要‌

在人工智能（AI）日新月异的今天，数据不仅是驱动其发展的核心燃料，更是塑造未来数字世界的基石。全球AI市场的蓬勃兴起，预计从当前的3900多亿美元增长到2030年的超8260亿美元…

王浩然
2025年6月12日
000
AI前沿

Patronus AI推出Judge-Image：旨在确保AI诚信，Etsy已率先采用

Patronus AI近日宣布推出业界首款多模态大型语言模型评判工具（MLLM-as-a-Judge），名为Judge-Image。该工具专为评估解释图像并生成文本的AI系统而设计…

王浩然
2025年3月17日
000
AI前沿

霍尼韦尔与高通合作开发移动设备人工智能代理

霍尼韦尔正在为其移动设备开发一种人工智能多模型智能代理。在Qualcomm Technologies的支持下，它将允许配送中心和零售店的客户和工作人员使用语音、图像和条形码与他们…

点点
2024年9月25日
000
AI前沿

克劳德AI的离奇商业冒险：从办公室售货机到“精神错乱”

在探索人工智能（AI）潜力的边界时，Anthropic与AI安全领域的先驱Andon Labs携手进行了一项名为“Project Vend”的实验。这次尝试将Claude AI——…

王浩然
2025年7月3日
000
AI前沿

初级技术职位消失，企业争夺高级AI人才‌

在人工智能（AI）开发的激烈竞争中，人才已成为最宝贵的资源。近日，社交媒体巨头Meta成功招募了Lucas Beyer、Alexander Kolesnikov和Xiaohua Z…

王浩然
2025年6月29日
000
AI前沿

超越思维链：思维偏好优化如何推进LLMs

Meta、加州大学伯克利分校和纽约大学的研究人员团队开发出一项突破性的新技术，有望增强人工智能系统处理一般任务的能力。这种方法被称为“思维偏好优化”（TPO），旨在使大型语言模型（…

点点
2024年10月16日
000
AI前沿

OpenAI据传将在未来几周内推出AI浏览器

在科技日新月异的今天，人工智能（AI）技术正以前所未有的速度改变着我们的生活和工作方式。近日，有消息称OpenAI，这家在AI领域具有举足轻重地位的公司，计划在不久的将来推出一款革…

王浩然
2025年7月12日
000
AI前沿

Scope3 开始追踪人工智能的碳足迹

是香蕉起了作用。布莱恩·奥凯利 (Brian O’Kelley) 最近以 16 亿美元的价格将他之前的创业公司广告平台 AppNexus 卖给了 AT&T。在…

王浩然
2024年10月12日
000
AI前沿

Cerebras完成11亿美元G轮融资，以81亿美元估值重新定义AI芯片竞争格局‌

在人工智能硬件领域掀起新一轮变革浪潮之际，Cerebras Systems公司近日宣布完成超额认购的11亿美元G轮融资，使其估值达到81亿美元。本轮融资由富达管理与研究公司（Fid…

王浩然
2025年10月4日
000
AI前沿

AI智能体如何重塑市场营销领导力：从人工协调到智能决策的范式转移‌

在数字化转型浪潮中，人工智能正以前所未有的深度重构市场营销领域的权力结构。Auxia联合创始人Sandeep Menon基于15年谷歌营销领导经验提出，AI智能体正在催生新一代&#…

王浩然
2025年8月20日
000
AI前沿

领导者对负责任的人工智能所需的治理水平存在分歧

领导者对于如何打造负责任的人工智能存在分歧，有两种观点，一种是治理主导，一种是实验优先，而监管机构则在寻找正确的平衡方面面临更大困难。这些见解是在上周的人工智能领袖论坛上…

王浩然
2024年12月10日
000
AI前沿

Hugging Face与Groq携手，打造超高速AI模型推理‌

在人工智能领域，速度与效率一直是开发者们不懈追求的目标。随着技术的不断进步，如何在保证模型性能的同时，降低计算成本、提升推理速度，成为了摆在众多企业和研究机构面前的一大挑战。近日，…

王浩然
2025年6月19日
000
AI前沿

Letterly测评：把“碎碎念”变结构化文本的AI语音转写工具

你是否有过这样的经历：对着人说话时思路清晰、妙语连珠，可一打开空白文档，那些鲜活的想法就瞬间消散？我们常常对着语音备忘录滔滔不绝，记录下充满能量的思考，可回头听时，却只听到满是“嗯…

王浩然
2026年2月24日
000
AI前沿

ScaleOps 与戴尔 – 英伟达合作双动态：AI 基础设施优化与联合平台升级引领企业降本增效

AI 基础设施领域迎来两大关键动态：ScaleOps 推出全新 AI Infra 产品，为自托管企业大语言模型（LLMs）实现 GPU 成本大幅削减；戴尔（Dell）与英伟达（NV…

王浩然
2025年11月22日
000
AI前沿

如何在不入侵任何东西的情况下窃取人工智能模型

人工智能模型的可窃取性令人惊讶——只要你设法嗅出模型的电磁特征。北卡罗来纳州立大学的研究人员在一篇新论文中描述了这种技术，尽管他们一再强调，事实上他们并不想帮助人们攻击神经网络。他…

王浩然
2024年12月29日
000
AI前沿

Gamma 完成 6800 万美元 B 轮融资，估值达 21 亿美元：AI 演示平台凭 “内容优先” 策略突围

总部位于美国旧金山的 AI 演示平台 Gamma 宣布完成 6800 万美元 B 轮融资，公司估值跃升至 21 亿美元。此次融资由知名风投机构 Andreessen Horowit…

王浩然
2025年11月16日
000
AI前沿

英国调整人工智能战略以应对预算限制

作为秋季预算前更广泛的削减成本措施的一部分，英国新政府正在制定一项人工智能战略，优先考虑公共部门的采用而不是直接的行业投资。自上任以来，英国政府一直在审查与人工智能相关的支出，并…

点点
2024年9月4日
000

发表回复

Please Login to Comment

百度发布专有模型 ERNIE 5.0：多模态能力超越 GPT-5，剑指全球企业 AI 市场

相关推荐

发表回复