全球AI模型密集上新：从通用大模型向多模态智能体加速演进

王浩然 • 2026年5月19日上午10:00 • AI前沿 • 169 views

2025年以来，人工智能（AI）技术在大语言模型和多模态领域持续突破，全球科技巨头密集推出新一代AI模型，不仅在理解与生成能力上实现飞跃，更在实用性与效率层面迈上新台阶，标志着AI正从通用大模型阶段，加速向多模态助手与智能体方向演进。

当地时间5月22日，美国Anthropic公司推出“克劳德4”系列的两款新模型——“奥珀斯4”（Opus 4）与“十四行诗4”（Sonnet 4），瞄准专业领域的编程、推理与智能体应用需求。其中Opus 4被定位为行业领先的编程模型，可高效完成复杂且长时程的任务；Sonnet 4则在3.7版本基础上完成显著升级，指令理解、逻辑推理与编程能力均得到强化。

仅两天后的5月20日，谷歌一口气推出多个“双子座2.5”系列大语言模型，整体性能与智能推理能力较前代版本大幅提升。同日，谷歌还发布了多款多模态模型：图像生成模型Imagen 4与视频生成模型Veo 3，具备从文本等多输入形式生成高质量视觉内容的能力；音乐生成模型Lyria 2则为音乐创作者提供了多模态创作工具。此外，AI电影制作工具Flow集成了前沿多模态技术，用户只需通过自然语言描述，就能生成高质量视觉作品。

除了多模态模型，谷歌在5月还发布了全新的进化式编程智能体AlphaEvolve，由谷歌大语言模型驱动，旨在实现通用算法的发现与优化。据谷歌官方博客介绍，AlphaEvolve不仅能发现单一函数，还能演化整个代码库，开发出复杂算法。在对超过50个数学难题的测试中，它在约75%的案例中重新发现最优解，甚至在20%的案例中提出了更优方案。谷歌团队认为，该智能体未来有望在材料科学、药物发现、可持续发展等领域发挥变革性作用。

更早的4月，美国OpenAI公司先后发布GPT-4.1系列模型，以及o3和o4 mini两款推理模型。据OpenAI官网介绍，GPT-4.1系列在编程与指令理解方面表现突出，长文本处理能力显著提升，同时具备更高的性价比。而o3和o4 mini则被OpenAI称为“迄今为止最智能的模型”：o3模型在编程、数学、科学、视觉感知等领域均实现突破，适合处理多维度复杂问题，尤其在图像、图表等视觉任务上表现亮眼，还具备严谨的分析能力与批判性思维，可作为可靠的“思维伙伴”；o4 mini则是一款经过优化的小型模型，在数学、编程与视觉任务上表现出色，适用于快速且成本效益高的推理场景。

国内AI企业也在加速布局，4月，字节跳动推出全新升级的“日日新SenseNova V6”大模型体系。据该公司官网介绍，这一大模型体系通过多模态长思维链训练、全局记忆、强化学习等技术突破，已形成领先的多模态推理能力，并突破了成本边界。

随着技术的快速发展，AI的能力边界不断拓展。正如谷歌旗下“深度思维”公司首席执行官德米斯·哈萨比斯所说，团队正在塑造一个更加个性化、主动、强大的AI，以此加快科学进步的步伐，开启一个充满新发现与成就的新时代。可以预见，这些不断迭代的AI模型，将为各行业的创新发展注入新的动力，推动人工智能技术向更广阔的应用场景延伸。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/quan-qiu-ai-mo-xing-mi-ji-shang-xin-cong-tong-yong-da-mo

Like (0)

王浩然作者

0 0

遗留系统的隐性代价：决策质量才是真正的成本核心

Previous 2026年5月18日下午6:00

从暂缓到爆发：小米MiMo大模型如何补位AI赛道，锚定人车家全生态

Next 2026年5月19日下午12:00

AI前沿

LiveKit跻身独角兽行列：10亿美元估值背后的语音AI基建热潮

在语音AI应用席卷全球各行各业的当下，基础设施层的玩家正在迎来属于自己的黄金时代。当地时间周三，实时音视频基础设施服务商LiveKit宣布完成1亿美元C轮融资，公司估值正式突破10…

王浩然
2026年1月28日
000
AI前沿

澳大利亚政府与 Anthropic 签署 MOU：AI 安全合作走向国际化

澳大利亚政府与 Anthropic 正式签署合作谅解备忘录（MOU），双方将在 AI 安全研究和负责任 AI 部署等领域展开深度合作。这是 Anthropic 继与美国政府机构合…

点点
2026年4月18日
000
AI前沿

如何利用冷硬数据科学来利用人工智能

有时很难区分技术的现实与每天轰炸我们收件箱的炒作和营销信息。例如，在过去五年里，我们可能听到了太多关于元宇宙、区块链和虚拟现实的信息。目前，我们正处于一场关于被滥用的术语“人工智能…

点点
2024年10月1日
000
AI前沿

OpenAI已开始组建其机器人团队

OpenAI 以其人工智能模型而闻名，迄今为止，这些模型主要存在于云服务器、其网站以及适用于 PC 和移动设备的应用程序中。不过，该公司的雄心并不局限于软件领域：今天在 X 上，…

王浩然
2025年1月11日
000
AI前沿

白皮书消除了人们对人工智能导致失业的担忧

一份新白皮书指出，担心人工智能会导致大量失业是没有根据的。英国人工智能软件公司 Automated Analytics 发布的这份报告发现，其在英国和美国的 5,000 家客户中，…

点点
2024年9月10日
000
AI前沿

GPT-5.2 初印象与综合评估：商业任务的强力助手，普通场景存短板

OpenAI 正式发布 GPT-5.2 系列模型，包含 Instant、Thinking、Pro 三个版本，首批测试反馈与多渠道实测数据显示，该模型在商业与专业场景中展现出显著优势…

王浩然
2025年12月17日
000
AI前沿

科学家如何在太空中研究宇航员的心理健康

保持宇航员在太空中的健康不仅仅是确保他们有足够的运动和好的食物。考虑他们的心理健康也很重要。这是任何工作的一个重要因素，但对于在国际空间站（ISS）上生活在太空中的人来说尤其重要。…

点点
2024年9月29日
000
AI前沿

搜索变得更智能：OpenAI 的 SearchGPT 如何改变游戏规则

在我们日益互联的世界里，高效而准确的网络搜索已变得至关重要。无论是学生为学术项目收集信息，还是专业人士想要了解最新的行业趋势，搜索引擎已成为我们日常生活中必不可少的一部分。然而，虽…

点点
2024年9月12日
000
AI前沿

三星推出微型 AI 模型 TRM：以 700 万参数突破复杂推理，颠覆大模型 “规模至上” 范式

2025 年 10 月 8 日，三星 AI 研究员 Alexia Jolicoeur-Martineau 发布的新研究显示，一款名为 “微型递归模型（Tiny Recursive …

王浩然
2025年10月10日
000
AI前沿

Tome 创始人放弃 2000 万用户爆款演示应用，打造 AI 原生 CRM 平台 Lightfield

总部位于旧金山的初创公司推出全新 AI 原生客户关系管理（CRM）平台 Lightfield，正式面向公众开放。这一举措堪称企业软件领域的大胆转型 —— 该公司前身开发的演示应用 …

王浩然
2025年11月22日
010
AI前沿

人工智能增强型量子大型语言模型发布

Secqai 是一家专门从事超安全硬件和软件的公司，推出了混合量子大语言模型 (QLLM)。 QLLM 旨在通过将量子计算与传统大型语言模型 (LLM) 相结合来增强人工智能应用，…

王浩然
2025年2月11日
000
AI前沿

生成式AI时代，高等教育如何重塑职场胜任力？专访美国西海岸大学校长Anthony Lee博士

在生成式AI与自动化技术飞速迭代的当下，职场对人才的要求正在经历颠覆性变革，而高等教育作为人才培养的核心阵地，也面临着前所未有的挑战与机遇。近日，美国西海岸大学（Westcliff…

王浩然
2026年3月31日
000
AI前沿

英国获得63亿英镑数据基础设施投资

美国四大公司宣布计划向英国数据基础设施投资总计 63 亿英镑。英国科技大臣彼得·凯尔在国际投资峰会上宣布了这一消息，称这是对英国与企业合作推动增长的方式的“信任投票”…

点点
2024年10月15日
000
AI前沿

公众信任赤字：AI发展的主要障碍‌

人工智能技术正以前所未有的速度改变着我们的世界，但一个不容忽视的挑战正日益凸显——公众对AI的信任缺失正成为制约行业发展的关键瓶颈。这一现象在全球范围内引发广泛关注，特别是在美国和…

王浩然
2025年9月24日
000
AI前沿

开源网络安全应用大规模部署的五大核心安全准则

在网络安全领域，开源AI正成为一股不可忽视的力量，它推动着创新边界，加速了从概念到产品的转化过程。特别是在构建大规模网络安全应用时，开源AI不仅提升了开发效率，还为解决复杂安全挑战…

王浩然
2025年6月13日
000
AI前沿

Treehouse 使用人工智能帮助电工更便宜地安装电动汽车充电器和热泵等技术

美国正面临电工短缺的问题，根据美国劳工统计局的数据，未来十年该领域的空缺职位预计将以每年 11% 的速度增长。但由于美国未来的电工通常需要工作8,000 小时才能获得执照，因此短缺…

王浩然
2024年10月17日
000
AI前沿

Adobe Foundry：不止于微调，为品牌量身重构 Firefly 生成式 AI 能力

Adobe 近期推出的 “Adobe Foundry” 平台，正试图打破生成式 AI 在品牌应用中的核心局限 —— 以往企业使用 Firefly 等 AI 工具时，多依赖基础模型的…

王浩然
2025年10月23日
000
AI前沿

Salesforce推出新AI基准和模型，解决“锯齿状智能”问题

在人工智能（AI）领域，Salesforce正致力于解决一个长期困扰商业应用的问题：即AI系统的原始智能与其在不可预测的企业环境中持续稳定执行任务的能力之间的差距，Salesfor…

王浩然
2025年5月6日
000
AI前沿

谷歌推出 Gemini Enterprise：打造企业级 AI 智能体平台，推动 “人人拥有 AI 助手” 的办公新范式

2025 年 10 月 9 日，谷歌云（Google Cloud）正式发布企业级 AI 平台 Gemini Enterprise，将其定位为 “职场 AI 新入口”。该平台整合谷歌…

王浩然
2025年10月11日
000
AI前沿

人工智能助手旨在改变最后一英里的配送

物流公司 NuVizz 表示，该技术可帮助调度员选择优化路线的理想算法总部位于亚特兰大的最后一英里物流专家 NuVizz 在其最新的软件更新中推出了一款名为 Vizzard 的新…

王浩然
2025年2月21日
000

发表回复

Please Login to Comment

全球AI模型密集上新：从通用大模型向多模态智能体加速演进

相关推荐

发表回复