
在科技界,人们常常将篮球界的“疯狂三月”与消费电子展相提并论,而作为人工智能(AI)领域,也一直在等待属于它的高光时刻。本周,随着微软Build开发者大会和谷歌I/O开发者大会的相继召开,这一时刻似乎终于到来。微软一口气宣布了50款新的AI工具,而谷歌也紧随其后发布了自己的产品阵容。而更令人意想不到的是,Anthropic公司在周四推出了其大型语言模型(LLM)的最新版本——Claude 4。在这场AI的盛宴中,以下是三条最引人瞩目的消息。
赋予AI执行人类工作的能力,而非仅仅模仿人类说话,是LLM发展的下一个显著步骤。然而,这一进程存在一个重大障碍:AI代理之间难以相互交互。想象一下,一个负责预订商务旅行机票的AI代理,与另一个负责预订酒店的AI代理,听起来很完美,但如果你因此到了伦敦却只能在马德里找到酒店,那就大煞风景了。
为了解决这个问题,微软采用了Model Context Protocol(MCP)这一标准,使得不同的代理——甚至使用不同LLM的代理——能够进行通信。值得一提的是,Anthropic在2024年11月就已经创建了这一标准。而微软的采纳,则意味着它正在成为未来代理架构的重要组成部分,就像HTML对于开放网络一样。微软还将MCP添加到其AI应用开发工具Azure AI Foundry中,使用户能够立即开始构建可以相互交互的代理。
尽管代理型AI仍处于起步阶段,但一个广泛采用的标准将为下一代代理工具的发展铺平道路。竞争对手之间的标准化意味着,在自动化流程时,你将能够在未来的LLM中进行选择,而不是被锁定在单一公司的生态系统中。
二、Claude 4赢得开发者青睐
尽管ChatGPT和Gemini在生成式AI市场中占据了主导地位,拥有高达96.7%的市场份额,使得Claude显得有些黯然失色,但开发者们对于Anthropic周四意外推出的Claude 4的两个版本——Opus 4和Sonnet 4——却表现出了极大的热情。
Claude 4最引人注目的特点是其“扩展思考”模式下的超长运行时间,可达七小时,这允许它执行数千个步骤并使用如网络搜索等工具。Anthropic声称,Claude 4将探索更多方法,捕获更多错误,并对更复杂的问题进行更细致的推理分解。凭借这些改进,Claude Opus 4在流行的SWE-bench软件工程基准测试中脱颖而出,得分高达72.5%,超过了OpenAI的o3(69.1%)和Gemini 2.5 Pro(63.2%)。
尽管基准测试并不能完全反映实际情况,但Claude已经赢得了开发者作为首选LLM的声誉。Claude 4通过针对软件工程社区的改进,进一步巩固了这一声誉,这将有助于它与其更通用的同类产品区分开来。
在2025年的I/O大会上,谷歌推出了众多消费者AI产品,从虚拟试穿到Google Beam,后者借助六个不同的摄像头角度和大量AI技术,将2D视频流实时转换成类似全息图的模型。然而,对于企业而言,最重要的变化可能是AI模式的搜索功能。
与之前的AI概览类似,AI模式将Gemini更深入地集成到搜索体验中。当你启用AI模式搜索时,谷歌会执行“查询分发技术”,将你的查询分解成多个搜索,同时执行它们,然后将结果拼接在一起。虽然这一模式之前仅对Google Labs用户开放,但本周,它已经开始面向主流用户推出。
即使你个人不使用AI模式,谷歌搜索的任何变化都会对数百万依赖谷歌搜索来吸引流量的企业产生涟漪效应。AI概览颠覆了搜索引擎优化(SEO)行业,而AI模式可能会带来更为剧烈的变化。人们在线查找信息的方式正在迅速改变。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/ben-zhou-ai-sheng-hui-de-san-da-zhen-han-xiao-xi