
在2025年的谷歌I/O大会上,这家科技巨头展示了其在人工智能领域的雄心壮志。谷歌不仅发布了一系列围绕其Gemini品牌(涵盖多种底层模型架构和研究)的创新技术,还提出了一个更为宏大的愿景:构建一个AI时代的“操作系统”。这并非传统的磁盘启动系统,而是一个逻辑层,每个应用程序都可以利用它,即一个“世界模型”,旨在驱动一个能够理解物理环境、进行推理并代表用户采取行动的通用助手。
谷歌的AI操作系统愿景
谷歌的这一战略攻势,表面上看似是对竞争对手的一次大胆超越,但更深层次上,它反映了谷歌在AI研究和技术转化方面的自信。谷歌希望,通过构建一个能够理解现实世界动态的AI,为用户提供一个无所不在、无所不能的智能助手。这个助手不仅能够处理日常任务,还能在用户需要时提供主动帮助,甚至通过模拟世界来规划未来和创造新体验。
世界模型与通用AI助手
谷歌DeepMind的CEO戴密斯·哈萨比斯在I/O大会上明确阐述了谷歌的这一愿景。他指出,Gemini已经是“最好的多模态模型”,但谷歌正在努力将其扩展为一个“世界模型”。这个模型能够模拟世界的各个方面,就像大脑一样制定计划和想象新体验。哈萨比斯还提到,Google DeepMind正在研究像Genie 2这样的模型,这些模型可以从图像或文本等提示中生成交互式二维游戏环境和可玩世界,这为实现“世界模型”提供了早期证明。
谷歌的AI技术布局
为了实现这一愿景,谷歌正在加速其AI技术的布局。在I/O大会上,谷歌展示了多个基于Gemini的应用,如Flow——一个拖放式的电影制作画布,它利用Veo 3模型保持角色和相机的一致性。此外,谷歌还推出了Gemini Robotics模型,用于机器人技术,并强调了AI系统需要世界模型来有效运行。谷歌还通过Gemini Live集成了实时视频理解和屏幕共享等Astra功能,进一步展示了其通用AI助手的潜力。
谷歌与竞争对手的较量
然而,谷歌的这一战略并非没有挑战。微软凭借其在Office 365等生产力应用中的主导地位,以及通过Copilot等工具推动AI在企业中的应用,对谷歌构成了强大威胁。此外,OpenAI也凭借其ChatGPT产品的广泛用户基础,以及最近推出的搜索和广告服务,对谷歌的搜索业务构成了潜在威胁。
尽管如此,谷歌仍在努力通过提供开发者访问、构建多模态能力和探索AGI(人工通用智能)轨迹等方式,来保持其在AI领域的领先地位。谷歌还通过项目如Mariner等,展示了其愿意与外部合作伙伴共享其AI技术的意愿。
对企业技术决策者的启示
对于企业技术决策者而言,谷歌的“世界模型”愿景提供了两个关键启示。首先,随着AI技术的不断发展,企业需要密切关注这些技术的进展,并考虑如何将其整合到自己的业务中。其次,企业需要制定长期的AI战略,以应对未来可能出现的变革性技术。这包括评估不同AI平台的能力和风险,以及制定灵活的策略来应对不断变化的市场环境。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/gu-ge-de-shi-jie-mo-xing-du-zhu-zai-wei-ruan-zhan-ju-yong