Meta新世界模型：让机器人在未知环境中灵活操控物体‌

王浩然 • 2025年6月15日下午4:00 • AI前沿 • 561 views

在人工智能领域，大型语言模型（LLMs）已经展现了其在文本处理方面的卓越能力，但在物理世界的动态环境中，它们却常常显得力不从心。这主要是因为LLMs缺乏物理“常识”，难以理解和应对现实世界中的因果关系。为了弥补这一缺陷，Meta推出了其最新的世界模型——V-JEPA 2，该模型能够从视频和物理交互中学习，为机器人在不可预测的环境中预测结果和规划行动提供了可能。

‌一、世界模型的规划与学习‌

人类从小通过观察周围环境来发展物理直觉。例如，当我们看到被扔出的球时，能够本能地预测其轨迹和落点。V-JEPA 2通过学习类似的“世界模型”，即AI系统对物理世界如何运作的内部模拟，来具备这种能力。这个世界模型基于三个核心能力：理解场景中的情况，预测行动将如何改变场景，以及规划实现特定目标的行动序列。

Meta在其博客中表示，其“长期愿景是让世界模型使AI代理能够在物理世界中规划和推理”。V-JEPA 2的架构，即视频联合嵌入预测架构，由两个关键部分组成：编码器和预测器。编码器观看视频片段并将其压缩成紧凑的数字摘要，即嵌入，该嵌入捕获了场景中物体及其关系的重要信息。预测器则接收这个摘要，并想象场景将如何演变，生成下一个摘要的预测。

‌二、从观察与行动中学习‌

V-JEPA 2的训练分为两个阶段。首先，它通过自监督学习建立对物理的基础理解，观看了超过一百万小时的未标记互联网视频。通过简单观察物体的移动和相互作用，它开发了一个无需人类指导的通用世界模型。在第二阶段，这个预训练模型在一个小型的、专门的数据集上进行微调。通过处理仅62小时的机器人执行任务的视频，以及相应的控制命令，V-JEPA 2学会了将特定行动与其物理结果联系起来。

这种两阶段训练为现实世界自动化提供了一项关键能力：零样本机器人规划。由V-JEPA 2驱动的机器人可以在新环境中部署，并成功操控它从未遇到过的物体，而无需为该特定设置进行重新训练。这是对之前模型的重大改进，因为之前的模型需要来自确切机器人和环境的训练数据。

‌三、现实世界的影响与应用‌

V-JEPA 2在新型情况下进行规划和行动的能力对业务运营有着直接影响。在物流和制造业中，它允许机器人更加灵活，能够处理产品和仓库布局的变化，而无需大量重新编程。这对于公司探索在工厂和装配线上部署人形机器人尤其有用。

同样的世界模型还可以为高度逼真的数字孪生提供动力，使公司能够模拟新流程或在物理准确的虚拟环境中训练其他AI。在工业环境中，模型可以监控机器的视频馈送，并根据其学习的物理理解预测安全问题和故障，从而提前采取措施。

‌四、未来展望‌

Meta的这一研究是朝着其所谓的“高级机器智能（AMI）”迈出的关键一步，其中AI系统可以“像人类一样了解世界，规划如何执行不熟悉的任务，并高效地适应不断变化的世界”。Meta已经发布了该模型及其训练代码，并希望“围绕这项研究建立一个广泛的社区，推动朝着开发能够改变AI与物理世界交互方式的世界模型这一最终目标取得进展”。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-xin-shi-jie-mo-xing-rang-ji-qi-ren-zai-wei-zhi-huan

Meta V-JEPA 2 世界模型数字孪生机器人规划物流与制造物理直觉自监督学习零样本规划高级机器智能

Like (0)

王浩然作者

0 0

牛津医学研究强调聊天机器人测试中缺失的一环：人类参与‌

Previous 2025年6月15日

美国参议员提出RISE法案：要求AI开发者公布训练数据及评估方法以换取免受诉讼的“安全港”‌

Next 2025年6月15日

AI前沿

推理走向二分：英伟达 200 亿美元押注 Groq，揭示其下一步行动

在人工智能领域，推理环节正经历着重大变革，呈现出二分的发展态势。而英伟达对 Groq 投资 200 亿美元这一举措，不仅凸显了该领域的动态变化，也揭示了英伟达在这一变革背景下的下一…

王浩然
2026年1月3日
000
AI前沿

Phi-4 证明 “数据优先” 的 SFT 方法是新的差异化竞争力

当前 AI 工程师虽仍有通过扩大大语言模型（LLM）参数规模与数据量追求性能的倾向，但 “更小、更高效、更聚焦” 的模型发展趋势已显著加速。微软研发的 Phi-4 模型及其微调方法…

王浩然
2025年11月20日
000
AI前沿

AI应用激增催生集成平台 Brainmax简化跨应用整合难题‌

随着企业AI应用数量呈指数级增长，一个严峻挑战正在浮现：不同AI工具间的数据孤岛和操作壁垒。最新数据显示，2025年典型企业平均部署47个AI系统，较2023年增长218%。这种碎…

王浩然
2025年7月21日
000
AI前沿

【2024 CX报告】AI成客户体验王牌，成本却让人意外！

一份新报告显示，尽管企业将生成式人工智能(GenAI) 视为改变客户体验 (CX) 的关键因素，但许多企业仍为实施成本而苦恼。该研究结果来自 CallMiner 的《2024 年客…

点点
2024年9月11日
000
AI前沿

突破8小时稳定运行！激光驱动自由电子激光器迈向实用化

在加速器物理领域，一项持续了超过8小时的实验正在改写行业的未来格局。近日，TAU Systems与劳伦斯伯克利国家实验室的研究团队合作，在《Physical Review Acce…

王浩然
2026年4月8日
000
AI前沿

Cam Myers：用AI机器人重构服装制造，从缝到粘的工业革命

当快时尚的库存浪费、供应链脆弱性成为行业痼疾，当传统服装制造因软材料的复杂性难以实现自动化时，一位跨界背景的创业者看到了破局的可能。CreateMe创始人兼CEO Cam Myer…

王浩然
2026年2月23日
000
AI前沿

AI 芯片独角兽 Cerebras 提交 IPO 申请：大模型算力军备竞赛催生新上市潮

AI 芯片初创公司 Cerebras Systems 近日正式向美国证券交易委员会（SEC）提交首次公开募股（IPO）申请，有望成为继英伟达之后 AI 芯片领域最受瞩目的上市事件之…

点点
2026年4月17日
000
AI前沿

OpenAI 推出 ChatGPT Atlas 浏览器：以 AI 深度整合重构浏览体验，挑战 Chrome 主导地位

OpenAI 于 2025 年 10 月 21 日正式发布首款 AI 原生浏览器 ChatGPT Atlas，首推 macOS 版本，Windows、iOS 及 Android 版…

王浩然
2025年10月23日
000
AI前沿

Neo4j 通过 gen AI copilot 降低了图形技术的门槛，读取容量提高了 15 倍

随着企业继续加大对人工智能和分析的投入，数据基础设施供应商正在竭尽全力降低其产品的采用门槛，并为希望从数据资产中获取价值的团队提供最大的投资回报。我们已经看到了Snowflake …

王浩然
2024年9月9日
000
AI前沿

OpenAI最新大型语言模型为中国AI初创企业开辟新机遇

在人工智能（AI）领域，大型语言模型（LLM）的突破正引领着新一轮的技术革命。近日，OpenAI宣布了其最新的LLM成果，这一消息迅速在全球范围内引起了广泛关注，特别是对中国AI初…

王浩然
2025年5月2日
000
AI前沿

Diffbot 的人工智能模型无需猜测——它能够知道，这要归功于万亿事实知识图谱

Diffbot是一家位于硅谷的小公司，以维护世界上最大的网络知识索引之一而闻名，该公司今天宣布发布一种新的人工智能模型，有望解决该领域最大的挑战之一：事实准确性。新模型是Meta…

王浩然
2025年1月10日
000
AI前沿

利用人工智能避免网络安全责任推诿

在当今的数字化时代，网络安全问题日益严峻，而大多数安全漏洞皆源于人为错误。无论是内部威胁、凭证误用，还是人为失误，都令安全专家倍感头痛。即便是最严谨、最有经验的安全专业人员，也可能…

王浩然
2025年5月1日
000
AI前沿

S&P如何利用深度网络爬虫、集成学习与Snowflake架构收集中小企业5倍多的数据‌

在投资领域，关于中小企业的数据一直是一个难题。这并不是因为数据的质量或准确性存在问题，而是因为这些数据根本难以获取。评估中小企业的信用状况历来充满挑战，因为它们的财务数据通常不对外…

王浩然
2025年6月3日
000
AI前沿

Salesforce豪掷10亿美元投资新加坡，力推AI技术普及‌

在科技日新月异的今天，人工智能（AI）已经成为推动各行各业发展的重要力量。近日，全球领先的客户关系管理软件提供商Salesforce宣布了一项重大投资决策——将在新加坡投入高达10…

王浩然
2025年3月13日
000
AI前沿

EliseAI首席体验官Fran Loftus：以人文视角打造垂直领域AI服务新范式

在AI技术深度渗透各行各业的当下，如何让智能系统真正贴合场景需求、服务于人，成为了行业探索的核心命题。纽约AI软件公司EliseAI的首席体验官Fran Loftus，凭借其在社区…

王浩然
2026年3月4日
000
AI前沿

PTC、微软和大众汽车携手合作开发生成式人工智能

PTC 已确认正在与微软和大众汽车集团合作开发用于实体产品软件开发的生成式 AI产品。 Codebeamer Copilot 基于 PTC 的 Codebeamer 应…

王浩然
2024年12月25日
000
AI前沿

AWS 关闭了用于 AI 音乐的 MIDI 键盘 DeepComposer

AWS 奇怪的人工智能键盘实验DeepComposer不复存在。该公司在今天的一篇博客文章中宣布关闭已有 5 年历史的 DeepComposer，这是一款物理 MIDI 钢琴和 …

王浩然
2024年9月19日
000
AI前沿

缩减攻击窗口，降低MTTP：环形部署成为企业防御的必备策略

在网络安全日益严峻的今天，未打补丁的系统如同定时炸弹，时刻威胁着企业的信息安全。据研究显示，超过一半的网络攻击受害者承认，如果及时应用了补丁，这些攻击本可以避免。然而，令人担忧的是…

王浩然
2025年5月22日
000
AI前沿

成功将 AI 智能体整合进产品开发的五个步骤

在当今竞争激烈的商业环境中，产品开发领域正经历着一场由人工智能驱动的变革。AI 智能体凭借其强大的功能和独特优势，正逐渐成为提升产品竞争力的关键因素。然而，要成功地将 AI 智能体…

王浩然
2026年1月20日
000
AI前沿

华为 AI 技术栈：重构与优化，打造自主可控的 AI 基础设施

2025 年 10 月 27 日，David Thomas 发表分析指出，华为通过发布新一代 AI 技术栈，包括 CloudMatrix 384 AI 芯片集群、MindSpore…

王浩然
2025年10月29日
000

发表回复

Please Login to Comment

Meta新世界模型：让机器人在未知环境中灵活操控物体‌

相关推荐

发表回复