Meta FAIR推进类人AI：五大重磅发布

王浩然 • 2025年5月4日下午9:00 • AI前沿 • 304 views

Meta公司的Fundamental AI Research（FAIR）团队最近宣布了五项重大进展，这些成果标志着Meta在追求高级机器智能（AMI）的道路上迈出了坚实的一步。此次发布的重点集中在提升AI的感知能力、语言建模、机器人技术以及协同AI代理方面，旨在打造能够像人类一样感知、理解和与世界互动的机器。

类人AI的五大支柱

感知编码器：锐化AI的“视觉”

感知编码器是此次发布的核心之一，它是一个大规模的视觉编码器，旨在各种图像和视频任务中表现出色。视觉编码器作为AI系统的“眼睛”，使AI能够理解视觉数据。Meta强调，构建能够满足高级AI需求的编码器是一项巨大挑战，这些需求包括跨越视觉和语言的桥梁、有效处理图像和视频，以及在恶劣条件下保持鲁棒性。

感知编码器据称在图像和视频的零样本分类和检索任务上取得了卓越性能，超越了所有现有的开源和专有模型。此外，当与大型语言模型（LLM）结合时，该编码器在视觉问答（VQA）、图像描述、文档理解和文本到图像区域的链接等任务上也表现出色。

感知语言模型（PLM）：视觉与语言的桥梁

与感知编码器相辅相成的是感知语言模型（PLM），这是一个开放且可复现的视觉-语言模型，专注于复杂的视觉识别任务。PLM通过大规模合成数据与开放视觉-语言数据集的结合进行训练，没有从外部专有模型中提炼知识。Meta还收集了250万个新的人类标注样本，专注于细粒度的视频问答和时空图像描述，形成了迄今为止同类数据集中最大的一个。

PLM以10亿、30亿和80亿参数版本提供，满足学术研究对透明度的需求。Meta还发布了PLM-VideoBench，这是一个新的基准测试，专门用于评估现有基准测试中经常遗漏的能力，如细粒度活动理解和时空链接推理。

Meta Locate 3D：赋予机器人环境感知能力

Meta Locate 3D是一个端到端模型，旨在使机器人能够根据开放式自然语言查询在3D环境中准确定位物体。该模型直接处理来自RGB-D传感器的3D点云数据，通过理解空间关系和上下文来精确识别指定物体。Meta还发布了一个基于指代表达式的大规模新数据集，用于物体定位，有效加倍了该领域现有的标注数据。

动态字节潜在变换器：高效且稳健的语言建模

动态字节潜在变换器是Meta在2024年底研究基础上发布的80亿参数模型。该模型摒弃了传统的基于令牌的语言建模方法，转而采用字节级别的处理方式。Meta声称这种方法在保持大规模性能的同时，显著提高了推理效率和稳健性。动态字节潜在变换器在多个任务上表现出比基于令牌的方法更高的鲁棒性，尤其是在处理拼写错误、新词或对抗性输入时。

协作推理器：推动社会智能AI代理的发展

协作推理器是Meta发布的最后一个模型，它旨在解决创建能够有效与人类或其他AI协作的AI代理的复杂挑战。人类协作往往能产生更好的结果，Meta希望将这种能力赋予AI，以便在家庭作业辅导、面试准备等任务中发挥作用。协作推理器包括需要通过两个代理之间对话实现的多步骤推理任务，测试了建设性不同意、说服伙伴和达成最佳共享解决方案等能力。

Meta对AI未来的展望

这五项发布共同展示了Meta在基础AI研究方面的持续投资，特别是在构建能够感知、理解和与世界互动的机器方面。通过感知编码器、PLM、Meta Locate 3D、动态字节潜在变换器和协作推理器，Meta正朝着创造更智能、更灵活的AI系统的目标迈进。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-fair-tui-jin-lei-ren-ai-wu-da-zhong-bang-fa-bu

FAIR Meta Meta Locate 3D 动态字节潜在变换器协作推理器感知编码器感知语言模型机器人技术类人AI 高级机器智能

Like (0)

王浩然作者

0 0

华为AI硬件突破挑战英伟达霸主地位

Previous 2025年5月4日下午7:00

迪拜AI周亮点： Machines Can See 2025 盛大启幕

Next 2025年5月5日

AI前沿

AI 编码初创公司 Poolside 从 eBay、Nvidia 等公司筹集 5 亿美元

人工智能软件开发平台Poolside已筹集5 亿美元新资本。这笔资金来自贝恩资本风险投资公司 (Bain Capital Ventures) 牵头的 B 轮融资，参与融资的还有 …

点点
2024年10月3日
000
AI前沿

Nvidia 发布了可分析视频的 AI 代理蓝图

今天，作为首席执行官黄仁勋 (Jensen Huang)在CES 2025开幕主题演讲的一部分， Nvidia推出了可分析视频的 AI 代理蓝图。由 Metropolis 提供支…

王浩然
2025年1月8日
000
AI前沿

行业领袖支持开源人工智能定义

开放源代码促进会（OSI）公布了一个定义框架，以评估人工智能系统是否可以归类为开源。第一个开源人工智能定义 (OSAID) 在All Things Open 大会上发布，标志着全…

点点
2024年11月4日
000
AI前沿

工程的未来：属于与AI共建者，而非无AI者‌

在当今这个日新月异的时代，工程领域的每一次革新都深刻地影响着我们的世界。如今，人工智能（AI）正逐渐成为推动这一领域发展的核心力量。未来的工程，将不再属于那些忽视或拒绝AI的从业者…

王浩然
2025年6月1日
000
AI前沿

超大型开源 AI DeepSeek-V3 发布时表现超越 Llama 和 Qwen

中国人工智能初创公司 DeepSeek 以其创新的开源技术挑战领先的人工智能供应商而闻名，今天发布了一种新的超大模型：DeepSeek-V3。根据该公司的许可协议，新模型可通过H…

王浩然
2024年12月28日
000
AI前沿

AI编程助手并非万能解决方案

近期的一份报告显示，人工智能（AI）编程助手虽然在一定程度上提高了编程效率，但并非所有编程问题的万能解决方案。这一结论基于对当前市场上主流AI编程助手功能的深入分析，以及对开发者实…

王浩然
2025年2月25日
000
AI前沿

麻省理工学院麦戈文脑研究所：塑造脑科学，改善人类生活‌

自其成立以来的二十五年间，麻省理工学院的麦戈文脑研究所（McGovern Institute for Brain Research）一直在神经科学、神经技术、人工智能、脑体连接以及…

王浩然
2025年4月21日
000
AI前沿

ChatGPT周活破9亿，OpenAI完成1100亿美元融资开启AI规模化新征程

当地时间周五，OpenAI同时抛出两大重磅消息：旗下核心产品ChatGPT的周活跃用户数突破9亿，较2025年10月公布的8亿用户数实现了1亿量级的增长；与此同时，该公司完成了规模…

王浩然
2026年3月4日
000
AI前沿

Replit估值90亿美元：AI驱动的“氛围编码”赛道淘金热已至

在AI技术重塑软件开发生态的当下，代码协作平台Replit的最新融资动态，再次为这个新兴赛道的火爆添上了注脚。近日，Replit完成了4亿美元D轮融资，估值一举跃升至90亿美元，较…

王浩然
5天前
000
AI前沿

DeepSeek：全面了解这款AI聊天机器人应用‌

在人工智能领域，一款名为DeepSeek的聊天机器人应用正逐渐崭露头角。这款应用凭借其强大的AI技术和出色的用户体验，吸引了众多用户的关注。 DeepSeek的核心优势在于其先进的…

王浩然
2025年3月10日
000
AI前沿

AI模型的“黑暗面”：对高管黑邮率高达96%‌

随着人工智能（AI）技术的飞速发展，AI模型在各个领域的应用日益广泛。然而，最近一项由Anthropic公司进行的研究揭示了一个令人震惊的事实：在模拟的企业环境中，当AI模型的目标…

王浩然
2025年6月24日
000
AI前沿

NVIDIA 全新微服务助力主权 AI

为了确保 AI 系统反映本地价值观和法规，各国越来越多地推行自主 AI 战略；利用自己的基础设施、数据和专业知识开发 AI。NVIDIA 推出四款全新 NVIDIA NIM来支持这…

AI News
2024年8月29日
000
AI前沿

Meta 计划进军电力交易业务，以支撑 AI 数据中心巨量能源需求

为加速建设满足自身数据中心能源需求的新电厂，Meta 正寻求进入电力交易领域。当前，Meta 与微软均在申请联邦层面的电力交易许可（苹果已率先获得该许可）。据 Meta 表述，此举…

王浩然
2025年11月30日
000
AI前沿

代理人工智能：2026 年或成 “职场实习生”——Nexos AI 的预测

在人工智能（AI）技术日新月异的发展进程中，各类创新不断涌现，重塑着各个行业的格局。Nexos AI 做出了一个引人深思的预测：到 2026 年，代理人工智能（Agent AI）可…

王浩然
2026年1月10日
000
AI前沿

多智能体对齐：AI 安全领域的新前沿，重塑互联系统风险治理逻辑

AI 对齐领域长期聚焦于让单个 AI 模型贴合人类价值观与意图，但随着多智能体系统的兴起，这一重心正发生根本性转变。如今，AI 生态不再是单一模型独立运作，而是由多个专业智能体构成…

王浩然
2025年10月23日
000
AI前沿

微软将在德国面临更严格的竞争审查，包括其对人工智能的使用

微软已加入受德国特殊滥用控制制度约束的科技巨头专属俱乐部。德国联邦企业联合办公室 (FCO) 周一证实，如果竞争管理机构认为有必要进行干预，这家软件巨头可能会受到限制。这项为期五…

王浩然
2024年10月1日
000
AI前沿

告别AI蔓延焦虑：与其恐慌，不如学会与它共生

当一家北美物流企业的团队为了提升旺季配送预测效率，自发用上了从企业授权到个人账号的各类AI工具，并且很快拿到了亮眼的成果时，一场关于AI的“隐形扩张”已经悄然发生。这并非个例，而是…

王浩然
2026年2月13日
000
AI前沿

埃隆·马斯克的Grok AI聊天机器人意外向用户谈论南非种族灭绝话题

近日，埃隆·马斯克的AI聊天机器人Grok在社交媒体平台上出现了一个奇怪的现象：它开始在没有任何提示的情况下，向用户回复关于南非“白人种族灭绝”的信息，甚至在一些与这个话题完全无关…

王浩然
2025年5月18日
000
AI前沿

Mistral 发布针对笔记本电脑和手机优化的新型 AI 模型

法国人工智能初创公司Mistral发布了其首批生成式人工智能模型，旨在在笔记本电脑和手机等边缘设备上运行。 Mistral 称之为“Les Ministraux”的新模型系列可用于…

王浩然
2024年10月17日
000
AI前沿

2024 年上半年网络安全趋势与洞察：您需要了解的内容

Perception Point发布的2024 年上半年网络安全趋势与洞察报告揭示了快速演变的网络威胁形势，其特点是攻击的复杂性和频率都在增加。与 2023 年上半年相比，每位用户…

点点
2024年9月5日
000