
人形机器人不再是科幻小说中的东西。想象一下这样一个世界:机器人不仅能在工厂与我们合作,还能在商店迎接我们、协助手术并照顾我们所爱的人。特斯拉计划在2026 年部署数千台 Optimus 机器人,人形机器人时代比我们想象的更近了。
随着越来越多的公司展示突破性创新,这一愿景正变得越来越切实可行。2025 年消费电子展 (CES) 展示了机器人技术在功能和以人为本的设计方面取得进步的几个例子。其中包括Richtech Robotics 的机器人调酒师 ADAM,它可以调制 50 多种饮料并与顾客互动,还有Tombot Inc. 的小狗,它们会摇尾巴并发出声音,旨在安抚患有痴呆症的老年人。虽然这些机器人和展会上展出的其他机器人可能有市场,但这种类型的机器人技术的广泛部署仍为时过早。
尽管如此,该领域正在取得真正的技术进步。越来越多的“人形”机器人使用生成式人工智能来创造更多类似人类的能力——使机器人能够在复杂的环境中学习、感知和行动。从特斯拉的 Optimus 到Realbotix的 Aria ,未来十年将见证人形机器人的激增。
尽管取得了这些令人鼓舞的进展,但一些专家警告称,实现完全类似人类的能力仍是一个遥远的目标。人工智能教父之一 Yann LeCun最近指出,当前技术存在缺陷,人工智能系统“没有规划、推理……或理解物理世界的能力”。他补充说,我们今天无法制造出足够智能的机器人,因为“我们无法让它们足够智能”。
LeCun 可能是对的,但这并不意味着我们不会很快看到更多的人形机器人。埃隆·马斯克最近表示,特斯拉将在 2025 年生产数千台 Optimus 机器人,预计 2026 年将出货5 万到 10 万台。与目前少数执行有限功能的机器人相比,这是一个巨大的增长。当然,马斯克的时间表也出了问题,比如他在 2016 年表示,完全自动驾驶将在两年内实现。
尽管如此,人形机器人似乎正在取得重大进展。特斯拉并不是唯一一家追求这一目标的公司,其他公司包括 Agility Robotics、波士顿动力和 Figure AI 都是人形机器人领域的领导者。
Business Insider最近采访了Agility Robotics 首席执行官佩吉·约翰逊 (Peggy Johnson),她表示,人形机器人在各种工作场所与人类共事很快就会“非常正常”。上个月,Figure 在LinkedIn 帖子中宣布:“我们向我们的商业客户交付了 F.02 人形机器人,它们目前正在努力工作。”在微软和 Nvidia 等主要投资者的大力支持下,Figure 将为人形机器人市场带来激烈的竞争。
创造世界观
不过,LeCun 确实说得有道理,因为机器人还需要更多的进步才能拥有更完整的人类能力。在工厂里移动零件比在动态、复杂的环境中导航要简单得多。
当前一代机器人面临三大挑战:快速处理视觉信息以便实时做出反应;理解人类行为中的细微线索;适应环境中的意外变化。当今大多数人形机器人都依赖于云计算,由此产生的网络延迟可能会使拾起物体等简单任务变得困难。
一家致力于克服当前机器人技术局限性的公司是初创公司 World Labs,其创始人是“AI 教母”李飞飞。在接受Wired采访时,李飞飞表示:“计算机通过摄像头看到物理世界,而计算机大脑位于摄像头后面。将这种视野转化为推理、生成和最终的交互需要理解物理世界的物理结构和物理动态。这项技术被称为空间智能。”
通用人工智能通过帮助机器人实时绘制周围环境地图(就像人类一样)来增强空间智能,预测物体可能如何移动或变化。这些进步对于创造能够应对复杂现实场景的自主人形机器人至关重要,并具备成功所需的适应性和决策能力。
虽然空间智能依靠实时数据来构建环境的思维地图,但另一种方法是帮助人形机器人从单个静态图像推断现实世界。正如一篇预先发表的论文所解释的那样,生成世界探索者 (GenEx) 使用人工智能从单个图像创建一个详细的虚拟世界,模仿人类如何推断周围环境。虽然仍处于研究阶段,但此功能将帮助机器人做出瞬间决策或在有限的传感器数据下导航新环境。这将使他们能够快速理解和适应他们从未体验过的空间。
机器人技术的 ChatGPT 时刻即将到来
World Labs 和 GenEx 不断突破 AI 推理的界限,而 Nvidia 的 Cosmos 和 GR00T 则致力于解决为人形机器人配备现实世界适应性和交互能力的挑战。Cosmos是AI“世界基础模型”系列,可帮助机器人理解物理和空间关系,而 GR00T(通用机器人 00 技术)则允许机器人通过观察人类来学习——就像学徒向师傅学习一样。这些技术共同帮助机器人理解要做什么以及如何自然地去做。
这些创新反映了机器人行业为人形机器人配备认知和身体适应能力的更广泛努力。GR00T 可以让人形机器人通过观察和模仿医疗专业人员来帮助医疗保健,而 GenEx 可以让机器人通过从有限的视觉输入推断环境来导航到灾区。据《投资者商业日报》报道,Nvidia 首席执行官黄仁勋表示:“机器人技术的 ChatGPT 时刻即将到来。”
另一家致力于创建物理 AI 模型的公司是 Google DeepMind。该公司的研究科学家 Timothy Brooks本月在 X 上发布了该公司计划制作模拟物理世界的大型生成模型的消息。
这些新兴的物理世界模型将更好地预测、规划和从经验中学习,这些都是未来人形机器人的基本能力。

机器人来了
2025 年初,人形机器人基本处于原型阶段。短期内,它们将专注于特定任务,例如制造、物流和灾难响应,在这些任务中,自动化可以带来立竿见影的价值。随着技术的成熟,护理或零售互动等更广泛的应用将在稍后出现。然而,人工智能和机械工程的进步正在加速此类人形机器人的发展。
咨询公司埃森哲最近注意到,专门为在人类世界中实现机器自主性而开发的全套机器人硬件、软件和人工智能模型正在不断开发中。该公司在其“ 2025 年技术愿景”报告中指出:“在未来十年,我们将开始看到机器人随意而常见地与人类互动,通过推理完成计划外的任务,并在任何环境中独立采取行动。”

华尔街公司摩根士丹利估计,到 2040 年美国人形机器人的数量可能达到 800 万台,到 2050 年将达到 6300 万台。该公司表示,除了技术进步之外,长期人口结构变化造成的劳动力短缺也可能有助于推动人形机器人的发展和应用。
打造值得信赖的机器人
除了纯粹的技术障碍之外,还必须克服潜在的社会反对意见。如果不解决这些问题,公众的怀疑态度可能会阻碍人形机器人的采用,即使在它们提供明显好处的领域也是如此。要取得成功,部署的人形机器人需要被视为值得信赖,人们需要相信它们对社会有帮助。正如《麻省理工技术评论》所指出的,“如果现在这样的机器人走进他们的客厅,很少有人会感到温暖和舒适。”
为了解决信任方面的挑战,研究人员正在探索如何让机器人看起来更容易相处。例如,日本的工程师用人类皮肤细胞制作了一个面罩并将其安装在机器人身上。根据去年夏天发表并由《纽约时报》报道的一项研究,该研究的首席研究员表示:“像人类一样的面孔和表情可以改善人机互动中的沟通和同理心,使机器人在医疗、服务和陪伴角色中更有效。”换句话说,像人类一样的外表会提高信任度。
除了看起来值得信赖之外,类人机器人还需要始终保持合乎道德和负责任的行为,以确保人类的接受。例如,在公共场所,带有摄像头的人形机器人可能会无意中收集敏感数据,例如对话或面部细节,从而引发对监视的担忧。确保数据透明的政策对于减轻这些风险至关重要。
未来十年
短期内,人形机器人将专注于特定任务,例如制造、物流和灾难响应,这些任务中的自动化可以带来立竿见影的价值。这些专业角色凸显了它们在结构化环境中的当前优势,而随着技术的成熟,医疗保健、护理和零售业务等更广泛的应用将会出现。
随着人形机器人在日常生活中越来越常见,它们的存在将深刻影响并可能重塑人类的互动和社会规范。除了执行任务之外,这些机器还将融入社会结构,要求人类与技术建立新的关系。它们的采用可以缓解老龄化社会的劳动力短缺问题并提高服务业的效率,但也可能引发关于工作流失、隐私和日益自动化的世界中的人类身份的争论。为这些转变做好准备不仅需要技术进步,还需要深思熟虑的社会适应。
通过应对挑战并充分利用人形机器人的效率和适应性,我们可以确保这些技术成为进步的工具。塑造这个未来不仅仅是政策制定者和技术领导者的责任——这是每个人的对话。公众参与对于确保人形机器人改善社会并满足人类的真正需求至关重要。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/ren-gong-zhi-neng-huo-le-guo-lai-cong-tiao-jiu-shi-dao-shou