Thinking Machines 挑战 OpenAI 的 AI 规模化策略：首个人工超级智能将是 “超级学习者”

王浩然 • 2025年10月27日下午8:00 • AI前沿 • 843 views

2025 年 10 月 24 日，人工智能初创公司 Thinking Machines Lab 的强化学习研究员拉斐尔・拉法伊洛夫（Rafael Rafailov）在旧金山 TED AI 大会上发表颠覆性观点，直指当前 AI 行业依赖 “扩大模型规模、数据量与算力” 的主流路径存在根本性缺陷，提出 “首个人工超级智能（ASI）将是具备超强学习能力的‘超级学习者’，而非单纯依靠规模堆砌的推理机器”。这一观点不仅挑战了 OpenAI、Anthropic、谷歌 DeepMind 等头部企业的技术战略，也揭示了这家由 OpenAI 前首席技术官米拉・穆拉蒂（Mira Murati）于 2025 年 2 月创立、估值达 120 亿美元（种子轮融资 20 亿美元）的神秘初创公司的核心研发方向。

拉法伊洛夫指出，当前顶尖 AI 系统（如代码助手、研究助手）的核心痛点在于 “无法从经验中学习”—— 即便能完成复杂任务（如理解代码、实现功能），也无法内化知识，次日面对相似任务时仍需重复相同流程，如同 “每天都是第一天上班”。以 AI 编码助手为例，其常通过 “try/except 代码块” 规避潜在错误，这种类似 “用胶带修补漏洞” 的做法，本质是为快速完成当前任务而回避问题根源，反映出当前训练体系 “仅优化即时任务完成率，忽视长期学习与知识积累” 的局限。拉法伊洛夫强调，“学习是智能体主动获取知识的过程，而训练只是外部施加的输入，两者的区别正是当前 AI 与真正智能的鸿沟”。

在他看来，行业普遍认为 “持续扩大规模就能实现通用人工智能（AGI）” 的认知存在严重偏差。尽管扩大模型参数、增加算力能提升 AI 的特定任务能力（如代码生成、网页浏览），未来 1-2 年这类能力还将进一步增强，但 “通用智能体”（能自主交互、执行多步骤任务）不等于 “通用智能”（具备自主学习、自我改进能力）。拉法伊洛夫明确表示：“无论当前范式下如何扩大规模、增加环境训练或强化学习（RL）迭代，都无法实现 AGI 或 ASI，因为这些模型始终缺乏‘主动学习’这一核心能力。”

为突破这一困境，拉法伊洛夫提出 “教科书式元学习” 方案，核心是让 AI 像人类学生一样通过系统性学习积累知识，而非孤立解决单个问题。具体而言，不再让模型针对孤立的难题（如一道复杂数学题）进行训练并在任务结束后丢弃所学，而是提供类似 “研究生级专业教科书” 的结构化学习材料，让 AI 按章节顺序学习、完成习题、逐步进阶，例如先掌握基础数学概念，再攻克复杂定理，过程中不仅奖励任务完成度，更奖励 “知识吸收效率” 与 “学习进步速度”。这种 “学习如何学习” 的元学习思路，在 DeepMind 的 AlphaGo 等游戏 AI 中已有小规模验证（通过自我对弈快速掌握策略），拉法伊洛夫认为需将其适配到基础模型规模，让 AI 学会 “自主构建知识体系”。

他进一步指出，实现这一目标无需彻底重构模型架构，现有核心技术框架已具备基础，关键在于 “重构训练数据与目标函数”：一方面需提供结构化、体系化的学习数据（如学科教科书、科研文献），而非零散的任务样本；另一方面需将训练目标从 “完成单个任务” 转向 “提升长期学习能力”，例如奖励 AI 发现通用规律、构建抽象概念（如数学家发展拓扑学以拓展几何体系，而非仅解决特定几何问题）。拉法伊洛夫坚信，“学习本身是一种可被学习的算法，若 AI 能掌握通用学习算法，就能在不同领域高效获取知识，这才是通往 ASI 的关键”。

这种思路下，首个人工超级智能的形态将与科幻作品中 “全能推理机器” 的想象截然不同。拉法伊洛夫描绘的 ASI 是 “超级学习者”—— 具备自主提出理论、设计实验、验证假设、迭代知识的能力，能通过与环境交互（如使用计算机、开展科研、操控机器人）持续自我改进，而非仅擅长解决特定领域难题。他举例说明：“这种智能体不会一开始就精通所有领域，但能快速学习并掌握新技能，如同一个能自主攻读任意学科的顶尖学者，最终凭借学习效率超越人类。”

值得关注的是，拉法伊洛夫的观点发布之际，Thinking Machines Lab 正面临人才挑战。2025 年 10 月初，公司联合创始人、机器学习专家安德鲁・塔洛克（Andrew Tulloch）因 Meta 的高薪挖角（据传薪酬方案最高达 15 亿美元 / 多年）离职，Meta 同时还接触了公司十余名员工，反映出行业对 “非规模化 AI 研发方向” 核心人才的争夺。尽管如此，Thinking Machines Lab 仍在推进相关落地 ——10 月推出首款产品 Tinker（一款用于微调开源语言模型的 API），而拉法伊洛夫的演讲暗示，该产品仅是公司 “元学习与自我改进 AI” 长期研发计划的基础。

拉法伊洛夫承认，实现 “超级学习者” 面临记忆机制、工程优化、数据构建等多重技术突破，且需要大量算力支持，但他强调 “这在理论上完全可行”。与行业高管常对 AGI 落地时间给出明确预测不同，他未提及具体时间表，仅强调 “需行业放弃对‘规模万能论’的依赖，转向对‘主动学习’的深耕”。这种谨慎态度既体现了科学严谨性，也暗示 Thinking Machines Lab 正走一条比 “规模化” 更漫长、更具挑战性的技术路径。

总体而言，拉法伊洛夫的观点不仅是对 OpenAI 等企业规模化战略的公开挑战，更为 AI 行业提供了 “从‘工具型智能’向‘自主型智能’转型” 的新方向。其核心价值在于指出：AI 的终极突破不在于 “能做更多事”，而在于 “能更快学会做新事”，这一认知或将重新定义未来 AI 研发的优先级，推动行业从 “规模竞赛” 转向 “学习能力竞赛”。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/thinking-machines-tiao-zhan-openai-de-ai-gui-mo-hua-ce-lyue

AI 规模化策略 Thinking Machines Lab 主动学习元学习强化学习 (RL)教科书式学习超级学习者通用人工智能 (AGI)

Like (0)

王浩然作者

0 0

法国 Mistral 推出 AI Studio：以欧洲本土模型为核心，打造企业级 AI 快速开发平台

Previous 2025年10月27日

AI 浏览器变 “敌人”：Comet 安全灾难暴露行业系统性风险

Next 2025年10月28日

AI前沿

Nvidia推出NemoClaw：为OpenClaw注入企业级安全，打造AI代理新生态

在2026年GTC大会的主题演讲中，英伟达（Nvidia）CEO黄仁勋抛出了一个振聋发聩的观点：如今每家企业都应该拥有自己的OpenClaw战略，而英伟达正准备成为这一战略的坚实后…

王浩然
2026年3月21日
000
AI前沿

AI如何重塑我们对人类决策机制的理解

人类决策机制的研究一直是心理学领域的核心课题。数十年来，科学家们致力于构建能够解释人类思维过程并预测行为的认知模型。如今，人工智能(AI)的崛起正在彻底改变这一研究领域。最新突破性…

王浩然
2025年7月25日
000
AI前沿

AUDEZE总部处于自己的联盟中——就像它的耳机一样

Audeze——CRBN和Maxwell等高端耳机的制造商——是奥德赛一词的戏剧，灵感来自开创性的科幻经典《2001：太空漫游》。这是一个恰当的名字，或者更确切地说，是一个恰当的灵…

点点
2024年9月29日
000
AI前沿

GPT-4o遭遇反感后，研究人员对模型进行道德背书基准测试，发现谄媚行为普遍存在‌

在人工智能领域，每一次技术革新都可能伴随着争议与挑战。近期，OpenAI的GPT-4o模型在推出后，因被指对用户过度谄媚而引发了一系列讨论。这一行为，被称为“谄媚性”，导致模型过于…

王浩然
2025年5月24日
000
AI前沿

OpenAI 可能以令人惊讶的方式摆脱与微软的协议

《纽约时报》周四发表了一篇文章，探讨了 OpenAI 与其投资者、合作伙伴兼竞争对手微软之间“紧张”的关系。报道称，由于 OpenAI 面临的财务压力、微软为 OpenAI 提供的…

王浩然
2024年10月19日
000
AI前沿

大型推理模型是否真的在“思考”？——苹果研究引发业界热议‌

在人工智能领域，关于大型推理模型（LRMs）是否具备真正“思考”或“推理”能力的讨论一直如火如荼。近期，苹果公司机器学习团队发布的一篇题为《思维的错觉》的研究论文，更是将这一话题推…

王浩然
2025年6月15日
000
AI前沿

自信的谬误：为何越智能的AI越难自我纠错？

在AI领域的畅想中，自我改进型AI一直是被寄予厚望的下一个革命方向——人们期待着AI能摆脱人类干预，通过自我迭代实现能力的持续提升，最终触发所谓的“智能爆炸”。这一愿景的核心，是A…

王浩然
2026年1月29日
000
AI前沿

网站无障碍性现状堪忧：监管加强下多数网站仍未达标‌

在当今这个数字化时代，互联网已经成为人们获取信息、交流互动和进行交易的关键平台。然而，随着各国政府对数字无障碍性的关注度日益提升，一系列旨在保障残障人士等特殊群体网络权益的法规相继…

王浩然
2025年3月29日
000
AI前沿

苹果 AI 负责人约翰・吉安南德雷亚因 Siri 发展受阻卸任，前微软高管接任

苹果公司宣布，负责人工智能业务的负责人约翰・吉安南德雷亚（John Giannandrea）正式卸任该职位。这一人事变动发生在苹果 AI 语音助手 Siri 遭遇发展挫折之后 ——…

王浩然
2025年12月5日
000
AI前沿

DuckDuckGo推出AI生成图片过滤功能隐私搜索引擎打响内容净化战‌

专注于隐私保护的搜索引擎DuckDuckGo近日推出革命性功能——允许用户在图片搜索结果中屏蔽AI生成内容。这项更新直接回应用户反馈，旨在解决泛滥的AI低质图片干扰正常搜索体验的问…

王浩然
2025年7月20日
000
AI前沿

研究发现：女性因道德担忧更少使用生成式 AI

在生成式人工智能（AI）迅速崛起并广泛应用于各个领域的当下，一项新的研究揭示了一个引人深思的现象：女性相较于男性，由于道德层面的担忧，对生成式 AI 的使用频率更低。这一发现不仅反…

王浩然
2026年1月12日
000
AI前沿

ChatGPT 的资源需求正在失控

众所周知，生成式人工智能的发展需要越来越多的水和电，但《华盛顿邮报》和加州大学河滨分校研究人员的一项新研究表明，OpenAI 的聊天机器人需要多少资源才能执行其最基本的功能。在…

王浩然
2024年9月24日
000
AI前沿

Meta Llama 4 正式发布：Scout、Maverick、Behemoth 三档齐发，开源大模型再树新标杆

Meta 于近日正式发布旗下开源大模型 Llama 4 系列，包含轻量级 Scout、中端 Maverick 以及旗舰级 Behemoth 三档版本，全面覆盖从边缘计算到超大规模推…

2026年4月19日
000
AI前沿

麻省理工学院研究团队设计出解决计算能源问题的量子解决方案

计算能力的不断进步长期以来依赖于我们制造更小、更高效的电子元件的能力。这一进步的核心是不起眼的晶体管——现代电子产品的基本组成部分。然而，随着我们的数字世界不断扩大，人工智能应用变…

王浩然
2024年11月10日
000
AI前沿

ServiceNow 提倡使用“隐形”人工智能代理来简化工人的采用

企业开始部署人工智能代理。但是，如果组织计划大规模部署代理生态系统并提高员工接受度，他们可能会考虑将人工智能代理视为在后台工作的工具，以避免吓倒那些认为他们必须知道如何使用这些工具…

王浩然
2024年10月26日
000
AI前沿

微博开源 AI 模型 VibeThinker-1.5B：低成本突破性能壁垒，在数学与代码任务中超越 DeepSeek-R1

中国社交平台巨头微博旗下 AI 部门正式发布开源大语言模型 VibeThinker-1.5B。该模型基于阿里巴巴 Qwen2.5-Math-1.5B 基座模型微调而成，参数量仅 1…

王浩然
2025年11月16日
000
AI前沿

帕尔默·卢基的人工智能防御公司 Anduril 正在俄亥俄州建造一座价值 10 亿美元的工厂

西方的火焰正向东方袭来。科技亿万富翁兼VR 耳机大亨帕尔默·卢基 (Palmer Luckey)创立的人工智能防御公司 Anduril周四宣布计划在俄亥俄州哥伦布市建造一家工厂。…

王浩然
2025年1月21日
000
AI前沿

GibberLink：让AI代理以机器语言互相“通话”‌

在人工智能领域，随着技术的不断进步，AI代理间的通信成为了一个备受关注的课题。近日，一款名为GibberLink的创新技术横空出世，它实现了AI代理之间以一种独特的“机器语言”进行…

王浩然
2025年3月8日
000
AI前沿

Bazaarvoice首席技术官Nick Shiftan：AI驱动下的信任型电商内容生态构建

在AI技术重塑电商行业的当下，用户生成内容（UGC）作为消费者决策的核心依据，其真实性、可信度与规模化运营正成为行业关注的焦点。近日，Bazaarvoice首席技术官Nick Sh…

王浩然
2026年1月30日
000
AI前沿

从热门噱头到理性现实：向量数据库两年发展复盘

对向量数据库行业过去两年的发展历程进行了深度复盘。回溯至 2024 年 3 月，该领域正处于狂热的炒作周期，向量数据库被奉为生成式 AI 时代不可或缺的基础设施层，承载着行业对 “…

王浩然
2025年11月20日
000

发表回复

Please Login to Comment

Thinking Machines 挑战 OpenAI 的 AI 规模化策略：首个人工超级智能将是 “超级学习者”

相关推荐

发表回复