三星推出微型 AI 模型 TRM：以 700 万参数突破复杂推理，颠覆大模型 “规模至上” 范式

王浩然 • 2025年10月10日下午4:00 • AI前沿 • 358 views

2025 年 10 月 8 日，三星 AI 研究员 Alexia Jolicoeur-Martineau 发布的新研究显示，一款名为 “微型递归模型（Tiny Recursive Model, TRM）” 的小参数 AI 模型，在复杂推理任务中击败了参数规模远超自身的大型语言模型（LLMs）。这款仅含 700 万参数的模型（不足主流 LLMs 参数规模的 0.01%），不仅在数独、迷宫导航等经典推理基准测试中刷新最佳成绩，更在衡量 AI “流体智力” 的 ARC-AGI 测试中超越 Gemini 2.5 Pro 等顶尖大模型，彻底挑战了行业内 “参数越大、性能越强” 的传统认知，为 AI 推理提供了更高效、更可持续的技术路径。

TRM 的核心突破在于 “递归自修正架构”，这一设计从根本上解决了传统 LLMs 在多步推理中的固有缺陷。传统 LLMs 采用逐 token 生成答案的模式，一旦早期推理出现错误，后续步骤会持续 “跑偏”，最终导致答案失效；即便借助 “思维链（Chain-of-Thought）” 技术拆解问题，也需消耗大量计算资源，且依赖高质量推理数据，仍难以避免逻辑漏洞。而 TRM 通过 “单网络递归迭代” 机制，让模型具备自我修正能力：它先接收问题、初始猜测答案与潜在推理特征，通过多轮循环（最多 16 次）优化内部推理逻辑 —— 首先基于三者输入反复精炼 “潜在推理特征”，再用优化后的推理更新答案，逐步修正错误。例如在解 Sudoku-Extreme 数独时，TRM 会先生成初步填数方案，再通过多轮自查，修正行、列、宫格的数字冲突，最终将准确率提升至 87.4%，远超分层推理模型（HRM）的 55%。

值得注意的是，TRM 在架构设计上做了两处关键简化，既提升效率又避免过拟合。其一，它摒弃了 HRM 的双网络结构（低层高频调用模块 + 高层低频调用模块），改用单一网络同时承担推理与答案更新任务，参数规模直接缩减至 HRM 的 1/4（HRM 含 2700 万参数）；其二，研究发现 “少层数更优”—— 仅含 2 层的网络比 4 层网络泛化能力更强，原因是层数减少能避免模型在小规模训练数据（如 Sudoku-Extreme 仅 1000 个训练样本）上过度拟合，确保在新任务中保持灵活性。此外，TRM 还去除了 HRM 依赖的复杂数学假设（如不动点定理），通过 “全递归反向传播” 直接优化整个推理过程，仅这一调整就使 Sudoku-Extreme 测试准确率从 56.5% 提升至 87.4%，大幅降低了技术落地的理论门槛。

在性能测试中，TRM 以极小的参数规模展现出碾压性优势。在 Maze-Hard 任务（30×30 迷宫寻路）中，它的准确率达 85.3%，超过 HRM 的 74.5%；在最具挑战性的 ARC-AGI 测试（衡量 AI 抽象推理能力）中，TRM 在 ARC-AGI-1 上准确率 44.6%，ARC-AGI-2 上达 7.8%—— 这一成绩不仅超越 2700 万参数的 HRM（ARC-AGI-2 准确率 5.0%），更超过参数规模是其 10000 倍的 Gemini 2.5 Pro（ARC-AGI-2 准确率仅 4.9%）。训练效率上，TRM 通过简化 “自适应停止机制（ACT）”，省去训练中每次迭代的二次前向传播，在不影响泛化能力的前提下，进一步降低计算成本，使其能在普通硬件上快速训练，打破了大模型对高端算力的依赖。

TRM 的研发背景，源于行业对 “大模型规模竞赛” 的反思。此前，科技巨头为追求 AI 性能，持续投入数十亿资金扩大模型参数（如 DeepSeek R1 达 6710 亿参数），但这种模式不仅成本高昂、能耗巨大，还面临 “性能边际效益递减” 问题 —— 参数增长带来的推理能力提升越来越有限，且难以避免 “推理黑箱” 与 “错误累积”。三星的研究证明，通过优化推理架构（而非单纯扩大规模），小模型也能实现复杂任务的高效解决。这种 “参数高效型 AI” 路径，不仅符合低碳环保的行业趋势，还能让 AI 技术更易普及到算力有限的场景（如边缘设备、中小企业应用），为 AI 推理的轻量化发展提供了重要参考。

未来，TRM 的技术思路有望进一步拓展。研究团队计划探索将递归架构与多模态能力结合，提升模型在图像推理、跨语言逻辑分析等任务中的表现；同时，针对医疗诊断、工业质检等高精度推理场景，优化模型的逻辑严谨性与结果可解释性。正如研究员 Alexia Jolicoeur-Martineau 所言：“TRM 证明‘少即是多’—— 通过让小模型学会‘反复思考’，我们能在控制成本的同时，解锁 AI 推理的新可能。” 这一研究不仅为 AI 架构创新提供了新方向，更推动行业从 “规模竞争” 转向 “效率竞争”，为可持续的 AI 发展奠定了技术基础。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/san-xing-tui-chu-wei-xing-ai-mo-xing-trm-yi-700-wan-can-shu

700 万参数 AI 推理 ARC-AGI 测试 Gemini 2.5 Pro 三星 TRM 分层推理模型 (HRM)参数高效型 AI 复杂推理微型递归模型递归自修正架构

Like (0)

王浩然作者

0 0

2025 年五大顶尖 AI 可观测性工具：守护 AI 系统可靠运行，赋能全链路风险管控

Previous 2025年10月10日

尽管投资激增，AI 价值仍难落地：红帽报告揭示企业 AI 困境与开源破局路径

Next 2025年10月10日

AI前沿

代理人工智能如何重塑企业工作流程

在当今数字化时代，企业面临着日益复杂多变的市场环境和业务需求，传统的工作流程正逐渐难以满足企业高效运营和创新发展的需要。代理人工智能（Agentic AI）的出现，如同一场变革的风…

王浩然
2026年1月17日
000
AI前沿

为了安全起见，我们必须停止接听电话

您如何知道电话另一端的人确实是他们所说的那个人？ 7 月初，法拉利的一位高管收到了大量 WhatsApp 消息，这些消息似乎来自他的老板——法拉利汽车公司的首席执行官贝…

点点
2024年9月8日
000
AI前沿

大语言模型如何迫使我们重新定义智能‌

“如果它看起来像鸭子，游泳像鸭子，叫声像鸭子，那么它很可能就是鸭子。”这句源自印第安纳诗人詹姆斯·惠特科姆·莱利的朴素推理，数十年来深刻影响着我们对人工智能…

王浩然
2025年9月8日
000
AI前沿

谷歌云推出托管 Slurm 的 Vertex AI Training：瞄准企业级 AI 训练，直面 CoreWeave 与 AWS 竞争

2025 年 10 月 27 日，谷歌云正式发布全新企业级 AI 训练服务 Vertex AI Training，核心通过提供托管 Slurm 环境、全栈数据科学工具及多类型芯片支…

王浩然
2025年10月28日
000
AI前沿

前美军士兵承认黑客攻击电信公司及敲诈勒索罪‌

美国司法部周二发布公告，前美军士兵卡梅隆·约翰·瓦格纽斯（Cameron John Wagenius）对黑客攻击电信公司并威胁公布窃取文件以实施敲诈的指控表示认罪。根据司法部披露…

王浩然
2025年7月19日
000
AI前沿

DeepSeek-V2.5获赞为新版真正开源AI模型领导者

开源生成式人工智能运动可能很难保持领先地位——即使对于那些在该领域工作或报道该领域的人来说也是如此，比如我们 VenturBeat 的记者。从本质上讲，新的开源人工智能模型的广泛可…

王浩然
2024年9月17日
000
AI前沿

Anthropic 聘请 OpenAI 联合创始人 Durk Kingma

Durk Kingma 是 OpenAI 鲜为人知的联合创始人之一，今天他宣布将加入 Anthropic。在 X 的一系列帖子中，Kingma 透露他将主要在荷兰（他常驻的地方）…

大龄程序员
2024年10月2日
000
AI前沿

Credo AI 的集成中心可实现亚马逊、微软等公司 AI 项目的自动化治理

人工智能治理公司Credo AI推出了一个新平台，该平台与第三方人工智能运营和业务工具相结合，以更好地了解负责任的人工智能政策。 Credo AI 的 Integrations …

王浩然
2024年10月7日
000
AI前沿

OpenAI 曾是一家研究实验室——现在只是一家科技公司

OpenAI 的 11 位联合创始人中，只有包括 Sam Altman 在内的 3 人留在了公司。向投资者借钱的目的是为了获得回报。 OpenAI 成立之初就秉持着一个著名的利他…

王浩然
2024年9月30日
000
AI前沿

本地 AI 模型：如何在不丢失数据的前提下掌控竞价流

在程序化广告领域应用 AI 时，性能与数据安全是两大核心诉求。当前，众多企业内部安全审计已将第三方 AI 服务列为风险暴露点，向第三方 AI 智能体开放专有竞价流数据会带来不必要的…

王浩然
2025年11月22日
000
AI前沿

Reddit 扩展 AI 驱动搜索至五种新语言，加速多语言社区服务覆盖

Reddit 于 2025 年 10 月 16 日宣布，将其 AI 驱动的搜索功能扩展至法语、德语、西班牙语、意大利语和葡萄牙语五种新语言，此次升级覆盖巴西、法国、德国、西班牙、墨…

王浩然
2025年10月20日
000
AI前沿

Concourse获1200万美元A轮融资，AI代理平台向全规模财务团队开放

在AI技术深度渗透各行业的当下，财务领域的智能化转型正迎来新的突破口。近日，专注于财务AI代理平台的Concourse公司完成了1200万美元的A轮融资，同时宣布其AI代理平台正式…

王浩然
2026年2月1日
000
AI前沿

Counterintuitive 推出新型芯片，旨在突破 AI “双重陷阱”

2025 年 10 月 29 日，David Thomas 发表深度分析指出，AI 初创企业 Counterintuitive 正以 “推理原生计算（reasoning-nativ…

王浩然
2025年10月31日
000
AI前沿

自动驾驶送货机器人获得 AI 升级；Uber Eats 将于 2025 年部署 2,000 个

Serve Robotics 推出其先进的新型送货机器人

点点
2024年10月22日
000
AI前沿

OpenAI 与 Perplexity 推出 AI 购物助手，垂直领域初创企业凭专业优势从容应对

随着假日购物季临近，OpenAI 与 Perplexity 两大 AI 企业相继推出集成于现有聊天机器人的 AI 购物功能，试图革新用户在线购物的研究与决策流程。尽管市场预测 AI…

王浩然
2025年12月2日
000
AI前沿

构建还是购买？2025 年扩展您的企业级 AI 管道

扩大生成工具的采用范围一直是平衡野心与实用性的挑战，而在 2025 年，风险比以往任何时候都高。竞相采用大型语言模型 (LLM) 的企业正在面临一个新的现实：扩大规模不仅仅是部署更…

王浩然
2025年1月19日
000
AI前沿

微软押注碳去除竞赛将有助于抵消其飙升的人工智能排放量

微软陷入困境：该公司承诺到 2030 年实现碳负排放，但自 2020 年以来，其排放量飙升了 40% 以上，部分原因是其蓬勃发展的人工智能业务。该公司购买了大量可再生能源，但有些排…

王浩然
2024年11月17日
000
AI前沿

Sakana AI 获 1 亿美元融资，挑战 OpenAI、Anthropic 成为“世界级”人工智能实验室

人工智能热潮席卷全球。中国阿里巴巴凭借 Qwen2-VL登上新闻头条仅几天后，由前谷歌研究员 David Ha 和 Llion Jones 以及前外交官 Ren Ito 创立的日本…

王浩然
2024年9月5日
000
AI前沿

IT 领导者需重新思考灵活办公场景下的 AI 部署策略

2025 年 10 月 29 日，GoTo 公司 IT 解决方案集团总经理约瑟夫・乔治（Joseph George）发表深度分析指出，在企业围绕 “员工返岗、远程办公或混合模式” …

王浩然
2025年10月30日
000
AI前沿

Claude Skills 框架：悄然崛起的 AI 行业标准

Anthropic 推出 Claude Skills 框架时，其最初被视作小众开发者功能，仅两个月后，OpenAI 便采用相同架构，这一行业共识的形成，标志着 AI 智能体领域在 …

王浩然
2025年12月18日
000

发表回复

Please Login to Comment

三星推出微型 AI 模型 TRM：以 700 万参数突破复杂推理，颠覆大模型 “规模至上” 范式

相关推荐

发表回复