Sakana推出新型AI架构：连续思维机器，让模型像人脑一样自主推理

王浩然 • 2025年5月13日下午8:00 • AI前沿 • 316 views

东京的人工智能初创公司Sakana，由前谷歌顶级AI科学家Llion Jones和David Ha等人联合创立，近日推出了一种全新的AI模型架构——连续思维机器（Continuous Thought Machines，简称CTM）。这一创新旨在引领AI语言模型进入一个新纪元，使它们更加灵活，能够处理更广泛的认知任务，从而在解决复杂问题时更接近人类大脑的思维方式。

动态推理，模拟人脑灵活性

与传统的Transformer模型不同，CTM并不依赖于固定的并行层来一次性处理所有输入。相反，它在每个输入/输出单元内，即每个人工“神经元”中逐步展开计算。每个神经元都保留了一个关于其之前活动的短期历史，并利用这段记忆来决定何时再次激活。这种内部状态使CTM能够根据任务的复杂性动态调整推理的深度和持续时间，每个神经元的信息密度和复杂性都远超典型的Transformer模型。

神经同步，实现自主协作

CTM架构围绕两个关键机制构建。首先，模型中的每个神经元都维护一个关于其激活时间和原因的“历史”或工作记忆，并利用这一历史来决定何时再次触发。其次，神经同步——即模型中的人工神经元如何以及何时“触发”或共同处理信息——是自然发生的。神经元群体基于内部对齐来决定何时一起触发，而不是依赖外部指令或奖励塑造。这些同步事件用于调节注意力并产生输出，即注意力被导向更多神经元正在触发的区域。

广泛应用，展现强大潜力

在图像分类、二维迷宫求解以及强化学习等多个领域的演示中，CTM都表现出了出色的可解释性和适应性。其内部的“思维”步骤允许研究人员观察决策是如何随时间形成的，这在其他模型家族中很少见到。尽管CTM并不是为了追逐排行榜上的最高分数而设计的，但其早期结果表明，这种生物学启发的设计并没有牺牲实用性。在广泛使用的ImageNet-1K基准测试中，CTM达到了72.47%的top-1准确率和89.89%的top-5准确率，尽管这略低于最先进的Transformer模型，但仍保持了一定的竞争力。

适应性强，满足复杂需求

CTM在顺序和自适应任务中的表现尤为突出。在迷宫求解场景中，该模型能够根据原始图像产生逐步的方向性输出，而无需使用在Transformer模型中通常必不可少的位置嵌入。视觉注意力轨迹显示，CTM往往以类似人类的顺序关注图像区域，如从眼睛到鼻子再到嘴巴来识别面部特征。此外，CTM还表现出强大的校准能力：其置信度估计与实际预测准确性紧密一致，无需温度缩放或事后调整。

社区开放，推动研究深入

虽然CTM架构仍处于实验阶段，尚未针对商业部署进行优化，但Sakana已为其奠定了坚实的基础，以促进社区采纳。CTM的完整实现已在GitHub上开源，包括针对特定任务的训练脚本、预训练检查点、绘图实用程序和分析工具。此外，Sakana还提供了一个交互式网络演示，让用户能够观察CTM在推理过程中注意力的转移，从而更深入地理解其推理流程。

未来展望，潜力巨大

对于CTM来说，要达到生产环境还需在优化、硬件效率和与标准推理管道的集成方面取得进一步进展。然而，凭借其动态分配计算能力、自我调节推理深度以及提供清晰可解释性的能力，CTM在生产系统中面对复杂多变的输入或严格监管要求时可能具有极高的价值。AI工程师将发现CTM在能源高效的推理方面的优势，特别是在大规模或延迟敏感的应用中。同时，CTM的逐步推理解锁了更丰富的可解释性，使企业能够追踪模型不仅预测了什么，还追踪了它是如何得出这一预测的。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/sakana-tui-chu-xin-xing-ai-jia-gou-lian-xu-si-wei-ji-qi

Like (0)

王浩然作者

0 0

OpenAI解决ChatGPT最恼人的商业难题：PDF导出功能引领变革

Previous 2025年5月13日

OpenVision：全新开源视觉编码器，超越OpenAI CLIP与Google SigLIP

Next 2025年5月13日

AI前沿

人工智能搜索大战升温：Genspark 按需添加由 Claude 提供支持的财务报告

早在 2024 年 6 月——快速发展的生成式 AI 领域的永恒——一家由微软、谷歌和百度校友创立的初创公司MainFunc 推出了其首款产品 Genspark，一款 AI 搜索引…

王浩然
2024年11月17日
000
AI前沿

Anthropic 在最新的 Claude AI 更新中推出可视化 PDF 分析

在文档处理方面取得的一项重大进步中，Anthropic为其 Claude 3.5 Sonnet 模型推出了新的 PDF 支持功能。这一发展标志着在弥合传统文档格式与 AI 分析之间…

点点
2024年11月4日
000
AI前沿

Gemini赋能Google Docs：AI音频摘要功能提升办公效率，付费用户率先体验

在AI工具持续渗透办公场景的当下，Google又为其Workspace生态增添了新的AI能力。近日，Google宣布旗下Gemini AI将为Google Docs推出音频摘要功能…

王浩然
2026年2月22日
000
AI前沿

飞行汽车公司利用人工智能进行车辆设计

SkyDrive 与 Braid Technologies 合作，利用人工智能对数千种设计模式进行微调，以优化其电动飞行器

点点
2024年9月27日
000
AI前沿

Cohere 推出全新 AI 模型，旨在弥合全球语言鸿沟

Cohere今天在其 Aya 项目中发布了两个新的开放权重模型，以缩小基础模型中的语言差距。 Aya Expanse 8B 和 35B 现已在Hugging Face上推出，扩展…

王浩然
2024年10月26日
000
AI前沿

沙特AI初创公司Solidrange获240万美元种子轮融资，加速AI驱动GRC布局

沙特阿拉伯的AI与网络安全生态再添新里程碑——总部位于利雅得的初创企业Solidrange近日宣布完成240万美元种子轮融资，这笔资金将助力公司加速在沙特乃至海湾阿拉伯国家合作委员…

王浩然
2026年2月18日
000
AI前沿

Lean4：定理证明器的工作原理及其成为 AI 领域新竞争优势的原因

大语言模型（LLMs）凭借其强大的能力震惊了世界，但它们仍受困于不可预测性和幻觉问题 —— 自信地输出错误信息。在金融、医疗或自动驾驶等高危领域，这种不可靠性是无法被接受的。而 L…

王浩然
2025年11月24日
000
AI前沿

为什么“亲社会人工智能”必须成为设计、部署和管理人工智能的框架

随着人工智能渗透到现代生活的各个领域，企业领导者、政策制定者和创新者面临的核心挑战不再是是否采用智能系统，而是如何采用。在一个两极分化加剧、资源枯竭、机构信任度下降和信息环境动荡的…

王浩然
2025年1月26日
000
AI前沿

智能体 AI 为何需要新型客户数据

当前多数企业的客户数据基础设施是为 “批量处理营销交互、以天为单位衡量活动时效、简单个性化（如邮件插入姓名）” 的传统模式设计，已无法适配智能体 AI 对实时性、对话语境与动态连续…

王浩然
2025年12月19日
000
AI前沿

Adobe 宣布视频生成功能今年将登陆 Firefly

几个月后，用户将首次有机会试用 Adobe 的视频生成 AI 模型。该公司表示，由Adobe Firefly Video 模型提供支持的功能将在 2024 年底前在 Pre…

王浩然
2024年9月13日
000
AI前沿

微软推出新型Phi 4 AI模型，性能媲美远大规模系统

微软于本周三正式发布了多款全新的“开放”AI模型，其中最为引人注目的Phi 4系列模型在性能上已能与OpenAI的o3-mini相媲美，甚至在某些基准测试中展现出超越之势。这一系列…

王浩然
2025年5月5日
000
AI前沿

上海杀出超级独角兽公司，一次融了5个亿

又一个师生联手创业的案例。

点点
2024年9月3日
000
AI前沿

谷歌与OpenAI：AI领域的新成本较量与生态系统对比

在人工智能（AI）领域，创新的步伐从未停歇。近期，OpenAI推出了强大的o3和o4-mini推理模型，以及GPT-4.1系列，而谷歌则迅速回应，发布了Gemini 2.5 Fla…

王浩然
2025年4月26日
000
AI前沿

DataStax 首席执行官：2025 年将是我们真正看到人工智能转型的一年

当企业领导者努力应对实施生成式人工智能的复杂性时，DataStax 首席执行官 Chet Kapoor 提出了一个令人放心的观点：当前的挑战是技术革命的正常组成部分，2025 年将…

王浩然
2024年9月22日
000
AI前沿

谷歌AI概览功能遭欧盟反垄断投诉

在科技日新月异的今天，人工智能（AI）的应用愈发广泛，为人们的生活带来了诸多便利。然而，随着AI技术的深入发展，其引发的问题也逐渐浮出水面。近日，一家名为“独立出版商联盟”的组织向…

王浩然
2025年7月10日
000
AI前沿

PostgreSQL崛起：AI应用不可或缺的数据库

在当今的数据基础设施领域，PostgreSQL（常简称为Postgres）已然成为企业级数据平台供应商竞相追逐的热门选项。这一开源数据库不仅在传统企业应用中占据了一席之地，更在AI…

王浩然
2025年6月4日
000
AI前沿

谷歌推出人工智能编码助手“Jules”，承诺自动修复错误并加快开发周期

谷歌周三发布了人工智能编码助手“ Jules ”，它可以在开发人员睡觉时自主修复软件错误并准备代码更改，这标志着该公司在核心编程任务自动化方面取得了重大进展。该实验性的人工智能代…

王浩然
2024年12月12日
000
AI前沿

OpenAI 招募微软副总裁，加剧 AI 人才争夺战

Sebastien Bubeck 曾任微软生成式人工智能副总裁

点点
2024年10月22日
000
AI前沿

AI 向边缘迁移：网络安全亟待同步升级

当前中小微企业（SMB）AI adoption 速度远超预期，智能客服、库存预测工具、现场分析系统等曾为大企业专属的 AI 应用，如今已广泛部署于零售店、区域医疗诊所、分支机构及远…

王浩然
2025年12月22日
000
AI前沿

联想泄露消息称，更便宜的 Copilot Plus 电脑将于本月上市

联想似乎已准备好推出价格更实惠的新款 Copilot Plus 电脑。可靠泄密者 Evan Blass发布了联想的一份新闻稿，详细介绍了将于本周晚些时候在 IFA 贸易展上发布的多…

王浩然
2024年9月3日
000