AlphaGo之父筹10亿美金押注非大模型路径,AI超级智能赛道再掀变局

{

大语言模型(LLM)占据人工智能行业绝对话语权的当下,一位AI界的传奇人物正试图开辟一条截然不同的道路。曾带领谷歌DeepMind团队打造出震惊世界的AlphaGo强化学习先驱大卫·西尔弗(David Silver),正在为其伦敦初创公司Ineffable Intelligence筹集高达10亿美元的种子轮融资。这一金额若最终落地,将创下欧洲初创公司种子轮融资的历史纪录,更重要的是,这笔资金将被投入到一个大胆的愿景中:绕过LLM,用强化学习构建真正的超级智能

10亿美金的豪赌,押注LLM之外的未来
据Unite.AI消息,这笔由红杉资本领投的融资,将让Ineffable Intelligence在未推出任何产品的情况下,获得40亿美元的投前估值。英伟达、谷歌和微软等科技巨头也在洽谈参与投资,尽管最终条款仍在协商中,但这一阵容足以显示出资本市场对西尔弗愿景的信心。

这并非西尔弗一时兴起的决定。作为强化学习领域的权威,他的理念深深植根于自己在DeepMind的研究成果。2017年,他和DeepMind CEO德米斯·哈萨比斯(Demis Hassabis)推出的AlphaGo Zero,彻底颠覆了AI界的认知。这个完全通过自我对弈学习、未使用任何人类棋谱数据的系统,以100:0的战绩击败了此前依赖人类数据训练的初代AlphaGo。随后推出的AlphaZero更将这一范式扩展到国际象棋、将棋和围棋三大领域,而MuZero甚至能在不知道游戏规则的情况下自主学习并规划策略。

这些成果让西尔弗坚信,依赖人类数据的LLM存在先天局限性。在离开DeepMind前的一次播客中,他将AI发展划分为两个时代:当前的”人类数据时代”和即将到来的”体验学习时代”。他认为,LLM本质上是在模仿人类已有的知识,而真正的超级智能需要超越人类经验,通过与环境的交互和自我探索来发现全新的知识。

背离主流的”阿尔伯塔学派”哲学
西尔弗的理念可以追溯到他在阿尔伯塔大学的求学经历,那里是强化学习的发源地之一,他师从该领域的先驱里奇·萨顿(Rich Sutton)。萨顿在2019年发表的著名论文《苦涩的教训》(The Bitter Lesson)中指出,依赖人类知识的AI方法最终会败给那些专注于计算能力和学习规模扩展的方法。西尔弗正是这一”阿尔伯塔学派”哲学的践行者,他决定将这一理念商业化,打造一家完全基于强化学习的AI公司。

在LLM占据绝对主流的今天,这一选择显得尤为激进。当前,OpenAI、谷歌和Anthropic等巨头正投入数百亿美元用于扩大LLM的参数规模,推出各种聊天机器人和AI服务。西尔弗却认为,这种路径是一条”局部最优解”——虽然能取得令人印象深刻的成果,但存在无法突破的天花板,无法通向真正的通用超级智能。

超级智能赛道的新玩家,与OpenAI前科学家的殊途同归
西尔弗并非唯一一位离开巨头实验室、押注超级智能的顶尖研究者。OpenAI前首席科学家伊利亚·苏茨克维(Ilya Sutskever)在2024年创立了Safe Superintelligence(SSI),同样认为脱离产品公司的压力,专注于基础研究能更快实现超级智能。SSI目前已筹集了数十亿美元,估值超过300亿美元。

两位顶尖科学家的选择有着惊人的相似:他们都离开了自己亲手参与定义的机构,都认为当前的LLM范式是通向超级智能的弯路,都仅凭个人声誉就吸引了巨额投资。但在技术路径上,两人却走向了不同方向。苏茨克维对SSI的技术细节讳莫如深,而西尔弗则明确将强化学习、自我对弈和从第一性原理学习作为核心方向,直接挑战LLM的基础地位。

机遇与风险并存,从游戏到现实世界的鸿沟
红杉资本对西尔弗的押注逻辑清晰:他是全球为数不多的、真正打造出在特定领域超越人类智能系统的科学家之一。如果强化学习确实是通向通用超级智能的正确路径,西尔弗无疑是最有可能实现这一目标的人。

但风险同样巨大。AlphaGo和AlphaZero的成功建立在规则清晰、信息完全、奖励信号明确的游戏环境中,而现实世界充满了模糊性、不确定性和不完整信息。如何将自我对弈的范式从游戏扩展到科学、工程、推理等开放领域,是一个尚未解决的难题——西尔弗在DeepMind期间就曾多年致力于此,但并未取得决定性突破。

此外,Ineffable Intelligence将总部设在伦敦,这也被视为欧洲AI野心的一个信号。尽管欧洲拥有世界级的AI研究者,但长期以来人才不断流向美国的科技巨头。这笔由硅谷顶级风投领投的10亿美元融资,或许标志着前沿AI研究的地理格局正在扩大,但参与投资的红杉、英伟达、谷歌和微软均为美国公司,这也反映出全球AI资本的集中程度。

行业的反思:LLM是否是唯一的答案?
西尔弗的大胆尝试,恰逢AI行业进入一个关键的反思期。尽管LLM在自然语言处理、内容生成等领域取得了惊人成就,但人们也开始意识到其局限性:依赖海量数据、存在事实错误、缺乏真正的推理能力,以及对计算资源的巨大需求。

Ineffable Intelligence的出现,不仅是一家初创公司的融资事件,更是对整个AI行业发展路径的一次重大挑战。它迫使人们思考:我们是否陷入了对LLM的过度依赖?是否存在其他通向通用人工智能的道路?

10亿美元的种子轮融资,是资本市场对西尔弗个人声誉的信任,也是对强化学习范式的一次豪赌。无论最终结果如何,这一尝试都将为AI行业提供宝贵的经验和视角。在追逐超级智能的道路上,或许没有绝对正确的答案,但正是这种多元的探索,才有可能带领我们抵达最终的目标。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/13891-2

Like (0)
王 浩然的头像王 浩然作者
Previous 1天前
Next 20小时前

相关推荐

发表回复

Please Login to Comment