Kumo的“关系基础模型”预见大语言模型无法洞悉的未来‌

王浩然 • 2025年7月5日下午7:00 • AI前沿 • 259 views

在生成式人工智能蓬勃发展的当下，我们拥有了强大的语言模型，它们能够撰写、摘要以及针对海量文本和其他类型数据进行推理。然而，在处理高价值的预测任务，比如预测客户流失或检测结构化关系数据中的欺诈行为时，企业依然受限于传统机器学习的范畴。斯坦福大学教授兼Kumo AI联合创始人尤雷·莱斯科维奇指出，这正是当前缺失的关键一环。他所在公司推出的工具——关系基础模型（RFM），是一种新型预训练人工智能，它能够将大型语言模型（LLM）的“零样本”能力应用于结构化数据库。

“它能够对尚未发生、你尚不了解的事物做出预测，”莱斯科维奇向VentureBeat表示，“我认为，这是当前我们认为的通用人工智能所缺失的全新能力。”

‌预测性机器学习：一项“30年前的技术”‌

尽管大型语言模型和检索增强生成（RAG）系统能够回答有关既有知识的问题，但它们从根本上说是回顾性的。它们检索并推理已经存在的信息。对于预测性业务任务，企业仍然依赖传统的机器学习。例如，为了构建一个预测客户流失的模型，企业必须聘请一支数据科学家团队，他们要花相当长的时间进行“特征工程”，即从数据中手动创建预测信号的过程。这涉及复杂的数据处理，以将不同表格中的信息（如客户的购买历史和网站点击量）连接起来，从而创建一个庞大且单一的训练表格。

“如果你想进行机器学习，很抱歉，你依然停留在过去，”莱斯科维奇说道。

昂贵且耗时的瓶颈阻碍了大多数组织在数据方面实现真正的敏捷性。

‌Kumo将Transformer泛化至数据库‌

Kumo提出的“关系深度学习”方法，通过两大关键见解规避了这一手动过程。首先，它自动将任何关系数据库表示为单个互联图。例如，如果数据库有一个“用户”表来记录客户信息，以及一个“订单”表来记录客户购买行为，那么“用户”表中的每一行都会变成一个用户节点，“订单”表中的每一行都会变成一个订单节点，以此类推。这些节点随后利用数据库的现有关系（如外键）自动连接，从而无需手动操作即可创建整个数据集的丰富映射。

其次，Kumo将Transformer架构泛化，该架构是大型语言模型背后的引擎，使其能够直接从这种图表示中学习。Transformer擅长通过“注意力机制”来理解令牌序列，该机制能够衡量不同令牌在相互关联中的重要性。Kumo的RFM将这种相同的注意力机制应用于图，使其能够同时学习跨多个表格的复杂模式和关系。

莱斯科维奇将这一飞跃比作计算机视觉的发展。在21世纪初，机器学习工程师必须手动设计特征，如边缘和形状，以检测物体。但更新的架构（如卷积神经网络CNN）能够接收原始像素，并自动学习相关特征。类似地，RFM能够接收原始数据库表格，并让网络自行发现最具预测性的信号，无需手动操作。

结果是，预训练基础模型能够立即对新数据库执行预测任务，即所谓的“零样本”。在演示中，莱斯科维奇展示了用户如何通过输入简单查询来预测特定客户在未来30天内是否会下单。几秒钟内，系统便返回了一个概率分数以及导致该结论的数据点的解释，如用户的近期活动或无活动情况。该模型未在所提供的数据库上进行训练，而是通过上下文学习实时适应它。

“我们有一个预训练模型，你只需将其指向你的数据，它便会在200毫秒后给出准确预测，”莱斯科维奇说道。他补充道，它的准确度“与数据科学家数周的工作不相上下”。

该界面旨在让数据分析师（而不仅仅是机器学习专家）也能熟悉，从而使预测分析实现民主化。

‌助力自主代理的未来‌

这项技术对企业AI代理的发展具有重要意义。代理要在企业内执行有意义的任务，不仅需要处理语言，还必须基于公司的私有数据做出智能决策。RFM能够成为这些代理的预测引擎。例如，客户服务代理可以查询RFM，以确定客户流失的可能性或他们的潜在未来价值，然后使用大型语言模型相应地调整对话和优惠。

“如果我们相信自主代理的未来，那么代理将需要做出基于私有数据的决策。这就是代理做出决策的方式，”莱斯科维奇解释道。

Kumo的工作预示着企业AI未来将分为两个互补领域：大型语言模型用于处理非结构化文本中的回顾性知识，而关系基础模型则用于结构化数据上的预测性预测。通过消除特征工程的瓶颈，RFM有望使更多企业掌握强大的机器学习工具，从而大幅减少从数据到决策所需的时间和成本。

该公司已发布了RFM的公开演示版，并计划在未来几周内推出允许用户连接自己数据的版本。对于需要最高准确度的组织，Kumo还将提供微调服务，以进一步提升私有数据集上的性能。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/kumo-de-guan-xi-ji-chu-mo-xing-yu-jian-da-yu-yan-mo-xing-wu

Kumo AI Transformer架构企业AI 关系基础模型（RFM）关系深度学习大型语言模型（LLM）特征工程自主代理零样本学习预测性机器学习

Like (0)

王浩然作者

0 0

AI能运营实体店铺吗？Anthropics的Claude尝试后结果既辉煌又滑稽

Previous 2025年7月5日

Dust年收入达600万美元，助力企业打造能“实干”的AI代理‌

Next 2025年7月5日

AI前沿

Midjourney结束了必须使用Discord来生成AI图片的时代

Midjourney是否因竞争对手数量激增而感到压力？随着越来越多的公司进入AI图像生成领域，竞争自然会加剧，用户也会有更多选择。因此，Midjourney可能会感到一些压力，并…

王浩然
2024年8月23日
000
AI前沿

Meta 研究人员破解 LLM “黑箱”，修复 AI 推理缺陷

Meta 旗下 FAIR（基础人工智能研究）团队与爱丁堡大学的研究人员联合开发出一项突破性技术 —— 基于电路的推理验证（Circuit-based Reasoning Verif…

王浩然
2025年11月3日
000
AI前沿

IBM在纽约市启动AI创新中心，旨在推动AI技术的飞跃发展‌

近日，IBM宣布在纽约市正式启用全新的watsonx AI Labs创新中心。这一举措不仅标志着IBM在人工智能领域的又一重大布局，更是对纽约市AI生态的又一次强力推动。watso…

王浩然
2025年6月5日
000
AI前沿

当Claude 4.0勒索其创造者：AI背叛我们的可怕后果

2025年5月，人工智能（AI）领域发生了一件震惊全球的事件。Anthropic公司公开承认，在严格控制的测试条件下，其最先进的模型Claude 4.0曾尝试勒索一名工程师。这一事…

王浩然
2025年5月26日
000
AI前沿

MiniMax 推出自己的开源 LLM，具有行业领先的 4M 代币上下文

如今，MiniMax 在美国最为人熟知的身份可能是Hailuo背后的这家新加坡公司。Hailuo 是一种逼真的高分辨率生成式 AI 视频模型，可与Runway、OpenAI 的 S…

王浩然
2025年1月15日
000
AI前沿

从 Atari 到 Doom：谷歌如何利用人工智能重新定义视频游戏

电子游戏产业目前市值3470 亿美元，已发展成为娱乐界的重要参与者，全球有 30 多亿人参与其中。最初只是Pong和Space Invaders等简单游戏，后来演变为 Doom 等…

点点
2024年9月10日
000
AI前沿

Meta拒绝签署欧盟AI行为准则欧洲AI发展路径引争议‌

在欧盟《人工智能法案》即将生效之际，Meta公司正式宣布拒绝签署该法案配套的自愿性行为准则，引发关于欧洲AI监管方向的激烈辩论。Meta全球事务主管乔尔·卡普兰通过领英声明指出：&…

王浩然
2025年7月20日
000
AI前沿

Manus AI如何重新定义跨行业的自主工作流程自动化

近年来，中国在人工智能（AI）领域取得了显著进展，其中Manus AI的推出尤为引人注目。这款由Butterfly Effect公司开发、腾讯支持的AI代理，旨在通过自主自动化复杂…

王浩然
2025年5月26日
000
AI前沿

CodeSignal 联合创始人兼首席执行官 Tigran Sloyan – 访谈系列

Tigran Sloyan 是 CodeSignal 的联合创始人兼首席执行官，负责推动公司的整体战略方向和成果。从麻省理工学院毕业后，他于 2015 年与他人共同创立了 Code…

点点
2024年9月4日
000
AI前沿

Nvidia的Cosmos-Transfer1：让机器人训练变得异常真实，彻底改变行业格局

在AI与机器人技术的融合日益紧密的今天，Nvidia推出了一项革命性的技术——Cosmos-Transfer1，这款创新的AI模型为开发者提供了一个前所未有的平台，用于创建高度逼真…

王浩然
2025年3月22日
000
AI前沿

阿里千问（Qwen）AI 应用下载量破千万：开源根基与技术优势驱动全球增长

阿里巴巴旗下 AI 助手 “千问（Qwen）”APP 在公测首周下载量突破 1000 万次，创下全球 AI 应用增长最快纪录，远超 ChatGPT、Sora、DeepSeek 等同…

王浩然
2025年11月26日
000
AI前沿

激辩大模型：投资人泼冷水，创业企业能走多远？

眼看着大模型越来越火，最近给大模型泼冷水的大佬们，却越来越多了。比如，前Google科学家、出门问问创始人兼CEO李志飞就表示：中国的OpenAI是个伪命题，OpenAI也不一定…

点点
2024年9月16日
000
AI前沿

Snowflake 击败 Databricks，直接集成 Claude 3.5

在宣布25财年第三季度收益后不久，Snowflake就爆出重磅消息：它正在与领先的AI供应商Anthropic合作，为其客户进一步推进AI项目。这家数据生态系统巨头签署了一项多…

王浩然
2024年11月24日
000
AI前沿

蚂蚁集团 Ring-1T 模型深度解析：破解万亿级强化学习瓶颈，开源推理模型迈入新高度

2025 年 10 月 24 日，阿里巴巴旗下蚂蚁集团正式公布万亿参数开源推理模型 Ring-1T 的技术细节。这款被称为 “全球首个万亿参数开源推理模型” 的产品，不仅以参数规模…

王浩然
2025年10月27日
000
AI前沿

阿里巴巴的“Qwen团队”再次取得突破

继前几天免费开源发布全球性能最强的非推理大语言模型Qwen3-235B-A22B-2507后，该研究团队又推出了一款重磅模型——专注于软件开发辅助的开源大语言模型Qwen3-Cod…

王浩然
2025年7月24日
000
AI前沿

Cohere 最小、最快的 R 系列模型在 RAG 方面表现出色，能够推理 23 种语言

人工智能初创公司Cohere发布了 Command R7B，这是其 R 模型系列中最小、最快的模型，以证明其支持广泛企业用例的意图，包括那些不需要昂贵、资源密集型的大型语言模型(L…

王浩然
2024年12月16日
000
AI前沿

AI竞赛白热化：对企业的深远影响

在当今这个科技飞速发展的时代，AI竞赛已经不再是理论上的担忧，而是成为了一场实实在在的、涉及科技巨头、初创企业乃至国家层面的激烈竞争。这场竞赛不仅重塑了技术格局，更对企业的战略规划…

王浩然
2025年5月27日
000
AI前沿

AWS 合作伙伴利用 AI 设计材料实现数据中心脱碳

亚马逊网络服务(AWS) 已与 Orbital Materials 公司建立多年合作伙伴关系，后者是一家使用人工智能开发先进材料的公司，旨在使数据中心更加环保、更加高效。 Orbi…

王浩然
2024年12月7日
000
AI前沿

人工智能阅读教练初创公司 Ello 现在让孩子们创作自己的故事

Ello是一款旨在帮助阅读困难儿童的人工智能阅读伴侣，它于周一推出了一款新产品，让孩子们可以参与故事创作过程。这项名为“Storytime”的人工智能新功能可以帮助孩子们从一系…

王浩然
2024年10月1日
000
AI前沿

AI如何重塑我们对人类决策机制的理解

人类决策机制的研究一直是心理学领域的核心课题。数十年来，科学家们致力于构建能够解释人类思维过程并预测行为的认知模型。如今，人工智能(AI)的崛起正在彻底改变这一研究领域。最新突破性…

王浩然
2025年7月25日
000

发表回复

Please Login to Comment

Kumo的“关系基础模型”预见大语言模型无法洞悉的未来‌

相关推荐

发表回复