CoreWeave高管揭秘：AI专用云如何颠覆通用云格局？

王浩然 • 2026年2月2日上午10:00 • AI前沿 • 86 views

在AI基础设施赛道的竞速中，CoreWeave凭借AI原生云的定位异军突起，成为众多AI实验室和企业的关键合作伙伴。近日，该公司产品高级副总裁科里·桑德斯（Corey Sanders）在接受Unite.AI采访时，分享了他在微软20年的行业洞察，以及CoreWeave如何凭借专用化策略破解AI基础设施的痛点。

### 从微软到CoreWeave：20年企业服务的核心启示
桑德斯在微软的20年职业生涯横跨Windows工程、云销售策略和行业云解决方案，这段经历让他深刻理解企业客户的核心需求。他指出，企业技术 adoption的关键并非为了创新而创新，而是解决具体的业务痛点。”企业客户愿意尝试创新方法，但最终更看重实用性而非炫酷的技术，”桑德斯强调，”产品设计中最常见的错误就是过度沉迷于技术本身的酷炫，而忽略了客户的实际问题。”

在CoreWeave，桑德斯将这一理念贯穿始终。他认为，企业客户真正关心的是如何降低支持成本、简化运营复杂度、提升客户连接效率，或是更好地管理全球团队和产品线。CoreWeave的产品策略正是围绕这些实际需求展开，而非追求通用化的技术覆盖。

### 专用化VS通用化：AI基础设施的本质差异
当被问及CoreWeave的”专用AI基础设施”与通用云平台的区别时，桑德斯用软硬件两个实例进行了阐释。在软件层面，CoreWeave的Object Storage产品搭配LOTA缓存，专为AI工作负载的缓存需求设计。该缓存直接部署在GPU节点上，通过跨节点扩展缓存，将GPU的吞吐量提升至每秒7GB，远超通用云平台的表现。这种设计基于AI工作负载的读写模式和集群布局假设，若用于数据库或电商网站则无法发挥优势，正是专用化的典型体现。

在硬件层面，CoreWeave的数据中心从设计之初就围绕AI需求构建。由于大量采用最新一代NVIDIA GPU，这些设备需要液冷系统支持，CoreWeave直接将液冷集成到数据中心架构中，而通用云平台通常是在现有设施上进行液冷改造。这种原生设计不仅降低了成本，还提升了高端GPU的可用性。

桑德斯指出，通用云平台的困境在于需要兼顾所有使用场景，无法针对AI工作负载进行深度优化。而CoreWeave的专用化策略使其能够聚焦AI需求，提供更高效的解决方案。

### 规模化AI训练的隐藏挑战：不止于GPU
许多企业在开始规模化AI训练时，往往只关注GPU资源，却忽略了配套服务的重要性。桑德斯提醒道，在大规模GPU集群中，存储、网络、可观测性、编排和安全等周边服务才是成功的关键。CoreWeave的Mission Control产品正是为解决这些问题而生，它能让客户深入了解整个集群的节点健康状况和运行时数据，并将这些信息集成到编排引擎中，使数千个GPU像一个统一的实体一样协同工作。

### 未来优先级：性能、易用性与创新门槛
当前，CoreWeave的产品研发聚焦三大方向：首先是持续提升平台的性能、可靠性和可观测性，确保客户能够稳定利用每一个GPU的计算能力；其次是简化新用户的上手流程，降低SLURM等工具的使用门槛；最后是开发新的服务和计费模式，降低AI创新的进入壁垒。

桑德斯提到，当前AI创新面临着容量限制、长期合同和专业人才需求等多重门槛，CoreWeave希望通过更灵活的服务模式，让客户能够以更小的规模启动创新项目。

### 从训练到推理：AI基础设施的新战场
随着AI工作负载从训练向推理转移，CoreWeave看到了新的机遇。桑德斯表示，LOTA缓存等技术可以从训练场景扩展到推理场景，例如与KVCache集成，成为推理性能的差异化优势。同时，Mission Control等可观测性工具在推理场景中变得更加重要，因为GPU健康状况直接影响着智能应用的可用性。

### 未来两年：AI云市场的领导力定义
在桑德斯看来，未来1-2年，AI云市场的领导力将由两大能力定义：一是满足不断增长的训练规模需求，这需要在可观测性、健康监控和自动恢复方面持续创新，毕竟当GPU数量从数百台扩展到数万台时，人工故障响应已不可行；二是提供适合推理和智能体工作负载的服务，这需要全球部署能力和鼓励实验的商业模式。

### 垂直行业经验的迁移：GPU迭代的永恒挑战
桑德斯曾领导微软在医疗、零售、金融服务、制造业和主权云等垂直领域的云项目，这些经验在CoreWeave也找到了用武之地。他指出，GPU的代际更迭不断带来新的复杂性，每一代GPU都在互联能力、内存和功耗上有显著提升，这要求基础设施提供商不断重新思考节点连接、机架管理和软件交付方式。CoreWeave必须持续聚焦这些挑战，才能保持领先地位。

不过，桑德斯也看到了积极的一面：客户对大规模计算的适应速度远超预期，他们能够利用不断增长的计算能力实现更宏大的目标。

### 超越 uptime：AI时代的可靠性新定义
在AI基础设施领域，可靠性的内涵早已超越了简单的节点 uptime。桑德斯表示，在大规模运算中，个别节点的故障或减速是不可避免的，客户真正关心的是能否完成任务。CoreWeave将Mission Control与SUNK（Kubernetes上的Slurm）等高层服务集成，实现故障的自动响应，避免客户损失数小时甚至数周的工作成果。对CoreWeave而言，成功的指标不是节点的在线时间，而是任务的完成率。

### 被低估的趋势：强化学习的复兴
当被问及AI基础设施领域被低估的趋势时，桑德斯认为强化学习（RL）的复兴值得关注。尽管强化学习并非新技术，但在大语言模型（LLM）发展的初期阶段被掩盖了光芒。如今，强化学习正在回归，将在使AI服务更好地响应用户需求方面发挥关键作用。CoreWeave目前已推出无服务器强化学习服务，正是对这一趋势的布局。

在AI基础设施的赛道上，CoreWeave凭借专用化策略和对客户需求的深刻理解，正在重新定义AI云市场的竞争格局。桑德斯的行业洞察和CoreWeave的实践，为我们揭示了AI基础设施发展的核心逻辑：真正的创新源于对客户痛点的精准把握，而非技术的盲目堆砌。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/coreweave-gao-guan-jie-mi-ai-zhuan-yong-yun-ru-he-dian-fu

Like (0)

王浩然作者

0 0

代理式AI信任鸿沟：客户体验的真正威胁

Previous 2026年2月1日下午8:00

AI“阴谋问题”：为何先进模型开始学会隐藏真实目标

Next 2026年2月2日

AI前沿

新兴市场网络安全韧性建设：从被动防御到主动运营的战略转型‌

在数字经济席卷全球的今天，网络韧性已成为衡量企业核心竞争力的关键指标。根据世界经济论坛《2024年全球风险报告》，网络攻击和关键基础设施故障已成为非洲、东南亚等新兴经济体的首要威胁…

王浩然
2025年9月12日
000
AI前沿

Pika 1.5 推出，具有违反物理规律的 AI 特效

Pika，也称为 Pika Labs，是首批推出自己的 AI 视频生成模型的初创公司之一，用户只需输入文本即可获得视频片段，并于 2023 年 11 月在 A 轮融资中筹集了 35…

free
2024年10月2日
000
AI前沿

AI风险文化：塑造企业决策的隐形支柱

当大语言模型、自动化工作流乃至完全自主智能体纷纷走进企业，人工智能终于从“纸面讨论”落地成为驱动业务的核心工具。但在这场AI转型浪潮中，不少企业陷入了技术先行的误区——急于部署AI…

王浩然
2026年3月9日
000
AI前沿

Devin 1.2：更新后的 AI 工程师通过更智能的上下文推理和语音集成增强了编码能力

去年，Cognition推出了一款名为Devin 的产品，即世界上第一个AI 工程师，掀起了 AI 代理浪潮。该产品保密了几个月，但现在已全面上市，并且正在迅速学习新功能。例如：由…

王浩然
2025年1月19日
000
AI前沿

电影制作人必备的AI前期制作工具‌

在电影制作的浩瀚征途中，前期制作无疑是最为关键的阶段之一。它奠定了整个项目的基调，决定了故事的走向以及最终的视觉效果。随着人工智能（AI）技术的飞速发展，电影制作人现在拥有了一系列…

王浩然
2025年4月28日
000
AI前沿

Artem Rodichev Ex-human 首席执行官兼创始人 – 访谈系列

Artem Rodichev 是Ex-human的创始人兼首席执行官，该公司专注于打造富有同理心的 AI 角色，以进行有趣的对话。在创立 Ex-human 之前，Artem 曾于 …

点点
2024年11月5日
000
AI前沿

AI竞赛中的战略制胜法则：为何系统性思维比技术速度更重要‌

在2025年这个被称作”AI应用元年”的时间节点，企业界正陷入一场前所未有的技术军备竞赛。Smartsheet产品管理副总裁米娅·麦克莱恩的最新研究揭示了一…

王浩然
2025年9月24日
000
AI前沿

Databricks 如何使用合成数据简化 AI 代理的评估

企业正在全力投入复合 AI 代理。他们希望这些系统能够推理和处理不同领域的不同任务，但评估代理性能的复杂且耗时的过程往往会阻碍其发展。xToday，数据生态系统领导者Databri…

王浩然
2024年12月10日
000
AI前沿

现代化第一步：摆脱技术债务‌

在当今这个技术日新月异的时代，技术债务已成为IT部门的一大顽疾，且其积累速度比以往任何时候都要快。高性能计算、人工智能等技术创新，以及快速上市的需求，都要求企业拥有现代化、可扩展的…

王浩然
2025年7月7日
000
AI前沿

Tennr 完成 3700 万美元 B 轮融资，利用人工智能革新医疗文档处理方式

医疗 AI 初创公司Tennr在 B 轮融资中获得了3700 万美元，而就在六个月前，该公司刚刚完成了1800 万美元的 A 轮融资。此轮融资由Lightspeed Venture…

点点
2024年10月23日
000
AI前沿

Regal 声称其客户服务聊天机器人比大多数聊天机器人都要好

人们通常对客服聊天机器人持怀疑态度，许多人甚至直接鄙视它们。在最近的 Gartner调查中，64% 的消费者表示，他们更希望公司在客户服务中不使用任何类型的人工智能（包括聊天机器人…

王浩然
2024年10月31日
000
AI前沿

AI助手商业化路线分野：Anthropic坚守Claude无广告，OpenAI试水ChatGPT广告模式

当AI行业的商业化探索进入深水区，头部玩家们正在用截然不同的选择勾勒出两条分道扬镳的发展路径。2026年2月，Anthropic正式宣布旗下AI助手Claude将永久保持无广告模式…

王浩然
2026年2月8日
000
AI前沿

微软 Fara-7B：可本地运行的计算机使用 AI 智能体，性能媲美 GPT-4o

微软正式推出参数规模为 70 亿的全新 AI 模型 Fara-7B，其定位为 “计算机使用智能体（Computer Use Agent，CUA）”，核心能力是直接在用户个人电脑上执…

王浩然
2025年11月25日
000
AI前沿

Paccurate 帮助公司使用更小的包装箱进行运输，为他们节省资金，同时帮助地球

Paccurate联合创始人兼首席执行官詹姆斯·马利 (James Malley) 喜欢开玩笑说，一旦你进入供应链技术领域，你就再也不会退出了。十年前，Malley 和 Patr…

王浩然
2024年10月23日
000
AI前沿

Glass Imaging获2000万美元融资，利用AI技术提升数字图像质量

在数字图像技术日新月异的今天，一家名为Glass Imaging的公司凭借其创新的AI技术，在提升数字图像质量方面取得了突破性进展。近日，Glass Imaging宣布成功获得20…

王浩然
2025年5月13日
000
AI前沿

Grok 4.1 Fast 开发者功能亮眼，却因狂吹马斯克陷入争议

埃隆・马斯克旗下 xAI 公司正式向开发者开放 Grok 4.1 Fast 系列模型的 API 访问权限，并推出全新 Agent Tools API，本应是技术落地的重要里程碑，却…

王浩然
2025年11月23日
000
AI前沿

AI编程新时代：谷歌与OpenAI在国际大学生程序设计竞赛中展现企业级AI实力‌

人工智能技术正在突破性发展的重要里程碑于2025年9月17日诞生——OpenAI的GPT-5与谷歌DeepMind的Gemini 2.5 DeepThink在国际大学生程序设计竞赛…

王浩然
2025年9月18日
000
AI前沿

微软推出新型Phi 4 AI模型，性能媲美远大规模系统

微软于本周三正式发布了多款全新的“开放”AI模型，其中最为引人注目的Phi 4系列模型在性能上已能与OpenAI的o3-mini相媲美，甚至在某些基准测试中展现出超越之势。这一系列…

王浩然
2025年5月5日
000
AI前沿

Google DeepMind 研究人员推出新基准以提高 LLM 真实性并减少幻觉

幻觉，即事实不准确的回答，继续困扰大型语言模型 (LLM)。当模型被赋予更复杂的任务，并且当用户寻求具体且高度详细的回答时，模型尤其会失效。这是数据科学家一直努力克服的一个挑战…

王浩然
2025年1月11日
000
AI前沿

AI 编码初创公司 Poolside 从 eBay、Nvidia 等公司筹集 5 亿美元

人工智能软件开发平台Poolside已筹集5 亿美元新资本。这笔资金来自贝恩资本风险投资公司 (Bain Capital Ventures) 牵头的 B 轮融资，参与融资的还有 …

点点
2024年10月3日
000

发表回复

Please Login to Comment

CoreWeave高管揭秘：AI专用云如何颠覆通用云格局？

相关推荐

发表回复