
在 SC25(超级计算 2025)大会上,戴尔科技(Dell Technologies)与英伟达(NVIDIA)联合发布双方合作 AI 平台的多项重大更新,核心目标是帮助企业更轻松地运行从传统模型到新型智能体系统的全范围 AI 工作负载,解决企业 AI 规模化过程中面临的 “软硬件混合管理难、数据控制权缺失、系统扩展性不足” 三大核心痛点。此次升级以 “戴尔 AI 工厂(Dell AI Factory with NVIDIA)” 为核心载体,整合戴尔全栈基础设施与英伟达 AI 工具链,并辅以戴尔专业服务,为企业搭建从 AI 概念验证到生产落地的 “无重构” 路径,标志着双方合作从硬件适配向 “全栈一体化 AI 解决方案” 深度演进。
从合作背景来看,当前企业 AI 规模化进程中普遍面临共性挑战:随着 AI 计划扩张,需管理日益复杂的软硬件组合,既要保障核心数据不脱离掌控,又要确保系统能随业务需求持续扩展。调研数据显示,多数企业在采用新技术时更倾向于与可信伙伴合作,且当 AI 运算靠近本地数据时,能感知到更高的业务价值。戴尔 AI 工厂正是基于这一需求构建,通过戴尔的存储、服务器、网络等基础设施与英伟达的 GPU、AI 软件工具深度集成,在控制技术复杂度的同时,帮助企业快速将 AI 想法转化为实际业务成果,避免因基础设施碎片化导致的落地效率低下。
在 “加速部署与性能优化” 维度,双方推出多项关键整合措施。存储层面,戴尔 AI 数据平台的核心存储引擎 ——ObjectScale(分布式多租户对象存储软件)与 PowerScale(横向扩展集群文件系统,搭载 OneFS 软件,技术源自收购的 Isilon),新增对英伟达 Dynamo NIXL 库的支持。这一整合实现了可扩展的 KV 缓存存储与共享功能,在 13.1 万 token 的大上下文窗口下,将 AI 推理的 “首令牌生成时间(Time to First Token)” 压缩至 1 秒,同时有效缓解 GPU 内存压力、降低算力成本。尤其值得关注的是,PowerScale 还通过 “闪电项目” 实现了并行化升级 —— 这是一项历时 18 个月的开发计划,为 OneFS 操作系统新增并行 IO 功能,借助 pNFS(并行 NFS)技术添加元数据服务器与 Flex Files 布局支持,使元数据服务器与客户端能双向通信,让数据在 PowerScale 集群多节点间实现更高效的并行分布,带来吞吐量与性能的线性提升,其 NIXL 支持下的 KV 缓存卸载能力,在相同上下文窗口下比标准 vLLM 推理速度快 19 倍。
硬件支持方面,戴尔 AI 工厂新增对 PowerEdge XE7740 与 XE7745 服务器的兼容,这两款服务器搭载英伟达 RTX PRO 6000 Blackwell Server Edition GPU 与 Hopper GPU,能为大型多模态模型运行、智能体类工作负载处理、AI 训练任务及企业级推理提供更强性能支撑,满足企业对高复杂度 AI 任务的算力需求。软件自动化层面,戴尔推出的自动化平台通过 “预调优 + 验证部署” 机制,消除传统 AI 部署中的配置猜测问题,确保结果可重复;同时,AI 代码助手(集成 Tabnine)、智能体 AI 平台(集成 Cohere North)等工具实现自动化运行,帮助团队快速将 AI 工作负载推向生产环境,并在规模扩张时保持运维可控性。此外,戴尔还扩展了 AI PC 生态,支持搭载英伟达 RTX Blackwell 与 RTX Ada GPU 的笔记本电脑和台式机,为企业提供从终端到数据中心的全场景硬件选择;其专业服务新增 “交互式试点” 服务,允许客户使用自有数据测试 AI 方案,通过明确的业务指标评估价值,降低大规模投资风险。
在 “下一代基础设施升级” 上,戴尔针对复杂 AI 与高性能计算(HPC)需求,更新基础设施产品组合。即将于下月上市的 PowerEdge XE8712 服务器,在标准机架内可支持多达 144 个英伟达 Blackwell GPU,结合 iDRAC、OpenManage Enterprise 及集成机架控制器的统一监控与自动化能力,大幅降低机架级 AI/HPC 部署门槛,让企业无需大规模改造机房即可实现算力扩容。网络层面,戴尔企业级 SONiC 分布系统新增对英伟达 Spectrum-X 平台及 Cumulus OS 的支持,帮助企业构建开放式、标准化的跨厂商 AI 网络;最新版 SmartFabric Manager 通过向导式自动化功能,扩展对英伟达 Spectrum-X 平台上戴尔 SONiC 的支持,有效缩短部署时间并减少配置错误,解决传统 AI 网络 “兼容性差、部署复杂” 的问题。
为提升企业工具选择灵活性,双方还扩展了 AI 生态合作。红帽 OpenShift 在戴尔 AI 工厂的验证范围覆盖更多 PowerEdge 系统,包括搭载英伟达 H100 与 H200 Tensor Core GPU 的 PowerEdge R760xa 和 XE9680 服务器。这一组合将红帽的管控与治理工具,与戴尔的安全基础设施深度融合,为需要规模化 AI 部署的企业提供更清晰的实施路径,避免因工具不兼容导致的落地阻碍。值得一提的是,PowerScale 还推出 “仅软件订阅许可” 模式,可在戴尔 PowerEdge R7725xd 等合格服务器上运行,帮助客户将 PowerScale 计算设施与硬件设备分开采购,降低初期投入成本,提升基础设施配置灵活性。
从行业价值与各方反馈来看,此次合作升级直击企业 AI 落地的核心痛点 —— 多数企业在从 AI 试点向生产过渡时,常因基础设施重构而延误进度、增加成本。戴尔副董事长兼首席运营官 Jeff Clarke 强调,戴尔与英伟达已完成大部分整合工作,客户无需自行处理复杂的软硬件适配,可 “更快部署并自信地扩展 AI 规模”。英伟达企业 AI 产品副总裁 Justin Boitano 则指出,当前企业 AI 正从 “实验阶段” 迈向 “转型阶段”,速度之快 “重新定义企业运营方式”,双方合作的统一平台通过整合基础设施、自动化工具与数据服务,助力企业实现 AI 规模化部署与可衡量的业务影响。IDC 基础设施系统、平台与技术部门副总裁 Ashish Nadkarni 评价,戴尔 AI 产品组合与英伟达技术的结合,“为交付企业就绪型 AI 迈出了重要一步”,精准满足了企业对 “高性能且易运维” AI 系统的需求。
目前,戴尔 ObjectScale 与搭载英伟达 Dynamo 的 PowerScale 已实现全球发布,软件定义的 PowerScale 计划于 2026 年上半年推出,PowerScale 并行 NFS 支持也将在 2026 年全球落地。此次合作不仅强化了戴尔与英伟达在企业 AI 基础设施领域的领先地位,更为行业提供了 “硬件整合 + 软件自动化 + 生态开放” 的 AI 落地范本,推动企业 AI 从 “碎片化试点” 走向 “规模化价值创造”。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/sc25-da-hui-dai-er-yu-ying-wei-da-ai-he-zuo-mai-ru-xin-jie