ScaleOps 与戴尔 – 英伟达合作双动态：AI 基础设施优化与联合平台升级引领企业降本增效

王浩然 • 2025年11月22日下午8:00 • AI前沿 • 136 views

AI 基础设施领域迎来两大关键动态：ScaleOps 推出全新 AI Infra 产品，为自托管企业大语言模型（LLMs）实现 GPU 成本大幅削减；戴尔（Dell）与英伟达（NVIDIA）在 SC25 大会上公布合作新阶段，升级联合 AI 平台以简化复杂 AI 工作负载部署。两者从 “资源优化” 与 “硬件生态整合” 两个维度，共同为企业解决 AI 规模化落地中的效率、成本与复杂度难题，推动自托管 AI 与混合云 AI 基础设施向更实用、更经济的方向发展。

ScaleOps 的 AI Infra 产品聚焦企业自托管 LLMs 与 GPU 类 AI 应用的核心痛点 ——GPU 资源利用率低、性能波动大、冷启动延迟长及运维负担重，通过全自动化资源管理实现突破性成本节约。该产品作为其云资源管理平台的扩展，核心能力在于 “实时智能调度 + 动态适应需求”：它能基于工作负载行为与集群实时状态，自动分配并缩放 GPU 资源，无需修改现有模型部署流水线或应用代码，确保在流量激增时通过 “主动 – 被动结合机制” 维持性能稳定，同时将 GPU 冷启动延迟降至最低，避免模型加载耗时过长影响用户体验。例如，当某企业的 AI 客服模型遭遇咨询高峰时，系统会预先调配闲置 GPU 资源，确保请求响应速度不受影响，且在峰值过后自动缩减资源，避免浪费。

从实际成效来看，该产品已在 Wiz、DocuSign、Rubrik、Grubhub 等企业及多家财富 500 强公司的生产环境中落地，早期采用者的 GPU 成本降低 50%-70%。典型案例包括：一家运营数千台 GPU 的大型创意软件公司，此前 GPU 平均利用率仅 20%，引入该产品后，通过资源整合与节点动态缩放，GPU 支出削减超 50%，关键工作负载延迟降低 35%；一家全球游戏公司利用其优化数百台 GPU 上的动态 LLM 工作负载，GPU 利用率提升 7 倍，仅这一项工作负载预计每年可节省 140 万美元。此外，产品兼容性覆盖所有 Kubernetes 发行版、主流云平台、本地数据中心及隔离环境，部署过程极为简便 —— 通过单个 helm 命令即可在两分钟内完成安装，无需修改代码、重构基础设施或调整现有配置清单，完美适配企业现有 GitOps、CI/CD 及监控工具链，让工程团队无需额外学习即可快速启用优化。

在资源可视与管控方面，平台提供从 Pod、工作负载到节点、集群多维度的 GPU 利用率、模型行为及缩放决策可视化，默认缩放策略可满足多数场景需求，同时保留工程师手动微调权限，减少 DevOps 与 AIOps 团队的人工调优工作。值得注意的是，该产品采用定制化定价模式，企业需根据运营规模与需求获取专属报价，其成本节约效果通常远超平台自身投入，尤其适合基础设施预算有限、追求快速 ROI 的企业。

与此同时，戴尔与英伟达在 SC25 大会上公布的合作升级，则从硬件生态与全栈整合角度，为企业提供更强大的 AI 运行基础。双方联合打造的 “戴尔 AI 工厂（Dell AI Factory with NVIDIA）”，整合戴尔全栈基础设施与英伟达 AI 工具，辅以戴尔专业服务，核心目标是帮助企业 “从 AI 试点快速迈向生产部署”，避免因基础设施重构导致的成本浪费与效率损耗。此次升级重点体现在三大维度：

一是加速部署与性能优化。戴尔 AI 数据平台的存储引擎 ObjectScale 与 PowerScale，新增对英伟达 Dynamo NIXL 库的支持，实现可扩展 KV 缓存存储与共享，在 13.1 万 token 上下文窗口下达成 “首令牌生成时间（Time to First Token）1 秒” 的突破，同时缓解 GPU 内存压力、降低成本。硬件方面，平台新增对戴尔 PowerEdge XE7740/7745 系统的支持，该系统搭载英伟达 RTX PRO 6000 Blackwell Server Edition 与 Hopper GPU，可高效运行大型多模态模型、智能体类工作负载、训练任务及企业级推理。此外，戴尔自动化平台通过 “预调优验证部署” 消除配置猜测，搭配自动化的 AI 代码助手（Tabnine）与智能体 AI 平台（Cohere North），帮助团队快速将工作负载推向生产，同时简化规模化运维。

二是下一代基础设施升级。为支撑复杂 AI 与高性能计算（HPC）工作负载，戴尔推出 PowerEdge XE8712 服务器，将于下月上市，标准机架内可支持多达 144 台英伟达 Blackwell GPU，结合 iDRAC、OpenManage Enterprise 及集成机架控制器的统一监控与自动化，降低机架级 AI/HPC 部署门槛。网络层面，戴尔企业级 SONiC 分布系统新增对英伟达 Spectrum-X 平台及 Cumulus OS 的支持，助力企业构建跨厂商的开放式标准化 AI 网络；最新版 SmartFabric Manager 通过向导式自动化，扩展对英伟达 Spectrum-X 平台上戴尔 SONiC 的支持，缩短部署时间并减少配置错误。

三是生态扩展与灵活性提升。针对企业对工具选择的灵活性需求，红帽 OpenShift 在戴尔 AI 工厂上的验证范围扩展至更多戴尔 PowerEdge 系统，包括搭载英伟达 H100/H200 Tensor Core GPU 的 PowerEdge R760xa 与 XE9680，将红帽的管控工具与戴尔的安全基础设施结合，为企业规模化 AI 部署提供清晰路径。戴尔还扩展了 AI PC 生态，支持搭载英伟达 RTX Blackwell 与 Ada GPU 的笔记本电脑与台式机，为企业提供更多终端硬件选择；其专业服务新增 “交互式试点”，允许客户使用自有数据测试 AI 方案，通过明确指标评估业务价值，降低大规模投资风险。

从行业价值来看，戴尔与英伟达的合作直击企业 AI 落地的核心痛点 —— 多数企业在从试点到生产的过程中，常因基础设施不兼容、整合复杂而受阻。戴尔副董事长兼首席运营官 Jeff Clarke 强调，双方已完成大部分整合工作，客户无需自行重构基础设施；英伟达企业 AI 产品副总裁 Justin Boitano 则指出，此次升级顺应 “企业 AI 从实验转向转型” 的趋势，通过统一平台帮助企业实现规模化 AI 部署与可衡量价值。IDC 基础设施系统、平台与技术部门副总裁 Ashish Nadkarni 评价，这一合作 “为企业级 AI 就绪系统的交付迈出重要一步”，满足了企业对 “高性能且易运维” AI 系统的需求。

综合来看，ScaleOps 的 AI Infra 产品与戴尔 – 英伟达的联合平台升级，分别从 “软件层资源优化” 与 “硬件层生态整合” 切入，形成互补：前者帮助企业在现有基础设施上实现 GPU 效率最大化、成本最小化，后者则为企业提供更强大、更易扩展的 AI 运行硬件基础与全栈支持。两者共同反映出当前 AI 基础设施领域的核心趋势 —— 企业对 AI 的需求已从 “技术探索” 转向 “实用落地”，而 “降本增效、简化运维、灵活扩展” 成为衡量基础设施价值的关键指标，这些创新也将进一步推动 AI 在企业生产场景中的深度渗透与规模化应用。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/scaleops-yu-dai-er-ying-wei-da-he-zuo-shuang-dong-tai-ai-ji

GPU 成本优化 ScaleOps AI Infra 企业 AI 基础设施戴尔 - 英伟达合作戴尔 AI 工厂自托管 LLM 英伟达 Blackwell GPU 资源自动化调度

Like (0)

王浩然作者

0 0

李维斯（Levi Strauss）如何借助 AI 推进 “直面消费者（DTC）优先” 商业模式

Previous 2025年11月22日

SC25 大会：戴尔与英伟达 AI 合作迈入新阶段，共推企业级 AI 基础设施升级

Next 2025年11月23日

AI前沿

AI 推动 IT 运营从被动响应转向主动预防：效率提升与战略价值重塑

当前，企业 CIO 普遍面临 “在不扩大团队规模的前提下加速解决 IT 问题” 的核心诉求，而 AI 的引入正成为实现这一目标的关键方案。长期以来，IT 团队依赖自动化工具与自助服…

王浩然
2025年10月22日
000
AI前沿

让艺术世界更加触手可及

初创公司 NALA 最初是麻省理工学院的一个课堂项目，旨在将艺术品买家与艺术家直接匹配。在高价艺术品的世界里，画廊通常扮演着守门人的角色。他们精心挑选的策展过程是大城市的画廊经常…

王浩然
2025年1月27日
000
AI前沿

Midjourney结束了必须使用Discord来生成AI图片的时代

Midjourney是否因竞争对手数量激增而感到压力？随着越来越多的公司进入AI图像生成领域，竞争自然会加剧，用户也会有更多选择。因此，Midjourney可能会感到一些压力，并…

王浩然
2024年8月23日
000
AI前沿

Mistral 推出了审核 API

人工智能初创公司 Mistral推出了一种用于内容审核的新 API。 Mistral 表示，该 API 与支持 Mistral 的 Le Chat 聊天机器人平台审核的 API 相…

王浩然
2024年11月8日
000
AI前沿

马斯克对 OpenAI 的修改后诉讼将微软列为被告

埃隆·马斯克对 OpenAI 提起的诉讼指控该公司放弃了非营利使命，该诉讼于 7 月撤回，但8 月又重新提起。现在，在一份修改后的诉状中，该诉讼将微软、LinkedIn 联合创始人…

王浩然
2024年11月16日
000
AI前沿

利用 GenNext AI 赋能科技人才：改变技术的未来

科技行业不断发展，其驱动力是创新步伐的不断加快和对创新解决方案日益增长的需求。在这种动态环境中，GenNext AI 成为科技爱好者和专业人士赋能的灯塔。通过提供先进的工具、个性化…

wang, jinchang
2024年10月4日
000
AI前沿

Gemini赋能Google Docs：AI音频摘要功能提升办公效率，付费用户率先体验

在AI工具持续渗透办公场景的当下，Google又为其Workspace生态增添了新的AI能力。近日，Google宣布旗下Gemini AI将为Google Docs推出音频摘要功能…

王浩然
2026年2月22日
000
AI前沿

全新高质量 AI 视频生成器 Pyramid Flow 推出 — — 而且它是完全开源的！

人工智能视频生成模型的数量不断增长，本周推出了一种新的模型Pyramid Flow，它可以提供长达 10 秒的高质量视频片段——速度快，而且全部开源。 Pyramid Flow由北…

王浩然
2024年10月15日
000
AI前沿

在 OpenAI 推出 ChatGPT Search 几个小时前，谷歌刚刚授予其 AI 搜索访问权限

谷歌周四为其 Gemini AI 平台推出了实时搜索功能，使其语言模型能够访问来自谷歌搜索的当前信息。这项名为“ Grounding with Google Search ”的新功…

王浩然
2024年11月3日
000
AI前沿

Nvidia 的“Eagle”人工智能以超高清视角看世界，它将取代你的工作

Nvidia 的研究人员推出了“ Eagle ”，这是一组新的人工智能模型，可以显著提高机器理解和与视觉信息交互的能力。该项研究发表在 arXiv 上，展示了从视觉问答到文档理解…

王浩然
2024年9月3日
000
AI前沿

Anthropic 的代理计算机使用正在赋予人们“超能力”

Anthropic发布其新的 Claude 功能“计算机使用”仅两天时间，但不同技术能力的早期采用者已经找到了各种方法来使用它——从复杂的编码任务到深入研究，再到收集“分散”的信息…

王浩然
2024年10月27日
000
AI前沿

OpenAI 推出其谷歌挑战者 ChatGPT Search

OpenAI 的谷歌挑战者终于来了。该公司周四推出了ChatGPT Search，这是今年夏天推出的 SearchGPT 原型的升级版。OpenAI 表示，ChatGPT Sea…

王浩然
2024年11月2日
000
AI前沿

‌AI发展的新纪元：算法创新如何超越规模扩张成为核心竞争力‌

过去十年间，人工智能领域的发展轨迹始终遵循着”规模至上”的铁律——更多的参数、更大的数据集和更强的算力构成了技术进步的三重奏。从GPT-3的1750亿参数到…

王浩然
2025年10月2日
000
AI前沿

协调人工智能代理：解锁企业效率和增长的关键

随着生成式人工智能改变各行各业，对能够规划和执行复杂、内容敏感任务的智能系统的需求日益增长。为了满足这一需求，下一波生成式人工智能创新——代理式人工智能应运而生。它代…

王浩然
2025年2月6日
000
AI前沿

病毒式传播的 AI 图片如何帮助一家墨西哥初创公司获得阿迪达斯的重要合同

有人在某处证明人工智能可以为工匠创造就业机会，而不是取代他们

点点
2024年9月8日
000
AI前沿

人工智能能力的增长速度快于硬件：去中心化可以缩小差距吗？

过去两年，人工智能能力呈爆炸式增长，ChatGPT、Dall-E 和 Midjourney 等大型语言模型 (LLM) 已成为日常使用的工具。当您阅读本文时，生成式人工智能程序正在…

AI News
2024年8月27日
000
AI前沿

联邦政府太穷且太愚蠢，无法应对AI革命

不管你喜欢还是讨厌，人工智能正在世界各地的办公室里蓬勃发展。除非这些办公室里都是为美国联邦政府工作的员工。Fedscoop 的一份新报告对华盛顿能否跟上时代的步伐表示怀疑。根据其对…

王浩然
2024年10月15日
000
AI前沿

数据新时代的交易枢纽：Carbon Arc打造授权交易数据市场，赋能LLMs与企业应用

在数据被誉为“新石油”的当今时代，数据的重要性不言而喻。然而，尽管数据被视为一种宝贵的资源，但其交易与流通却远不如石油那样顺畅。数据的获取往往伴随着法律纠纷与版权问题，使得企业在追…

王浩然
2025年3月24日
000
AI前沿

构建 AI 韧性：迎接信息新时代的核心生存能力

人工智能正以不可逆的态势重塑信息生产、传播与消费的全链条 —— 生成式 AI 能在秒级产出海量文本、图像、视频内容，大语言模型成为信息获取的核心入口，这既极大提升了信息流通效率，也…

王浩然
2025年12月12日
000
AI前沿

2025年浏览器大战白热化：Chrome与Safari之外的八大创新选择‌

在全球浏览器市场竞争日趋激烈的背景下，Google Chrome和Apple Safari虽仍占据主导地位，但一批具有创新理念的替代浏览器正通过AI集成、隐私保护和用户体验优化等差…

王浩然
2025年7月17日
000

发表回复

Please Login to Comment

ScaleOps 与戴尔 – 英伟达合作双动态：AI 基础设施优化与联合平台升级引领企业降本增效

相关推荐

发表回复