亚太企业因 AI 推理成本攀升转向边缘计算，重构基础设施战略

王浩然 • 2025年11月26日下午6:00 • AI前沿 • 182 views

当前亚太地区（APAC）企业 AI 支出持续增长，但大量 AI 项目却因基础设施支撑不足难以实现预期价值 —— 多数现有系统无法满足实际应用对推理速度与规模的需求，即便企业在生成式 AI（GenAI）工具上投入重金，仍有许多项目因推理成本高、延迟高而未达 ROI 目标。这一矛盾凸显出 AI 基础设施对区域内 AI 落地的性能、成本与规模化能力的关键影响，也推动企业重新审视基础设施策略，其中 “将推理工作负载迁移至边缘” 成为核心趋势，以 Akamai 与 NVIDIA 合作推出的 “Inference Cloud” 为代表的解决方案，正通过 “靠近用户部署推理” 的模式，帮助企业平衡成本、延迟与实时响应需求，重塑 AI 基础设施格局。

从 AI 项目落地的核心痛点来看，基础设施的 “不匹配” 是首要障碍。Akamai 云计算首席技术官 Jay Jenkins 指出，企业普遍低估了 AI 从实验到规模化部署的鸿沟 —— 即便对生成式 AI 兴趣浓厚，高额的基础设施账单、居高不下的延迟，以及模型规模化运行的技术难题，仍会阻碍项目推进。当前多数企业依赖集中式云与大型 GPU 集群，但随着 AI 使用量增长，这种架构在远离主要云区域的地区成本骤增，且长距离传输导致的延迟问题愈发严重。例如，需多步推理的 AI 应用在跨区域传输时，延迟会显著削弱用户体验与业务价值；同时，多云环境的复杂性、严苛的数据规则与不断升级的合规要求，进一步延缓了从试点到生产的落地速度。Jenkins 强调 “AI 的能力取决于其运行的基础设施与架构”，集中式架构在实时性、成本控制与合规适配上的短板，已成为亚太企业 AI 规模化的主要瓶颈。

推理成本与需求的 “双重爆发”，使其取代训练成为 AI 基础设施的核心约束。随着亚太企业 AI 应用从试点转向实际部署（如在多市场推出语言、视觉及多模态模型），日常推理而非周期性训练，成为消耗算力的主力。与训练不同，推理需应对多语言环境、差异化监管规则与实时交互需求，集中式系统原本并非为这种高响应性场景设计，导致资源消耗与成本远超预期。例如，零售场景的个性化推荐、金融领域的实时 fraud 检测，均需毫秒级推理响应，而集中式云架构的长距离数据传输不仅无法满足速度要求，还会因海量数据回传产生高额带宽费用。Jenkins 以印度、越南企业为例，指出将图像生成模型的工作负载迁移至边缘后，企业通过优化 GPU 利用率与降低数据出口费用，实现了显著成本节省，印证了边缘架构在推理成本控制上的优势。

边缘计算凭借 “低延迟、低成本、高合规” 三重优势，成为亚太企业的基础设施转型方向。从技术逻辑来看，边缘计算将推理部署在靠近用户、设备或智能体的位置，大幅缩短数据传输距离，既能将响应延迟降至毫秒级（满足机器人、自动驾驶机器、智慧城市工具等物理 AI 系统的实时决策需求），又能避免大规模数据跨云传输的成本。从行业落地来看，对延迟敏感、合规要求高的行业率先拥抱边缘推理：零售与电商领域，因消费者会放弃响应缓慢的体验，将个性化推荐、多模态购物工具的推理本地化，以提升转化率；金融行业则将 fraud 核查、支付审批、交易评分等依赖多步 AI 决策的工作负载迁移至边缘，既保证毫秒级响应速度，又确保数据在监管边界内处理，规避跨境合规风险。

公私合作成为边缘 AI 基础设施落地的关键支撑。随着 AI 工作负载增长，云服务商与 GPU 厂商的协作愈发紧密，以 Akamai 与 NVIDIA 的合作为例，双方在数千个边缘节点部署 GPU、DPU 及 AI 软件，构建 “AI 交付网络”—— 将推理分散到多个站点而非集中于少数区域，既提升性能，又通过本地化处理满足不同市场的数据合规要求。这种合作模式还注重原生安全设计，零信任控制、数据感知路由、反欺诈与反机器人保护等已成为边缘基础设施的标准配置，尤其契合金融机构等强监管行业的安全需求。

面向未来，企业需从 “运营、治理、安全” 三方面做好准备，以适配边缘驱动的分布式 AI 生命周期。运营层面，模型需在多站点同步更新，要求企业强化跨核心与边缘系统的编排能力，实时监控性能、成本与错误；数据治理层面，本地化处理虽能缓解合规压力，但不同市场的监管差异仍需精细化管理，需确保推理与数据生成位置匹配，降低跨境合规风险；安全层面，边缘节点的分散性要求每个站点都具备同等安全防护能力，需加强 API、数据管道的保护，防范欺诈与 bot 攻击。IDC 等机构预测，到 2027 年，亚太地区 80% 的 CIO 将依赖边缘服务支撑 AI 工作负载，这一趋势不仅是技术选择，更是企业在 AI 时代保持竞争力的必然要求。

结合行业补充信息来看，边缘计算的崛起还与 “AI 推理成本结构变化” 深度关联。一方面，前沿模型的 “测试时扩展（长思考）” 技术虽提升推理质量，却使单次推理计算量增至传统模式的 100 倍以上，加剧集中式架构的成本压力；另一方面，AI 智能体的并行化、长时工作趋势，导致 Token 消耗量激增，推动应用层推理成本两年内上涨约 10 倍。而边缘计算通过 “就近处理、减少数据传输、优化 GPU 利用”，成为应对这一趋势的核心方案 —— 某制造企业测算显示，边缘推理可减少 70% 核心云传输量，年节省带宽费用近百万，进一步印证了边缘架构在成本与效率上的双重价值。

总体而言，亚太企业将 AI 基础设施转向边缘，既是对推理成本攀升的被动应对，也是对 AI 规模化落地需求的主动适配。这种转型不仅重塑了 “核心云训练 + 边缘推理” 的协同架构，更推动 AI 从 “实验室技术” 向 “高性价比业务工具” 转变，为零售、金融、制造等行业的 AI 深度应用奠定基础。随着边缘生态的持续成熟，企业需加快能力建设，以在分布式 AI 时代把握竞争主动权。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/ya-tai-qi-ye-yin-ai-tui-li-cheng-ben-pan-sheng-zhuan-xiang

Like (0)

王浩然作者

0 0

阿里千问（Qwen）AI 应用下载量破千万：开源根基与技术优势驱动全球增长

Previous 2025年11月26日

欧洲人才如何助力获取万亿欧元 AI 经济红利

Next 2025年11月26日

AI前沿

研究发现：基于不安全代码训练的AI模型具有毒性‌

最新研究表明，使用未受保护或存在安全漏洞的代码来训练的AI模型，可能会表现出“毒性”特征，即这些模型在生成代码或做出决策时可能包含恶意代码、偏见或错误逻辑。 ‌一、研究背景‌ 在人…

王浩然
2025年3月2日
000
AI前沿

FrodoBots 和 YGG 携手地球探测挑战赛，共同开发游戏化人工智能和机器人技术

FrodoBots和Yield Guild Games联手通过地球探测器挑战赛活动将人工智能和机器人研究游戏化。总部位于新加坡的 FrodoBots 多年来一直在研究机器人技术。它…

王浩然
2024年9月17日
000
AI前沿

谷歌低调推出AI Edge Gallery，让安卓手机脱离云端运行AI‌

谷歌近日悄然发布了一款实验性的安卓应用程序——AI Edge Gallery，该程序使用户能够在不依赖互联网连接的情况下，直接在智能手机上运行复杂的人工智能模型。这一举措标志着谷歌…

王浩然
2025年6月3日
000
AI前沿

电影制作人必备的AI前期制作工具‌

在电影制作的浩瀚征途中，前期制作无疑是最为关键的阶段之一。它奠定了整个项目的基调，决定了故事的走向以及最终的视觉效果。随着人工智能（AI）技术的飞速发展，电影制作人现在拥有了一系列…

王浩然
2025年4月28日
000
AI前沿

腾讯 Hunyuan3D-PolyGen：打造艺术级3D资产的新模型

在数字化时代，3D资产已成为创意产业不可或缺的一部分，广泛应用于影视、游戏、广告等多个领域。为了满足市场对高质量3D资产日益增长的需求，腾讯推出了全新的Hunyuan3D-Poly…

王浩然
2025年7月10日
000
AI前沿

DuckDuckGo进一步拥抱GenAI，其AI聊天界面正式脱离测试阶段‌

在人工智能技术日新月异的今天，搜索引擎巨头DuckDuckGo宣布其基于GenAI（通用人工智能）技术打造的聊天界面已正式脱离测试阶段，迈向全面应用。这一重大进展标志着DuckDu…

王浩然
2025年3月7日
000
AI前沿

Timekettle 推出 Babel OS，用于语言翻译耳机中的 AI 同声传译

Timekettle推出了 Babel OS，这是其首个旨在重新定义人工智能驱动的同声传译的操作系统，它将用于其语言翻译耳机。这一突破不仅为翻译软件树立了新的标杆，而且还显著提高…

王浩然
2025年1月6日
000
AI前沿

解析 Grok 3：可能重新定义行业的 AI 模型

自推出以来不到两年，xAI 已经推出了迄今为止可以说是最先进的 AI 模型。Grok 3 在所有关键基准以及用户评估的Chatbot Arena上都匹敌或超越了最先进的模型，而且它…

王浩然
2025年2月20日
000
AI前沿

代理人工智能如何重塑企业工作流程

在当今数字化时代，企业面临着日益复杂多变的市场环境和业务需求，传统的工作流程正逐渐难以满足企业高效运营和创新发展的需要。代理人工智能（Agentic AI）的出现，如同一场变革的风…

王浩然
2026年1月17日
000
AI前沿

美国海军陆戰队刚刚公布了ROGUE 1：其新的爆炸无人机

周二，美国海军陆战队和Teledyne FLIR Defense推出了“Rogue 1”——一种垂直起飞和降落（VTOL）神风无人机，具有一些有趣的功能：弹头可以在战场上交换，如果…

点点
2024年9月29日
000
AI前沿

OpenAI的O3模型在基准测试中表现不及预期‌

在人工智能领域，每一次技术的飞跃都伴随着无数的期待与挑战。近日，OpenAI公司推出的O3模型在业界引起了广泛关注，但令人意外的是，该模型在某一基准测试中的得分远低于公司最初的预期…

王浩然
2025年4月21日
000
AI前沿

英国签署人工智能安全条约保护人权与民主

英国签署了具有里程碑意义的人工智能安全条约，旨在保护人权、民主和法治免受人工智能可能带来的威胁。大法官沙巴纳·马哈茂德 (Shabana Mahmood) 今天签署了欧洲委员会的…

AI News
2024年9月6日
000
AI前沿

人工智能在空间观测与数据技术中的关键作用

2025 年 10 月 27 日，SETI 研究所天文学家、Unistellar 联合创始人 Franck Marchis 发表分析指出，在数字化与人工智能技术的快速推动下，空间观…

王浩然
2025年10月28日
000
AI前沿

捕捉自动化新浪潮：当任何人都能自动化一切时‌

在技术发展的长河中，自动化始终承载着解放人类生产力的美好承诺。从早期的宏命令到如今的智能代理，自动化技术经历了数次范式转移，而当下正在发生的变革可能是最具颠覆性的一次。Turbot…

王浩然
2025年9月9日
000
AI前沿

为何 “AI 自食狗粮” 对企业领导者而言不再是可选项

在人工智能（AI）快速发展并深刻改变商业格局的当下，“AI 自食狗粮” 这一概念逐渐凸显出其对于企业领导者的重要性，已从一种可选择的策略转变为企业发展的必要举措。所谓 “AI 自食…

王浩然
2026年1月23日
000
AI前沿

Adobe 为 AWS 带来生成式 AI 和实时个性化：以下是下一步计划

Adobe正在积极进军亚马逊的云计算领域，将其体验平台扩展到AWS，这一合作标志着企业处理人工智能和客户数据方式的重大转变。 Adobe 领导层表示，该交易于上周在亚马逊网络服务r…

王浩然
2024年12月10日
000
AI前沿

当技术进步不再像家：解析AI大迁徙中的抗拒心理‌

在2025年夏季的一场高管教练大师课上，当主讲人提及AI时，全场陷入尴尬的沉默。这种场景正在全球职场重复上演——埃德尔曼最新调研显示，尽管企业级AI工具普及率达89%，但42%的专…

王浩然
2025年7月28日
000
AI前沿

安娜·帕特森的Ceramic AI：助力企业更快速、高效地构建AI模型‌

在AI技术日新月异的今天，如何更快地构建高效、精准的模型成为了众多企业关注的焦点。安娜·帕特森，一位在AI领域深耕多年的专家，带着她的创新项目——Ceramic AI，为企业提供了…

王浩然
2025年3月8日
000
AI前沿

英特尔推出新款 Core Ultra 处理器，AI 应用性能提升 2 至 3 倍

英特尔今天在CES 2025上发布了全新英特尔酷睿超极本 9 处理器，其 AI 应用的边缘性能比之前提升了两到三倍。英特尔酷睿 Ultra 9 和酷睿 i9 系列芯片此前的代号分…

王浩然
2025年1月7日
000
AI前沿

SpaceX星舰基地工伤率远超行业水平安全文化引发NASA关注‌

根据获取的联邦安全记录显示，SpaceX位于德克萨斯州的星舰基地（Starbase）工伤率持续领跑航天制造业。这个被马斯克称为”多行星文明摇篮”的基地，20…

王浩然
2025年7月21日
000

发表回复

Please Login to Comment

亚太企业因 AI 推理成本攀升转向边缘计算，重构基础设施战略

相关推荐

发表回复