谷歌推出性能提升 4 倍的 AI 芯片，斩获 Anthropic 数十亿美元大单

王浩然 • 2025年11月8日下午2:00 • AI前沿 • 229 views

谷歌云正式发布其迄今最强大的人工智能基础设施，核心包含第七代张量处理单元（TPU）“Ironwood” 与扩展的 Arm 架构 Axion 处理器系列。这一发布标志着行业正从 “模型训练” 向 “面向数十亿用户的模型推理服务” 转型，而谷歌通过定制化芯片与垂直整合策略，试图在 AI 基础设施竞争中打破英伟达 GPU 的主导地位。更引人瞩目的是，AI 安全公司 Anthropic（Claude 系列模型开发商）宣布计划接入多达 100 万块 Ironwood TPU 芯片，这份价值数十亿美元的合作，成为迄今已知规模最大的 AI 基础设施协议之一，为谷歌定制芯片战略注入强力背书。

从行业背景来看，谷歌此次布局紧扣 “推理时代” 的核心需求。随着 Gemini、Claude 等前沿模型逐渐成熟，企业资源正从耗时耗力的模型训练，转向支撑每日数百万甚至数十亿次请求的推理服务。谷歌云 AI 与基础设施副总裁兼总经理阿明・瓦赫达特（Amin Vahdat）指出，推理场景对基础设施的要求远超训练 —— 训练可容忍批量处理与较长耗时，而推理必须保证极低延迟、超高吞吐量与极致可靠性。例如，响应时间超过 30 秒的聊天机器人或频繁超时的代码助手，即便模型能力再强也无法投入实用；尤其在智能体（Agentic）工作流中，AI 需自主执行任务而非仅响应指令，更需要专用加速器与通用计算的紧密协同，这正是谷歌定制芯片的核心发力点。

Ironwood TPU 的突破不仅体现在性能提升，更源于系统级的协同设计。相较于第六代 TPU，Ironwood 在训练与推理性能上均实现 4 倍以上提升，这并非单纯依赖晶体管数量增加，而是通过架构创新实现。其最显著的特点是规模化设计：单个 “Ironwood Pod”（由多芯片组成的超级计算机单元）可通过谷歌自研的芯片间互联（Inter-Chip Interconnect）网络，连接多达 9216 块芯片，互联带宽达 9.6 太比特 / 秒 —— 这一速度相当于不到 2 秒即可下载整个美国国会图书馆的数字资源。配套的高带宽内存（HBM）总量达 1.77 拍字节，足以同时供数千个处理器高速访问，相当于 4 万部高清蓝光电影的容量，谷歌称其 FP8 精度下的算力达 118 exaFLOPS，远超同类竞品。

为应对大规模集群的可靠性挑战，Ironwood 引入光电路交换（Optical Circuit Switching）技术，构建动态可重构的互联架构。当单个组件故障或需要维护时，系统可在毫秒内自动 reroute 数据流量，确保工作负载无感知续跑。这一设计源自谷歌五代 TPU 的部署经验，其液冷系统自 2020 年以来始终保持 99.999% 的可用性，年均 downtime 不足 6 分钟，完全满足企业级服务的严苛要求。

Anthropic 的合作堪称谷歌定制芯片战略的 “里程碑式验证”。这家公司计划接入的 100 万块 TPU 芯片，规模远超行业内常见的万级或五万级加速器集群，配套基础设施、网络与能耗投入预计形成一份价值数十亿美元的多年期合同。Anthropic 首席财务官克里希纳・拉奥（Krishna Rao）表示，双方长期合作的基础在于 TPU 的 “性价比与效率优势”，以及 Anthropic 在 TPU 上训练与部署模型的成熟经验。据披露，Anthropic 将在 2026 年获得 “超过 1 吉瓦” 的算力容量 —— 这一电力规模足以支撑一座小型城市，将用于满足 Claude 模型指数级增长的用户需求，从财富 500 强企业到 AI 原生初创公司均依赖其提供核心服务。Anthropic 计算部门负责人詹姆斯・布拉德伯里（James Bradbury）特别强调，Ironwood 在推理性能与训练扩展性上的双重提升，能帮助团队在保证用户体验的同时高效扩容。

与 Ironwood 互补的是谷歌 Axion 处理器家族的扩展。作为定制 Arm 架构 CPU，Axion 聚焦 AI 应用的通用支撑工作负载 —— 无需专用加速器的微服务、容器化应用、开源数据库、数据分析与 Web 服务等。此次推出的 N4A 实例在预览阶段即展现出显著优势，谷歌称其性价比较当前主流 x86 虚拟机提升 2 倍；而首次亮相的 C4A 裸金属实例，则为 Android 开发、汽车系统与有严格授权要求的软件，提供专属物理服务器支持。Axion 的定位凸显了谷歌的基础设施逻辑：TPU 负责 AI 模型的密集计算，Axion 则处理数据摄入、预处理、应用逻辑与 API 服务等 “辅助但关键” 的任务，二者协同构成完整的 AI 应用栈。早期客户反馈印证了这一策略的价值：Vimeo 在 N4A 实例上测试核心转码工作负载，性能提升 30%；ZoomInfo 的数据处理管道运行于 Java 服务时，性价比提升 60%，充分体现通用计算优化对 AI 效率的间接增益。

软件生态的完善则让硬件性能真正转化为开发者效率。谷歌将 Ironwood 与 Axion 整合进 “AI 超算（AI Hypercomputer）” 体系，该系统融合计算、网络、存储与软件，据 2025 年 10 月 IDC 研究，使用该系统的客户三年平均 ROI 达 353%，IT 成本降低 28%，团队效率提升 55%。具体优化包括：谷歌 Kubernetes 引擎（GKE）新增 TPU 集群的高级维护与拓扑感知能力，实现智能调度与高弹性部署；开源框架 MaxText 支持监督微调（SFT）与生成式强化策略优化（GRPO）等先进训练技术；而推理网关（Inference Gateway）通过前缀缓存感知路由等技术，将首 token 响应延迟降低 96%，服务成本减少 30%—— 例如在对话 AI 中，网关可将共享上下文的请求路由至同一服务器，避免冗余计算。

值得关注的是，谷歌在基础设施物理层面的创新。为支撑 AI 时代的超高功率需求，谷歌推出 ±400 伏直流供电系统，单机架功率可达 1 兆瓦，较传统部署提升 10 倍。其工程师在 2025 年 4 月的博客中预测，2030 年前机器学习机架功率将突破 500 千瓦。目前，谷歌正与 Meta、微软合作推进高压直流配电的接口标准化，并选择 400 伏规格以复用电动汽车供应链，降低成本并提升规模化能力。冷却方面，谷歌第五代冷却分配单元将贡献给开放计算项目（OCP），其液冷系统已在 7 年间部署于 2000 多个 TPU Pod，水的散热效率是空气的 4000 倍，足以应对单芯片超 1000 瓦的散热需求。

这一系列动作背后，是谷歌对 AI 芯片市场格局的挑战。当前英伟达凭借 80%-95% 的市场份额主导 AI 加速器领域，但云厂商正通过定制芯片寻求差异化。亚马逊有 Graviton CPU 与 Inferentia/Trainium 加速器，微软开发 Cobalt 处理器并传闻布局 AI 芯片，而谷歌的 TPU、Axion 组合构成了主流云厂商中最完整的定制芯片 portfolio。尽管定制芯片需数十亿前期投入，软件生态落后于英伟达 CUDA 平台，且面临模型架构快速迭代的风险，但谷歌坚信垂直整合的长期价值 —— 正如其十年前开发首款 TPU，间接推动了 Transformer 架构的诞生。

除 Anthropic 外，早期客户已展现出积极反馈。开发创意 AI 工具的 Lightricks 研究总监约夫・哈科恩（Yoav HaCohen）表示，Ironwood 的测试表现让团队有信心为全球数百万用户打造 “更细腻、精准、高保真的图像与视频生成工具”。不过行业仍存在疑问：当前数百亿美元的基础设施投入能否持续？定制芯片是否真能在经济上优于英伟达 GPU？模型架构演进是否会让现有芯片过时？

对谷歌而言，这一策略延续了其数十年的技术逻辑：通过定制基础设施实现通用硬件无法支撑的应用，再将其开放给无需承担巨额投入的客户。随着 AI 从实验室走向服务数十亿用户的生产场景，基础设施层 —— 包括芯片、软件、网络、供电与冷却 —— 正与模型本身同等重要。而 Anthropic 100 万块芯片的订单表明，谷歌针对推理时代的定制芯片赌注，或许正赶上需求爆发的关键拐点。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/gu-ge-tui-chu-xing-neng-ti-sheng-4-bei-de-ai-xin-pian-zhan

AI 推理 AI 超算 Anthropic Arm 架构 Axion 处理器光电路交换定制 AI 芯片液冷系统芯片间互联谷歌 Ironwood TPU

Like (0)

王浩然作者

0 0

谷歌文件搜索：何以颠覆企业自建 RAG 架构？

Previous 2025年11月8日

月之暗面 Kimi K2 Thinking 崛起：领先开源 AI 模型超越 GPT-5 与 Claude Sonnet 4.5

Next 2025年11月8日

AI前沿

Shaktiman Mall，Aviatrix 首席产品经理 – 访谈系列

Shaktiman Mall是 Aviatrix 的首席产品经理。凭借十多年的网络解决方案设计和实施经验，Mall 以其独创性、创造力、适应性和精确性而自豪。在加入 Aviatri…

点点
2024年9月1日
000
AI前沿

Salesforce豪掷80亿美元收购Informatica：对企业数据与AI领域将产生深远影响‌

Salesforce近日宣布了一项重大决策，将以80亿美元的价格收购Informatica。这一举措标志着Salesforce意图在企业领域进一步拓展其版图，将两家拥有数十年实战经…

王浩然
2025年5月29日
000
AI前沿

Cohere 联合创始人 Nick Frosst 的独立乐队 Good Kid 几乎和他的 AI 公司一样成功

他们在 Lollapalooza 音乐节上表演过，为葡萄牙音乐节 The Man 做开场表演，白天还做程序员。估值 55 亿美元的加拿大人工智能初创公司 Cohere的联合创始人…

王浩然
2024年9月16日
000
AI前沿

OpenAI 达成又一笔循环交易：入股投资方关联企业，深度绑定开启 AI 行业新合作模式

人工智能巨头 OpenAI 正式宣布获得私募股权投资公司 Thrive Holdings 的股权，而颇具戏剧性的是，Thrive Holdings 的母公司正是 OpenAI 的主…

王浩然
2025年12月5日
000
AI前沿

Apple Intelligence 有望推动收入增长；研究公司预测 2024 年 AI 智能手机出货量将增加两倍

受益于 iPhone 等硬件产品的热销，以及服务业务创纪录的表现，苹果预计 2024 财年（截至 9 月底）总营收将超过 4000 亿美元。这一增长很大一部分将来自 Apple I…

王浩然
2024年9月16日
000
AI前沿

汤森路透多智能体系统：反ChatGPT式AI如何将20小时任务压缩至分钟级‌

在全球法律与金融信息服务业掀起革命性变革——汤森路透最新研发的”多智能体协同系统”(Multi-Agent System)成功将传统需要20小时人工处理的复…

王浩然
2025年9月17日
000
AI前沿

AI 智能体的陷阱：自主系统中无人准备的隐藏失效模式

当前行业在竞相打造高度自主的 AI 智能体时，过度聚焦于提升其能力、展示其成果 —— 从更快完成任务的基准测试，到成功预订复杂行程、生成完整代码库的惊艳演示，却严重忽视了这些系统可…

王浩然
2025年12月16日
000
AI前沿

小模型，大影响：Patronus AI 的 Glider 在关键 AI 评估任务中表现优于 GPT-4

一家由前 Meta AI 研究人员创立的初创公司开发了一种轻量级 AI 模型，该模型可以像更大的模型一样有效地评估其他 AI 系统，同时为其决策提供详细的解释。 Patronus …

王浩然
2024年12月20日
000
AI前沿

ChatGPT“编造”音乐应用功能，创始人竟将其变为现实

在创新与技术日新月异的今天，一个有趣的故事在音乐教学平台Soundslice上悄然上演。这个故事不仅展现了人工智能（AI）的奇妙之处，也深刻反映了技术与人之间微妙的互动关系。 AI…

王浩然
2025年7月12日
000
AI前沿

IDC：GenAI 智能手机将在 2024 年推动全球出货量增长

IDC 已修订其对 2024 年全球智能手机出货量的预测，预计同比增长 5.8% 至 12.3 亿部。这家市场情报公司之所以持乐观态度，是因为新兴市场中价格实惠的 Androi…

AI News
2024年9月1日
000
AI前沿

Experity 远程放射学首席医疗官 Ron Boucher 博士 – 访谈系列

Ron Boucher 博士担任Experity的远程放射学首席医疗官，Experity 是一家专注于美国紧急护理市场的软件和服务公司。 Experity 提供集成操作系统，包括电…

点点
2024年10月27日
000
AI前沿

Amazon DocumentDB无服务器数据库助力AI代理加速与成本优化

亚马逊云科技(AWS)近期发布了DocumentDB无服务器数据库的重大更新，旨在为AI代理应用提供更高效的运行环境并显著降低运营成本。这一创新解决方案通过自动扩展和按需计费模式，…

王浩然
2025年8月8日
000
AI前沿

AI 在气象建模中日益重要的作用：从速度革命到行业变革，重塑极端天气应对能力

随着极端天气事件频发（如本月大西洋突发且快速增强的 “梅利莎飓风”），传统气象预报模型因依赖物理方程、计算缓慢且资源消耗大，已难以应对 “瞬息万变的大气环境”，而 AI 气象模型凭…

王浩然
2025年11月19日
000
AI前沿

量子驱动的生成式人工智能框架问世

量子计算公司Quantinuum推出了其生成量子人工智能 (Gen QAI) 框架，这是一种量子驱动人工智能的新方法。该方法利用量子生成的数据来增强人工智能系统，解锁制药、金融建…

王浩然
2025年2月5日
000
AI前沿

供应链需为 AI 间直接通信做好准备

AI 已深度融入供应链运营（如文档验证、堆场监控等），而 AI 系统间直接信息交互的新阶段即将到来，这一变革将重塑物流网络数据流转与决策模式，企业需从多维度做好准备以趋利避害。 A…

王浩然
2025年12月19日
000
AI前沿

DeepMind 的 Talker-Reasoner 框架为 AI 代理带来了系统 2 思维

人工智能代理必须解决一系列需要不同速度和不同水平的推理和规划能力的任务。理想情况下，代理应该知道何时使用其直接记忆，何时使用更复杂的推理能力。然而，设计能够根据需求正确处理任务的代…

王浩然
2024年10月27日
000
AI前沿

Google AMIE：AI“医生”学会解读医疗影像

在医疗领域，人工智能（AI）正逐渐展现出其巨大的潜力。近日，Google推出的AMIE项目再次刷新了我们对AI在医疗影像解读方面的认知。这一创新技术，被誉为AI“医生”，正在学习如…

王浩然
2025年5月11日
000
AI前沿

Cohere 更新 API，让开发人员更轻松地从其他模型切换

Cohere宣布发布其 AI 模型 Chat、Embed、Rerank 和 Classify 的应用程序编程接口 (API) 的更新版本。新的 API 更新统称为 API V2，…

王浩然
2024年9月30日
000
AI前沿

Microsoft Outlook 现在允许您创建个性化的 AI 主题

微软周四宣布，Outlook 将推出一项新功能，允许您使用生成式 AI 根据个人喜好创建主题。拥有 Copilot Pro 消费者订阅和启用了 Copilot 的企业帐户的用户可…

王浩然
2024年11月8日
000
AI前沿

矿业 AI 实践启示：必和必拓（BHP）的应用路径与行业借鉴

全球矿业巨头必和必拓（BHP）将人工智能视为 “运营数据转化为优化决策的核心工具”，通过聚焦实际业务痛点、建立量化评估体系，在预测性维护、能源与水资源优化、自主运营等场景实现 AI…

王浩然
2025年12月22日
000

发表回复

Please Login to Comment

谷歌推出性能提升 4 倍的 AI 芯片，斩获 Anthropic 数十亿美元大单

相关推荐

发表回复