Decart 携手 AWS Trainium3 实现实时视频生成，定制 AI 加速器挑战英伟达 GPU 主导地位

王浩然 • 2025年12月10日上午10:00 • AI前沿 • 339 views

AI 视频初创公司 Decart 与亚马逊云服务（AWS）达成合作，将其旗舰 AI 模型 “Lucy” 在 AWS 新一代定制 AI 加速器 Trainium3 上进行优化，以实现实时视频生成功能。此次合作不仅标志着 AWS Trainium 系列加速器在高性能 AI 应用场景的重要突破，也凸显了定制 AI 加速器在特定领域对英伟达 GPU 的竞争潜力，为 AI 视频生成等实时性要求高的领域提供了更高效、低成本的算力解决方案。

从合作核心内容来看，Decart 对 AWS 生态展开深度布局：除优化 Lucy 模型适配 Trainium3 外，还将自身模型接入亚马逊 Bedrock 平台 —— 这一 AWS 旗下的生成式 AI 服务平台，可让开发者无需关注底层基础设施，就能将 Decart 的实时视频生成能力集成到各类云应用中。对 AWS 而言，此举进一步丰富了 Bedrock 的 “即插即用” 功能，印证了其对实时 AI 视频需求增长的信心；对 Decart 来说，借助 Bedrock 的开发者生态，能大幅扩大自身技术的覆盖范围与 adoption 速度，加速实时视频生成技术在电商营销、游戏动画、内容创作等领域的落地。而 Trainium3 为 Lucy 模型提供的核心支撑，在于其强大的算力与低延迟特性 —— 既能保障生成高保真视频的质量，又能满足实时交互场景对响应速度的要求，解决了此前 AI 视频生成 “质量与速度难以兼顾” 的痛点。

定制 AI 加速器（如 AWS Trainium）的崛起，核心优势源于其 ASIC（专用集成电路）架构。与英伟达 GPU 的通用计算定位不同，ASIC 芯片为特定应用场景量身设计，剥离了与目标任务无关的功能单元，专注于提升核心计算效率。具体来看，计算架构的差异造就了性能与能效的差距：CPU 如同 “瑞士军刀”，可处理多类任务但效率有限；GPU 类似 “大功率电钻”，擅长并行计算，适用于 AI 训练、图形渲染等场景，但仍存在通用架构带来的冗余；而 ASIC 则像 “手术刀”，针对单一任务极致优化 —— 以 Trainium 为例，其架构专为 AI 训练与推理设计，在数据吞吐量、内存带宽利用、能耗控制等方面均针对 AI workloads 做了深度适配。这种特性使其在特定场景下展现出显著优势：Anthropic 与 AWS 合作的 “Project Rainier” 项目，采用数十万颗 Trainium2 芯片构建超大规模集群，可提供数百艾字节每秒（exaflops）的算力，支撑 Claude Opus-4.5 等先进大模型运行；AI 编码初创公司 Poolside 也选择 Trainium2 训练模型，并计划将其用于后续推理任务，均印证了 ASIC 在特定 AI 场景的实用性。

在 Decart 与 Trainium3 的合作中，技术突破具体体现在实时视频生成的关键指标上。Lucy 模型在 Trainium3 的支持下，“首帧生成时间”（time-to-first-frame）仅需 40 毫秒，意味着用户输入指令后，模型可近乎即时启动视频生成；同时，通过对视频处理流程的优化，Lucy 能以每秒 30 帧（fps）的速度生成视频，且质量可媲美 OpenAI Sora 2、谷歌 Veo-3 等成熟但生成速度更慢的视频模型。更值得关注的是，Decart 还获得了 Trainium3 的早期使用权 —— 这款新一代加速器在性能上进一步升级，可支持每秒 100 帧的输出速度，且延迟更低。Decart 联合创始人兼 CEO 迪恩・莱特斯多夫（Dean Leitersdorf）表示：“Trainium3 的下一代架构带来了更高的吞吐量、更低的延迟和更强的内存效率，使我们的帧生成速度提升了 4 倍，而成本仅为 GPU 的一半。” 这一数据直接体现了定制加速器在 “性能 – 成本比” 上的竞争力，为实时视频生成的规模化应用奠定了基础。

从行业竞争格局来看，定制 AI 加速器正对英伟达 GPU 的主导地位形成挑战，但短期内难以实现全面替代。目前，英伟达仍凭借 GPU 的通用性与成熟生态，占据 AI 训练市场的核心份额 —— 其 GPU 可支持 GPT-5、Gemini 3 等通用大模型，适配各类复杂 AI 任务，而 ASIC 的优势集中在需求稳定、场景单一的任务（如实时视频生成、推荐系统推理）。不过，越来越多科技巨头正加入定制芯片阵营：Meta 与博通合作开发专用 AI 芯片，用于训练和运行 Llama 系列模型；OpenAI 也计划推出自研芯片，减少对外部供应商的依赖；谷歌则持续迭代 TPU（张量处理器），并向外部客户开放算力租赁服务。这种趋势推动行业从 “英伟达单一主导” 向 “多元化算力竞争” 转变，企业可根据自身任务特性选择适配的硬件方案 —— 通用大模型训练仍以 GPU 为主，特定场景推理与生成任务则更多采用 ASIC，形成 “互补共存” 的格局。

此次合作的行业意义不仅在于技术落地，更在于推动 AI 创新向 “场景化定制” 方向发展。实时视频生成是 AI 应用的重要前沿领域，其对算力的 “高吞吐量、低延迟” 要求，传统 GPU 难以高效满足，而 Trainium3 等定制加速器的出现，恰好填补了这一空白。随着更多定制芯片在细分场景的突破，AI 技术将在更多实时交互领域（如虚拟直播、即时动画制作、智能交互界面）实现落地，进一步拓展 AI 的应用边界。同时，定制芯片的成本优势也将降低中小开发者的技术门槛，让更多企业有能力探索实时 AI 视频等高端应用，推动行业创新活力提升。

综上，Decart 与 AWS Trainium3 的合作，既是定制 AI 加速器在实时视频生成领域的成功实践，也是行业算力格局变革的缩影。未来，随着 ASIC 技术的持续迭代与生态完善，其在特定 AI 场景的竞争力将进一步增强，与 GPU 共同推动 AI 算力向 “高效化、场景化、多元化” 方向发展，为 AI 技术的全面落地注入新动力。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/decart-xie-shou-aws-trainium3-shi-xian-shi-shi-shi-pin

AI 视频生成 ASIC 架构 AWS Trainium3 Decart Lucy 模型亚马逊 Bedrock 定制 AI 加速器实时视频生成算力竞争英伟达 GPU

Like (0)

王浩然作者

0 0

数据中心冷却技术的三代演进：为何多数运营商仍在构建过时基础设施

Previous 2025年12月9日

从内罗毕走向世界：非洲在全球人工智能服务交付中的新兴角色

Next 2025年12月10日

AI前沿

Regal 声称其客户服务聊天机器人比大多数聊天机器人都要好

人们通常对客服聊天机器人持怀疑态度，许多人甚至直接鄙视它们。在最近的 Gartner调查中，64% 的消费者表示，他们更希望公司在客户服务中不使用任何类型的人工智能（包括聊天机器人…

王浩然
2024年10月31日
000
AI前沿

Anthropic 披露 AI 主导的网络间谍活动：自主智能代理重塑攻击格局，安全防御开启 AI 对抗新纪元

AI 企业 Anthropic 旗下威胁情报团队发布重磅报告，详细揭露了全球首起由人工智能自主协调运作的大规模网络间谍活动 —— 代号 “GTG-1002 行动”。这起活动于 20…

王浩然
2025年11月16日
000
AI前沿

GPT-4o：OpenAI推出原生图像生成功能，惊艳用户

引言‌ 自OpenAI在2024年5月发布其首款“全能”或多模态模型GPT-4o以来，近一年的时间里，这款模型始终保持着强大的竞争力。而今，OpenAI再次为ChatGPT的Plu…

王浩然
2025年3月27日
000
AI前沿

华纳音乐与 AI 音乐初创公司 Suno 达成合作并和解诉讼，重塑行业 AI 音乐生态

全球音乐巨头华纳音乐集团（WMG）与 AI 音乐初创公司 Suno 正式宣布达成合作协议，同时解决了双方此前的版权诉讼纠纷。这一合作不仅为 AI 音乐领域建立 “授权创作 + 艺术…

王浩然
2025年12月2日
000
AI前沿

OpenAI 推出其谷歌挑战者 ChatGPT Search

OpenAI 的谷歌挑战者终于来了。该公司周四推出了ChatGPT Search，这是今年夏天推出的 SearchGPT 原型的升级版。OpenAI 表示，ChatGPT Sea…

王浩然
2024年11月2日
000
AI前沿

OpenAI升级Operator至o3，增强ChatGPT Pro订阅吸引力‌

在AI领域持续火热的背景下，OpenAI宣布了一项重要更新，为其ChatGPT Pro订阅服务增添了新的亮点。这次更新将Operator——一个自主网页浏览和光标控制代理——从原先…

王浩然
2025年5月28日
000
AI前沿

从模型到系统：AI规模化落地的核心逻辑与未来格局——对话NeuroMetric创始人Rob May

当全球企业都在为AI落地的“最后一公里”绞尽脑汁时，Rob May的视角显得格外清醒。作为NeuroMetric的联合创始人兼CEO、HalfCourt Ventures的董事总经…

王浩然
2026年3月29日
000
AI前沿

法官允许加州禁止未成年人食用成瘾性食品的禁令生效

周二晚些时候，一名联邦法官阻止了科技游说团体 NetChoice 对加州最近颁布的法律SB 976的挑战，该法律禁止公司向未成年人提供“上瘾内容”。该决定的效果是，从周三开始，除…

王浩然
2025年1月2日
000
AI前沿

AI领域的颠覆者：DeepSeek如何以低成本重塑AI开发范式‌

今年1月，当DeepSeek发布其R1模型时，这不仅仅是一次普通的AI公告，而是一次震撼整个科技行业的里程碑事件，迫使行业领袖重新审视他们对AI开发的基本方法。 DeepSeek的…

王浩然
2025年6月16日
000
AI前沿

构建信任：人工智能的新基准线‌

在人工智能（AI）领域，技术的迅猛发展正引领我们进入一个全新的时代。AI已深深植根于我们的个人生活和职场之中，影响着我们的决策、交流乃至生存方式。作为AI领域的领航者，我们站在了一…

王浩然
2025年6月9日
000
AI前沿

中国智能手机厂商斥资100亿布局人形机器人，加速AI领域拓展‌

在科技日新月异的今天，中国智能手机行业的一匹黑马——荣耀，正以其雄厚的实力和前瞻性的战略眼光，向人工智能（AI）领域发起新的冲锋。近日，荣耀宣布了一项斥资100亿元人民币的AI行动…

王浩然
2025年6月5日
000
AI前沿

DVC合伙人Nick Davidov：用AI重构风投，让LP成为核心参与者

在AI创业浪潮席卷全球的当下，风险投资行业正经历着前所未有的变革。位于旧金山的DVC资本，凭借其独特的AI驱动型投资模式，在早期AI创业投资领域异军突起。近日，DVC联合创始人兼管…

王浩然
2026年2月15日
000
AI前沿

大英百科全书现在是一家人工智能公司

《大英百科全书》曾是20世纪的标志，但在21世纪却被视为过时，如今，它正全力投入人工智能领域，据《纽约时报》报道，它可能很快以近 10 亿美元的估值上市。直到 2012 年印刷业…

王浩然
2024年12月25日
000
AI前沿

人工智能驱动的沟通平台如何缓解医护人员职业倦怠

医护人员职业倦怠问题已持续恶化七年，美国疾病控制与预防中心（CDC）数据显示，2022 年近半数医护人员存在倦怠症状，较前一年增长 14%，且近半数受访者表示计划寻找新工作。这种倦…

王浩然
2025年11月29日
000
AI前沿

Salesforce豪掷10亿美元投资新加坡，力推AI技术普及‌

在科技日新月异的今天，人工智能（AI）已经成为推动各行各业发展的重要力量。近日，全球领先的客户关系管理软件提供商Salesforce宣布了一项重大投资决策——将在新加坡投入高达10…

王浩然
2025年3月13日
000
AI前沿

Replit 和 Anthropic 的人工智能帮助 Zillow 构建了生产软件 – 无需一名工程师

Replit已将Zillow的非技术员工转变为软件开发人员。这家房地产巨头现在使用从未编写过代码的团队成员开发的应用程序将超过100,000 名购房者转介给代理商。此次突破源于 …

王浩然
2025年2月18日
000
AI前沿

谷歌利用人工智能识别量子误差

谷歌的DeepMind和Quantum AI团队开发了AlphaQubit，这是一种基于神经网络的解码器，可以比以前的方法更准确地识别量子计算错误。量子计算机可以解决传统计算机目…

王浩然
2024年12月2日
000
AI前沿

人工智能增强人力资源，但以人为本的方法不可或缺

随着人工智能 (AI) 在人力资源领域不断开辟新天地，其接受度也越来越高。最近的一项研究显示，近一半接受调查的英国和美国员工认为人工智能有助于减少偏见和不公平的招聘待遇；许多人甚至…

王浩然
2025年1月13日
000
AI前沿

WestCX总裁Sam Meckey：Agentic AI重构医疗沟通，以智能自动化重塑患者体验

在医疗健康与客户体验（CX）的交叉领域，AI技术正在掀起一场深刻的变革。WestCX作为云原生AI沟通与互动平台的领军者，正通过Agentic AI技术重新定义医疗场景下的患者沟通…

王浩然
2026年2月4日
000
AI前沿

为何各国以主权人工智能的名义竞相建立人工智能工厂

如今，人工智能已成为一项至关重要的技术，世界也陷入了激烈的地缘政治斗争，“主权人工智能”成为国家问题也就不足为奇了。想想看，美国会允许其为人工智能生成的数据在中国存储和处理吗？欧盟…

王浩然
2024年10月2日
000

发表回复

Please Login to Comment

Decart 携手 AWS Trainium3 实现实时视频生成，定制 AI 加速器挑战英伟达 GPU 主导地位

相关推荐

发表回复