Meta发布Llama API，速度较OpenAI快18倍，与Cerebras合作实现每秒2600个令牌处理

王浩然 • 2025年4月30日下午4:00 • AI前沿 • 283 views

Meta今日宣布与Cerebras Systems达成合作，共同推出全新的Llama API，为开发者提供比传统GPU解决方案快18倍的推理速度。这一宣布是在Meta首届LlamaCon开发者大会上做出的，标志着Meta正式进入AI计算销售市场，与OpenAI、Anthropic和Google等公司在快速增长的AI推理服务市场中展开直接竞争。

Cerebras技术为Meta API加速

Cerebras的首席营销官Julie Shin Choi在新闻发布会上表示：“Meta选择了Cerebras作为合作伙伴，共同为开发者提供他们所需的超快速推理服务，通过新的Llama API。我们非常兴奋能宣布我们的首个CSP超大规模合作伙伴关系，为所有开发者提供超快速推理服务。”

Cerebras的AI芯片为Meta的Llama API提供了显著的速度优势。据Artificial Analysis的基准测试显示，Cerebras系统为Llama 4 Scout提供超过每秒2600个令牌的处理能力，而ChatGPT大约为每秒130个令牌，DeepSeek则约为每秒25个令牌。

从模型提供商到全服务AI基础设施公司

此次合作标志着Meta AI战略的重大转变，从主要作为模型提供商转变为提供全方位AI基础设施服务的公司。通过提供API服务，Meta不仅为其AI投资创造了新的收入来源，同时保持了其对开放模型的承诺。

Meta强调，它不会使用客户数据来训练自己的模型，且使用Llama API构建的模型可以转移到其他主机上，这与一些竞争对手更为封闭的方法形成鲜明对比。

全球数据中心网络支持

Cerebras将通过其遍布北美的数据中心网络为Meta的新服务提供支持，包括位于达拉斯、俄克拉荷马州、明尼苏达州、蒙特利尔和加利福尼亚州的设施。Cerebras的首席营销官Choi解释说：“目前，我们所有提供推理服务的数据中心都在北美。我们将以Cerebras的全部容量服务Meta，工作负载将在所有这些不同的数据中心之间平衡。”

提供多种高性能推理选项

除了Cerebras之外，Meta还宣布与Groq合作，为开发者提供除传统GPU推理之外的多种高性能推理选项。Meta进入推理API市场，凭借其卓越的性能指标，有可能打破由OpenAI、Google和Anthropic主导的市场格局。

Llama API的广泛应用前景

Llama API的推出将开启一系列之前因性能限制而无法实现的新应用类别，包括实时智能体、低延迟语音对话系统、交互式代码生成和即时多步推理等。这些应用都需要在短时间内完成多个大型语言模型的调用，而现在这些调用可以在几秒钟内完成，而非几分钟。

开发者生态系统受益

对于开发者来说，Llama API提供了一个强大的工具，用于微调和评估模型。从Llama 3.3 8B模型开始，开发者可以生成数据、进行训练并测试自定义模型的质量。Meta表示，它不会使用客户数据来训练自己的模型，这为开发者提供了额外的保障。

Meta的独特优势

Meta拥有30亿用户、超大规模数据中心和庞大的开发者生态系统，使其处于独特地位。Cerebras的演示材料指出，与Cerebras技术的集成将帮助Meta在性能上超越OpenAI和Google约20倍。

展望未来

Llama API目前处于有限预览阶段，Meta计划在未来几周和几个月内进行更广泛的推广。对超快速Llama 4推理感兴趣的开发者可以通过在Llama API中选择Cerebras模型选项来请求早期访问。

随着AI技术的不断发展，速度已成为关键因素。Meta与Cerebras的合作表明，在未来的AI领域，不仅仅是模型的能力重要，更重要的是它们处理信息的速度。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/meta-fa-bu-llama-api-su-du-jiao-openai-kuai-18-bei-yu

Like (0)

王浩然作者

0 0

Meta发布首款专用AI应用：以Llama 4为核心，更偏向消费而非生产力或商业导向

Previous 2025年4月30日

Meta的Llamacon：剑指OpenAI，展现竞争优势

Next 2025年4月30日

AI前沿

AI先驱因强化学习研究荣获图灵奖‌

在人工智能领域，一项至高无上的荣誉近日揭晓——几位在强化学习领域取得卓越成就的AI先驱荣获了图灵奖。这一奖项不仅是对他们个人才华和贡献的认可，更是对整个强化学习社区乃至整个AI领域…

王浩然
2025年3月8日
000
AI前沿

医疗AI转录平台Freed实现2万临床医生用户里程碑行业竞争白热化‌

在生成式AI技术饱受争议的背景下，其语音转录能力却获得医疗行业的广泛认可。旧金山初创企业Freed AI近日宣布，其开发的智能医疗转录系统已吸引2万名付费临床医生用户，每月处理近3…

王浩然
2025年7月28日
000
AI前沿

Puppygraph 加快了 LLM 获取图形数据洞察的速度

随着企业继续在高级分析和大型语言模型(LLM)方面投入大量资金，图形技术已成为设置数据堆栈最受欢迎的方法之一。它允许用户了解数据集中的复杂关系，而这些关系在传统关系数据库中通常并不…

王浩然
2024年11月9日
000
AI前沿

AI初创公司Cohere收购市场研究平台Ottogrid

在人工智能（AI）技术迅速发展的当下，各行业的数字化转型正在加速推进。近日，AI领域的佼佼者Cohere宣布了一项重要收购——市场研究平台Ottogrid。此次收购不仅彰显了Coh…

王浩然
2025年5月19日
000
AI前沿

Uniphore 推出 X-Stream，一款统一的知识产品，可将 RAG 应用的构建速度提高 8 倍

Uniphore是一家以对话式 AI 和自动化解决方案而闻名的全球科技公司，它正在朝着简化企业开发检索增强生成(RAG) 应用程序的方式迈进。该公司今天宣布推出 X-Stream，…

王浩然
2024年9月20日
000
AI前沿

谷歌发布 Gemini 3：横扫多领域基准测试，引领 AI 向 “强执行力” 全面进化

谷歌正式推出新一代旗舰级大模型家族 Gemini 3，这是自 2023 年 Gemini 系列首次亮相以来，谷歌在人工智能领域最全面、最具突破性的一次产品发布。作为闭源专有模型，G…

王浩然
2025年11月21日
000
AI前沿

Meta 豪掷 20 亿收购 AI 代理初创公司，宣称与中国切断一切联系

在科技巨头 Meta 的发展版图中，近期的一项收购行动引发了广泛关注。Meta 以 20 亿美元的价格收购了一家 AI 代理初创公司，这本是一次在 AI 领域的重大布局，然而，随之…

王浩然
2026年1月2日
000
AI前沿

本周人工智能：OpenAI 的新 Strawberry 模型可能很聪明，但速度却很慢

如果《The Information》中的一篇文章可信的话，本周在人工智能领域，OpenAI 的下一个重要产品发布即将到来。据The Information周二报道，OpenAI…

王浩然
2024年9月13日
000
AI前沿

OpenAI 推出其谷歌挑战者 ChatGPT Search

OpenAI 的谷歌挑战者终于来了。该公司周四推出了ChatGPT Search，这是今年夏天推出的 SearchGPT 原型的升级版。OpenAI 表示，ChatGPT Sea…

王浩然
2024年11月2日
000
AI前沿

DeepSeek 有助于加速威胁检测，但同时也引发了国家安全担忧

DeepSeek 及其 R1 模型不会浪费任何时间来实时重写网络安全 AI 规则，从初创公司到企业提供商等所有公司都在本月试行集成到他们的新模型中。 R1 是在中国开发的，基于纯强…

王浩然
2025年2月3日
000
AI前沿

OpenAI 雄心勃勃的增长战略伴随着巨大的财务风险

据 The Information最近的一份报告称， OpenAI的内部财务预测揭示了一项高风险战略，即将激进的收入目标与巨额预计损失相结合。该公司的计划凸显了快速发展的人工智能领…

点点
2024年10月11日
000
AI前沿

科技巨头的语音大战，亚马逊Claude让Alexa飞起，Cerebras速度惊人

亚马逊的Alexa一直是智能语音助手的佼佼者，现在有了Claude的加持，就像是给超级英雄穿上了新战衣。Claude的算法优化让Alexa的语音识别和处理能力大幅提升，反应速度和准确性都有了质的飞跃。

点点
2024年9月11日
000
AI前沿

无需微调：SAP 的 RPT-1 模型为商业任务带来即用型 AI

SAP 推出了一款全新的基础 “表格型” 模型，旨在替代部分通用大型语言模型（LLMs）。该公司称，这款名为 SAP RPT-1 的模型能显著降低企业对 AI 模型的训练需求，为商…

王浩然
2025年11月5日
000
AI前沿

OpenAI 聘请首位首席经济学家

OpenAI 聘请了其首位首席经济学家：Aaron Chatterji，他曾任美国总统乔·拜登 (Joe Biden) 商务部的首席经济学家和总统巴拉克·奥巴马 (Barack O…

王浩然
2024年10月24日
000
AI前沿

2025年，1X将在数百户家庭中测试人形机器人

随着科技的飞速发展，人形机器人正逐渐成为现实生活中的一部分。据最新消息，创新科技公司1X计划在2025年启动一项雄心勃勃的项目：在数百户家庭中测试其人形机器人的实际应用。这一举措标…

王浩然
2025年3月25日
000
AI前沿

这一届AI创业者：不敢再谈理想，怕伤钱

ChatGPT引发的人工智能热潮被疯狂追捧一年多后，AI行业开始陷入迷茫。距离OpenAI发布GPT-4已超过一年半，GPT-5还迟迟不见踪影，文生视频大模型Sora也没有全面开…

点点
2024年9月25日
000
AI前沿

企业对人工智能模型的判断：开源为何会胜出

企业界对开源大型语言模型 (LLM) 的使用正在迅速增加，这是由于企业在 AI 方面变得越来越成熟——寻求更强的控制力、定制化和成本效率。虽然 OpenAI 的 GP…

王浩然
2024年10月27日
000
首份，人工智能公约即将落地

人工智能公约

点点
AI前沿 2024年9月6日
000
AI前沿

暗流涌动：AI谄媚与黑暗模式的隐忧

在人工智能（AI）日新月异的今天，一次小小的更新却意外地掀起了轩然大波。年月中旬，OpenAI推出的ChatGPT-o版本，非但没有因其创新功能赢得满堂喝彩，反而因一种令人不安的倾…

王浩然
2025年5月15日
000
AI前沿

Sakana推出新型AI架构：连续思维机器，让模型像人脑一样自主推理

东京的人工智能初创公司Sakana，由前谷歌顶级AI科学家Llion Jones和David Ha等人联合创立，近日推出了一种全新的AI模型架构——连续思维机器（Continuou…

王浩然
2025年5月13日
000