初创公司Positron以内存优化芯片挑战英伟达AI推理市场霸主地位‌

王浩然 • 2025年7月30日下午6:00 • AI前沿 • 494 views

在AI芯片市场被英伟达长期主导的格局下，一家名为Positron的初创公司正凭借其专为推理任务设计的创新芯片架构发起挑战。这家成立仅15个月的公司近日宣布完成5160万美元A轮超额融资，其首款产品Atlas推理加速器已实现量产交付，下一代平台Titan也计划于2026年面世。

‌突破性技术优势‌
Positron的核心竞争力来自其”内存优先”的设计哲学。与传统GPU不同，Atlas芯片针对Transformer架构的内存需求进行专门优化，实现了93%的内存带宽利用率，远超GPU普遍的10-30%水平。技术数据显示，Atlas在运行前沿AI模型时，每瓦特性能和每美元性能达到英伟达H100的2-5倍，功耗降低66%。

公司CTO Thomas Sohmers指出：”现代AI推理已从计算密集型转向内存密集型，我们的设计使内存操作与计算操作比例接近1:1，这正是效率突破的关键。”这种架构特别适合生成式AI等需要快速模型服务的场景，目前已被Cloudflare等客户部署于其全球分布式数据中心。

‌差异化市场定位‌
Positron采取了三重差异化战略：

‌能效优先‌：Atlas系统支持0.5万亿参数模型，仅需2kW服务器功耗，且完全采用风冷设计
‌无缝兼容‌：直接支持Hugging Face模型和OpenAI API兼容端点，无需代码重写
‌基建友好‌：不需要液冷或高密度供电，可部署于现有数据中心环境

CEO Mitesh Agrawal强调：”我们不要求客户改变任何行为模式，这是替代方案能否被采纳的决定性因素。”这种务实策略使Positron在Lambda等云服务商和内容分发网络等垂直领域获得早期采用。

‌下一代技术布局‌
计划中的Titan平台将实现更大跨越：

采用定制”Asimov”芯片设计
单加速器配备2TB高速内存
支持最高16万亿参数模型
保持标准数据中心风冷要求

这一配置直指未来多万亿参数模型的需求，如传闻中的GPT-5等前沿模型。值得注意的是，Titan仍将维持对NVIDIA训练模型的直接支持，体现Positron”参与而非对抗CUDA生态”的战略定位。

‌市场挑战与机遇‌
尽管前景看好，Positron面临严峻市场环境：

竞争对手Groq已下调2025年收入预期
小型语言模型(SLM)兴起可能减少云端推理需求
英伟达在训练市场的优势可能向推理领域延伸

但公司管理层认为，轻型设备应用与重型基础设施处理将长期并存发展。Sohmers预测：”未来每人手机都可能搭载能力模型，但它们仍需依赖数据中心的大型模型生成深度洞察。”

‌供应链与地缘优势‌
Positron的另一个差异化优势是其美国本土化供应链：

首代芯片采用英特尔美国工厂制造
服务器组装集成全程本土完成
下一代虽转投台积电代工，但仍最大限度保留美国供应链

在当前地缘政治环境下，这一特点成为许多企业采购决策的关键考量因素。

‌商业模式创新‌
与许多AI硬件商不同，Positron坚持”纯硬件”商业模式：

不捆绑专有API或云服务
完全依靠芯片经济性说服客户
目前已获Valor Equity Partners等知名机构投资

Agrawal表示：”如果无法凭硬件本身的经济效益赢得客户，企业就不可能持续盈利。”这种聚焦可能帮助Positron在拥挤的AI芯片市场建立独特定位。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/chu-chuang-gong-si-positron-yi-nei-cun-you-hua-xin-pian

Like (0)

王浩然作者

0 0

Stack Overflow数据揭示”基本正确”AI代码带来的隐性生产力损耗‌

Previous 2025年7月30日

Acree发布全新企业级可定制AI模型AFM-4.5B：基于严格过滤的高质量数据训练‌

Next 2025年7月30日

AI前沿

AI的道德准则：Anthropic分析70万Claude对话后的惊人发现

在人工智能（AI）日益融入我们日常生活的今天，AI的行为和道德准则成为了公众关注的焦点。近日，由前OpenAI员工创立的AI公司Anthropic发布了一项震撼业界的研究报告，该报…

王浩然
2025年4月22日
000
AI前沿

国防中的人类学和元科学：军事人工智能应用的新前沿

想象一下这样的未来：无人机以惊人的精度运行，战场策略实时调整，军事决策由不断从每次任务中学习的人工智能系统提供支持。这样的未来不再遥不可及。相反，它正在发生。人工智能 (AI)已从…

王浩然
2024年12月23日
000
AI前沿

Manus推出突破性”广域研究”功能：同时启动100+AI代理的并行研究新模式

新加坡AI初创公司Manus近期推出了一项名为”广域研究”(Wide Research)的创新功能，这项技术突破性地实现了同时启动100多个AI代理进行并行…

王浩然
2025年8月7日
000
AI前沿

ChatGPT瞄准企业市场，工作空间集成升级引领新潮流‌

在人工智能（AI）技术迅猛发展的今天，每一次的技术革新都在为企业带来前所未有的变革机遇。近期，OpenAI再次发力，宣布对ChatGPT进行重大升级，通过引入工作空间集成功能，正式…

王浩然
2025年6月6日
000
AI前沿

Cerebras 成为世界上最快的 DeepSeek R1 主机，速度比 Nvidia GPU 快 57 倍

Cerebras Systems今天宣布，它将在美国服务器上托管 DeepSeek 的突破性 R1 人工智能模型，承诺速度比基于 GPU 的解决方案快 57 倍，同时将敏感数据保留…

王浩然
2025年2月1日
000
AI 战略停滞之谜：阻碍落地的三大陷阱与破局之道

在全球 AI 市场规模突破 5000 亿美元的狂欢背景下，企业 AI 战略的推进却普遍陷入 “雷声大、雨点小” 的困境：Gartner 数据显示，全球 60% 的企业 AI 项目未…

王浩然
AI前沿 2025年10月14日
000
AI前沿

当进化的攻击超越传统防御：为何亟需主动式 AI 安全体系

当前网络安全领域正陷入 “被动追赶” 的困境 —— 新闻中不断涌现的数据泄露、勒索软件攻击与新型攻击手段，让防御者疲于应对，而多数企业的防护体系仍停留在 “网络有明确边界、攻击者行…

王浩然
2025年12月8日
000
AI前沿

Brex如何凭借拥抱混乱，紧跟AI步伐

在人工智能（AI）技术日新月异的时代，企业如何快速适应并有效利用这一技术，成为了关乎其未来发展的关键。对于Brex这家企业信用卡公司而言，面对AI技术的迅猛崛起，它们没有选择按部就…

王浩然
2025年7月11日
000
AI前沿

LLM 汽车：人机通信领域的突破

随着自动驾驶汽车 (AV) 逐渐普及，一个重大挑战仍然存在：弥合人类乘客和机器人司机之间的沟通鸿沟。尽管自动驾驶汽车在复杂道路环境中的导航方面取得了显著进步，但它们往往难以理解人类…

点点
2024年9月20日
000
AI前沿

从数据到决策：First Insight高管揭秘AI如何重构零售决策逻辑

在零售行业正经历前所未有的快速变革之际，如何将消费者洞察转化为可落地的业务决策，成为了品牌和零售商们共同面临的核心挑战。First Insight首席增长与战略官Viki Zaba…

王浩然
2026年2月2日
000
AI前沿

亚马逊Prime Day创下240亿美元电商销售额纪录，生成式AI流量激增3300%‌

亚马逊年度购物盛事Prime Day再次刷新美国电商销售纪录，根据Adobe Analytics的最新分析报告，在7月8日至11日为期四天的促销活动中，美国电商总销售额达到241亿…

王浩然
2025年7月17日
000
AI前沿

2026年AI赋能行政助理：从时间管理者到效能倍增器的角色重塑

在2026年的职场生态中，行政助理（EA）的角色正经历着前所未有的变革。仅仅两年时间，这个曾经以时间管理、平衡高管工作与生活为核心的岗位，已经进化为企业高管的“效能倍增器”，而AI…

王浩然
2026年2月7日
000
AI前沿

Salesforce 发现，93% 的 IT 领导者看到了 AI 代理的价值，但难以实现

每个人都在谈论人工智能代理。但到目前为止，很多都还只是说说而已。 Salesforce 表示，这种情况将在 2025 年发生改变——人工智能代理终于成为现实。根据其集成…

王浩然
2025年2月4日
000
AI前沿

Miravoice获630万美元种子轮融资，AI语音代理重塑市场调研与民意调查格局

在AI技术持续渗透各行各业、重构数据收集与分析方式的当下，电话调研这一领域却始终未能摆脱高度依赖人工的困境。如今，专注于AI语音技术的初创公司Miravoice正试图打破这一局面，…

王浩然
2026年4月6日
000
AI前沿

AI时代下医疗营收周期现代化：从效率优先到风险预判的转型

在过去相当长的时间里，医疗行业的营收周期现代化几乎等同于“提速”。为了优化营收流程，医院和医疗系统纷纷投入资金，升级那些能够减少人工录入、提升资格验证效率、加快账单周期的系统。这些…

王浩然
2026年2月20日
000
AI前沿

Uber 与 AI 公司联手开发自动驾驶汽车

Uber正在与英国人工智能公司Wayve合作开发自动驾驶汽车。这家叫车公司表示，将与汽车制造商合作，使用这家位于伦敦的初创公司的人工智能解决方案。这将为车辆提供 4 级自动驾驶…

点点
2024年9月5日
000
AI前沿

Reply 预制 AI 应用：加速企业 AI 规模化落地的关键解决方案

当前，企业在规模化采用 AI 时普遍面临严峻挑战，部署速度缓慢成为突出痛点，背后交织着实施复杂度高、系统集成难度大、定制化需求难满足等多重问题。生成式 AI 虽具备强大能力，但对于…

王浩然
2025年10月6日
000
AI前沿

人工智能不会改善你的营销，除非你先改善数据‌

人工智能已从营销领域的实验性工具转变为实际运营工具。如今，AI能够撰写内容、推荐产品、跨平台和渠道个性化用户体验，并在客户生命周期中自动化工作流程。然而，尽管AI技术迅速普及，实际…

王浩然
2025年8月15日
000
AI咨询蜜月期终结：技术顾问面临ROI危机，务实派将成赢家

当ChatGPT等大语言模型掀起AI热潮时，技术咨询公司曾站在风口之上。它们迅速拥抱新技术，推出动辄数百万甚至上千万美元的多年期AI数字化转型项目，而急于追赶技术潮流、担心被时代淘…

王浩然
AI前沿 2026年3月30日
000
AI前沿

亚马逊推出了一款视频生成器——但仅用于广告

与其竞争对手谷歌一样，亚马逊也推出了一款人工智能视频生成器——但目前它仅面向广告商，而且功能有些有限。今天，在 Accelerate 大会上，亚马逊推出了视频生成器，经过一定程度…

王浩然
2024年9月21日
000

发表回复

Please Login to Comment

初创公司Positron以内存优化芯片挑战英伟达AI推理市场霸主地位‌

相关推荐

发表回复