初创公司Positron以内存优化芯片挑战英伟达AI推理市场霸主地位‌

初创公司Positron以内存优化芯片挑战英伟达AI推理市场霸主地位‌

在AI芯片市场被英伟达长期主导的格局下,一家名为Positron的初创公司正凭借其专为推理任务设计的创新芯片架构发起挑战。这家成立仅15个月的公司近日宣布完成5160万美元A轮超额融资,其首款产品Atlas推理加速器已实现量产交付,下一代平台Titan也计划于2026年面世。

突破性技术优势
Positron的核心竞争力来自其”内存优先”的设计哲学。与传统GPU不同,Atlas芯片针对Transformer架构的内存需求进行专门优化,实现了93%的内存带宽利用率,远超GPU普遍的10-30%水平。技术数据显示,Atlas在运行前沿AI模型时,每瓦特性能和每美元性能达到英伟达H100的2-5倍,功耗降低66%。

公司CTO Thomas Sohmers指出:”现代AI推理已从计算密集型转向内存密集型,我们的设计使内存操作与计算操作比例接近1:1,这正是效率突破的关键。”这种架构特别适合生成式AI等需要快速模型服务的场景,目前已被Cloudflare等客户部署于其全球分布式数据中心。

差异化市场定位
Positron采取了三重差异化战略:

  1. 能效优先‌:Atlas系统支持0.5万亿参数模型,仅需2kW服务器功耗,且完全采用风冷设计
  2. 无缝兼容‌:直接支持Hugging Face模型和OpenAI API兼容端点,无需代码重写
  3. 基建友好‌:不需要液冷或高密度供电,可部署于现有数据中心环境

CEO Mitesh Agrawal强调:”我们不要求客户改变任何行为模式,这是替代方案能否被采纳的决定性因素。”这种务实策略使Positron在Lambda等云服务商和内容分发网络等垂直领域获得早期采用。

下一代技术布局
计划中的Titan平台将实现更大跨越:

  • 采用定制”Asimov”芯片设计
  • 单加速器配备2TB高速内存
  • 支持最高16万亿参数模型
  • 保持标准数据中心风冷要求

这一配置直指未来多万亿参数模型的需求,如传闻中的GPT-5等前沿模型。值得注意的是,Titan仍将维持对NVIDIA训练模型的直接支持,体现Positron”参与而非对抗CUDA生态”的战略定位。

市场挑战与机遇
尽管前景看好,Positron面临严峻市场环境:

  • 竞争对手Groq已下调2025年收入预期
  • 小型语言模型(SLM)兴起可能减少云端推理需求
  • 英伟达在训练市场的优势可能向推理领域延伸

但公司管理层认为,轻型设备应用与重型基础设施处理将长期并存发展。Sohmers预测:”未来每人手机都可能搭载能力模型,但它们仍需依赖数据中心的大型模型生成深度洞察。”

供应链与地缘优势
Positron的另一个差异化优势是其美国本土化供应链:

  • 首代芯片采用英特尔美国工厂制造
  • 服务器组装集成全程本土完成
  • 下一代虽转投台积电代工,但仍最大限度保留美国供应链

在当前地缘政治环境下,这一特点成为许多企业采购决策的关键考量因素。

商业模式创新
与许多AI硬件商不同,Positron坚持”纯硬件”商业模式:

  • 不捆绑专有API或云服务
  • 完全依靠芯片经济性说服客户
  • 目前已获Valor Equity Partners等知名机构投资

Agrawal表示:”如果无法凭硬件本身的经济效益赢得客户,企业就不可能持续盈利。”这种聚焦可能帮助Positron在拥挤的AI芯片市场建立独特定位。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/chu-chuang-gong-si-positron-yi-nei-cun-you-hua-xin-pian

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年7月30日
Next 2025年7月30日

相关推荐

发表回复

Please Login to Comment