
在AI芯片市场被英伟达长期主导的格局下,一家名为Positron的初创公司正凭借其专为推理任务设计的创新芯片架构发起挑战。这家成立仅15个月的公司近日宣布完成5160万美元A轮超额融资,其首款产品Atlas推理加速器已实现量产交付,下一代平台Titan也计划于2026年面世。
突破性技术优势
Positron的核心竞争力来自其”内存优先”的设计哲学。与传统GPU不同,Atlas芯片针对Transformer架构的内存需求进行专门优化,实现了93%的内存带宽利用率,远超GPU普遍的10-30%水平。技术数据显示,Atlas在运行前沿AI模型时,每瓦特性能和每美元性能达到英伟达H100的2-5倍,功耗降低66%。
公司CTO Thomas Sohmers指出:”现代AI推理已从计算密集型转向内存密集型,我们的设计使内存操作与计算操作比例接近1:1,这正是效率突破的关键。”这种架构特别适合生成式AI等需要快速模型服务的场景,目前已被Cloudflare等客户部署于其全球分布式数据中心。
差异化市场定位
Positron采取了三重差异化战略:
- 能效优先:Atlas系统支持0.5万亿参数模型,仅需2kW服务器功耗,且完全采用风冷设计
- 无缝兼容:直接支持Hugging Face模型和OpenAI API兼容端点,无需代码重写
- 基建友好:不需要液冷或高密度供电,可部署于现有数据中心环境
CEO Mitesh Agrawal强调:”我们不要求客户改变任何行为模式,这是替代方案能否被采纳的决定性因素。”这种务实策略使Positron在Lambda等云服务商和内容分发网络等垂直领域获得早期采用。
下一代技术布局
计划中的Titan平台将实现更大跨越:
- 采用定制”Asimov”芯片设计
- 单加速器配备2TB高速内存
- 支持最高16万亿参数模型
- 保持标准数据中心风冷要求
这一配置直指未来多万亿参数模型的需求,如传闻中的GPT-5等前沿模型。值得注意的是,Titan仍将维持对NVIDIA训练模型的直接支持,体现Positron”参与而非对抗CUDA生态”的战略定位。
市场挑战与机遇
尽管前景看好,Positron面临严峻市场环境:
- 竞争对手Groq已下调2025年收入预期
- 小型语言模型(SLM)兴起可能减少云端推理需求
- 英伟达在训练市场的优势可能向推理领域延伸
但公司管理层认为,轻型设备应用与重型基础设施处理将长期并存发展。Sohmers预测:”未来每人手机都可能搭载能力模型,但它们仍需依赖数据中心的大型模型生成深度洞察。”
供应链与地缘优势
Positron的另一个差异化优势是其美国本土化供应链:
- 首代芯片采用英特尔美国工厂制造
- 服务器组装集成全程本土完成
- 下一代虽转投台积电代工,但仍最大限度保留美国供应链
在当前地缘政治环境下,这一特点成为许多企业采购决策的关键考量因素。
商业模式创新
与许多AI硬件商不同,Positron坚持”纯硬件”商业模式:
- 不捆绑专有API或云服务
- 完全依靠芯片经济性说服客户
- 目前已获Valor Equity Partners等知名机构投资
Agrawal表示:”如果无法凭硬件本身的经济效益赢得客户,企业就不可能持续盈利。”这种聚焦可能帮助Positron在拥挤的AI芯片市场建立独特定位。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/chu-chuang-gong-si-positron-yi-nei-cun-you-hua-xin-pian