
在AI与高性能计算(HPC)需求爆发的当下,传统CPU与GPU架构正逐渐逼近性能、功耗与扩展性的极限。以色列半导体企业NextSilicon正试图以一款名为Maverick-2的智能计算加速器,重构算力硬件与工作负载的关系。近日,该公司CEO埃拉德·拉兹(Elad Raz)在Unite.AI的访谈中,详细阐述了这家成立于2017年的企业如何以“硬件适配工作负载”的核心理念,为数据中心与超算市场带来变革。
### 从童年爱好到行业痛点:NextSilicon的诞生契机
拉兹的科技生涯始于童年对计算机的痴迷——他至今仍收藏着早年拆解研究的Commodore 64和Atari设备。这种对底层技术的热爱,推动他在精英军事工程、半导体企业高管、创业与投资等多个领域积累了深厚经验。在将前一家公司出售给Mellanox后,拉兹注意到行业中一个反复出现的痛点:随着计算工作负载日益复杂,传统架构始终要求工作负载去适配硬件,而非反过来。
“我们一直在思考,能不能彻底扭转这种关系?”拉兹回忆道,“让计算架构主动适配工作负载,而不是让开发者为了适配硬件不断改写代码。”这一疑问成为NextSilicon创立的原点,也催生了该公司核心的智能计算架构(ICA)理念——将算法设计与硬件能力实时结合,打破传统冯·诺依曼架构的束缚。
### Maverick-2:重新定义自适应计算
作为NextSilicon的旗舰产品,Maverick-2智能计算加速器的核心差异在于其“软件定义、硬件适配”的设计思路。与传统CPU、GPU或FPGA不同,这款加速器采用数据流架构,让计算进程跟随数据可用性推进,而非由程序计数器驱动指令执行。这种设计使其能够实时创建软件定义的虚拟处理单元,根据工作负载的变化动态调整硬件配置。
“传统架构是为通用场景设计的,从未考虑过现代AI和HPC工作负载的复杂需求。”拉兹解释说,“无论是气候模拟、粒子物理还是AI大模型推理,这些工作负载都有复杂的数据依赖和不规则的内存访问模式,传统硬件往往会在此类场景中出现性能瓶颈。”
Maverick-2的性能表现印证了这一设计的优势:相比GPU,它能实现4倍以上的每瓦性能提升,对比高端CPU更是达到20倍以上,同时可将运营成本降低一半以上。这种提升并非来自理论峰值,而是通过持续的自适应优化,在真实工作负载中维持高效能。
### 突破生态壁垒:无需改写代码的即插即用
对于开发者而言,Maverick-2最具吸引力的特性之一是对现有生态的兼容性。它原生支持C/C++、Fortran、OpenMP和Kokkos等主流编程语言与框架,开发者无需改写代码即可直接运行现有应用。同时,NextSilicon正在积极开发对CUDA、ROCm以及TensorFlow、PyTorch等AI框架的支持,彻底打破厂商锁定的困境。
“开发者们喜欢这种真正的‘即插即用’体验。”拉兹表示,“他们可以在不中断现有工作流的情况下,评估和采用新架构,无需承担昂贵的代码重写成本。”这种开放的生态策略,让NextSilicon在竞争激烈的加速器市场中脱颖而出——客户无需为了切换硬件而重构整个技术栈。
### 实时优化的秘密:遥测驱动的自适应循环
Maverick-2的自适应能力背后,是一套基于遥测数据的实时优化系统。在运行过程中,芯片会监测数百项性能指标,包括内存带宽、资源利用率、队列深度等,这些数据会被实时输入运行时优化器。如果当前硬件配置不再适配工作负载的变化,系统会在毫秒级时间内重新分配资源、调整数据路径和计算流水线,整个过程无需中断应用运行。
“这就像一个持续的闭环优化过程。”拉兹比喻道,“芯片会不断‘感知’工作负载的变化,并自动调整自身配置,始终保持最佳性能状态。”不过他也坦言,任何架构都存在权衡:对于高度可预测的固定功能工作负载,Maverick-2的自适应优势可能不如专门优化的GPU明显,但在复杂、不规则的工作负载中,其性能提升是革命性的。
### 先攻HPC再拓AI:以硬核场景验证技术实力
在众多初创企业纷纷涌入AI芯片赛道时,NextSilicon选择先从HPC市场切入。拉兹解释说,HPC代表了计算复杂性的前沿,无论是气候建模、粒子物理还是生命科学,这些场景对算力的需求最为严苛。如果能在HPC领域证明Maverick-2的能力,那么进入AI市场就是水到渠成的事。
“在HPC市场的深耕,让我们获得了真实世界的性能数据和行业信誉。”拉兹说,“我们没有为了追逐短期AI热点而妥协架构设计,而是先在最具挑战性的场景中打磨产品。”如今,Maverick-2已在多个旗舰项目中得到应用:在美国桑迪亚国家实验室的Spectra超级计算机中,它无需修改代码即可实现显著的性能提升;在ODISSEE项目中,它将帮助处理欧洲核子研究中心(CERN)和平方公里阵列天文台(SKAO)产生的EB级数据,大幅缩短物理分析和天文发现的周期。
### 3亿美元融资背后:加速技术落地与市场扩张
截至目前,NextSilicon已累计融资超过3亿美元。拉兹透露,这笔资金主要用于三个方向:一是推动架构的根本性创新,而非渐进式改进;二是扩大制造和供应链规模,以满足不断增长的客户需求;三是拓展软件生态系统,加快客户的集成与部署进程。此外,资金还帮助NextSilicon与超算中心和云服务商建立战略合作伙伴关系,加速从概念到部署的落地过程。
### 差异化竞争:超越芯片的技术公司
面对Cerebras、SambaNova和英伟达等竞争对手,NextSilicon将自己定位为“技术公司”而非单纯的“芯片公司”。拉兹强调,NextSilicon的核心优势在于为每个工作负载提供自适应优化,同时避免客户陷入专有生态的锁定。随着AI工作负载从单纯的模型训练转向推理、大上下文理解等更复杂的场景,动态内存访问、可变长度计算和自适应资源分配的需求日益凸显,而这些正是固定架构难以解决的问题。
“行业目前被固定架构主导,但我们提供了一种截然不同的选择。”拉兹表示,“AI正在从‘规模驱动’转向‘智能驱动’,更大的模型需要更灵活的计算能力。在这个转型过程中,自适应架构将不再是可选的创新,而是必备的基础设施。”
从童年的计算机爱好者到推动计算架构变革的创业者,拉兹的经历印证了技术创新往往源于对行业痛点的深刻洞察。NextSilicon的实践表明,当硬件开始主动适配工作负载,而非让开发者去迁就硬件时,算力的边界将被重新定义。在AI与HPC融合的时代,这种自适应计算架构或许将成为解锁下一代算力的关键。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/nextsilicon-ceo-elad-raz-yi-zi-shi-ying-ji-suan-jia-gou-da