Liquid AI推出Hyena Edge模型:重塑大型语言模型,赋能边缘设备‌

Liquid AI推出Hyena Edge模型:重塑大型语言模型,赋能边缘设备‌

在人工智能领域,大型语言模型(LLMs)的发展如火如荼,但它们往往受限于庞大的计算需求和复杂的架构,难以在智能手机边缘设备上高效运行。然而,这一局面即将被打破。Liquid AI,这家源自麻省理工学院(MIT)的波士顿基础模型初创公司,近日宣布推出Hyena Edge模型,这一卷积基、多混合模型专为智能手机和其他边缘设备设计,有望彻底改变LLMs在边缘设备上的应用格局。

Hyena Edge模型是Liquid AI团队在国际学习表征大会(ICLR)2025前夕推出的重要成果。该模型摒弃了传统LLMs所依赖的Transformer架构,转而采用了一种全新的设计思路。通过巧妙地替换掉大部分注意力机制,Hyena Edge引入了来自Hyena-Y家族的门控卷积,从而在保持语言模型质量的同时,大幅提升了计算效率和内存使用效率。

在实际测试中,Hyena Edge展现出了令人瞩目的性能。在三星Galaxy S24 Ultra智能手机上,与参数相当的Transformer++模型相比,Hyena Edge在延迟、内存占用和基准测试结果方面均表现出色。特别是在处理长序列时,Hyena Edge的预填充和解码延迟优势更为明显,这对于需要快速响应的边缘设备应用至关重要。

Hyena Edge的出色表现得益于Liquid AI独有的合成定制架构(STAR)框架。该框架利用进化算法自动设计模型骨干,能够在多个硬件特定目标(如延迟、内存使用和质量)之间找到最佳平衡。通过STAR框架的不断迭代和优化,Hyena Edge得以在保持高效性的同时,不断提升语言模型的准确性和泛化能力。

值得一提的是,Hyena Edge的训练过程同样充满创新。它采用了1000亿个标记进行训练,并在多个标准基准测试上进行了评估,包括WikitextLambadaPiQAHellaSwagWinogrande以及ARC-easyARC-challenge等。在这些测试中,Hyena Edge不仅匹配或超过了GQA-Transformer++模型的性能,还在某些基准上取得了显著改进,如Wikitext和Lambada的困惑度得分以及PiQA、HellaSwag和Winogrande的准确率。

Hyena Edge的成功推出,标志着Liquid AI在推动LLMs向边缘设备迁移方面迈出了重要一步。该模型不仅为智能手机等边缘设备提供了强大的语言处理能力,还为AI应用的广泛部署和普及奠定了坚实基础。未来,随着更多边缘设备开始原生支持复杂的AI工作负载,Hyena Edge有望成为边缘优化AI的新标杆。

此外,Liquid AI还计划在未来几个月内开源一系列Liquid基础模型,包括Hyena Edge。这一举措将进一步促进AI技术的普及和发展,为构建更加智能、高效和通用的AI系统提供有力支持。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/liquid-ai-tui-chu-hyena-edge-mo-xing-chong-su-da-xing-yu

Like (0)
王 浩然的头像王 浩然作者
Previous 2025年4月26日
Next 2025年4月26日

相关推荐

发表回复

Please Login to Comment