扩散语言模型
-
蚂蚁集团发布万亿参数 AI 模型 Ling-1T:以双轨策略突破推理与效率瓶颈
中国金融科技巨头蚂蚁集团正式入局万亿参数 AI 模型赛道,推出开源语言模型 Ling-1T。这款模型以 “平衡计算效率与高阶推理能力” 为核心定位,在复杂数学推理任务中展现出竞争力…
-
d1推理框架:将AI响应时间从30秒缩短至3秒
研究人员近日推出了d1,这是一个使用强化学习(RL)的新型框架,旨在显著提升基于扩散的大型语言模型(dLLMs)的推理能力。尽管目前大部分注意力都集中在诸如GPT等自回归模型上,但…