指令模型

AI前沿

AI2 发布 Olmo 3.1：强化学习升级驱动推理能力跃升，全流程开源树立行业新标杆

艾伦人工智能研究所（Ai2）在 Olmo 3 基础上推出迭代版本 Olmo 3.1，通过延长强化学习（RL）训练时长、优化训练策略，显著提升模型在数学推理、指令遵循等核心能力上的表…

王浩然
2025年12月18日
000