指令模型
-
AI2 发布 Olmo 3.1:强化学习升级驱动推理能力跃升,全流程开源树立行业新标杆
艾伦人工智能研究所(Ai2)在 Olmo 3 基础上推出迭代版本 Olmo 3.1,通过延长强化学习(RL)训练时长、优化训练策略,显著提升模型在数学推理、指令遵循等核心能力上的表…
艾伦人工智能研究所(Ai2)在 Olmo 3 基础上推出迭代版本 Olmo 3.1,通过延长强化学习(RL)训练时长、优化训练策略,显著提升模型在数学推理、指令遵循等核心能力上的表…