LLM 训练优化

AI前沿

谷歌新 AI 训练方法 SRL：助力小模型攻克复杂推理，平衡效率与性能

谷歌云与加州大学洛杉矶分校（UCLA）的研究人员提出一种名为 “监督强化学习（Supervised Reinforcement Learning, SRL）” 的新型强化学习框架，…

王浩然
2025年11月19日
000