首页
AI前沿
技术评测
AI工具
生成式人工智能
图像生成
AI快讯
登录
注册
LLM 训练优化
AI前沿
谷歌新 AI 训练方法 SRL:助力小模型攻克复杂推理,平衡效率与性能
谷歌云与加州大学洛杉矶分校(UCLA)的研究人员提出一种名为 “监督强化学习(Supervised Reinforcement Learning, SRL)” 的新型强化学习框架,…
王 浩然
2025年11月19日
0
0
0