首页
AI前沿
技术评测
AI工具
生成式人工智能
图像生成
AI快讯
登录
注册
diffu-GRPO
AI前沿
d1推理框架:将AI响应时间从30秒缩短至3秒
研究人员近日推出了d1,这是一个使用强化学习(RL)的新型框架,旨在显著提升基于扩散的大型语言模型(dLLMs)的推理能力。尽管目前大部分注意力都集中在诸如GPT等自回归模型上,但…
王 浩然
2025年4月29日
0
0
0