监督微调
-
大语言模型的”流畅幻觉”:当推理超越训练边界时的系统性失效
亚利桑那州立大学(ASU)最新研究揭示了大型语言模型(LLM)中”思维链”(Chain-of-Thought, CoT)推理的本质缺陷。这项发表在2025年…
-
QwenLong-L1:突破当前大型语言模型的长文本推理挑战
阿里巴巴集团近日推出了一款名为QwenLong-L1的全新框架,该框架能够使大型语言模型(LLMs)在极长的输入文本上进行推理。这一发展有望开启一波新的企业应用浪潮,这些应用需要模…
-
d1推理框架:将AI响应时间从30秒缩短至3秒
研究人员近日推出了d1,这是一个使用强化学习(RL)的新型框架,旨在显著提升基于扩散的大型语言模型(dLLMs)的推理能力。尽管目前大部分注意力都集中在诸如GPT等自回归模型上,但…