监督微调 | 点点资讯

AI前沿

亚利桑那州立大学(ASU)最新研究揭示了大型语言模型(LLM)中”思维链”(Chain-of-Thought, CoT)推理的本质缺陷。这项发表在2025年…

2025年8月22日

000

AI前沿

阿里巴巴集团近日推出了一款名为QwenLong-L1的全新框架，该框架能够使大型语言模型（LLMs）在极长的输入文本上进行推理。这一发展有望开启一波新的企业应用浪潮，这些应用需要模…

2025年6月1日

000

AI前沿

研究人员近日推出了d1，这是一个使用强化学习（RL）的新型框架，旨在显著提升基于扩散的大型语言模型（dLLMs）的推理能力。尽管目前大部分注意力都集中在诸如GPT等自回归模型上，但…

2025年4月29日

000