强化学习
-
MIT衍生AI:革新认知,勇于承认无知以消除幻觉
在人工智能(AI)领域,追求高精度与可靠性一直是科研人员的核心目标。然而,AI系统在面对不确定性时的表现却往往不尽如人意,时常会产生误导性的“幻觉”——即输出与输入不符或完全错误的…
-
QwenLong-L1:突破当前大型语言模型的长文本推理挑战
阿里巴巴集团近日推出了一款名为QwenLong-L1的全新框架,该框架能够使大型语言模型(LLMs)在极长的输入文本上进行推理。这一发展有望开启一波新的企业应用浪潮,这些应用需要模…
-
Snowflake开源文本到SQL与Arctic推理模型:破解企业AI部署两大难题
在当今数据驱动的时代,企业对于人工智能(AI)的依赖日益加深,以期从海量数据中挖掘出有价值的洞察。然而,尽管AI技术取得了长足进步,企业在实际部署过程中仍面临诸多挑战。其中,文本到…
-
S3:全新RAG框架,以极少量数据训练搜索代理
在人工智能的广阔天地中,检索增强生成(RAG)系统正逐渐成为提升信息检索与生成能力的关键。近日,来自美国伊利诺伊大学厄巴纳-香槟分校的研究人员提出了一种名为S3的创新框架,该框架旨…
-
Mistral AI发布Devstral:强大的开源软件工程师代理模型,可在笔记本电脑上运行
法国AI模型制造商Mistral AI自去年秋季推出其强大的开源基础模型以来,便持续在AI领域展现出卓越的创新能力。然而,近期Mistral因发布了一款名为Medium 3的专有大…
-
Sakana推出新型AI架构:连续思维机器,让模型像人脑一样自主推理
东京的人工智能初创公司Sakana,由前谷歌顶级AI科学家Llion Jones和David Ha等人联合创立,近日推出了一种全新的AI模型架构——连续思维机器(Continuou…
-
DeepSeek-Prover-V2:搭建非正式与正式数学推理之间的桥梁
随着人工智能技术的不断进步,AI在解决各种复杂问题方面展现出了惊人的潜力。然而,在数学领域,尤其是在正式定理证明方面,AI仍面临巨大挑战。近期,DeepSeek-AI团队推出的De…
-
阿里巴巴的ZeroSearch:让AI学会自我搜索,训练成本直降88%
阿里巴巴集团的研究人员开发出了一种创新方法,有望显著降低训练AI系统进行信息搜索的成本和复杂性,甚至完全消除对昂贵商业搜索引擎API的依赖。这项技术被命名为“ZeroSearch”…
-
Microsoft发布Phi-4-reasoning-plus:小巧而强大的开源权重推理模型
近日,Microsoft Research宣布推出Phi-4-reasoning-plus,这是一款专为需要深入、结构化推理的任务设计的开源权重语言模型。该模型在Phi-4的基础上…
-
体验时代:自我学习的AI代理将遍布网络,如何做好准备
在人工智能领域,两位知名科学家——大卫·西尔弗和理查德·萨顿在一篇新论文中提出了一个引人注目的观点:人工智能即将进入一个全新的阶段,即“体验时代”。在这个阶段,AI系统将越来越少地…