推理能力
-
AI2 发布 Olmo 3.1:强化学习升级驱动推理能力跃升,全流程开源树立行业新标杆
艾伦人工智能研究所(Ai2)在 Olmo 3 基础上推出迭代版本 Olmo 3.1,通过延长强化学习(RL)训练时长、优化训练策略,显著提升模型在数学推理、指令遵循等核心能力上的表…
-
OpenAI 的 GPT – 5.2 已发布,企业需了解这些关键信息
OpenAI 正式推出了其迄今为止性能最为强大的模型系列 GPT – 5.2,此次发布并非简单的常规版本迭代,而是 OpenAI 聚焦职场自动化、深耕企业级客户市场的关…
-
Anthropic 发布 Claude Sonnet 4.5,全力争夺 AI 智能体与编程领域主导地位
2025 年 9 月 29 日,人工智能企业 Anthropic 正式推出旗下 Claude 系列模型的重要更新版本 ——Claude Sonnet 4.5。这款新模型在自主任务执…
-
日本Sakana AI推出TreeQuest:多模型团队协作,效能超越单体大型语言模型30%
在人工智能领域,团队合作的力量正逐渐显现其无与伦比的优势。日本Sakana AI实验室最近推出了一项名为TreeQuest的创新技术,该技术能够让多个大型语言模型(LLM)在同一任…
-
Google发布Gemini 2.5 AI模型,挑战OpenAI企业市场霸主地位
Google在人工智能领域的竞争中迈出了决定性的一步,宣布其最强大的Gemini 2.5模型已准备好投入企业生产使用,并同时推出了一款旨在以成本和速度优势超越竞争对手的超高效变体。…
-
大型推理模型是否真的在“思考”?——苹果研究引发业界热议
在人工智能领域,关于大型推理模型(LRMs)是否具备真正“思考”或“推理”能力的讨论一直如火如荼。近期,苹果公司机器学习团队发布的一篇题为《思维的错觉》的研究论文,更是将这一话题推…
-
DeepSeek R1-0528:以开源之力挑战OpenAI o3与Google Gemini 2.5 Pro
在人工智能领域,开源模型正逐渐成为推动技术创新的重要力量。近期,中国初创企业DeepSeek发布的DeepSeek R1-0528版本,以其强大的推理能力和开放的许可协议,向业界巨…
-
微软推出新型Phi 4 AI模型,性能媲美远大规模系统
微软于本周三正式发布了多款全新的“开放”AI模型,其中最为引人注目的Phi 4系列模型在性能上已能与OpenAI的o3-mini相媲美,甚至在某些基准测试中展现出超越之势。这一系列…
-
并非越大越好:探讨数百万令牌大型语言模型的商业案例
在人工智能领域,大型语言模型(LLMs)正朝着数百万令牌的容量迈进,这一趋势引发了AI界的热烈讨论。模型如MiniMax-Text-01拥有400万令牌的容量,而Gemini 1.…
-
NVIDIA新推Llama 3.1 Nemotron Ultra,性能超越DeepSeek R1,体积仅其一半
在AI领域,大型语言模型(LLM)的竞争日益激烈,各大科技公司纷纷推出自己的旗舰产品,以期在这个充满挑战与机遇的市场中占据一席之地。近日,NVIDIA宣布推出其最新的LLM——Ll…