推理能力
-
Anthropic 发布 Claude Sonnet 4.5,全力争夺 AI 智能体与编程领域主导地位
2025 年 9 月 29 日,人工智能企业 Anthropic 正式推出旗下 Claude 系列模型的重要更新版本 ——Claude Sonnet 4.5。这款新模型在自主任务执…
-
日本Sakana AI推出TreeQuest:多模型团队协作,效能超越单体大型语言模型30%
在人工智能领域,团队合作的力量正逐渐显现其无与伦比的优势。日本Sakana AI实验室最近推出了一项名为TreeQuest的创新技术,该技术能够让多个大型语言模型(LLM)在同一任…
-
Google发布Gemini 2.5 AI模型,挑战OpenAI企业市场霸主地位
Google在人工智能领域的竞争中迈出了决定性的一步,宣布其最强大的Gemini 2.5模型已准备好投入企业生产使用,并同时推出了一款旨在以成本和速度优势超越竞争对手的超高效变体。…
-
大型推理模型是否真的在“思考”?——苹果研究引发业界热议
在人工智能领域,关于大型推理模型(LRMs)是否具备真正“思考”或“推理”能力的讨论一直如火如荼。近期,苹果公司机器学习团队发布的一篇题为《思维的错觉》的研究论文,更是将这一话题推…
-
DeepSeek R1-0528:以开源之力挑战OpenAI o3与Google Gemini 2.5 Pro
在人工智能领域,开源模型正逐渐成为推动技术创新的重要力量。近期,中国初创企业DeepSeek发布的DeepSeek R1-0528版本,以其强大的推理能力和开放的许可协议,向业界巨…
-
微软推出新型Phi 4 AI模型,性能媲美远大规模系统
微软于本周三正式发布了多款全新的“开放”AI模型,其中最为引人注目的Phi 4系列模型在性能上已能与OpenAI的o3-mini相媲美,甚至在某些基准测试中展现出超越之势。这一系列…
-
并非越大越好:探讨数百万令牌大型语言模型的商业案例
在人工智能领域,大型语言模型(LLMs)正朝着数百万令牌的容量迈进,这一趋势引发了AI界的热烈讨论。模型如MiniMax-Text-01拥有400万令牌的容量,而Gemini 1.…
-
NVIDIA新推Llama 3.1 Nemotron Ultra,性能超越DeepSeek R1,体积仅其一半
在AI领域,大型语言模型(LLM)的竞争日益激烈,各大科技公司纷纷推出自己的旗舰产品,以期在这个充满挑战与机遇的市场中占据一席之地。近日,NVIDIA宣布推出其最新的LLM——Ll…
-
MetaScale利用自适应策略提升大型语言模型推理能力
重写与翻译后的内容 MetaScale利用自适应策略提升大型语言模型推理能力 引言 在人工智能领域,大型语言模型(LLM)的推理能力一直是研究者们关注的焦点。近期,MetaSc…
-
少即是多:加州大学伯克利分校与谷歌通过简单采样解锁大型语言模型潜力
在人工智能领域,大型语言模型(LLMs)的推理能力一直是研究者和开发者关注的焦点。近期,来自谷歌研究和加州大学伯克利分校的研究人员发表了一篇新论文,揭示了一种令人惊讶的简单测试时间…