泛化能力

AI前沿

GEPA革命：无需强化学习的LLM优化新范式‌

在AI优化技术迎来重大突破的今天，加州大学伯克利分校、斯坦福大学与Databricks联合研发的GEPA（Genetic-Pareto）框架，正以颠覆性方式重塑大型语言模型（LLM…

王浩然
2025年8月21日
000
AI前沿

‌大型语言模型究竟能记住多少信息？新研究给出了答案‌

在人工智能领域，大型语言模型（LLMs）如ChatGPT、Anthropic的Claude和Google的Gemini等，已成为推动技术进步的重要力量。这些模型通过训练海量的数据集…

王浩然
2025年6月7日
000
AI前沿

大语言模型定制：微调与上下文学习的较量

在人工智能领域，大语言模型（LLM）的定制已成为实现特定任务性能优化的关键步骤。近期，来自Google DeepMind与斯坦福大学的研究人员发布了一项关于微调（Fine-Tuni…

王浩然
2025年5月12日
000
AI前沿

SWiRL：打造如顶尖问题解决者般的AI商业应用新篇章

在AI技术日新月异的今天，斯坦福大学与谷歌DeepMind的研究人员携手推出了Step-Wise Reinforcement Learning（SWiRL）技术，旨在为大型语言模型…

王浩然
2025年4月23日
000
AI前沿

大型语言模型中的灾难性过度训练：研究人员的警告

在人工智能领域，大型语言模型（LLM）正逐渐成为研究和应用的核心。然而，随着这些模型规模的不断扩大和能力的不断增强，一个潜在的问题也逐渐浮出水面——灾难性过度训练。近日，研究人员纷…

王浩然
2025年3月31日
000
AI前沿

LLM新技术：控制CoT长度，优化推理，降低成本

一、引言在人工智能领域，大型语言模型（LLM）通过“链式思考”（Chain of Thought，简称CoT）进行推理已成为最新一代模型的关键特征。这种推理过程涉及将复杂问题分解…

王浩然
2025年3月17日
000
AI前沿

Google DeepMind发布新型AI模型以强化机器人控制能力‌

在人工智能领域，Google DeepMind一直以其前沿的技术和创新的研究引领着行业发展。近日，DeepMind团队再次取得突破，发布了一系列专为机器人控制设计的新型AI模型。这…

王浩然
2025年3月13日
000