大语言模型定制：微调与上下文学习的较量

王浩然 • 2025年5月12日下午5:00 • AI前沿 • 308 views

在人工智能领域，大语言模型（LLM）的定制已成为实现特定任务性能优化的关键步骤。近期，来自Google DeepMind与斯坦福大学的研究人员发布了一项关于微调（Fine-Tuning）与上下文学习（In-Context Learning, ICL）在LLM定制中效果对比的研究。这项研究不仅深入探讨了两种方法的优缺点，还提出了一种结合两者优势的新策略，为LLM在现实任务中的应用提供了宝贵的指导。

微调与上下文学习的核心差异

微调，作为一种常见的LLM定制方法，涉及在预训练模型的基础上，使用特定任务的较小数据集进行进一步训练。这一过程调整模型的内部参数，使其能够学习到新的知识和技能，从而针对特定任务进行优化。然而，微调的一个潜在缺点是可能导致模型在原始预训练任务上的泛化能力下降，即所谓的“过拟合”现象。

相比之下，上下文学习则是一种非参数化的方法，它不需要改变模型的底层参数。在ICL中，模型通过直接在输入提示中提供任务示例来指导LLM。这些示例作为上下文信息，帮助模型理解如何处理类似的新查询。这种方法的一个显著优势是保留了模型的泛化能力，因为它没有改变模型的原始参数。然而，ICL在计算成本上可能更高，因为每次推理时都需要提供额外的上下文信息。

研究方法与发现

为了全面比较微调与上下文学习的泛化能力，研究人员构建了具有复杂、自洽结构的“控制合成数据集”，如虚构的家族树或概念层次结构。为避免模型利用预训练期间可能接触到的信息，所有名词、形容词和动词都被替换为无意义的术语。

随后，他们使用这些数据集对Gemini 1.5 Flash模型进行了微调，并通过在测试问题前提供整个训练数据集（或大型子集）作为上下文，评估了ICL的效果。结果表明，在数据匹配的设置下，ICL在泛化能力上优于标准的微调方法。特别是在处理关系反转或逻辑推断等任务时，使用ICL的模型表现更佳。而未经过微调或ICL的预训练模型表现不佳，这进一步证明了测试数据的新颖性。

结合两者优势的新策略

鉴于ICL在泛化能力上的优势以及微调在特定任务性能上的提升，研究人员提出了一种创新方法：将ICL推断添加到微调数据中，以增强微调过程。这种方法的核心思想是利用LLM自身的ICL能力生成更多样化和丰富推断的示例，然后将这些增强后的示例添加到用于微调的数据集中。

实验证明，这种增强的微调方法不仅显著提高了模型的泛化能力，还超越了标准的微调和纯ICL方法。例如，如果公司文档中提到“XYZ是分析数据的内部工具”，结合ICL和增强微调的模型将更有效地回答相关问题，如“存在哪些用于数据分析的内部工具？”。

对企业应用的影响与启示

对于企业而言，这项研究为LLM的定制提供了重要指导。通过投资创建ICL增强的数据集，开发者可以构建出具有更强泛化能力的微调模型。这将有助于开发出更健壮、更可靠的LLM应用，这些应用能够在多样化的真实世界输入上表现出色，同时避免了持续推理时间成本高昂的问题。

尽管增强微调会增加数据准备和模型训练的成本，但长期来看，这种投资将带来更高的回报。因为与每次模型使用时都需要昂贵计算的ICL相比，增强微调在多次使用模型时能够摊销成本。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/da-yu-yan-mo-xing-ding-zhi-wei-tiao-yu-shang-xia-wen-xue-xi

上下文学习企业应用策略增强微调大语言模型微调控制实验数据集合成模型性能优化泛化能力计算成本

Like (0)

王浩然作者

0 0

当SOC团队在凌晨2:13分遇袭：生成式AI攻击链如何利用遥测延迟

Previous 2025年5月12日

MCP与创新悖论：为何开放标准将拯救AI于水火之中

Next 2025年5月12日

Lightning AI与Voltage Park完成合并，打造全栈式AI云平台新范式

在AI基础设施与工具链加速整合的浪潮中，Lightning AI与Voltage Park的合并成为了行业关注的焦点。近日，两家公司正式宣布完成合并，将AI原生软件与大规模GPU基…

王浩然
AI前沿 2026年1月25日
000
AI前沿

尽管人工智能军备竞赛激烈，但我们仍将迎来多模式未来

每周，有时甚至每天，都会有一个新的最先进的人工智能模型诞生。随着我们进入 2025 年，新模型的发布速度令人眼花缭乱，甚至令人精疲力竭。过山车的曲线继续呈指数级增长，疲劳和惊奇已成…

王浩然
2024年12月30日
000
AI前沿

AI赋能职场安全：将事故数据转化为可落地的预防行动

每年，全球各行各业的职场安全团队都会产生海量的事故数据，从制造业的设备故障记录，到建筑业的高空作业隐患报告，再到公共事业领域的操作失误记录，这些数据涵盖了事故报告、未遂事件、危险源…

王浩然
2026年2月19日
000
AI前沿

“每一毫秒都很重要”：为什么电动方程式车队选择 Cato Networks 来连接其维修站

最近采访了保时捷赛车运动IT 主管 Friedemann Kurz ，他数十年的经验使他成为将技术与高风险赛车相结合的领导者。 Kurz 负责监管泰格豪雅保时捷电动方程式车队的 I…

王浩然
2024年12月1日
000
AI前沿

人工智能的”锯齿状智能”现象：为何AI能解奥数难题却做不好小学数学‌

2025年，人工智能领域迎来一个耐人寻味的里程碑——谷歌DeepMind和OpenAI的系统在国际数学奥林匹克竞赛中斩获金牌，这些AI模型解决的难题全球仅有少数顶尖青年数学家能够攻…

王浩然
2025年9月30日
000
AI前沿

仓库中的机器人经过人工智能训练，可实现更快的分类

Ambi Robotics 最近发布了 Prime-1，该公司称这是第一个用于商业仓库运营中部署的机器人分拣机的 AI 基础模型。 Prime-1 代表可立即投入生产的工业操作专家…

王浩然
2025年1月26日
000
AI前沿

扩展 AI：平台最佳实践

企业现在投入大量资金来构建和不断发展世界一流的企业平台，使 AI 用例能够随着时间的推移而构建、部署、扩展和发展。许多公司历来都采用联合方式构建平台，以构建功能和特性来支持其业务各…

王浩然
2024年12月12日
000
AI前沿

快速行动但不鲁莽：如何平衡负责任的 AI 应用与创新

2025 年 10 月 29 日，Solvd 公司首席技术官斯凯勒・罗巴克（Skylar Roebuck）发表深度分析指出，当前 AI 行业正深陷 “快速创新与风险管控失衡” 的困…

王浩然
2025年10月30日
000
AI前沿

Nvidia 推出 Omniverse 实时物理数字孪生

Nvidia 宣布了其 Nvidia Omniverse Blueprint，这是一项使行业软件开发人员能够构建具有逼真的实时物理特性的数字孪生技术。它使航空航天、汽车、制造、能…

王浩然
2024年11月20日
000
AI前沿

AI 芯片厂商 Cerebras 完成 11 亿美元融资，估值达 81 亿美元，加速挑战英伟达地位

2025 年 10 月 1 日，总部位于美国硅谷的 AI 芯片厂商 Cerebras Systems 宣布完成规模达 11 亿美元的 G 轮融资，公司估值由此攀升至 81 亿美元。…

王浩然
2025年10月9日
000
AI前沿

小鹏汽车在慕尼黑车展发布超越汽车的AI生态系统：重新定义未来出行边界‌

在2025年慕尼黑国际车展的聚光灯下，中国新能源汽车制造商小鹏汽车以”AI改变世界”为主题，向全球展示了其突破传统汽车制造商边界的AI生态系统战略。这场发布…

王浩然
2025年9月11日
000
AI前沿

AI可穿戴设备1.0：Humanes的AI胸针是否过于野心勃勃？

自2021年11月1日起，Yahoo服务套件在中国大陆已无法访问，但这并不影响我们在全球其他地区的讨论。今日，我们聚焦于AI可穿戴设备领域，特别是Humanes推出的AI胸针项目。…

王浩然
2025年2月25日
000
AI前沿

这些 Planetly 前员工对离职感到不满，他们正在利用人工智能来完善碳核算

初创公司员工通常会继续创办有趣的企业，并将从零开始创办公司时获得的经验作为新工作的基础。但并非所有这些经验都是积极的，有时，不尽人意的退出比其他任何事情都更能激发创始人的热情。对…

王浩然
2024年10月10日
000
AI前沿

Shutterstock 与 Lightricks 合作率先推出“研究许可”模式，降低 AI 训练数据的门槛

Shutterstock正在通过一种新颖的“研究许可”方法重塑 AI 公司访问训练数据的方式，并率先与 AI 创意技术公司Lightricks合作。今天宣布的合作允许 Lightr…

王浩然
2024年12月16日
000
AI前沿

从金融科技到活动智能：Voxo CEO揭秘AI对话分析的进化之路

在AI技术重塑各行各业的当下，对话分析与活动智能正成为企业挖掘实时价值的新赛道。Voxo AI作为这一领域的创新者，凭借AI驱动的实时对话分析能力，正在改变会议、论坛等活动的内容生…

王浩然
2026年2月3日
000
AI前沿

人机协同（HITL）AI 在高风险医疗领域的重要性：以协作筑牢安全防线

iMerit Technology 医疗与生命科学人工智能副总裁 Sina Bari 博士在《Importance of Human-in-the-Loop (HITL) AI f…

王浩然
2025年11月18日
000
AI前沿

智能体AI重塑反洗钱合规：五大策略赋能金融风控

过去一年，智能体AI（Agentic AI）无疑是科技领域的焦点话题。从AWS与OpenAI联手推进高级AI工作负载，到零售、政府、金融服务等全行业的广泛落地，AI智能体正深度融入…

王浩然
2026年1月26日
000
AI前沿

出现了一种神秘的新图像生成模型

一种神秘的新图像生成模型在众包人工智能分析基准上击败了 Midjourney、Black Forest Labs 和 OpenAI 的模型。该模型名为“ red_pa nda…

王浩然
2024年10月29日
000
AI前沿

AI 颠覆 “自建 vs 采购”：企业软件决策的范式革命

AI 的普及彻底打破了企业软件 “自建（Build）” 与 “采购（Buy）” 的传统二元决策框架。过去数十年，企业遵循 “核心业务自建、非核心业务采购” 的逻辑 —— 自建需投入…

王浩然
2025年12月19日
000
AI前沿

起底AIGC概念股：退潮之后，谁在裸泳？

生成式AI技术狂飙一年多以后，A股市场的「AIGC概念股」正在经历一场集体的「去泡沫」。截至9月12日收盘，相比去年的涨幅，今年以来，万得AIGC概念指数(8841660.WI)…

点点
2024年9月13日
000