LinkedIn 生成式 AI “食谱” 揭秘：如何将人员搜索规模扩展至 13 亿用户

王浩然 • 2025年11月17日下午12:00 • AI前沿 • 149 views

LinkedIn 正式推出 AI 驱动的人员搜索功能，这一举措距离 ChatGPT 发布已过去三年，距其自身 AI 职位搜索功能上线也有六个月。对技术管理者而言，这一时间线揭示了企业级生成式 AI 部署的核心挑战：在 13 亿用户的超大规模场景下，AI 落地并非一蹴而就，而是需要经过缓慢且严苛的务实优化过程。该功能的推出，不仅重塑了 LinkedIn 的搜索体验，更凝结出一套可复制的 “AI 食谱（Cookbook）”，为企业级 AI 从试点走向亿级用户规模提供了技术蓝图。

从功能体验来看，新的 AI 人员搜索彻底摆脱了传统关键词搜索的局限。用户可输入自然语言查询（如 “谁精通癌症治疗相关知识”），系统能通过底层大语言模型（LLM）理解语义意图，而非仅匹配字面关键词。例如，它能识别 “癌症（cancer）” 与 “肿瘤学（oncology）”“基因组学研究（genomics research）” 的概念关联，即使专业人士的个人资料中未出现 “癌症” 一词，也能将肿瘤学领域的领导者与研究者纳入搜索结果。更重要的是，系统在 “相关性” 与 “实用性” 间实现平衡：不会只推送遥不可及的顶级专家（如三度人脉以外的权威），还会优先推荐用户直接人脉圈中 “具备一定相关性” 的联系人（如一度人脉中的相关从业者），这些人可作为连接专家的关键桥梁，大幅提升搜索结果的实际价值。而在旧有搜索模式下，用户需分别搜索 “癌症”“肿瘤学” 等关键词并手动整合结果，效率与精准度均大幅落后。

LinkedIn 的核心突破，在于其打造的 “多阶段、可复制”AI 食谱，这一流程源于 AI 职位搜索的成功实践，并经过人员搜索的规模化验证。早期，LinkedIn 曾试图构建覆盖全产品的统一 AI 系统，却因 “目标过于庞杂” 导致进展停滞。此后团队转变策略，先聚焦单一垂直领域突破：AI 职位搜索功能不仅实现了商业价值（帮助无四年制学位的求职者聘用概率提升 10%），更沉淀出一套包含 “数据构建、模型蒸馏、多模型协同” 的标准化流程。这套流程的核心逻辑是 “先精后广”—— 在单一领域验证可行性后，再逐步迁移至更复杂的场景，而人员搜索正是其向 “超大规模（13 亿用户图谱）” 发起的挑战。

在技术实现上，该食谱围绕 “数据 – 模型 – 架构” 三层展开，每一步均针对规模化痛点优化。首先是 “黄金数据集与合成数据生成”：团队先构建数百至数千条 “真实查询 – 个人资料匹配” 的黄金数据集，并依据 20-30 页的详细产品政策文档进行精准评分；随后，利用这一小规模黄金数据集，驱动基础大模型生成海量合成训练数据，进而训练出 70 亿参数的 “产品政策模型”。该模型虽能高精度判断搜索相关性，却因速度过慢无法直接用于生产，转而承担 “教师模型” 角色，为后续轻量化模型提供训练依据。

模型层面的关键创新在于 “多教师蒸馏架构”。早期团队曾花费 6-9 个月尝试训练单一模型，却始终无法平衡 “严格政策合规（相关性）” 与 “用户互动信号（如连接、关注行为）”。最终解决方案是 “拆分任务、协同优化”：将 70 亿参数的政策模型蒸馏为 17 亿参数的 “相关性教师模型”，专注于判断搜索结果是否符合政策与语义需求；同时训练独立的 “行为预测教师模型”，针对人员搜索场景预测用户可能的互动行为（如发送连接请求、关注操作）。这些教师模型会输出软概率分数，最终的 “学生模型” 通过 KL 散度损失函数学习并模仿这些分数，实现 “相关性” 与 “互动性” 的融合。

架构设计上，系统采用 “两阶段流水线” 应对规模化挑战。第一阶段由 80 亿参数的模型负责 “广度检索”，从 13 亿用户图谱中广泛筛选候选结果，确保覆盖足够多的潜在匹配；第二阶段由轻量化学生模型负责 “精细排序”，在保证速度的同时提升结果精准度。为适配人员搜索的超大规模，团队对模型进行了极致压缩：参考职位搜索中 6 亿参数学生模型的成功经验，进一步将人员搜索的学生模型从 4.4 亿参数剪枝至 2.2 亿参数，最终实现 “13 亿用户场景下响应速度达标，相关性损失不足 1%” 的目标。此外，团队还解决了检索层的架构瓶颈 —— 此前职位搜索的检索依赖 CPU 基础设施，而人员搜索需处理百亿级记录，团队不得不将索引系统迁移至 GPU 架构，这一基础性调整为 “流畅搜索体验” 提供了硬件支撑。

效率优化是规模化落地的另一关键。为提升模型吞吐量，团队开发了基于强化学习（RL）的 “输入摘要模型”，专门用于压缩搜索查询的输入上下文，在信息损失极小的前提下，将输入规模缩减 20 倍。结合 2.2 亿参数的轻量化模型，最终实现排序吞吐量提升 10 倍，确保系统能高效服务海量用户。这种 “务实优化优先于技术噱头” 的思路贯穿始终：LinkedIn 产品工程副总裁 Erran Berger 强调，当前企业级 AI 的核心价值在于完善推荐系统，而非追逐 “智能体（Agent）热潮”；团队选择模型的唯一标准是 “任务效率”，而非技术热度，这种务实态度使其避开了许多企业级 AI 常见的 “技术空转” 陷阱。

从组织协作来看，跨团队经验迁移加速了人员搜索的落地。早期 LinkedIn 曾让职位搜索与人员搜索团队并行探索，但在职位搜索团队通过 “政策驱动的蒸馏方法” 取得突破后，管理层迅速调动该团队的核心架构师（产品负责人 Rohan Rajiv 与工程负责人 Wenjing Zhang），将 “AI 食谱” 直接移植到人员搜索领域，避免了重复造轮子，大幅缩短了研发周期。这种 “单点突破 – 经验复用” 的组织模式，也成为 LinkedIn AI 规模化的重要保障。

对企业级 AI 实践者而言，LinkedIn 的经验提炼出三大核心启示：一是 “务实聚焦”，避免试图一次性覆盖所有场景，应先在单一垂直领域验证流程并沉淀经验；二是 “流程固化”，将成功实践转化为包含 “数据标准、模型步骤、优化方法” 的可复制食谱，减少后续项目的试错成本；三是 “极致优化”，亿级规模的突破往往来自细节创新，如模型剪枝、输入压缩、架构迁移等，这些看似微小的调整，正是决定 AI 能否落地的关键。

目前，LinkedIn 计划将这套食谱进一步推广至其他产品线，并为未来的智能体应用奠定基础。正如 Berger 所言，“智能体的价值取决于其背后工具的质量”—— 当前的 AI 人员搜索虽定位为 “工具”，但其精准的检索与排序能力，未来将成为 LinkedIn 智能体服务的核心支撑。而对整个行业而言，这套从 13 亿用户规模中淬炼出的 AI 食谱，为企业级生成式 AI 的规模化落地提供了 “从 0 到 1 再到亿” 的清晰路径，证明超大规模 AI 的成功，不在于追求尖端模型，而在于对 “数据、模型、架构” 每一个环节的务实打磨。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/linkedin-sheng-cheng-shi-ai-shi-pu-jie-mi-ru-he-jiang-ren

LinkedIn AI 人员搜索企业级 AI 规模化多教师模型模型蒸馏生成式 AI 食谱用户图谱检索自然语言搜索轻量化模型

Like (0)

王浩然作者

0 0

Alembic 深耕因果 AI 领域：突破 GPU 极限建成全球最快私有超算，获 1.45 亿美元融资重塑企业决策

Previous 2025年11月17日

智能工作流如何将数据囤积转化为变革

Next 2025年11月17日

AI前沿

麻省理工学院的突破可能会改变机器人训练

麻省理工学院的研究人员开发出了一种机器人训练方法，可以减少时间和成本，同时提高对新任务和环境的适应性。这种方法称为异构预训练变压器 (HPT)，它将来自多个来源的大量不同数据组合…

点点
2024年11月4日
000
AI前沿

ApertureData 使用多模式数据为企业提供 10 倍速度提升

数据是人工智能的圣杯。从敏捷的初创公司到全球企业集团，世界各地的组织都在投入数十亿美元来调动数据集，以打造高性能的人工智能应用程序和系统。但即使付出了这么多努力，现实情况是，访问…

王浩然
2024年10月15日
000
AI前沿

从试点困境到规模化落地：科技与ISV企业如何通过AI实现可衡量的客户体验价值

生成式AI的热潮正在褪去，科技行业和独立软件供应商（ISV）企业正面临着一个清醒的现实：AI部署正在出现明显的分化。许多企业陷入了“试点困境”——在受控环境中表现亮眼的概念验证，一…

王浩然
2026年2月15日
000
AI前沿

YouTube 正在测试一项功能，允许选定的创作者使用人工智能混音歌曲

YouTube 去年开始允许美国的部分创作者使用 Charlie Puth、Charli XCX、Demi Lovato、John Legend、Sia、T-Pain 和 Troy…

王浩然
2024年11月14日
000
AI前沿

Relyance 获得 3200 万美元融资，帮助公司遵守数据法规

随着对人工智能的需求激增，人工智能供应商正在投入更多精力解决数据安全问题。他们不仅被迫遵守新兴的数据隐私法规（例如欧盟数据法案），而且还发现自己受到客户的密切关注，这些客户对他们的…

点点
2024年10月13日
000
AI前沿

‌瑞士发布完全开源AI模型：欧洲技术自主的新里程碑‌

在全球科技巨头垄断人工智能基础模型的背景下，瑞士科研机构近日宣布推出首个完全开源的AI大语言模型，这一突破性进展标志着欧洲在关键技术领域追求战略自主的重要一步。不同于主流商业公司仅…

王浩然
2025年9月4日
000
AI前沿

治理差距：为何人工智能监管总是滞后

在人工智能（AI）迅猛发展的时代，其广泛应用正以前所未有的速度改变着社会的各个层面。然而，与之相伴的是一个日益凸显的问题 ——AI 监管总是滞后于技术的发展。这种治理差距不仅带来了…

王浩然
2026年1月13日
000
AI前沿

注意力机制并非万能：通义千问3新变体Brumby-14B-Base的混合架构革新

自2017年谷歌提出Transformer架构并喊出“注意力机制就是一切”的口号以来，注意力机制便成为大型语言模型（LLM）的核心驱动力，支撑起ChatGPT、Gemini等一众主…

王浩然
2025年11月6日
000
AI前沿

AI安全陷入误区：我们为何在错误的地方筑墙？

当一项新技术诞生，网络安全行业总会本能地为它建起“围墙”——从云计算到容器技术，再到如今的人工智能，这个循环似乎从未打破。但这一次，我们耗费大量资源搭建的防御工事，可能从一开始就选…

王浩然
2026年2月4日
000
AI前沿

人工智能独立撰写首篇同行评议论文：科研范式的历史性突破‌

2025年8月，人工智能领域迎来一个足以载入科学史册的里程碑事件。由Sakana AI团队联合不列颠哥伦比亚大学、牛津大学研发的AI Scientist-v2系统，在未经任何人工干…

王浩然
2025年9月2日
000
AI前沿

OpenAI 开放企业数据托管区域选择，破解全球化合规瓶颈

OpenAI 正式宣布扩展 ChatGPT 及 API 的数据驻留区域，允许企业用户根据业务运营需求选择数据存储与处理地点，此举彻底打破了此前全球企业规模化部署 ChatGPT 的…

王浩然
2025年11月26日
000
AI前沿

谷歌发布免费 Gemini 2.0 Flash Thinking 模型，对 OpenAI 的付费战略施压

谷歌悄然发布了其热门人工智能模型 Gemini 的重大更新，该模型现在可以解释其推理过程，在数学和科学任务中创下新的性能记录，并提供了 OpenAI 高级服务的免费替代方案。周二…

王浩然
2025年1月23日
000
AI前沿

Sakana AI 首席技术官直言 “厌倦 Transformer”：深耕者呼吁突破单一架构，探索 AI 下一个突破点

作为 Transformer 架构的联合缔造者之一 —— 曾参与撰写 2017 年里程碑式论文《Attention Is All You Need》、并为该架构命名的 Llion …

王浩然
2025年10月26日
000
AI前沿

PostgreSQL崛起：AI应用不可或缺的数据库

在当今的数据基础设施领域，PostgreSQL（常简称为Postgres）已然成为企业级数据平台供应商竞相追逐的热门选项。这一开源数据库不仅在传统企业应用中占据了一席之地，更在AI…

王浩然
2025年6月4日
000
AI前沿

苹果在产生错误警报后暂停新闻的人工智能通知摘要

苹果因生成不准确的新闻警报而受到强烈反对，因此暂停了新闻和娱乐应用的 AI 通知摘要。此外，该公司正在对整个通知摘要进行更改，以提高透明度。在 iOS 18.3、iPadOS 1…

王浩然
2025年1月17日
000
AI前沿

英国94亿英镑深度伪造诈骗损失：给美国敲响的AI欺诈警钟

当人们还在为深度伪造技术在娱乐、艺术领域的应用惊叹时，这项技术早已被犯罪集团盯上，演变成了规模化敛财的工具。近日，英国曝出的一组数据让全球警惕：截至2025年11月的9个月里，英国…

王浩然
2026年3月1日
000
AI前沿

白皮书消除了人们对人工智能导致失业的担忧

一份新白皮书指出，担心人工智能会导致大量失业是没有根据的。英国人工智能软件公司 Automated Analytics 发布的这份报告发现，其在英国和美国的 5,000 家客户中，…

点点
2024年9月10日
000
AI前沿

Perplexity 称其目前每周处理 1 亿次搜索查询

Perplexity 首席执行官 Aravind Srinivas表示，该人工智能搜索引擎目前每周执行 1 亿次查询。按月推算，大约有 4 亿次查询，高于7 月份的 2.5 亿次查…

王浩然
2024年10月26日
000
AI前沿

Apple Intelligence 将于 2025 年支持德语、意大利语、韩语、葡萄牙语和越南语

苹果周三宣布，其生成式 AI 产品将在 2025 年提供更多语言版本。Apple Intelligence新增的语言包括英语（印度）、英语（新加坡）、德语、意大利语、韩语、葡萄牙语…

王浩然
2024年9月19日
000
AI前沿

Claude记忆系统深度解析：项目隔离架构如何重塑AI助手专业边界‌

在人工智能助手功能日趋同质化的当下，Anthropic公司为Claude设计的记忆系统独树一帜，其创新的”项目隔离”架构正在重新定义专业场景下的AI交互标准…

王浩然
2025年8月20日
000

发表回复

Please Login to Comment

LinkedIn 生成式 AI “食谱” 揭秘：如何将人员搜索规模扩展至 13 亿用户

相关推荐

发表回复