巧妙的架构胜过原始计算：DeepSeek 打破了“越大越好”的 AI 开发方法

王浩然 • 2025年2月2日上午11:00 • AI前沿 • 399 views

人工智能的发展已经到达了一个关键的转折点。DeepSeek 的突破——无需依赖最先进的芯片即可实现最先进的性能——证明了 12 月 NeurIPS 上许多人已经宣称的内容：人工智能的未来不是投入更多计算来解决问题——而是重新想象这些系统如何与人类和我们的环境协同工作。

作为一名毕业于斯坦福大学的计算机科学家，我见证了人工智能发展的前景和风险，我认为这一刻比 ChatGPT 的首次亮相更具变革性。我们正在进入一些人所说的“推理复兴”。OpenAI的 o1、DeepSeek 的 R1 和其他公司正在从蛮力扩展转向更智能的东西——而且效率空前。

这种转变来得正是时候。在 NeurIPS 主题演讲中，前 OpenAI 首席科学家 Ilya Sutskever宣称“预训练将会终结”，因为虽然计算能力在增长，但我们受到有限互联网数据的限制。DeepSeek 的突破证实了这一观点——这家中国公司的研究人员以极低的成本实现了与 OpenAI o1 相当的性能，这表明创新，而不仅仅是原始计算能力，才是前进的道路。

无需大量预训练的高级人工智能

世界模型正在努力填补这一空白。世界实验室最近筹集了 2.3 亿美元，用于构建像人类一样理解现实的人工智能系统，这与 DeepSeek 的方法相似，他们的 R1 模型表现出“啊哈！”时刻——像人类一样停下来重新评估问题。这些系统受到人类认知过程的启发，有望改变从环境建模到人机交互的一切。

我们看到了早期的成果：Meta 最近对其Ray-Ban 智能眼镜进行了更新，可以与 AI 助手进行连续的情境对话，而无需唤醒词，同时还可以进行实时翻译。这不仅仅是功能更新，它还预览了 AI 如何增强人类能力，而无需大量预先训练的模型。

然而，这种演变也带来了微妙的挑战。虽然 DeepSeek 通过创新的训练技术大幅降低了成本，但这种效率突破却可能导致总体资源消耗增加——这种现象被称为杰文斯悖论，即技术效率的提高往往会导致资源使用增加而不是减少。

对于人工智能而言，更便宜的训练可能意味着更多组织将训练更多模型，从而可能增加净能耗。但 DeepSeek 的创新有所不同：通过证明无需尖端硬件即可实现最先进的性能，他们不仅提高了人工智能的效率，还从根本上改变了我们开发模型的方式。

这种从原始计算能力向智能架构的转变可以帮助我们摆脱杰文斯悖论陷阱，因为焦点从“我们能负担得起多少计算？”转移到“我们能多智能地设计我们的系统？”正如加州大学洛杉矶分校教授 Guy Van Den Broeck 所说，“语言模型推理的总体成本肯定不会下降。”这些系统对环境的影响仍然很大，推动着行业走向更高效的解决方案——这正是 DeepSeek 所代表的创新。

优先考虑高效架构

这种转变需要新的方法。DeepSeek 的成功证明了这样一个事实：未来不是要构建更大的模型，而是要构建更智能、更高效的模型，与人类智能和环境约束相协调。

Meta 的首席人工智能科学家 Yann LeCun设想，未来的系统会像人类一样，花费数天或数周时间思考复杂问题。DeepSeek 的 R1 模型具有暂停和重新考虑方法的能力，代表着朝着这一愿景迈出了一步。虽然资源密集型，但这种方法可能会在气候变化解决方案、医疗保健创新等领域取得突破。但正如卡内基梅隆大学的Ameet Talwalkar明智地警告的那样，我们必须质疑任何声称确定这些技术将引领我们走向何方的人。

对于企业领导者来说，这种转变指明了一条清晰的前进道路。我们需要优先考虑高效的架构。这种架构可以：

部署专门的 AI 代理链，而不是单个的大型模型。
投资于可优化性能和环境影响的系统。
构建支持迭代、人机交互开发的基础设施。

让我兴奋的是：DeepSeek 的突破证明，我们正在走出“越大越好”的时代，进入一个更有趣的时代。随着预训练达到极限，创新型公司找到新方法以更少的投入实现更大的目标，创造性解决方案的广阔空间正在打开。

小型专业代理组成的智能链不仅效率更高，而且还能以我们从未想象过的方式帮助我们解决问题。对于愿意以不同方式思考的初创企业和企业来说，这是我们再次享受人工智能乐趣的时刻，可以打造对人类和地球都有意义的东西。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/qiao-miao-de-jia-gou-sheng-guo-yuan-shi-ji-suan-deepseek-da

Like (0)

王浩然作者

0 0

Cerebras 成为世界上最快的 DeepSeek R1 主机，速度比 Nvidia GPU 快 57 倍

Previous 2025年2月1日

Sam Altman 承认 OpenAI 在开源辩论中“站在了历史的错误一边”

Next 2025年2月2日

AI前沿

思科警告：微调使大型语言模型成为威胁向量‌

随着人工智能技术的飞速发展，大型语言模型（LLMs）在金融、医疗、法律等众多领域展现出了巨大的潜力。然而，思科公司最近发布的一份报告却揭示了这些模型在微调过程中可能带来的巨大安全风…

王浩然
2025年4月6日
000
AI前沿

Google DeepMind发布新型AI模型以强化机器人控制能力‌

在人工智能领域，Google DeepMind一直以其前沿的技术和创新的研究引领着行业发展。近日，DeepMind团队再次取得突破，发布了一系列专为机器人控制设计的新型AI模型。这…

王浩然
2025年3月13日
000
AI前沿

Google Gemini 意外超越 OpenAI 跃居第一，但基准测试并不能说明全部情况

谷歌凭借其最新实验模型在一项关键的人工智能基准测试中名列前茅，标志着人工智能竞赛发生重大转变——但业内专家警告称，传统的测试方法可能不再有效衡量真正的人工智能能力。该模型名为“ …

王浩然
2024年11月19日
000
AI前沿

AI治理困局：企业为何在解决错误的问题？

在全球商业竞争日益激烈的当下，人工智能（AI）正在成为企业提升效率、抢占市场的核心武器。从客户服务的智能应答，到数据分析的深度洞察，再到内部流程的自动化优化，企业部署AI的脚步正在…

王浩然
2026年2月20日
000
AI前沿

Ilya Sutskever的10亿美元创业公司SSI：AI界的新宠

随着SSI的加入，AI行业的竞争无疑将更加激烈。但竞争也意味着进步，我们有理由相信，在Ilya Sutskever的带领下，SSI将为AI领域带来新的突破和惊喜。

点点
2024年9月7日
000
AI前沿

Nvidia发布全开源转录AI模型Parakeet-TDT-0.6B-v2，加速语音识别领域发展‌

近年来，随着生成式AI技术的蓬勃发展，Nvidia作为全球领先的计算技术公司，不仅在GPU领域取得了巨大成功，还积极投身于AI模型的研发与推广。近日，Nvidia在Hugging …

王浩然
2025年5月7日
000
AI前沿

OpenAI谋求估值高达1250亿美元新融资，暂无IPO计划

OpenAI估值到底能攀多高？筹资越来越难或需IPO续命

点点
2024年9月3日
000
AI前沿

硅谷在 2024 年扼杀了人工智能末日运动

多年来，技术专家一直在敲响警钟，警告先进的人工智能系统可能给人类造成灾难性的破坏。但到了 2024 年，这些警告声被科技行业所推广的生成式人工智能的实用而繁荣的愿景所淹没——这一…

王浩然
2025年1月2日
000
AI前沿

微软让AI代理彼此交流，或将改变我们的工作方式

微软在近日宣布对其Copilot Studio平台进行了重大扩展，推出了多代理系统，允许不同的AI代理协作完成复杂的商业任务。此外，微软还发布了新的开发者工具、安全增强功能以及与W…

王浩然
2025年5月21日
000
AI前沿

Han Heloir，MongoDB：可扩展数据库在人工智能应用中的作用

随着数据管理变得越来越复杂，现代应用程序扩展了传统方法的功能，人工智能正在彻底改变应用程序的扩展。除了将操作员从需要仔细监督和额外资源的过时、低效方法中解放出来之外，AI 还可以…

点点
2024年10月1日
000
AI前沿

认识 OpenAI 的 Operator，这是一个人工智能代理，它使用网络为你预订晚餐、订票、编制购物清单等

OpenAI 推出了其首款半自主 AI 代理Operator，旨在像人类一样“操作”网络浏览器。代理使用光标进行指向和点击，自行输入内容，浏览网页并在各种网站上执行操作，例如通过 …

王浩然
2025年1月25日
000
AI前沿

LinkedIn 在更新服务条款前曾抓取用户数据用于培训

LinkedIn 可能已经在没有更新其条款的情况下利用用户数据训练了 AI 模型。 LinkedIn 的美国用户（欧盟、欧洲经济区或瑞士除外，这可能是由于这些地区的数据隐私规则）在…

王浩然
2024年9月19日
000
AI前沿

华为开源AI开发平台技术规格详解‌

在当今快速发展的科技领域，人工智能已成为推动创新的核心驱动力。作为全球领先的信息与通信技术解决方案提供商，华为始终站在技术前沿，致力于通过开源方式推动AI技术的发展。华为最新推出的…

王浩然
2025年9月30日
000
AI前沿

AI渗透HR全流程：合规成为HR领导者的新核心挑战

曾几何时，AI在人力资源领域的登场，是一场被普遍看好的效率革命。从加速招聘流程、优化绩效评估，到提供全天候员工支持，AI被视为解决HR部门长期手动流程痛点的“万能工具”，为这个长期…

王浩然
2026年2月6日
000
AI前沿

从实验室到生产线：企业AI可靠性的觉醒与重构——对话TrueFoundry创始人Nikunj Bajaj

当ChatGPT掀起的生成式AI浪潮席卷全球后，企业对AI的期待早已从实验室里的技术演示，转向了业务流程中稳定运行的核心系统。但随之而来的，是AI系统故障带来的真实代价——从医疗场…

王浩然
2026年3月2日
000
AI前沿

企业现在可以借助强化学习微调OpenAI的o4-mini推理模型‌

OpenAI近日在其面向开发者的社交媒体账号上宣布，企业用户现在可以利用强化学习微调（Reinforcement Fine-Tuning, RFT）功能，定制化OpenAI全新的o…

王浩然
2025年5月10日
000
AI前沿

法律软件公司Clio斥资10亿美元收购法律数据巨头vLex

在数字化浪潮席卷全球的背景下，法律行业也迎来了前所未有的变革。近日，加拿大法律软件公司Clio宣布了一项重大收购交易，以10亿美元现金和股票的方式收购了拥有26年历史的法律数据情报…

王浩然
2025年7月4日
000
AI前沿

OpenAI 推出适用于 iPhone 的 ChatGPT，与 Apple 实现具有里程碑意义的 AI 整合

随着iOS 18.2向用户推出，OpenAI于周三展示了其新的 iPhone 集成，将 ChatGPT 直接引入 Siri、写作工具和相机功能。该功能更新在 OpenAI 的“ …

王浩然
2024年12月12日
000
AI前沿

Spotify推出可编辑“品味档案”功能，终于能亲手掌控推荐内容了

在2026年西南偏南（SXSW）大会上，Spotify联合首席执行官古斯塔夫·瑟德斯特伦（Gustav Söderström）宣布了一项备受用户期待的新功能：可编辑的“品味档案”（…

王浩然
2026年3月17日
000
AI前沿

AI生成广告新框架：精准触达特定人群，个性化营销再进阶

当《少数派报告》中能识别路人并精准喊话的智能广告牌出现在现实讨论中，个性化广告的未来似乎离我们越来越近。尽管为每个用户定制专属广告创意目前仍不现实，但一项全新的AI研究正在打破这一…

王浩然
2026年2月8日
000