DeepSeek-R1

AI前沿

微博开源 AI 模型 VibeThinker-1.5B：低成本突破性能壁垒，在数学与代码任务中超越 DeepSeek-R1

中国社交平台巨头微博旗下 AI 部门正式发布开源大语言模型 VibeThinker-1.5B。该模型基于阿里巴巴 Qwen2.5-Math-1.5B 基座模型微调而成，参数量仅 1…

王浩然
2025年11月16日
000
AI前沿

Meta 全新 CWM 模型：不止 “看懂” 代码，更能 “理解” 代码运行逻辑

在 AI 编程领域，“生成代码” 早已不是新鲜事，但 “生成可靠、高质量且符合复杂场景需求的代码”，始终是行业待解的难题。2025 年 9 月 30 日，Meta 的 AI 研究团…

王浩然
2025年10月4日
000
AI前沿

DeepSeek震撼AI行业：AI的下一次飞跃或不再依赖更多数据，而是推理时的更强计算能力‌

人工智能领域正以前所未有的速度发展，而近期的突破更是颠覆了已有的认知。2025年初，中国AI实验室DeepSeek发布的新模型，在AI行业内引起了巨大震动，导致Nvidia等AI数…

王浩然
2025年4月7日
000
AI前沿

Together AI 3.05亿美元赌注：DeepSeek-R1等推理模型正在增加而非减少GPU需求‌重写并翻译后的内容

DeepSeek-R1刚出现时，业界普遍担忧先进推理能力的实现可能会减少对基础设施的需求。然而，事实证明情况并非如此。至少，根据Together AI的说法，DeepSeek和开源…

王浩然
2025年2月22日
000
AI前沿

超越基准：DeepSeek-R1 和 o1 在实际任务中的表现如何

DeepSeek-R1无疑引起了很多兴奋和担忧，尤其是对于 OpenAI 的竞争对手模型 o1。因此，我们在几个简单的数据分析和市场研究任务上对它们进行了并排比较测试。为了让这…

王浩然
2025年2月2日
000
技术评测

开源 DeepSeek-R1 使用纯强化学习来匹敌 OpenAI o1 — 成本降低 95%

中国人工智能初创公司DeepSeek以使用开源技术挑战领先的人工智能供应商而闻名，最近它又抛出了一颗重磅炸弹：一项名为 DeepSeek-R1 的全新开放式推理法学硕士学位课程。 …

王浩然
2025年1月21日
000