DeepSeek-R1
-
微博开源 AI 模型 VibeThinker-1.5B:低成本突破性能壁垒,在数学与代码任务中超越 DeepSeek-R1
中国社交平台巨头微博旗下 AI 部门正式发布开源大语言模型 VibeThinker-1.5B。该模型基于阿里巴巴 Qwen2.5-Math-1.5B 基座模型微调而成,参数量仅 1…
-
Meta 全新 CWM 模型:不止 “看懂” 代码,更能 “理解” 代码运行逻辑
在 AI 编程领域,“生成代码” 早已不是新鲜事,但 “生成可靠、高质量且符合复杂场景需求的代码”,始终是行业待解的难题。2025 年 9 月 30 日,Meta 的 AI 研究团…
-
DeepSeek震撼AI行业:AI的下一次飞跃或不再依赖更多数据,而是推理时的更强计算能力
人工智能领域正以前所未有的速度发展,而近期的突破更是颠覆了已有的认知。2025年初,中国AI实验室DeepSeek发布的新模型,在AI行业内引起了巨大震动,导致Nvidia等AI数…
-
Together AI 3.05亿美元赌注:DeepSeek-R1等推理模型正在增加而非减少GPU需求重写并翻译后的内容
DeepSeek-R1刚出现时,业界普遍担忧先进推理能力的实现可能会减少对基础设施的需求。然而,事实证明情况并非如此。至少,根据Together AI的说法,DeepSeek和开源…
-
超越基准:DeepSeek-R1 和 o1 在实际任务中的表现如何
DeepSeek-R1无疑引起了很多兴奋和担忧,尤其是对于 OpenAI 的竞争对手模型 o1。因此,我们在几个简单的数据分析和市场研究任务上对它们进行了并排比较测试。 为了让这…
-
开源 DeepSeek-R1 使用纯强化学习来匹敌 OpenAI o1 — 成本降低 95%
中国人工智能初创公司DeepSeek以使用开源技术挑战领先的人工智能供应商而闻名,最近它又抛出了一颗重磅炸弹:一项名为 DeepSeek-R1 的全新开放式推理法学硕士学位课程。 …