‌全新DeepSeek R1T2 Chimera模型问世，速度提升200%‌

王浩然 • 2025年7月7日下午9:00 • AI前沿 • 307 views

在人工智能领域，模型的效率与速度一直是研究者们追求的关键指标。近日，来自德国的TNG Technology Consulting GmbH实验室宣布推出了一种全新的DeepSeek R1T2 Chimera模型，该模型在保持高推理能力的同时，速度相比之前的DeepSeek R1-0528版本提升了惊人的200%。

‌DeepSeek模型的持续进化‌

DeepSeek，这一源自中国AI初创企业DeepSeek（香港High-Flyer Capital Management旗下）的开源模型，自发布以来就因其低廉的训练成本和出色的推理表现而广受好评。特别是其最新版本R1-0528，更是在全球AI和商业社区中引起了轰动。得益于其Apache 2.0许可证的开放性质，R1-0528迅速被其他AI实验室和开发者采纳、改编和应用。

‌TNG Technology的创新突破‌

TNG Technology Consulting GmbH，这家拥有24年历史的德国公司，以其深厚的技术积累和创新精神，在AI领域不断推陈出新。此次推出的DeepSeek-TNG R1T2 Chimera模型，是TNG在大型语言模型（LLM）领域的又一力作。通过采用独特的Assembly-of-Experts（AoE）方法，TNG成功地将DeepSeek-R1-0528、DeepSeek-R1和DeepSeek-V3-0324三个父模型的优势融合在一起，创造出了R1T2这一高效能的新模型。

‌AoE方法的独特优势‌

与传统的Mixture-of-Experts（MoE）架构不同，AoE是一种模型合并技术，它通过选择性地合并多个预训练模型的权重张量来创建新模型。在R1T2的构建过程中，TNG主要合并了负责专门推理的路由专家张量，同时保留了来自更快模型（如V3-0324）的高效共享和注意力层。这种方法使得R1T2在继承父模型推理强度的同时，避免了它们的冗长和延迟问题。

‌性能与速度的双重飞跃‌

根据TNG提供的基准测试结果，R1T2在AIME-24、AIME-25和GPQA-Diamond等测试集上的推理性能达到了DeepSeek-R1-0528的90%至92%。然而，与R1-0528倾向于生成长而详细的答案不同，R1T2的设计更加简洁，它能够在保持同样智能响应的同时，使用显著更少的词汇。具体来说，R1T2生成响应所需的输出令牌数仅为R1-0528的约40%，这意味着其推理速度和计算负载都得到了大幅降低。

‌开源与可用性‌

R1T2模型在发布时采用了宽松的MIT许可证，并已在Hugging Face平台上公开可用。这意味着任何开发者或企业都可以免费使用、修改和部署该模型，以满足自己的需求。TNG还提醒欧洲用户注意即将于2025年8月2日生效的欧盟AI法案，并建议相关企业评估其合规性。

‌对企业技术决策者的意义‌

对于CTO、AI平台所有者、工程主管和IT采购团队来说，R1T2的推出带来了诸多实际好处和战略选择。首先，通过减少每个任务所需的输出令牌数，R1T2显著降低了GPU时间和能耗，从而为企业节省了基础设施成本。其次，R1T2在保持高推理质量的同时，避免了冗长的回答，这对于需要结构化答案（如数学、编程和逻辑任务）的场景尤为理想。此外，其开源和可修改性使得企业能够在受监管或隔离的环境中进行私有托管、模型对齐或进一步训练。

‌未来展望‌

TNG的Assembly-of-Experts方法预示着未来模型构建的一种可能趋势：模块化。通过重组现有模型的优势，企业可以更容易地创建出专门化的变体，而无需从头开始训练。随着R1T2及其后续版本的推出，我们有理由相信，AI模型的效率、速度和可用性将得到进一步的提升。

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/quan-xin-deepseek-r1t2-chimera-mo-xing-wen-shi-su-du-ti

Like (0)

王浩然作者

0 0

Bright Data战胜埃隆·马斯克与Meta，其1亿美元AI平台挑战科技巨头‌

Previous 2025年7月7日

日本Sakana AI推出TreeQuest：多模型团队协作，效能超越单体大型语言模型30%‌

Next 2025年7月8日

AI前沿

Zencoder收购Machinet，加速AI编码助手市场整合，挑战GitHub Copilot‌

在人工智能（AI）领域，技术的快速发展正不断推动市场的变革。近日，Zencoder宣布收购Machinet，这一举动不仅加强了Zencoder在AI编码助手市场的竞争地位，也预示着…

王浩然
2025年4月26日
000
AI前沿

Aarki 首席执行官 Aman Sareen – 访谈系列

Aman Sareen 是Aarki的首席执行官，Aarki 是一家 AI 公司，提供广告解决方案，推动移动应用开发者的收入增长。Aarki 通过使用数十亿个情境竞价信号以及专有的…

点点
2024年9月5日
000
AI前沿

Cognichip获6000万美元A轮融资，以物理感知AI重构芯片设计范式

在半导体行业陷入设计成本高企、周期漫长的结构性瓶颈之际，AI驱动的芯片设计新势力Cognichip近日完成了6000万美元的A轮融资。此轮融资由Seligman Ventures领…

王浩然
2026年4月4日
000
AI前沿

AWS与沙特支持的Humain达成战略合作，共筑AI新生态

在科技日新月异的今天，全球科技巨头们纷纷寻求与不同国家和地区的合作，以拓展其业务版图和技术影响力。近日，亚马逊旗下的云服务提供商AWS宣布与沙特阿拉伯新成立的人工智能（AI）公司H…

王浩然
2025年5月17日
000
AI前沿

被忽视的AI环境代价：数字便利背后的生态账单‌

在人工智能技术狂飙突进的今天，我们享受着AI带来的即时摘要、内容生成和问题解答等便利服务，却很少关注其背后的环境代价。这种”数字便利”依赖于庞大的隐形基础设…

王浩然
2025年8月20日
000
AI前沿

为什么情境感知型人工智能代理将在 2025 年赋予我们超能力

2025 年将是大型科技公司从向我们出售越来越强大的工具转变为向我们出售越来越强大的能力的一年。工具和能力之间的区别微妙而深刻。我们将工具用作帮助我们克服有机限制的外部物品。从汽车…

王浩然
2025年1月6日
000
AI前沿

DeepMind 的 Demis Hassabis 和 John Jumper 因 AlphaFold 荣获诺贝尔化学奖

本周是人工智能领域诺贝尔奖的重要一周。瑞典皇家科学院今天宣布了 2024 年诺贝尔化学奖获奖者，DeepMind 首席执行官Demis Hassabis和主任John Jum…

王浩然
2024年10月10日
000
AI前沿

蒂姆·库克的其他工作

今年 5 月，苹果首席执行官蒂姆·库克 (Tim Cook) 在一次活动上发布最新款 iPad 时，穿了一双定制的、独一无二的耐克运动鞋，鞋上的装饰针脚上印有“Made on iP…

王浩然
2024年10月23日
000
AI前沿

机器狗利用人工智能爬楼梯、下山

Deep Robotics 正式推出了其新款机器狗 Lynx，这是一款全地形机器人，它使用轮子和腿的组合来在各种崎岖的地形上行驶。轮腿混合设计将轮子的速度和腿的灵活性结合起来，使…

王浩然
2024年12月2日
000
AI前沿

Python 数据验证器 Pydantic 推出与模型无关的 AI 代理开发平台

为了不被本周 AWS re:Invent 上的众多 AI 公告所掩盖，领先的开源 Python 编程语言数据验证库背后的团队Pydantic推出了PydanticAI，这是一个新的…

王浩然
2024年12月5日
000
AI前沿

Runware 使用定制硬件和高级编排实现快速 AI 推理

有时，演示就是您了解产品所需的全部内容。Runware 就是这种情况。如果您访问Runware 的网站，输入提示并按 Enter 生成图像，您会惊讶于 Runware 为您生成图像…

王浩然
2024年10月2日
000
AI前沿

实现 AI 供应链可见性的七个关键步骤

在当今数字化转型的浪潮中，人工智能（AI）技术已广泛融入各个行业的供应链体系，为企业带来了前所未有的效率提升和创新机遇。然而，随着 AI 在供应链中的应用日益复杂，确保 AI 供应…

王浩然
2026年1月3日
000
AI前沿

AI安全测评存重大漏洞：简单改写即可突破Gemini、Claude等主流大模型防线

近日，美国一项企业研究揭示了当前大语言模型（LLM）安全测评体系的致命缺陷：被评为“相对安全”的主流模型，包括谷歌Gemini 3 Pro和Anthropic Claude Son…

王浩然
2026年2月24日
000
AI前沿

Amazon Nova 基础模型：重新定义生成式 AI 的价格和性能

生成式人工智能通过实现独特的内容创建、自动化任务和引领创新来改变行业。在过去十年中，人工智能 (AI)取得了显著进步。OpenAI的GPT-4 和 Google 的 Bard 等技…

王浩然
2025年1月20日
000
AI前沿

AI赋能网络安全：撰写吸引媒体关注的新闻稿策略

在网络安全领域，每一次新的威胁发现、漏洞修复或技术创新都可能成为媒体关注的焦点。然而，如何在众多新闻稿中脱颖而出，吸引媒体的注意，成为网络安全企业面临的一大挑战。本文将探讨如何利用…

王浩然
2025年5月2日
000
AI前沿

我们不再调试人工智能，而是协调不同文明

随着人工智能技术从专用模型向通用智能快速演进，其早已跳出单一工具的范畴，深度嵌入全球金融、医疗、能源等关键领域，成为重塑人类社会运行规则的核心力量。曾经，科技界与学术界聚焦的核心命…

王浩然
2025年12月12日
000
AI前沿

不眠之眼：Hakimo获1050万美元A轮融资，加码自主安防‌

在安防领域，一场由人工智能引领的变革正在悄然进行。近日，一家专注于自主安防监测平台的AI创业公司Hakimo宣布成功获得1050万美元的A轮融资，本轮融资由Vertex Ventu…

王浩然
2025年3月29日
000
AI前沿

Persado 联合创始人兼总裁 Assaf Baciu – 访谈系列

Assaf Baciu 拥有近二十年为市场领先的 SaaS 组织制定企业战略和产品方向的经验。作为Persado的联合创始人兼总裁，他推动了 Persado 不断增长的产品组合的发…

点点
2024年10月24日
000
AI前沿

吉卜力风格AI图像的兴起：隐私忧虑与数据风险‌

在互联网的广阔天地中，一种结合先进人工智能（AI）与艺术的新趋势正悄然兴起，这便是吉卜力风格AI图像。这些图像将日常照片转化为令人惊叹的艺术作品，模仿了著名日本动画工作室吉卜力那独…

王浩然
2025年5月25日
000
AI前沿

用于训练 Stable Diffusion 的数据集背后的组织声称已经删除了 CSAM

德国研究机构LAION创建了用于训练Stable Diffusion和其他生成式 AI 模型的数据，该机构发布了一个新数据集，声称该数据集“已彻底清除已知的疑似儿童性虐待材料 (C…

王浩然
2024年8月31日
000

发表回复

Please Login to Comment

‌全新DeepSeek R1T2 Chimera模型问世，速度提升200%‌

相关推荐

发表回复