AI 推理
-
为何 AI 推理而非训练是下一个重大工程挑战
过去十年,人工智能领域的焦点几乎被模型训练垄断 —— 突破多源于大规模计算集群、万亿参数模型及数十亿美元的研发投入,行业将 AI 开发视为 “建造智能摩天大楼” 的工程。然而,当这…
-
谷歌发布 Gemini 3:横扫多领域基准测试,引领 AI 向 “强执行力” 全面进化
谷歌正式推出新一代旗舰级大模型家族 Gemini 3,这是自 2023 年 Gemini 系列首次亮相以来,谷歌在人工智能领域最全面、最具突破性的一次产品发布。作为闭源专有模型,G…
-
高通推出 AI 数据中心芯片 AI200 与 AI250,发力推理市场破局
全球移动芯片巨头高通(Qualcomm)正式宣布进军 AI 数据中心芯片领域,推出专为 AI 推理工作负载设计的机架级解决方案 AI200 与 AI250,直接向英伟达(Nvidi…
-
谷歌推出性能提升 4 倍的 AI 芯片,斩获 Anthropic 数十亿美元大单
谷歌云正式发布其迄今最强大的人工智能基础设施,核心包含第七代张量处理单元(TPU)“Ironwood” 与扩展的 Arm 架构 Axion 处理器系列。这一发布标志着行业正从 “模…
-
英特尔推出 Crescent Island AI GPU:聚焦推理场景,以 160GB LPDDR5X 内存打造高性价比风冷解决方案
英特尔于 2025 年正式发布代号为 “Crescent Island” 的新一代数据中心 AI GPU,该产品以 “推理专用” 为核心定位,通过 160GB 大容量 LPDDR5…
-
三星推出微型 AI 模型 TRM:以 700 万参数突破复杂推理,颠覆大模型 “规模至上” 范式
2025 年 10 月 8 日,三星 AI 研究员 Alexia Jolicoeur-Martineau 发布的新研究显示,一款名为 “微型递归模型(Tiny Recursive …
-
边缘数据对人工智能至关重要——戴尔如何帮助企业释放其价值
预计到明年,超过 50% 的企业数据将在传统数据中心或云之外创建和处理。在这个人工智能时代,企业需要能够快速访问边缘数据并从中提取价值——但这样做可能既耗时又复杂,而且许多企业领导…
-
Runware 使用定制硬件和高级编排实现快速 AI 推理
有时,演示就是您了解产品所需的全部内容。Runware 就是这种情况。如果您访问Runware 的网站,输入提示并按 Enter 生成图像,您会惊讶于 Runware 为您生成图像…
-
Cerebras 推出全球最快的 AI 推理解决方案:速度提高 20 倍,成本却降低
高性能 AI 计算领域的先驱Cerebras Systems推出了一项突破性的解决方案,旨在彻底改变 AI 推理。2024 年 8 月 27 日,该公司宣布推出世界上最快的 AI …