AI推理
-
英伟达发布Rubin CPX GPU:专为大规模AI推理工作负载打造的革命性架构
2025年9月,图形计算巨头英伟达再次以颠覆性产品震撼人工智能硬件市场。公司正式推出全新Rubin CPX GPU系列,这款专为处理视频、音频和文本等长上下文数据优化的加速器,标志…
-
Anthropic研究人员发现AI的”过度思考”悖论:推理时间越长模型表现越差
人工智能行业正面临一个反直觉的发现:让AI模型花费更长时间”思考”问题并不总能提升表现,在某些情况下反而会导致性能显著下降。Anthropic公司的最新研究…
-
Groq加速Hugging Face,向AWS和Google发起挑战
在人工智能(AI)推理领域,一家名为Groq的初创企业正以其独特的技术实力和激进的市场策略,向行业内的传统巨头发起有力挑战。近日,Groq宣布了两项重大进展,不仅全面支持了阿里巴巴…
-
Dream 7B:基于扩散的推理模型如何重塑AI领域
随着人工智能(AI)的飞速发展,AI已经超越了简单的文本和图像生成任务,进入了能够推理、规划和决策的新时代。然而,传统的AI模型,如GPT-4和LLaMA,在应对复杂、细致的推理任…
-
Meta发布Llama API,速度较OpenAI快18倍,与Cerebras合作实现每秒2600个令牌处理
Meta与Cerebras携手,推出超高速Llama API Meta今日宣布与Cerebras Systems达成合作,共同推出全新的Llama API,为开发者提供比传统GPU…
-
探索NVIDIA Dynamos高性能架构:实现大规模AI推理
在人工智能(AI)日益普及的今天,高效的AI推理能力成为了技术发展的关键。NVIDIA,作为全球领先的图形处理单元(GPU)制造商,不断推陈出新,旨在为用户提供更加强大的计算解决方…
-
Google发布新一代Ironwood芯片:性能超世界最快超级计算机24倍
Google Cloud于近日正式推出了其第七代张量处理单元(Tensor Processing Unit,简称TPU)——Ironwood。这款专为人工智能(AI)推理工作负载设…
-
Groq与PlayAI合作推出Dialog:让语音AI更自然、更高效
在人工智能领域,一场关于如何让机器声音更加人性化的革新正在悄然进行。近日,Groq与PlayAI携手宣布,将把PlayAI的先进文本转语音模型Dialog推向市场,而这一切都将借助…