GPT-4o
-
医生称人工智能正在给患者护理带来麻烦
如今,时不时就会有研究声称人工智能在诊断健康问题方面比人类医生更胜一筹。这些研究之所以引人注目,是因为美国的医疗体系严重崩溃,每个人都在寻找解决方案。人工智能为医生提供了一个潜在的…
-
DeepSeek 的新 AI 模型似乎是迄今为止最好的“公开”挑战者之一
中国的一个实验室创建了迄今为止最强大的“开放式”人工智能模型之一。 该模型DeepSeek V3由人工智能公司 DeepSeek 开发,并于周三根据宽松的许可证发布,允许开发人员下…
-
新加坡初创公司 Sapient 凭借全新模型架构加入全球企业 AI 竞赛
新加坡首家基础模型 AI 初创公司Sapient Intelligence宣布成功完成种子轮融资,以 2 亿美元的估值募集 2200 万美元。 在 Vertex Ventures、…
-
Qodo 的完全自主代理解决了回归测试的复杂性
在软件开发过程中,代码不断演变,需要不断测试其质量和可维护性。这是回归测试的根源,在回归测试中,现有测试会重新运行,以确保修改后的代码继续按预期运行。 然而,回归测试可能非常耗时且…
-
OpenAI 计划为其。o1“推理”模型注册商标
OpenAI 已为其最新 AI 模型o1提交了商标申请,以保护其知识产权。 周二,OpenAI 向美国专利商标局 (USPTO) 提交了文件,注册“OpenAI o1”商标。有趣的…
-
Google Gemini 意外超越 OpenAI,跃居第一,但基准测试结果并不能说明全部情况
谷歌凭借其最新实验模型在一项关键的人工智能基准测试中名列前茅,标志着人工智能竞赛发生重大转变——但业内专家警告称,传统的测试方法可能不再有效衡量真正的人工智能能力。 该模型名为“ …
-
Qwen2.5-Coder 改变了人工智能编程的游戏规则——而且它是免费的
阿里云发布了新的 AI 编程助手Qwen2.5-Coder,它已经成为Hugging Face Spaces上第二受欢迎的演示。早期测试表明,它的性能可与 GPT-4o 相媲美,并…
-
微软的新 Magentic-One 系统指挥多个 AI 代理完成用户任务
希望部署多个 AI 代理的企业通常需要实施一个框架来管理它们。 为此,微软研究人员最近推出了一种名为Magentic-One 的新型多智能体基础设施,该基础设施允许单个 AI 模…
-
xAI 以每月价值 25 美元的 API 积分吸引开发者,并支持 OpenAI、Anthropic SDK
我们已经知道这一点有一段时间了,但现在我们可以确定的是:生成式人工智能竞赛对于开发人员来说就像对于最终用户来说一样是一场竞赛。 举个例子:今天,埃隆·马斯克的 xAI(社交网络 X…
-
Pictionary 和 Minecraft 可以测试 AI 模型的创造力吗?
大多数人工智能基准测试并没有告诉我们太多信息。它们提出的问题可以通过死记硬背来解决,或者涉及与大多数用户不相关的主题。 因此一些人工智能爱好者开始通过游戏来测试人工智能解决问题的能…