MMLU

AI前沿

超越ARC-AGI：GAIA与寻找真正的智能基准

智能无处不在，但其衡量标准却显得颇为主观。最佳情况下，我们只能通过测试和基准来近似评估智能水平。想象一下高考：每年都有无数学生报名参加，死记硬背考试技巧，有时甚至能获得满分。那么，…

王浩然
2025年4月14日
000
AI前沿

微软的 GRIN-MoE AI 模型采用编码和数学，在关键基准测试中击败竞争对手

微软推出了一种突破性的人工智能模型GRIN-MoE（梯度知情混合专家模型），旨在提高编码和数学等复杂任务的可扩展性和性能。该模型有望通过一次选择性地激活一小部分参数来重塑企业应用程…

王浩然
2024年9月22日
000