多模态 AI 缺陷

AI前沿

70% 事实准确性天花板：谷歌新 FACTS 基准为何为企业 AI 敲响警钟

当前生成式 AI 基准测试虽能衡量模型在编码、指令遵循等企业任务中的表现，却普遍忽视对 “事实准确性” 的评估 —— 即模型输出信息与真实世界数据的客观一致性，尤其在处理图像、图表…

王浩然
2025年12月16日
000