视觉语言模型 (VLMs)

AI前沿

AI 更倾向于 “读文字” 而非 “看视频”：视觉语言模型的文本依赖现象

即便一些 AI 模型专为处理视频任务设计，要让它们真正分析视频内容并发表评论仍异常困难，相比之下，它们对文字内容的处理意愿和能力要突出得多。日常生活中，若你尝试向 ChatGPT…

王浩然
2025年11月3日
000