视觉语言模型

AI前沿

AI 模型局部重训：破解 “全量重训” 困局，开启低成本高效迭代新路径

当企业为适配新业务场景对 AI 模型进行微调时，常面临两难困境：全量重训需投入数百万美元、消耗数周时间，还可能导致模型 “灾难性遗忘”—— 丢失此前习得的关键能力；而完全不更新模型…

王浩然
2025年10月14日
000
AI前沿

中国科学家突破AI图像幻觉难题：通过放大幻觉来消除幻觉的技术革命‌

在人工智能视觉模型日益普及的今天，一个长期困扰业界的难题正在被中国科研团队以颠覆性的方式破解。由中国科学技术大学和南京大学联合研发的新型”暴露幻觉以抑制幻觉&#8221…

王浩然
2025年10月3日
000
AI前沿

人工智能独立撰写首篇同行评议论文：科研范式的历史性突破‌

2025年8月，人工智能领域迎来一个足以载入科学史册的里程碑事件。由Sakana AI团队联合不列颠哥伦比亚大学、牛津大学研发的AI Scientist-v2系统，在未经任何人工干…

王浩然
2025年9月2日
000
AI前沿

AI在医学影像中难以区分左右的困境：最新研究揭示重大缺陷‌

最新研究表明，以ChatGPT为代表的AI图像模型在解读翻转或旋转的解剖结构时存在严重缺陷，可能导致危险的诊断错误。这项由美德联合团队开展的研究发现，这些模型在医学扫描中经常犯下基…

王浩然
2025年8月9日
000
AI前沿

OpenAI最新大型语言模型为中国AI初创企业开辟新机遇

在人工智能（AI）领域，大型语言模型（LLM）的突破正引领着新一轮的技术革命。近日，OpenAI宣布了其最新的LLM成果，这一消息迅速在全球范围内引起了广泛关注，特别是对中国AI初…

王浩然
2025年5月2日
000
AI前沿

Verizon 与 Nvidia 联手在 5G 专用网络上为 AI 工作负载提供支持

Verizon和Nvidia宣布他们已经开发出一个新平台，两家公司表示该平台代表着为企业客户加速 AI 的下一阶段。新的带有企业 AI 的 5G 专用网络允许大量 AI 应用程序…

王浩然
2024年12月22日
000
AI前沿

小而强大：H2O.ai 的新 AI 模型在文档分析领域挑战科技巨头

开源 AI 平台提供商H2O.ai今天宣布了两种新的视觉语言模型，旨在改进文档分析和光学字符识别 (OCR) 任务。这两个模型名为H2OVL Mississippi-2B和H2OV…

王浩然
2024年10月19日
000