视觉语言模型
-
AI 模型局部重训:破解 “全量重训” 困局,开启低成本高效迭代新路径
当企业为适配新业务场景对 AI 模型进行微调时,常面临两难困境:全量重训需投入数百万美元、消耗数周时间,还可能导致模型 “灾难性遗忘”—— 丢失此前习得的关键能力;而完全不更新模型…
-
中国科学家突破AI图像幻觉难题:通过放大幻觉来消除幻觉的技术革命
在人工智能视觉模型日益普及的今天,一个长期困扰业界的难题正在被中国科研团队以颠覆性的方式破解。由中国科学技术大学和南京大学联合研发的新型”暴露幻觉以抑制幻觉”…
-
人工智能独立撰写首篇同行评议论文:科研范式的历史性突破
2025年8月,人工智能领域迎来一个足以载入科学史册的里程碑事件。由Sakana AI团队联合不列颠哥伦比亚大学、牛津大学研发的AI Scientist-v2系统,在未经任何人工干…
-
AI在医学影像中难以区分左右的困境:最新研究揭示重大缺陷
最新研究表明,以ChatGPT为代表的AI图像模型在解读翻转或旋转的解剖结构时存在严重缺陷,可能导致危险的诊断错误。这项由美德联合团队开展的研究发现,这些模型在医学扫描中经常犯下基…
-
OpenAI最新大型语言模型为中国AI初创企业开辟新机遇
在人工智能(AI)领域,大型语言模型(LLM)的突破正引领着新一轮的技术革命。近日,OpenAI宣布了其最新的LLM成果,这一消息迅速在全球范围内引起了广泛关注,特别是对中国AI初…
-
Verizon 与 Nvidia 联手在 5G 专用网络上为 AI 工作负载提供支持
Verizon和Nvidia宣布他们已经开发出一个新平台,两家公司表示该平台代表着为企业客户加速 AI 的下一阶段。 新的带有企业 AI 的 5G 专用网络允许大量 AI 应用程序…
-
小而强大:H2O.ai 的新 AI 模型在文档分析领域挑战科技巨头
开源 AI 平台提供商H2O.ai今天宣布了两种新的视觉语言模型,旨在改进文档分析和光学字符识别 (OCR) 任务。这两个模型名为H2OVL Mississippi-2B和H2OV…