开源模型
-
一种 “禅式” 方法:终结语言模型的幻觉问题
来自清华大学电子工程系的两名研究人员提出了一种低成本、高通用性的语言模型优化方法 ——“验证优先(Verification-First,简称 VF)”,该方法通过让模型先验证一个无…
-
2026 年 AI 泡沫会破裂吗?—— 洞悉 AI 投资现实与应对策略
2026 年 AI 泡沫不会破裂,但企业需警惕盲目投资带来的风险,并通过战略规划规避潜在冲击。文章围绕 “泡沫争议的根源”“AI 投资的现实困境”“破局路径” 展开分析,结合行业数…
-
中国 DeepSeek V3.2 模型:以更低训练成本比肩 GPT-5,重塑前沿 AI 效率格局
当科技巨头为训练前沿 AI 模型投入数十亿美元算力资源时,中国杭州的 DeepSeek 实验室走出了一条 “智慧算力” 之路 —— 其最新发布的 DeepSeek V3.2 AI …
-
阿里发布 Qwen3-VL 技术报告,攻克两小时长视频分析难题,开源多模态能力引领行业突破
阿里巴巴通义千问 Qwen 团队于 11 月 26 日发布 Qwen3-VL 技术报告,详细披露了这款 9 月开源的视觉 – 语言模型的核心能力与技术细节。该模型凭借 …
-
AI 如何经历泡沫却存续:以互联网发展为鉴,探索行业可持续路径
当前 AI 领域正经历剧烈的市场波动 ——AI 驱动的科技巨头在不到一个月内市值蒸发超 1 万亿美元,凸显估值与基本面的脱节。但行业真正的核心问题并非 “泡沫何时破裂”,而是 “如…
-
百度开源多模态 AI 模型 ERNIE-4.5-VL-28B-A3B-Thinking,宣称性能超越 GPT-5 与 Gemini
中国搜索引擎巨头百度正式发布开源多模态 AI 模型 ERNIE-4.5-VL-28B-A3B-Thinking,该模型以 “高效轻量化” 与 “跨模态强推理” 为核心优势,在视觉相…
-
AI 初创公司为何自主掌控数据:从质量突围到构建核心竞争壁垒
在生成式 AI 技术飞速迭代的当下,数据已不再是简单的 “训练原料”,而是决定 AI 模型性能、产品竞争力乃至企业生存的核心资产。越来越多 AI 初创公司正跳出 “依赖第三方数据”…
-
Databricks的百亿美元突破:超越OpenAI合作的真正技术创新
在人工智能领域,OpenAI与Databricks近期宣布的1亿美元合作伙伴关系引发了广泛关注,但行业专家指出,这家数据巨头真正的突破性进展其实隐藏在合作新闻的背后。Databri…
-
通义千问3-Next震撼发布:仅30亿参数展现惊人效能突破
人工智能领域迎来新的里程碑——阿里云旗下通义千问团队最新推出的Qwen3-Next模型,以仅30亿参数的轻量级架构,实现了媲美百亿参数大模型的卓越性能。这一突破性进展不仅重新定义了…
-
字节跳动开源Seed-OSS-36B模型:512K超长上下文架构重塑开源LLM格局
在全球AI竞赛进入白热化的2025年夏季,字节跳动旗下Seed团队突然在Hugging Face平台开源Seed-OSS-36B系列大语言模型,凭借512K tokens的行业领先…