盛数科技完成超8600万美元A+轮融资,加速多模态AI商业化落地

盛数科技完成超8600万美元A+轮融资,加速多模态AI商业化落地

近日,多模态AI领域的先锋企业盛数科技宣布完成规模超6亿元人民币(约合8600万美元)的A+轮融资,这一里程碑式的融资将为其多模态大模型在数字与物理世界的规模化应用注入强劲动力。本轮融资由中关村科学城和LINK-X CAPITAL联合领投,万兴科技、视觉中国、拓尔思等战略投资方参与,多家老股东也持续追加投资,充分彰显了资本市场对盛数科技技术路线与商业化进展的认可。

在多模态AI从实验室工具转向支撑实体经济的基础设施的关键节点,这笔资金的注入恰逢其时。盛数科技的发展轨迹正是这一行业趋势的缩影:从早期的技术探索,到如今将研究成果转化为跨行业落地的成熟产品。

作为全球最早聚焦多模态生成算法的团队之一,盛数科技自成立起就锚定了技术攻坚的核心方向。2022年,公司推出U-ViT架构,为实现文本、图像、视频跨模态推理奠定了技术基础,这一研究导向的战略为2024年中期推出Vidu大模型铺平了道路。

不同于传统的文本转视频或图像转视频技术,Vidu以独特的“参考生成视频”能力切入市场,创新性地解决了商业视频生成中长期存在的多实体一致性难题。该系统不再将每一帧视为孤立输出,而是注重场景中多个主体在不同画面中的连贯性。自上线以来,盛数科技持续迭代优化,先后推出多个版本,不断提升模型的语义理解能力、运动稳定性、视觉连贯性与推理速度。

最新发布的Vidu Q3版本则将重点放在了叙事能力的强化上,支持最长16秒的音视频同步生成、原生1080P分辨率输出、精准镜头转场、多语言文本渲染与多语种输出。这些功能的升级,让Vidu从生成实验性短向视频的工具,真正向适配专业生产流程的平台迈进。

除了输出质量,效率也是盛数科技打造核心竞争力的关键。2025年末,公司开源了TurboDiffusion框架,大幅降低了视频生成延迟。借助这一框架,在单台高端GPU上生成5秒视频的时间可缩短至2秒以内,相比早期技术实现了数量级的提升。这种对速度的追求并非单纯的技术炫技,更低的延迟与算力需求直接关系到多模态模型规模化部署的可行性,尤其是在交互式应用与实时创作工具场景中。通过降低高质量视频生成的成本与时间,盛数科技正推动多模态AI在专业场景中的日常应用。

目前,盛数科技已围绕Vidu构建了涵盖托管服务、SaaS产品、垂直应用与智能代理工具的完整生态,服务覆盖全球200多个国家和地区的创作者、工作室与企业客户。2025年,公司用户规模与营收均实现了十倍以上的增长,展现出强劲的市场渗透力。

在影视娱乐领域,Vidu已应用于动画制作、短视频生产与长片制作流程,覆盖内容方、工具提供商与制作工作室;互联网平台与智能硬件企业则将其用于营销素材创作、交互式内容开发与产品创新;广告与游戏行业也成为重要的落地场景,品牌方与广告代理商借助Vidu规模化生成营销视频,游戏开发者则用其制作广告内容与游戏场景。在国际市场,Vidu也获得了创意工具开发者与企业用户的青睐,应用场景延伸至教育、广电与文旅等领域。

多模态大模型的发展意义远不止于视频创作。通过将文本、图像、音频与运动信息整合到统一系统中,这类模型能让机器以更接近人类的方式理解上下文信息,为各行业带来更短的生产周期、更低的高质量内容创作门槛,以及人机交互的全新形态。

与此同时,多模态AI的成熟也带来了关于内容真实性、知识产权与负责任部署的思考。随着生成式视频的逼真度不断提升,技术防护与治理框架的构建将成为维护数字媒体信任的关键。

展望未来,多模态模型不仅将在数字工作流中发挥重要作用,还将逐步渗透到机器人、仿真系统与智能环境等物理世界场景中。盛数科技的最新融资,将助力其在多模态AI从创意工具向下一代生产力基础设施转型的过程中,占据行业前沿位置。

原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/sheng-shu-ke-ji-wan-cheng-chao-8600-wan-mei-yuan-a-lun-rong

Like (0)
王 浩然的头像王 浩然作者
Previous 1天前
Next 1天前

相关推荐

发表回复

Please Login to Comment