OpenCV 创始人推出 AI 视频初创公司 CraftStory，向 OpenAI 与谷歌发起挑战

王浩然 • 2025年11月21日下午6:00 • AI前沿 • 356 views

由全球最广泛使用的计算机视觉库 OpenCV 创始人创立的 AI 初创公司 CraftStory 正式走出 “隐身模式”，凭借其最新发布的 Model 2.0 视频生成系统，在 AI 视频领域掀起变革。该系统最引人瞩目的突破在于，能生成长达 5 分钟、以人为中心的高真实感视频 —— 这一能力远超行业竞品，包括 OpenAI 的 Sora 2（最长 25 秒）与谷歌的 Veo（多数竞品仅能生成 10 秒以内片段），为企业解决 “视频制作规模化难” 的痛点提供了新路径，尤其适用于培训、营销、客户教育等需要长时程视频的场景。

CraftStory 此次获得 200 万美元初始融资，资金主要来自 Andrew Filev（2021 年将项目管理软件公司 Wrike 以 22.5 亿美元出售给 Citrix，现运营 AI 编码公司 Zencoder）。尽管与 OpenAI 单轮超 60 亿美元的融资规模相比相形见绌，但公司创始人兼 CEO、OpenCV 早期核心贡献者 Victor Erukhimov 强调，“巨额算力与资金并非成功的唯一路径”，团队的核心竞争力在于计算机视觉领域的深厚积累与对 “高质量数据” 的专注，而非盲目追求规模。

Model 2.0 的技术突破源于其创新的 “并行扩散架构”，彻底颠覆了传统视频生成模型的 “顺序处理” 逻辑。传统模型通过在 “时间作为第三轴” 的三维空间中运行扩散算法生成视频，生成长度越长，所需网络规模、训练数据与算力呈正比增长，且易出现 “瑕疵累积” 问题 —— 前几秒的画面缺陷会不断传递到后续片段。而 CraftStory 的并行架构通过 “多小型扩散算法同步运行 + 双向约束连接”，让视频的所有片段（即使是 5 分钟全长）被同时处理，而非分段生成后拼接。Erukhimov 解释：“视频后半段的内容也能反向影响前半段，避免了顺序处理时瑕疵不断叠加的问题。” 例如，生成 “产品教程” 视频时，系统会同步优化开头的操作演示与结尾的总结画面，确保整体逻辑连贯、细节一致，不会出现传统模型中 “前半段按钮位置与后半段不符” 的漏洞。

数据训练策略上，CraftStory 摒弃了行业普遍依赖的 “互联网爬取视频”，转而投入资源打造专有数据集。公司聘请专业工作室，使用高帧率摄像系统拍摄演员，即使是手指快速移动等细节也能捕捉清晰，避免了标准 30 帧 / 秒视频中常见的运动模糊。这种对 “高质量数据” 的坚持，使得 Model 2.0 在无需海量数据与巨额训练预算的情况下，仍能生成细腻、自然的视频。Erukhimov 表示：“制作高质量视频的关键不是数据量，而是数据质量 —— 我们用少量精准数据，就实现了传统模型需海量数据才能达到的真实感。”

当前，Model 2.0 采用 “视频到视频” 的工作模式：用户需上传一张静态图像（如产品图、人物肖像）作为基础，再上传一段 “驱动视频”（包含希望 AI 复制的人物动作），系统会结合两者生成新视频。CraftStory 提供由专业演员拍摄的预设驱动视频（演员会从动作数据使用中获得分成），用户也可上传自定义 footage。在生成效率上，系统生成 30 秒低分辨率视频约需 15 分钟，同时具备先进的唇形同步功能 —— 能将脚本或音轨与人物嘴部动作精准匹配，以及手势对齐算法 —— 确保肢体语言与语音节奏、情感基调保持一致。例如，生成 “软件操作培训视频” 时，AI 能让虚拟讲师的手势与 “点击按钮”“拖拽文件” 的语音讲解同步，表情也会随内容情绪（如强调重点时的严肃、演示成功时的微笑）自然变化。

在市场定位上，CraftStory 选择聚焦 B2B 领域，避开消费者创意工具的红海，专注解决企业视频制作的核心痛点。对软件公司、制造业等企业而言，传统培训视频、产品演示视频制作成本高（动辄数万美元、耗时数月）、更新慢（产品迭代后需重新拍摄），而 AI 生成的短片段又无法完整讲解复杂操作（如 “企业软件流程设置”“工业设备维护步骤”）。Model 2.0 的 5 分钟长视频能力恰好填补这一空白，Filev 举例：“小企业主如今能在几分钟内生成原本需 2 万美元、2 个月制作的培训视频，且产品更新后只需调整脚本，无需重拍。” 此外，CraftStory 还向创意代理机构推广，帮助其降低多日拍摄的成本 —— 代理机构只需拍摄一次演员素材，即可通过 AI 转化为不同风格、不同场景的成品视频，大幅提升制作效率。

未来，CraftStory 的 roadmap 清晰聚焦两大方向：一是开发 “文本到视频” 模型，让用户直接通过脚本生成长视频，进一步降低使用门槛；二是支持 “移动镜头” 场景，如高端广告中常见的 “边走边说” 格式，丰富视频表现形式。

从行业竞争格局来看，CraftStory 面临的对手既有 OpenAI、谷歌等资金雄厚的科技巨头，也有 Runway、Pika、Stability AI 等专注视频生成的初创公司。但 Erukhimov 认为，团队的差异化优势在于 “专注以人为中心的长视频”—— 巨头们更倾向于打造 “通用视频基础模型”，而 CraftStory 则深耕企业所需的 “场景化长视频”，相当于 “巨头建引擎，我们建引擎之上的专业生产车间”。这种聚焦策略，让 CraftStory 在资源有限的情况下，仍能在细分领域形成竞争力。

尽管目前 Model 2.0 仅通过app.craftstory.com/model-2.0开放早期访问，且面临 “资金规模小、算力资源有限” 的挑战，但 Erukhimov 对未来充满信心。他认为，AI 生成视频将很快成为企业传递信息的主要方式，而 CraftStory 的长视频能力与企业需求的契合，将帮助其在竞争中占据一席之地：“当企业需要一段能完整讲解产品、培训员工的视频时，他们会发现，只有我们能满足这种‘长而精’的需求。”

原创文章，作者：王浩然，如若转载，请注明出处：https://www.dian8dian.com/opencv-chuang-shi-ren-tui-chu-ai-shi-pin-chu-chuang-gong-si

Like (0)

王浩然作者

0 0

Meta DreamGym 框架：在模拟世界训练 AI 智能体，大幅降低强化学习成本

Previous 2025年11月21日

打造 AI 智能体的 “谷歌搜索”：Fetch 推出 ASI:One 与商业层级，开启非人类网络新时代

Next 2025年11月21日

AI前沿

德勤调查：企业对生成式人工智能持谨慎乐观态度

一项新调查发现，一年前，企业对生成式人工智能的前景充满热情，但随着它们面临将人工智能的可能性转化为成果的复杂性，这种热情已逐渐消退，转而变得乐观起来。德勤第四份《企业生成人工智能…

王浩然
2025年1月26日
000
AI前沿

海外客户突破一万家，国际业务成腾讯云新增长点

9月5日至6日，2024腾讯全球数字生态大会在深圳国际会展中心举办。会上，腾讯云公布企业出海全景图，并发布国际业务阶段成绩单：腾讯云海外客户累计突破1万家，全球合作伙伴超过1.1万…

点点
2024年9月7日
000
AI前沿

人工智能正在帮助品牌避免与有争议的网红合作

对于希望以真实方式推出内容来推广产品和服务的品牌来说，与网红合作可能是一个不错的选择。这类合作可以显著提高品牌知名度和品牌情感，但也存在风险。社交媒体明星在最好的时候也是不可预测的…

点点
2024年10月26日
000
AI前沿

Credo AI 的集成中心可实现亚马逊、微软等公司 AI 项目的自动化治理

人工智能治理公司Credo AI推出了一个新平台，该平台与第三方人工智能运营和业务工具相结合，以更好地了解负责任的人工智能政策。 Credo AI 的 Integrations …

王浩然
2024年10月7日
000
AI前沿

Anthropic创纪录赔偿15亿美元：AI公司与作家版权纠纷达成历史性和解‌

在人工智能训练数据版权争议愈演愈烈的背景下，AI公司Anthropic与作家群体达成了一项具有里程碑意义的和解协议。根据2025年9月6日公布的法律文件，这家以开发Claude A…

王浩然
2025年9月7日
000
AI前沿

Flower Labs发布创新服务：自动切换本地与云端AI

引言‌ 在科技日新月异的今天，人工智能（AI）正逐步渗透到我们生活的方方面面，从智能家居到自动驾驶，从医疗诊断到金融分析，AI正以其独特的优势引领着新一轮的科技革命。近日，Flow…

王浩然
2025年3月13日
000
AI前沿

Reddit押注AI搜索：从流量红利到营收新引擎的野心

在周四发布的2025年第四季度财报中，Reddit交出了一份远超华尔街预期的成绩单：季度营收达到7.26亿美元，同比增长70%，净利润2.52亿美元；全年营收突破22亿美元，净利润…

王浩然
2026年2月10日
000
AI前沿

专家观点：人工智能尚未准备好成为科研合作者‌

随着人工智能技术的飞速发展，关于AI能否胜任科研合作者角色的讨论日益激烈。然而，近期一项调查结果显示，多数专家对此持保留态度，他们认为人工智能目前尚未准备好成为真正的科研合作者。 …

王浩然
2025年3月6日
000
AI前沿

Zyphra 的新 Zyda-2 数据集可让企业以高精度训练小型 LLM

Zyphra Technologies是一家致力于开发多模式代理系统的公司，该系统结合了下一代状态空间模型架构、长期记忆和强化学习方面的先进研究，该公司刚刚发布了 Zyda-2，这…

王浩然
2024年10月19日
000
AI前沿

OpenAI快速更新Responses API，新增MCP支持、GPT-o原生图像生成等企业级功能‌

OpenAI近期对其新推出的Responses API进行了一系列重大更新，旨在进一步简化开发者和企业构建智能、面向行动的代理应用程序的过程。此次更新涵盖了远程Model Cont…

王浩然
2025年5月23日
000
AI前沿

毫秒级突破：补丁自动化如何堵住攻击者的最快漏洞

在当今的数字世界中，拖延打补丁已成为导致网络崩溃和公司受损的主要原因，其危害甚至超过了零日漏洞利用或高级网络攻击。忽视补丁管理，就如同敞开了网络的大门，让攻击者轻易得逞。无论是数据…

王浩然
2025年2月23日
000
AI前沿

DeepSeek：全面了解这款AI聊天机器人应用‌

在人工智能领域，一款名为DeepSeek的聊天机器人应用正逐渐崭露头角。这款应用凭借其强大的AI技术和出色的用户体验，吸引了众多用户的关注。 DeepSeek的核心优势在于其先进的…

王浩然
2025年3月10日
000
AI前沿

房产行业的“Plaid时刻”将至：开放API将为7500万住户解锁AI智能助手

当你只需动动手指就能在手机上完成转账、查看医疗报告、预订机票时，你是否想过，每天都要打交道的住宅物业管理，还停留在20年前的效率水平？在这个数字化渗透到生活每个角落的时代，有750…

王浩然
2026年3月14日
000
AI前沿

OpenAI 在 2025 年初大力宣传通用人工智能和超级智能

就像2024 年在纽约市结束的方式一样，2025 年人工智能新闻周期也以一声雷鸣般的响声开始。 OpenAI 联合创始人兼首席执行官 Sam Altman昨天 (1 月 5 日) …

王浩然
2025年1月7日
000
AI前沿

Mistral Small 3 将开源 AI 带给大众——更小、更快、更便宜

迅速崛起的欧洲人工智能初创公司Mistral AI今天推出了一种新的语言模型，该公司声称该模型的性能可与三倍于其规模的模型相媲美，同时大幅降低计算成本——这一进展可能会重塑先进人工…

王浩然
2025年2月2日
000
AI前沿

OpenAI 招募微软副总裁，加剧 AI 人才争夺战

Sebastien Bubeck 曾任微软生成式人工智能副总裁

点点
2024年10月22日
000
AI前沿

Opentrons与NVIDIA联手开启AI驱动实验室新时代：让机器人变身“学习型科学家”

在过去十年里，人工智能在生命科学领域的应用大多聚焦于“预测”——AI模型可以预测药物靶点、生成分子结构，或是分析体量庞大的生物数据集。虽然AI带来的科研洞见正在飞速增长，但实验执行…

王浩然
2026年2月9日
000
AI前沿

人工智能克隆是明星声音的最大威胁

AI 语音克隆技术专家 Podcastle 进行了一项调查，以发现哪些名人最容易受到 AI 语音克隆滥用的风险。该公司对 1,000 名美国民众进行了调查，以了解他们…

点点
2024年9月11日
000
AI前沿

编程新风尚：Vibe Coding引领潮流，Google Stitch强势入局

在科技领域，Vibe Coding正成为一股不可忽视的力量，它标志着AI与自然语言提示在代码自动生成方面的广泛应用，正逐步改变着传统的编程思维方式。近日，科技巨头Google也加入…

王浩然
2025年5月28日
000
AI前沿

Google虚拟卫星AlphaEarth如何重新定义全球地球测绘‌

我们正见证地理空间技术的革命性突破。Google最新推出的虚拟卫星系统AlphaEarth正在彻底改变人类对地球的认知方式，通过融合人工智能、量子计算与分布式传感网络，构建出前所未…

王浩然
2025年8月10日
000

发表回复

Please Login to Comment

OpenCV 创始人推出 AI 视频初创公司 CraftStory，向 OpenAI 与谷歌发起挑战

相关推荐

发表回复