
AI 初创公司 Runway 正式发布新一代文本生成视频模型 Gen-4.5。该模型以 “物理准确性与视觉精度突破” 为核心亮点,不仅能生成电影级逼真画面,还能精准匹配复杂文本提示,进一步模糊了 AI 生成内容与真实影像的界限,同时延续了前代模型的速度与效率优势,为创作者与企业带来更灵活的视频创作工具,也推动文本生成视频(text-to-video)领域进入 “高保真与强可控” 的新阶段。
从核心能力来看,Gen-4.5 在物理真实性与提示词遵循度上实现显著突破。Runway 在官方声明中强调,该模型达成 “前所未有的物理准确性”——AI 生成的物体运动时能呈现真实的重量感、动量与作用力,例如人物行走时肢体摆动的惯性、物体碰撞时的受力反馈均贴合现实物理规律;液体流动也符合真实动力学特性,如水流的倾泻、咖啡的泼洒等场景中,液体形态与运动轨迹自然无违和。同时,模型对文本提示的理解与执行精度大幅提升,即便面对包含多元素、复杂场景描述的提示(如 “低光环境下,镜头平移掠过摆满餐具的厨房台面,窗外光线投射出斑驳阴影与物体倒影”),也能精准还原细节,且不会因场景复杂度提升而降低视频质量。此外,Gen-4.5 在视觉风格适配性上更具优势,可稳定生成照片级写实、风格化动画(如定格动画风、奇幻电影风)、电影质感等多种视觉效果,且同一视频内视觉语言保持连贯统一,例如生成 “戴草帽穿西装的狐狸骑摩托车穿行乡间” 的定格动画风视频时,角色动作、场景细节与艺术风格能始终保持一致,避免出现风格断裂或元素错位。
在技术部署与用户体验层面,Gen-4.5 延续了前代模型的高效特性,同时实现广泛适配。Runway 表示,该模型将逐步向所有用户推送,生成速度与效率与上一代 Gen-4 持平,不会因质量提升而增加等待时间;定价策略也保持一致,所有订阅计划的价格与 Gen-4 相当,确保不同规模的创作者(从个人爱好者到企业团队)都能负担使用。值得注意的是,Gen-4.5 的训练与推理均运行在由英伟达(Nvidia)Blackwell 与 Hopper 系列芯片构建的 AI 集群上,依托英伟达的硬件支持,模型在处理高复杂度场景时仍能保持稳定性能。Runway 还计划将现有全部控制模式(如图生视频、关键帧编辑、视频风格迁移等)整合至 Gen-4.5,让用户可基于同一模型实现多场景创作,无需切换工具,进一步提升创作效率。例如,用户可先通过文本生成初始视频,再通过关键帧调整特定镜头的运动轨迹,最后用视频风格迁移功能将整体画面转为复古电影质感,全流程在单一模型生态内完成。
不过,Gen-4.5 仍存在技术局限性,主要集中在物体持续性与因果推理两方面。在物体持续性上,模型可能出现 “物体帧间消失或错位” 的问题,例如视频中被遮挡的杯子再次出现时位置偏移,或角色的配饰(如帽子)在运动中突然消失;因果推理缺陷则表现为 “效果先于原因发生”,如门在人物未接触门把手前提前开启,或球在被踢之前先产生运动轨迹。这些问题反映出当前文本生成视频技术在 “长时序逻辑连贯性” 上仍有提升空间,Runway 也坦言将在后续迭代中重点优化物体记忆与动作因果关联能力。
从行业竞争与技术趋势来看,Gen-4.5 的发布进一步加剧了文本生成视频领域的竞争,同时推动技术标准提升。此前,OpenAI 已于 2025 年 9 月推出 Sora 2 模型,重点强化物理效果模拟,例如能精准呈现 “人在桨板上做后空翻时的流体动力学与浮力变化”;谷歌也在推进 Veo 3 系列模型,侧重长时长视频生成(如几分钟的产品营销视频)。而 Gen-4.5 则以 “短时长高保真 + 强风格控制” 为差异化优势,尤其适配 Instagram 等社交媒体平台的短视频创作需求,与 OpenAI、谷歌形成 “场景互补” 的竞争格局。此外,Gen-4.5 在行业基准测试中表现亮眼,在 Artificial Analysis 文本生成视频基准评测中以 1247 Elo 分数位居榜首,超越 Sora 2 Pro、谷歌 Veo 3.1 等竞品,成为当前公认的 “性能最强文本生成视频模型” 之一,这一成绩也为行业树立了新的技术标杆,推动更多企业聚焦 “物理准确性” 与 “提示词精准匹配” 的技术突破。
随着 Gen-4.5 等模型的推出,AI 生成视频的逼真度持续提升,也引发了行业对 “内容真实性鉴别” 与 “伦理规范” 的讨论。有分析师建议为 AI 生成视频添加明确标识(如片尾免责声明),以帮助观众区分真实影像与 AI 内容,但这一观点在游戏、影视等行业尚未形成共识 —— 部分企业担心标识会影响内容传播效果,而另一部分企业则认为透明化是避免误导用户的必要措施。Runway 虽未明确提及 Gen-4.5 生成内容的标识方案,但表示将持续关注 AI 伦理问题,在技术创新的同时兼顾社会影响。
总体而言,Runway Gen-4.5 的发布是文本生成视频技术发展的重要里程碑。其在物理准确性、风格控制、效率与成本平衡上的突破,不仅为创作者提供了更强大的工具,也推动行业从 “追求视觉逼真” 向 “兼顾逼真与可控” 转型。尽管存在时序逻辑缺陷,但 Gen-4.5 已展现出 “赋能创意生产” 的核心价值,未来随着技术迭代与生态完善,有望在社交媒体内容创作、影视前期故事板制作、品牌短视频营销等场景中实现更广泛的应用,进一步重塑视频内容的生产模式。
原创文章,作者:王 浩然,如若转载,请注明出处:https://www.dian8dian.com/runway-tui-chu-gen4-5-wen-ben-sheng-cheng-shi-pin-ai-mo