12 月 2 日消息,可灵 AI 正式全量上线其全新 O1 视频大模型,号称 " 全球*统一多模态视频大模型 ",打破传统视频生成工具功能割裂、操作复杂的痛点。
目前,该模型已在可灵 App 及官网开放体验。

与以往需分步处理文生视频、图生视频、局部编辑等任务不同,可灵 O1 基于创新 MVL(多模态视觉语言)交互架构,在单一输入框内无缝融合文字、图像、视频等多种指令。
结合 Chain-of-thought 技术,模型不仅能理解用户意图,还能进行常识推理与事件推演,实现更符合逻辑的视频生成。

例如,用户上传一段真人视频后,只需简单对话指令,即可局部增加 / 删除元素、智能延展前后镜头、捕捉动作生成新画面。
更关键的是,O1 通过多视角主体构建技术,彻底解决视频中人物或物体在镜头切换时 " 特征漂移 " 的行业难题,确保多主体场景下画面精准连贯。
此外,O1 支持 3 – 10 秒自由生成时长,把叙事节奏的控制权交还创作者。
无论是短视频博主、广告团队还是个人用户,都能快速产出高质量、高一致性的创意视频。



