一个模型整合多模态输入
如果创作者希望用同一个模型同时处理文本、图像、视频和主体参考,Kling O1 会是非常合适的选择。


工作流预览
就绪当故事节奏、分镜推进和镜头语言需要先由文字定义时,用这一模式作为起点。
当前简报
以产品照片作为主参考,保持瓶身形状和标签一致,然后生成一支带慢速推进镜头的高端发布视频。
Kling O1 于 2025 年 12 月 1 日正式发布。根据快手公告,Kling O1 被定位为统一的多模态创作工具,可在同一引擎中整合文本、视频、图像和主体输入。公告还提到,Kling O1 把参考驱动生成、文生视频、首尾帧生成、视频局部重绘、视频修改、风格重渲染和镜头延展整合进同一条工作流。对于不只关心单一任务,而是希望获得更完整创作系统的用户来说,Kling O1 是这一页面集群中最强的入口之一。

如果创作者希望用同一个模型同时处理文本、图像、视频和主体参考,Kling O1 会是非常合适的选择。
官方发布把 Kling O1 明确放在解决一致性问题的位置上,因此这个页面天然适合面向重视人物和场景连贯性的用户。
对于同时需要生成、修改、局部重绘、重渲染和镜头延展的创作者来说,O1 是最容易讲清完整模型能力的一页。

基于参考并保持主体一致性的视频生成
同时混合文本、图像和视频输入的创意项目
需要统一编辑链路的广告与电商视频
强调场景连续性的影视或社媒内容流程
想把 Kling O1 与更早 Kling 版本页面进行比较的用户
01
在添加其他条件之前,先决定文本、图像、视频或主体参考中哪一个是主信号。
02
如果角色连续性或场景连续性很重要,就尽早写出来,并保持参考指令直接清晰。
03
先完成生成,再逐步加入修改或延展目标,这样整条创作路径会更容易控制。
通过下面这些相关页面,你可以把版本迭代带来的能力变化,与更偏工作流导向的入口一起进行比较。