功能综述
Sora是一款能够快速制作最长一分钟视频的AI工具,这些视频能够准确反映用户提示并实现一镜到底的效果。相比其他AI视频工具还在突破几秒内的连贯性,Sora已经能够呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。使用Sora需要在OpenAI官网上进行操作,首先需要拥有OpenAI账号并升级至4.0版本。如果你已经拥有3.5版本的账号,可以按照教程快速完成升级,整个过程仅需一分钟。
Sora的主要功能
静态图生成视频
Sora具备根据静态图像生成视频的能力,能够让图像内容动起来,并关注细节部分,使得生成的视频更加生动逼真。这一功能在动画制作、广告设计等领域具有广泛的应用前景。
视频扩展与缺失帧填充
Sora能够获取现有视频并对其进行扩展或填充缺失的帧。这一功能在视频编辑、电影特效等领域具有重要应用,能够帮助用户快速完成视频内容的补充和完善。
连接视频
Sora还可以连接两个输入视频,在具有完全不同主题和场景组成的视频之间实现无缝过渡。
其他能力
- 图像生成:Sora可以生成各种尺寸的图像,分辨率最高达2048×2048。
- 3D一致性:Sora可以生成动态运动的视频,随着相机的移动和旋转,人和场景元素在三维空间中一致移动。
- 远距离连贯性与物体持久性:Sora通常能够有效地对短期和长期依赖关系进行建模,包括人、动物和物体的持久化,即使它们被遮挡或离开框架。
- 互动性:Sora有时可以用简单的方式模拟影响世界状态的动作。例如,一个画家可以在画布上留下新的笔触,并随着时间的推移而持续,或者一个男人可以吃汉堡并留下咬痕。
- 模拟数字世界:Sora可以模拟人工过程,例如电子游戏,并能够通过基本策略控制玩家,同时高保真地渲染世界及其动态。
- 多机位生成:Sora可以生成多机位、多角度的视频。
Sora的缺点
尽管Sora功能强大,但也存在一些不足:
- 物理原理模拟:Sora可能难以准确模拟复杂场景的物理原理。
- 因果关系理解:Sora无法理解因果关系。
- 空间细节混淆:Sora有时会混淆提示的空间细节。
- 时间推移描述:Sora难以精确描述随着时间推移发生的事件,缺乏一定的灵动性和事实性。
Sora的局限性
- 未全面开放:Sora尚未全面开放,真正的AI文生视频并未被广泛应用。
- 剪报式智能:当前自媒体使用的文生视频工具,如百度的文心一言、抖音的剪映,虽然能够快速生成视频,但主要基于文本内容“智能搜索”相应的库存图片和视频拼接而成,缺乏真正的导演创意。
- 创意为王:即使Sora这种基于深度学习的大模型成熟,工具再方便,创意仍然是关键。如同人人会写字却少数人才能成为作家,门槛的降低并不会让档次也降低,但会让更多人拥有过去专属少数人的机会。