上周四，OpenAI 发布了首个视频生成模型 Sora。栩栩如生的高清视频让众多网友惊呼“真假难辨，以后连视频证据都不可信了吧”！

作为一个正对视频号跃跃欲试的技术传播小号主，自然知道视频制作的门槛。之前，哪怕只是想做个好一点的动图，也需要花好长时间。每次动手前，我都得进行一下心理建设！

对于像我这样的业余选手来说，“龙年一开年，Sora 霸屏了”绝对是个好消息。

本文将从一个普通群众的角度总结一下 Sora 及其竞品的功能特性，从而更全面地展现人工智能在视频制作领域的发展现状，说不定能帮助很多像我一样的小伙伴挑选到更顺手的工具呢！

Sora

根据 OpenAI 的技术报告，Sora 可以根据用户输入的提示词、图片和视频等素材自动生成视频。

Sora 生成的视频最长可达一分钟，视频尺寸可以是 1920×1080p（宽屏）、1080×1920p（竖屏）以及二者之间的任意尺寸。也就是说，Sora 可以直接生成可在各种设备上播放的视频，无需后续编辑。

如果你想观看视频样片，请移步 OpenAI 官网：《Sora 简介》和《Sora 官方技术报告》

除了自动生成视频，Sora 还可以生成图片、编辑图片和视频。

图片可以被视为单帧视频。Sora 可以生成任意尺寸的图片，分辨率最高可达 2048×2048。

如果你给 Sora 输入图片和提示词，它能按照提示词将图片变成视频。

如果你给 Sora 输入视频和提示词，它能按照提示词为视频添加片头或片尾、变换视频风格或者将视频无缝拼接在一起。

目前，Sora 还没有对公众开放。但 OpenAI 已经邀请红队成员、视觉艺术家、设计师和电影制作人等各领域的专业人士试用 Sora，以评估关键领域的危害和风险，为后续的改进和完善模型收集专业的反馈意见。

红队是网络安全中的术语，指通过模拟真实的攻击手法测试和评估系统弱点的安全专家团队。

其他视频生成模型

Sora 并不是地球上的首个视频生成模型。OpenAI 发布 Sora 之前，Runway AI、Stability AI、 MoonValley AI 和 Pika Labs AI 等许多创业公司早已发布了类似的视频生成模型。

各个模型生成的视频质量虽然参差不齐，但也有一些不错的视频样片。那么，为什么 Sora 还是惊艳了所有人呢?

除了在画面内容的丰富度、逼真度和流畅度上逊色很多之外，其他视频生成模型的最大硬伤还有视频时长，尤其是在文生视频方面。

除了 Runway 的视频生成模型 Gen-2 支持生成最长 16 秒的视频，其他的视频生成模型都只能生成几秒钟的视频（或许叫“动图”更合适）。

除了视频生成模型，还有一类基于素材库的视频生成工具虽然智能程度不高，却比较实用。知乎曾经上线过类似的功能可以一键【生成视频】。不过，知乎的这个功能现在不能用了。

在了解视频生成模型的时候，我意外发现了一个叫做 Fliki 的视频生成工具。

standalone

它可以根据文字生成带语音的视频。视频素材可以从自带的 Fliki 素材库中选取，也可以上传自己的素材。

它允许为每个段落（场景）单独设置语音参数（比如使用哪种语言、哪种口音、男声还是女声等）、单独选取视频素材，还能设置标题和背景音乐等。

显然，Fliki 的智能程度比视频生成模型要差很多，但在很多场合里它仍然是一个非常好的选择。

standalone