圣数科技发布了其最新的 AI 模型 Vidu 1.5,该公司旨在涉足文本到视频和图像到视频生成领域,将新的竞争对手带入市场,与今年早些时候宣布的 OpenAI Sora 等公司竞争。对于不了解圣书科技的人来说,它是一家新兴的人工智能公司,成立于去年 2023 年 3 月。
该公司的新 AI 模型与 OpenAI 的 Sora 非常相似,尽管有一些调整。Vidu 1.5 能够从图像和文本提示中生成长达 8 秒的视频。AI 模型使用其内部的多实体一致性功能无缝拼接人员、对象和环境,同时根据用户提示生成视频。
Vidu 还有一个叫多角度一致性的东西,它允许用户使用任何输入的图像或通过上传单个主题的三张照片来生成视频。这家 AI 公司进一步表示,AI 模型利用高级控制功能在生成的输出中添加更好的运动和详细的背景。根据模型制作者的说法,您可以在 30 秒内生成一个 8 秒的视频。
Vidu 还在其官网上列出了一些由 Vidu 1.5 模型生成的 AI 视频,感觉非常逼真。但问题是,您只能创建 8 秒的视频,而它的直接竞争对手 Sora 模型允许您制作长达一分钟的视频。
说到视频分辨率,Vidu 1.5 能够以最大 1080p 的分辨率制作视频。Vidu 1.5 有其自身的缺陷。例如,一些 AI 生成的视频缺乏小细节,并且还揭示了一些不切实际的动作,例如在火焰穿过汽车中间的汽车场景中。虽然这些不是主要缺陷,甚至在您仔细观察它们之前都不会注意到。
Vidu 1.5 多模态 AI 在免费增值模式下运行。免费版可让您生成具有速度分辨率的 4 秒剪辑,而高级版每月花费 9.99 美元,允许您生成分辨率高达 8p 的 1080 秒视频。Vidu 1.5 现在可通过其官方网站向所有人提供。