Meta 展示了一组以 Movie Gen 名义收集的基础模型,为创作者提供了生成、定制和编辑超现实视频的工具,甚至通过文本描述提供音频。通过这种方式,扎克伯格与其他公司一起创建人工智能 (AI) 工具来生成视频,就像 OpenAI 去年 2 月与 Sora 所做的那样。

这个新工具, 用梅塔的话来说面向内容创作者和电影制作人,目标是帮助“增强而不是取代他们的创造力”。 Movie Gen 有两种功能模型,一种针对视频(Movie Gen Video),有 300 亿个参数,另一种则专注于生成声音(Movie Gen Audio),有 130 亿个参数。

扎克伯格对其进行了测试

正如 Meta 所解释的,Movie Gen 的工作方式与其他此类实用程序非常相似。只需文字描述,就可以创建长度为 4 到 16 秒、每秒 16 帧的视频。人工智能还允许您使用不同的文本描述编辑现有剪辑,甚至通过上传用户照片来创建个性化视频。尽管该公司表示该材料是超现实的并且具有全高清质量,但令人惊讶的是 Meta 选择以 16 FPS 来制作它们,而不是像电影行业那样采用每秒 24 帧的风格。

扎克伯格本人通过 Instagram 上的一篇帖子首次展示了 Meta Movie Gen 的功能。在其中你可以看到他在锻炼,而背景、他的衣服或设备的不同元素会根据人工智能的要求而变化。

生成音频的能力

Movie Gen 的主要区别元素之一是它为相关视频生成声音的能力。让我们记住,像 Sora 这样的工具不提供这种可能性。据其创建者介绍,这个 130 亿参数模型可以使用视频和文本描述来生成与图像中发生的情况相匹配的音轨。

在 Meta 分享的例子中,可以看到一辆四轮车在加速和跳跃,背景中伴随着音乐和发动机的噪音。你还可以看到一条蛇在植被中移动,树叶的噪音和相应的音乐伴奏也是由人工智能创建的。这次,音频允许长达 45 秒的持续时间,并且可以实现从环境声音到器乐的所有内容。然而,它不允许生成声音或对话,可能是为了避免生成深度赝品。

1728311418
#Meta #通过新的视频生成人工智能 #Movie #Gen #与 #Sora #竞争
2024-10-07 08:38:40

Leave a Reply

Your email address will not be published. Required fields are marked *