视频创作人工智能工具:vasa-1

微软的研究团队推出了一款令人印象深刻的人工智能工具,名为 VASA-1。 它利用该技术生成仅包含一张照片和一个音频样本的视频。 VASA-1 这个名称代表“视觉情感技能与音频”,它提供的不仅仅是面部动画和音频同步。 它还集成了与所提供的音频相关的自然面部表情和头部运动,形成接近真实的某人说话的视频。

它使用“面部潜在空间”模型来创建动作。 它了解生成视频的独立控制和自定义方面,并分解图像的外观以及面部表情和头部姿势。 目前,该工具正用于教育目的,例如 NPC 和虚拟助手。

图片来源:微软

1713620315
#视频创作人工智能工具vasa1
2024-04-20 08:10:02

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​