微软推出人工智能模型，让肖像照片说话和唱歌 – 计算机 – 新闻

微软发布了一项关于其人工智能模型 VASA-1 的研究。该模型允许将肖像照片链接到音频文件。然后，VASA-1 生成视频，其中的照片可以“以逼真的方式说话和唱歌”。

AI模型主要是为了设计虚拟角色。 “VASA-1 能够产生与音频完美同步的嘴唇运动。此外，它还可以捕捉各种微妙的面部表情和自然的头部运动，有助于感知真实性和活力。” 微软说。

该公司分享了几段展示这一点的视频，其中包括一段饶舌的《蒙娜丽莎》。模型的用户可以自行调整，例如头部移动或注视方向。在离线模式下，VASA-1 以 45 fps 生成 512×512 像素的视频，在线版本中支持高达 40 fps。微软强调，它没有计划将 VASA-1 商业化，因为担心人工智能模型被滥用来制造 Deepfakes。

布朗：微软

1713541410
#微软推出人工智能模型让肖像照片说话和唱歌 #计算机 #新闻
2024-04-19 13:46:59

Related

Tags: 微软推出人工智能模型让肖像照片说话和唱歌, 新闻, 计算机

相关新闻

沃尔玛出售的近8吨碎牛肉因可能受大肠杆菌污染被召回

May 2, 2024

州政府扩大全民流感疫苗接种范围

May 2, 2024

公布了安省惠特比 401 号高速公路上致命逆行事故受害者的最新细节。

May 2, 2024

大肠杆菌爆发后杂货店召回有机核桃

May 2, 2024

“替罪羊”让 80 年代的电视节目变得愚蠢……彻底堕落

May 2, 2024

永远不会太迟！科学家发现，你可以通过在 50 多岁时变得活跃来“弥补”青少年时期的懒惰

May 2, 2024

泰格·伍兹接受特殊豁免参加六月美国公开赛

May 2, 2024

大规模分析发现，近几十年来，非洲潮湿森林的野火数量增加了一倍

May 2, 2024

四名 BBC 女新闻主播的同工同酬要求被法庭驳回英国广播公司

May 2, 2024

导演的观点 – 在季中赋予坦克力量 — 《守望先锋 2》 — 暴雪新闻

May 2, 2024

红毛猩猩首次用草药治疗野生动物伤口灵长类动物学

May 2, 2024

空军成员因受保护的披露而受到“处罚”

May 2, 2024

Leave a Reply Cancel reply

近期新闻

沃尔玛出售的近8吨碎牛肉因可能受大肠杆菌污染被召回

May 2, 2024

州政府扩大全民流感疫苗接种范围

May 2, 2024

公布了安省惠特比 401 号高速公路上致命逆行事故受害者的最新细节。

May 2, 2024

大肠杆菌爆发后杂货店召回有机核桃

May 2, 2024

“替罪羊”让 80 年代的电视节目变得愚蠢……彻底堕落

May 2, 2024

永远不会太迟！科学家发现，你可以通过在 50 多岁时变得活跃来“弥补”青少年时期的懒惰

May 2, 2024

编辑精选

Web Analytics