Gen-3 Alpha 是 Runway 对 OpenAI 的 sora 的回应:9 个视频展示了 AI 模型的多功能性 | 科技新闻

人工智能发展迅速,应用范围也不断扩大。一方面,人工智能取代人类工作的威胁越来越大,另一方面,人工智能也展示了众多增强人类创造力的方法。总部位于美国的 Runway AI 推出了其最新的人工智能模型 Gen-3 Alpha。该公司声称,这是“高保真、可控视频生成的新前沿”。 Gen-3 Alpha 是 Runway 即将推出的一系列模型中的第一个,这些模型是在为大规模多模式训练而构建的新基础设施上训练的。Runway 声称,新模型在保真度、一致性和运动方面比 Gen-2 有了很大的改进。这是它朝着构建通用世界模型迈出的一步——通用世界模型是人工智能的下一个重大进步,因为这些系统将能够理解视觉世界及其动态。 自从 Gen-3 Alpha 模型推出以来,互联网用户一直在与世界分享他们独特的创作。这些高清视频展示了 Runway AI 的新 AI 模型的多功能性和范围。以下是 Gen-3 Alpha 的一些引人入胜的视频。 创作你的怪物小说 像 Gen-3 Alpha 这样的文本转视频模型可以真正放大您的创造力。X(以前是 Twitter)上的一位名为 Uncanny Harry AI 的用户使用该模型制作了一段短片,视频中一只虚构的怪物从伦敦泰晤士河中升起。视频显示一只“丑陋的怪物”从河中升起,让人想起著名的哥斯拉或怪兽。这段 11 秒的视频具有电影般的效果,阴云密布的天空下是伦敦的阴暗场景,怪物在汹涌的海浪中缓缓升起。 延时摄影铅笔画 另一位用户 Anu Akash 在 X 的个人简介中声称自己正在“探索 AI 工具”,她分享了 Gen-3 Alpha 制作的一段短视频,视频中以延时方式展示了一位女孩的铅笔画。Akash 使用了描述手绘铅笔画的俯视延时视频的提示。她将其描述为一幅从头到尾都长着兔子头发的女孩艺术作品。该用户还承认,她给出的提示中的毛发是拼写错误,因为她本意是“兔子耳朵”。不过,她似乎对 Gen-3 Alpha 的成果很满意。 用花讲故事 […]

如何在 Runway 上进行口型同步

Runway 最近发布了 Gen-3 Alpha 工具,旨在将 AI 视频创作提升到一个新的水平。阅读完本指南后,您将清楚地了解如何使用 Runway 的口型同步工具,并能够确定它是否是满足您视频创作需求的正确解决方案。 作为开创性 Stable Diffusion 图像生成平台的早期开发者之一,Runway 为人工智能图像和视频创作的各个方面带来了丰富的经验。Runway 最容易使用和最受欢迎的功能之一是其音频到视频唇形同步工具。这项技术允许用户通过将唇部动作与音频输入相匹配来创建逼真的头部说话视频。无论您是内容创作者、教育工作者还是商务专业人士,此工具都提供了一系列应用程序来增强您的视频项目。 1. 登录 (图片:© Future) 登录到 跑道。 如果您是第一次使用AI平台,您可以使用您的Gmail账户进行注册。 2. 浏览界面 (图片:© Future) 视频口型同步功能位于 Runway 帐户仪表板的音频菜单下 以及 3D 工具和图像和视频生成。 选择您喜欢的声音 从选项中。 用户界面的优点在于每个阶段都大量使用教程材料,这对于刚开始接触 AI 媒体之旅的初学者来说是令人放心的。 3. 输入提示 (图片:© Future) 口型同步页面本身非常简单且易于使用。 左上角是用户输入的空间。 这可以通过文本提示、上传的音频文件或动态录制音频的工具来实现。 如果您每月支付 35 美元升级到专业版计划,您甚至可以录制自己的自定义声音并与头像一起使用。 4. 选择你的声音 (图片:© Future) 我决定上传我之前创建的 AI 生成的头像,并将其与一个简短的脚本结合起来,以测试唇部动作的准确性。 有大量的声音可供选择,这可能反映了 […]

Runway 的最新 AI 视频生成器让巨型棉花糖怪物栩栩如生

放大 / 使用提示“一个巨大的人形生物,由蓬松的蓝色棉花糖制成,踩着地面,向天空咆哮,身后是湛蓝的天空”生成的 Runway Gen-3 Alpha 视频的屏幕截图。 周日,Runway 宣布了一种新的 AI 视频合成模型,名为 第三代阿尔法 该软件仍在开发中,但它似乎可以制作出与 OpenAI 的 Sora,于今年早些时候首次亮相(目前也尚未发布)。它可以根据文本提示生成新颖的高清视频,这些提示包括现实中的人类以及踩踏乡村的超现实怪物。 Gen-3 Alpha 不会生成音频来配合视频片段,时间连贯的生成(保持角色随时间保持一致的生成)很可能依赖于 类似的高质量培训材料但 Runway 在过去一年中在视觉保真度方面的进步却不容忽视。 人工智能视频热度上升 过去几周,人工智能研究界的人工智能视频合成工作非常忙碌,其中包括推出中国模型 克林,由总部位于北京的快手科技公司(有时称为“Kwai”)开发。Kling 可以以每秒 30 帧的速度生成两分钟的 1080p 高清视频,速度高达 细节和连贯性 据报道,这与 Sora 相匹配。 Gen-3 Alpha 提示:“日本某城市中,高速行驶的火车窗户上,隐约可见一位女性的影子。” Kling 出道后不久,社交媒体上就开始有人创建 超现实的人工智能视频 使用 Luma AI 的 亮度梦幻机。这些视频很新奇,也很怪异,但一般来说 缺乏连贯性;我们测试了 Dream Machine,但对所看​​到的一切都没有留下深刻的印象。 广告 与此同时,最早将文本转视频的先驱之一、总部位于纽约的 Runway(成立于 2018 年)最近发现自己成了表情包的笑柄,这些表情包表明,与较新的视频合成模型相比,其 Gen-2 技术已不再受欢迎。这可能促使 […]