Gen-3 Alpha 是 Runway 对 OpenAI 的 sora 的回应:9 个视频展示了 AI 模型的多功能性 | 科技新闻

人工智能发展迅速,应用范围也不断扩大。一方面,人工智能取代人类工作的威胁越来越大,另一方面,人工智能也展示了众多增强人类创造力的方法。总部位于美国的 Runway AI 推出了其最新的人工智能模型 Gen-3 Alpha。该公司声称,这是“高保真、可控视频生成的新前沿”。

Gen-3 Alpha 是 Runway 即将推出的一系列模型中的第一个,这些模型是在为大规模多模式训练而构建的新基础设施上训练的。Runway 声称,新模型在保真度、一致性和运动方面比 Gen-2 有了很大的改进。这是它朝着构建通用世界模型迈出的一步——通用世界模型是人工智能的下一个重大进步,因为这些系统将能够理解视觉世界及其动态。

自从 Gen-3 Alpha 模型推出以来,互联网用户一直在与世界分享他们独特的创作。这些高清视频展示了 Runway AI 的新 AI 模型的多功能性和范围。以下是 Gen-3 Alpha 的一些引人入胜的视频。

创作你的怪物小说

像 Gen-3 Alpha 这样的文本转视频模型可以真正放大您的创造力。X(以前是 Twitter)上的一位名为 Uncanny Harry AI 的用户使用该模型制作了一段短片,视频中一只虚构的怪物从伦敦泰晤士河中升起。视频显示一只“丑陋的怪物”从河中升起,让人想起著名的哥斯拉或怪兽。这段 11 秒的视频具有电影般的效果,阴云密布的天空下是伦敦的阴暗场景,怪物在汹涌的海浪中缓缓升起。

延时摄影铅笔画

另一位用户 Anu Akash 在 X 的个人简介中声称自己正在“探索 AI 工具”,她分享了 Gen-3 Alpha 制作的一段短视频,视频中以延时方式展示了一位女孩的铅笔画。Akash 使用了描述手绘铅笔画的俯视延时视频的提示。她将其描述为一幅从头到尾都长着兔子头发的女孩艺术作品。该用户还承认,她给出的提示中的毛发是拼写错误,因为她本意是“兔子耳朵”。不过,她似乎对 Gen-3 Alpha 的成果很满意。

节日优惠

用花讲故事

短文插入
Gen-3 Alpha 甚至可以实现您最疯狂的梦想。另一位 X 用户 Martin Haerlin 使用该模型创建了一个视觉花朵旋转木马。人们可以看到粉红色和红色花瓣在大城市上空绽放,枪支射出各种颜色和大小的花朵,战士的弓变成向日葵,雏菊在空中飘浮,士兵和武术家操纵花朵。在他的帖子中,Haerlin 惊呼,有了 Gen-3 Alpha,他感觉自己讲故事的工具集得到了增强,并实现了飞跃。

制作你的科幻电影

Sidhu 还强调了第三代 Alpha 能够保持高频细节、第一人称射击游戏风格的视频生成,以及使用文本提示进行控制,而不受物理效果不完美影响。这位创作者还指出了逼真的动态图形、物理效果和城市可视化。虽然他发现人类渲染效果很好,但他表示它们很难控制。Sidhu 说,平视显示器和增强现实提示非常逼真。

文字提示控制相机速度

AI 艺术爱好者 vkuoo 分享了 Gen-3 Alpha 的独特创作。这也许是 AI 文本转视频生成领域的首例。该用户展示了一个演示,展示了他如何使用文本命令控制摄像机速度。当其中一位用户要求他提供制作视频的提示时,vkuoo 给出了这样的提示:“超快速的令人迷失方向的延时摄影,穿过一条隧道,进入一个快速生长的藤蔓迷宫。隧道灯光以高频率闪烁,藤蔓迅速生长,挡住了道路。快速的摄像机移动,焦点剧烈移动。”

巡航跑车的视频

Heather Cooper 的个人简介中称自己是一名 AI 教育者和顾问,她分享了一段令人惊叹的短视频,视频中一辆跑车在湿滑的路面上行驶。这段低角度拍摄的视频显示,这辆未来派汽车正在穿过一条霓虹灯环绕的街道。Cooper 使用了这样的提示:“低角度跟踪拍摄一辆时髦的跑车,霓虹灯在湿滑的路面上闪烁。”

丰富的细节和逼真的口型同步

另一位 X 用户、AI 视频创作者 Chrissie 分享了一段使用 Gen-3 Alpha 制作的短片。短片中,一名女性边走边谈论 Gen-3 Alpha。该用户指出,Runway AI 的 Gen-3 Alpha 的口型同步能力很有趣。“看看她在最后轻轻摆动身体时的表情,哈哈,”Chrissie 写道

超现实的视觉效果

数字艺术家兼电影制作人克里斯托弗·弗莱恩特 (Christopher Fryant) 分享了一部 53 秒的短片,名为《这个小镇不是真实的》。弗莱恩特使用了 Gen-3 Alpha 模型,并进行了一些额外的编辑和声音设计。弗莱恩特说,输出完全是文本到视频。视频片段显示摄像机在夜景中平移,显示人们在运动。起初,它可能看起来像真实的镜头。

穿越时空和风景

布莱恩·布朗(Blaine Brown)的 X 简介中称自己是创新领袖,他首次尝试了 Gen-3 Alpha。布朗在他的 X 帐户上分享了输出。他的提示是:“飞过爱尔兰的一座城堡,城堡变成了一座摩天大楼林立的未来赛博朋克城市。” Gen-3 Alpha 制作的视频细节丰富,准确描绘了城堡的角塔、鹅卵石人行道,以及顺利过渡到一座摩天大楼林立的赛博朋克城市的过程。

AI 视频模型证明了 AI 在视觉通信领域的潜力。今年早些时候,OpenAI 以其卓越的文本转视频模型 Sora 震惊了世界。虽然 AI 视频模型一直存在,但近年来,越来越多的 AI 初创公司推出了自己的 AI 模型,这些模型基本上超越了前辈。

根据上述来自不同用户的创作,Runway 的 Gen-3 Alpha 似乎与 Sora 不相上下,根据 OpenAI 分享的视频样本,在某些情况下甚至超过了 Sora。Sora 尚未上市。Stability AI 前首席执行官 Emad Mostaque 也分享了一篇文章,将 Gen-3 Alpha 与 Sora 进行了比较。

Runway AI 是最早致力于视频生成 AI 的初创公司之一。Gen-3 Alpha 现已全面推出,允许用户从文本、图像甚至视频提示中制作超逼真的 AI 视频。那些在 RunwayML 平台上注册的人可以使用该模型。虽然 Gen-1 和 Gen-2 是免费模型,但要使用 Gen-3,用户必须购买每月每位编辑器 12 美元起的订阅。

© IE 在线媒体服务私人有限公司

Bijin Jose - 印度快报助理编辑

Bijin Jose 是新德里《印度快报》在线版的助理编辑,也是一名科技记者,曾在多家知名出版物任职。2013 年,他以公民记者的身份加入《印度时报》,之后在《今日印度数字报》和《经济时报》任职,最后在《印度快报》找到自己的位置。Bijin 拥有巴罗达 Maharaja Sayajirao 大学的英语学士学位和英语文学硕士学位,他的专业领域从犯罪报道到文化专题报道。Bijin 对密切报道人工智能的发展有着浓厚的兴趣,他从细致入微的角度阐述了人工智能对社会及其他领域的影响。… 阅读更多

首次上传于:2024 年 7 月 2 日 15:31 IST


1719916251
2024-07-02 10:01:55
#Gen3 #Alpha #是 #Runway #对 #OpenAI #的 #sora #的回应9 #个视频展示了 #模型的多功能性 #科技新闻

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​