中国研究人员旨在在开源社区的帮助下“复制”OpenAI 的文本到视频模型 Sora

一组研究人员正在全力开发中国版 OpenAI 文本转视频模型 Sora,这是中国生成式人工智能 (AI) 热潮的最新迹象。

3月1日,北京大学和深圳人工智能公司Rabbitpre的教授们联合发起了Open-Sora计划,并在GitHub上发布了页面,其使命是“重现OpenAI的视频生成模型”。

Open-Sora 计划旨在在开源社区的帮助下重现 OpenAI 视频生成模型的“简单且可扩展”版本。 OpenAI 在 2023 年底推出了 ChatGPT 生成聊天机器人,掀起了全球人工智能热潮。

OpenAI Sora的中国开发者的努力在大陆获得赞誉

根据该项目的 GitHub 页面,该团队开发了一个由三部分组成的框架,并展示了四个不同分辨率和长宽比的重建视频演示,时长从 3 秒到 24 秒不等。

该团队的进一步任务包括微调技术以生成更高分辨率,以及使用更多数据和更多图形处理单元 (GPU) 进行训练。

自从2月初OpenAI发布了Sora生成的演示视频以来,中国商业和技术界对微软支持的OpenAI的最新进展表达了复杂的感受。

虽然一些公司对使用文本到视频的人工智能模型表现出浓厚的兴趣,但其他公司则表示 对中国竞争能力的担忧 在这个区域。 美国继续收紧对原产于美国的先进芯片及相关技术向中国出口的贸易限制。

腾讯人工智能在一月份发布了一款名为VideoCrafter2的开源视频生成和编辑工具箱,该工具箱能够从文本生成视频。 这是 VideoCrafter1 的更新版本,于 2023 年 10 月发布,但仅限于持续两秒的视频。

几乎在同一时间, 字节跳动 发布了MagicVideo-V2文本转视频模型。 根据该项目的 GitHub 页面,它将“文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块组合成端到端视频生成管道”。
ModelScope,来自达摩视觉智能实验室 阿里巴巴集团控股南华早报的所有者推出了文本到视频的生成模式。 目前仅支持英文输入,视频输出仅限于两秒。

Open-Sora计划由北京大学深圳研究生院与Rabbitpre合作成立的“Rabbitpre AIGC联合实验室”发起,成立于2023年6月。该联合实验室致力于人工智能内容制作领域的研究。

Open-Sora 项目列出了 13 名成员作为其初始团队。 其中包括北京大学电气与计算机工程学院助理教授袁力和计算机学院田永红教授。 名单中还包括Rabbitpre创始人兼首席执行官董少岭和公司首席技术官周星。

1709572006
#中国研究人员旨在在开源社区的帮助下复制OpenAI #的文本到视频模型 #Sora
2024-03-04 13:00:20

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​