什么是维奥? 认识一下由 Imagen 3 提供支持的 Google 下一代 AI 视频创作者

截图由 Sabrina Ortiz/ZDNET 提供 AI 图像生成器在 2023 年风靡一时,但现在各公司正在将焦点转移到下一个前沿——AI 视频生成。 随着 OpenAI 于 2024 年 2 月推出人工智能文本到视频生成器 Sora,谷歌推出同样的产品只是时间问题。 周二,在年度 Google I/O 开发者大会上,Google 推出了 Veo,这是其最先进的文本到视频生成器,能够生成长度超过一分钟的 1080p 分辨率视频。 谷歌表示,除了高质量的输出之外,Veo 还为用户提供了“前所未有的创意控制水平”。 AI 生成器对自然语言有更深入的理解,使 Veo 能够从较长的提示中提供更多细节,并理解“延时摄影”或“空中镜头”等电影术语。 另外:Google I/O 2024 期间宣布的所有内容:Gemini、搜索、Android 15 等 此外,视频生成器可以解决视频生成的常见问题——镜头的流畅性。 据谷歌称,Veo 可以创建一致的镜头,不同的主题(例如人、动物和物体)在镜头中真实地移动。 谷歌对于视频生成并不陌生。 该公司指出,该模型建立在其之前所有视频生成项目的基础上,包括 Imagen-Video、VideoPoet 和 Lumiere。 与 OpenAI 的 Sora 一样,谷歌的 Veo 尚未向公众开放。 相反,Google 首先在 VideoFX […]

谷歌发布 Imagen 2,视频剪辑生成器

在图像生成人工智能方面,谷歌并没有最好的记录。 今年 2 月,谷歌人工智能聊天机器人 Gemini 内置的图像生成器被发现在有关人物的提示中随机注入性别和种族多样性,导致出现种族多样化纳粹分子的图像,以及其他令人反感的错误。 谷歌撤下了该生成器,并发誓要改进它并最终重新发布它。 在我们等待其回归时,该公司在其 Vertex AI 开发者平台内推出了一款增强型图像生成工具 Imagen 2,尽管该工具显然更具企业倾向。 谷歌在拉斯维加斯举行的年度 Cloud Next 会议上宣布了 Imagen 2。 图片来源: 弗雷德里克·拉迪诺斯/> Imagen 2 实际上是一个模型系列,在 2023 年 5 月的 Google I/O 大会上预览后于 12 月推出,可以根据文本提示创建和编辑图像,就像 OpenAI 的 DALL-E 和 Midjourney 一样。 对于企业类型来说,Imagen 2 可以以多种语言呈现文本、标志和徽标,并可选择将这些元素覆盖在现有图像中,例如名片、服装和产品上。 首次推出预览版后,Vertex AI 现已普遍提供使用 Imagen 2 进行图像编辑以及两项新功能:修复和修复。 修复和修复,其他流行的图像生成器(例如 DALL-E)已经提供了一段时间的功能,可用于删除 图像中不需要的部分,添加新的组件并扩展图像的边界以创建更宽的视野。 但 Imagen 2 升级的真正核心是谷歌所说的“文本到实时图像”。 […]

Google Bard 最终可用于通过神经网络 Imagen 2 生成图像 在围绕创建有害内容的主要语言模型的争论中

吟游诗人被称为 谷歌对OpenAI的ChatGPT人工智能的回应。 因此,由于缺乏从文本生成图像的能力,谷歌的人工智能与 ChatGPT 相比处于劣势。 然而,由于巴德的最新消息,情况发生了变化。 只需要求 Bard 使用对话提示生成照片,Bard 将能够通过 Imagen 2 神经网络的贡献生成高质量图像。 该功能出现在围绕创建有害内容的主要语言模型的争论背景下。 为了激发您的创造力,您现在可以在世界上大多数国家/地区免费使用 Bard 生成英文图像。 这项新功能由我们更新的 Imagen 2 模板提供支持,该模板旨在平衡质量和速度,提供高质量的逼真结果。 谷歌表示,只需输入描述,例如“在冲浪板上创建一只狗的图像”,巴德就会生成个性化和多样化的图像,帮助您将想法变为现实。 Google 将 Bard 定位为 OpenAI 的 ChatGPT Plus 的有力竞争对手,后者使用 GPT-4 并允许用户通过 DALL-E 3 集成生成图像。 两种聊天机器人都有能力,但 Bard 缺乏文本到图像转换的功能,这给 ChatGPT Plus 带来了轻微的优势。 用户可以免费使用 Bard 的更新版本和 Imagen 2,这与需要付费订阅的 ChatGPT Plus 不同。 图像生成不会受到巴德的限制。 谷歌推出了一款基于 Imagen 2 的新实验性照片工具,名为 […]