谷歌 DeepMind 推出全新 AI 模型 V2A,可为视频生成配乐和对话 | 科技新闻

消息 技术 人工智能 Google DeepMind 推出 V2A,一种可以为视频生成配乐和对话的新型 AI 模型 谷歌人工智能研究实验室 Google DeepMind 最近推出了一种可以从视频生成音频的新模型 V2A。 Google 近期没有计划向公众推出 V2A。(图片来源:Google) Sora、Dream Machine、Veo 和 Kling 等视频生成模型正在快速发展,允许用户根据文本提示生成视频。但是,这些系统中的大多数仅限于无声视频。Google DeepMind 似乎意识到了这个问题,目前正在开发一种新的大型语言模型,可以为视频生成配乐和对话。 该科技巨头的人工智能研究实验室在一篇博客文章中公布了 V2A(视频转音频),这是一种正在研发的新型人工智能模型,它“将视频像素与自然语言文本提示相结合,为屏幕上的动作生成丰富的音景”。 你已经用尽了 每月免费故事的数量限制。 免费阅读更多故事使用 Express 帐户。 投资民主。仅需 999 卢比/年即可全面访问 Express 这篇优质文章目前免费。 注册即可阅读更多免费故事并获取合作伙伴提供的优惠。 投资民主。仅需 999 卢比/年即可全面访问 Express 此内容仅供我们的订阅者使用。 立即订阅即可无限制访问《印度快报》的独家和优质故事。 V2A 与 Veo(该公司在最近结束的 Google I/O 2024 上推出了一种文本转视频模型)兼容,可用于添加戏剧性音乐、逼真的音效和与视频基调相匹配的对话。谷歌表示,新的大型语言模型也适用于“传统镜头”,如无声电影和档案材料。 新的 V2A 模型可以为任何视频生成“无限数量的音轨”,并具有可选的“正提示”和“负提示”,可用于根据您的喜好调整输出。它还使用 SynthID 技术为生成的音频添加水印。 […]

新的影子之手可以承受打击

多年, 影子机器人公司的 暗影之手 可以说是机器人操作的黄金标准。 它既美观又昂贵,能够模仿人手的外形和功能,这使其成为复杂任务的理想选择。 我亲身体验过在远程操作环境中使用“影子之手”是多么令人惊奇,很难想象还有什么比这更好的了。 问题在于 最初的影子手 过去(现在仍然)是脆弱的。 在研究环境中,这一切都很好,只是研究正在发生变化:机器人专家不再仔细地手工编程操作任务。 现在一切都与机器学习有关,其中您需要机械手一遍又一遍地进行大规模故障,直到它们积累足够的数据来了解如何成功。 “我们的目标是稳健性和性能,而不是拟人化以及人类的体型和形状。” ——里奇·沃克,影子机器人公司 用影子手来做这件事是不现实的, 谷歌 五年前,当 DeepMind 要求 Shadow Robot 为它打造一只新手时,它就明白了这一点,它的硬件可以处理现在典型的操纵研究的训练环境。 所以影子机器人在过去的五年里一直致力于 新的三指暗影手,该公司今天推出了。 该公司恰如其分地将其称为“新影子之手”。 正如你所看到的,这东西绝对是一头野兽。 Shadow Robot 表示,这只新手“能够抵御大量误用,包括强力的用力需求、磨损和冲击。” 不过,部分要点在于,机器人手的作用是 设计师 可能称为“滥用”,机器人操纵 研究人员 这很可能被称为“进步”,而这只手的设计是为了经受住操纵研究的考验,这些研究突破了机器人硬件和软件物理能力的极限。 Shadow Robot 明白,尽管尽了最大的工程努力,这只新手仍然偶尔会损坏(因为它是机器人,而这就是机器人所做的事情),因此该公司将其设计为模块化且易于修复。 每个手指都是独立的单元,可以轻松更换,手指底部有五个 Maxon 电机,通过电缆驱动四个手指关节,其设计消除了 反弹。 电缆本身有时需要更换,但在新的 Shadow Hand 上更换比原来的要容易得多。 Shadow Robot 表示,您可以在更换新手的电缆的同时更换整个新手的电缆。 单身的 老手上的电缆。 影子机器人 新的Shadow Hand本身比典型的人手要大一些,而且也更重:每个模块化手指单元重1.2公斤,整个三指手刚刚超过4公斤。 手指具有人类的特征 运动学,每个关节每秒可移动高达 180 […]

谷歌的新人工智能解码分子,可以快速跟踪疫苗开发和治疗

谷歌的人工智能 (AI) 研究实验室 DeepMind 开发了 AlphaFold 3,这是一种新的人工智能工具,旨在彻底改变我们对人体的理解。 最新的人工智能模型预计还将促进和加快疫苗和治疗方法的研发。 谷歌宣称,与 Isomorphic Labs 合作开发的 AlphaFold 3 在预测生命基本分子(包括蛋白质、DNA 和 RNA)的结构和相互作用方面具有令人印象深刻的准确性。 Google DeepMind 的 AlphaFold 是一款人工智能工具,可帮助科学家了解生命的组成部分蛋白质如何更快地折叠和相互作用。 推特/马里奥·诺法尔@MarioNawfal 新模型利用其创建生物分子 3D 模型的能力,包括大蛋白质、DNA 和 RNA,以及称为配体的较小分子。 这种可视化能力使研究人员能够见证这些分子如何在生命的复杂舞蹈中相互作用,并让他们对健康和疾病的控制过程有更深刻的见解。 AlphaFold 3 及其突破性功能 AlphaFold 3 建立在 AlphaFold 2 于 2020 年实现的突破性蛋白质结构预测的基础上,标志着这一革命性技术的下一步。 AlphaFold 2 在蛋白质结构预测方面表现出色,而 AlphaFold 3 通过预测更广泛的细胞分子(包括 DNA、RNA,甚至微小的药物分子)的结构和相互作用而开辟了新天地。 AlphaFold 3 通过可视化这些相互作用,提供细胞机制的全景视图,揭示其各个元素如何协同工作。 通过揭示药物如何与蛋白质和其他细胞成分结合的细节,AlphaFold 3 使研究人员能够更好地了解人类免疫系统,并解开导致 COVID-19 的冠状病毒等病毒的秘密。 […]

球场上的人工智能:谷歌 DeepMind 的人工智能现在掌握了足球战术

谷歌的人工智能部门 DeepMind 开发了一种工具,可以分析专业的足球战术并预测角球的结果。 这家谷歌旗下的人工智能(AI)公司对超越人类游戏能力并不陌生。 它此前曾征服过“围棋”、一款复杂的棋盘游戏和一款具有挑战性的即时战略视频游戏“星际争霸II”。 🎲 TacticAI 使用预测人工智能和生成人工智能来帮助重新设计角球战术,以针对某些场景进行优化。 它还可以建议调整球员的位置——这意味着教练可以识别模式并检测谁对战术的成功或失败至关重要。 pic.twitter.com/AU3jfJ1N7Z — 谷歌 DeepMind (@GoogleDeepMind) 2024 年 3 月 19 日 再次利用人工智能的能力,DeepMind 推出了 TacticAI,这是一个与利物浦足球俱乐部合作开发的为期三年的项目。 博客文章 作者:Zhe Wang 和 Petar Veličković,周二。 根据博客文章,TacticAI 通过结合生成式人工智能和预测式人工智能,实现了“最先进的结果”。 我们宣布推出 TacticAI:一款人工智能助手,能够为足球专家提供角球方面的见解。 ⚽ 开发与 @LFC,它可以帮助团队对替代球员设置进行采样,以评估可能的结果,并实现最先进的结果。 🧵… pic.twitter.com/8oVYtamGGe — 谷歌 DeepMind (@GoogleDeepMind) 2024 年 3 月 19 日 DeepMind 指出:“TacticAI 展示了辅助人工智能技术为运动员、教练和球迷带来革命性体育运动的潜力。” TacticAI 是一个完整的人工智能系统,使教练能够探索定位球(例如角球)的各种球员阵型。 接下来,该工具模拟这些不同策略的潜在结果,帮助教练直接评估其有效性。 🟩 […]