谷歌 DeepMind 最新人工智能代理学会玩“模拟山羊 3”

“SIMA 更进一步,对新游戏表现出更强的通用性,”他说。 “环境数量仍然很少,但我认为 SIMA 走在正确的轨道上。

一种新的游戏方式

SIMA 展示了 DeepMind 为游戏代理带来了新的变化,这是该公司过去开创的一项人工智能技术。

2013 年,在 DeepMind 被谷歌收购之前,这家总部位于伦敦的初创公司 展示了一种技术如何 被称为 强化学习,其中涉及训练一种算法,对其性能进行正反馈和负反馈,可以帮助计算机玩经典游戏 雅达利视频游戏。 2016年,作为谷歌的一部分,DeepMind开发了 阿尔法围棋,一个使用相同方法的程序 击败围棋世界冠军,一种古老的棋盘游戏,需要微妙和本能的技巧。

对于 SIMA 项目,Google DeepMind 团队与多家游戏工作室合作,收集人类在 3D 环境下玩 10 种不同游戏时的键盘和鼠标数据,包括 无人深空, 拆除, 海德尼尔, 和 满意的。 DeepMind 后来在这些数据中添加了描述性标签,将点击和点击与用户所采取的操作联系起来,例如他们是寻找喷气背包的山羊还是挖掘黄金的人类角色。

然后,来自人类玩家的数据被输入到为现代聊天机器人提供动力的语言模型中,该模型通过消化巨大的文本数据库获得了处理语言的能力。 然后,SIMA 可以根据键入的命令执行操作。 最后,人类评估了 SIMA 在不同游戏中的努力,生成用于微调其性能的数据。

SIMA AI 软件使用人类玩 10 种不同 3D 环境游戏的数据进行训练。

由谷歌 DeepMind 提供

经过所有这些训练后,SIMA 能够响应人类玩家发出的数百个命令来执行操作,例如“向左转”或“前往宇宙飞船”或“穿过大门”或“砍倒一棵树”。 ” 该程序可以执行 600 多种动作,从探索到战斗再到工具使用。 研究人员避免了具有暴力行为的游戏,这符合谷歌的人工智能道德准则。

“这在很大程度上仍然是一个研究项目,”谷歌 DeepMind 团队的另一位成员 Tim Harley 说。 “然而,人们可以想象有一天,像 SIMA 这样的代理会与你并肩作战,与你和你的朋友一起玩游戏。”

视频游戏为人工智能代理的任务提供了一个相对安全的环境。 为了让代理能够完成有用的办公室或日常管理工作,他们需要变得更加可靠。 DeepMind 的 Harley 和 Besse 表示,他们正在研究使智能体更加可靠的技术。

美国东部时间 2024 年 3 月 13 日上午 10:20 更新:添加了 Linxi “Jim” Fan 的评论。

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​