忘记聊天机器人吧。 人工智能代理是未来

本周一家名为 人工智能认知 发布后引起了一些轰动 演示 显示一个 人工智能 名为 Devin 的程序执行通常由高薪软件工程师完成的工作。 像 ChatGPT 和 Gemini 这样的聊天机器人可以生成代码,但 Devin 更进一步,规划如何解决问题,编写代码,然后测试和实现它。

Devin 的创建者将其称为“人工智能软件开发商”。 当被要求测试 Meta 时 开源语言模型 Llama 2 当通过托管它的不同公司访问时,Devin 生成了该项目的分步计划,生成了访问 API 和运行基准测试所需的代码,并创建了一个总结结果的网站。

评价演示总是很难,但 Cognition 已经显示 Devin 处理了各种令人印象深刻的任务。 它 令投资者和工程师赞叹不已 在 X 上,收到大量 代言,甚至受到启发 一些 模因——包括一些人预测德文很快就会成为 负责任的 科技行业裁员潮。

德文只是我一段时间以来一直在追踪的趋势的最新、最完美的例子——人工智能代理的出现,它不再只是为人类提出的问题提供答案或建议,而是可以采取行动来解决问题。 几个月前我 测试 Auto-GPT,一个开源程序,尝试通过在个人计算机和网络上执行操作来完成有用的杂务。 最近我 测试了另一个名为 vimGPT 的程序 了解新人工智能模型的视觉技能如何帮助这些代理更有效地浏览网络。

我对这些药物的实验印象深刻。 然而就目前而言,就像为它们提供动力的语言模型一样,它们也犯了很多错误。 当一款软件正在采取行动而不仅仅是生成文本时,一个错误可能意味着彻底失败,并可能带来代价高昂或危险的后果。 将代理可以执行的任务范围缩小到一组特定的软件工程杂务似乎是降低错误率的聪明方法,但仍然有许多潜在的失败方式。

不仅初创公司正在构建人工智能代理。 本周早些时候我 写了一篇关于名为 SIMA 的代理的文章,由 Google DeepMind 开发,可以玩视频游戏,包括真正疯狂的游戏 模拟山羊3。 SIMA 通过观察人类玩家如何完成 600 多项相当复杂的任务,例如砍倒一棵树或射击小行星。 最重要的是,即使在不熟悉的游戏中,它也可以成功地完成其中的许多操作。 谷歌 DeepMind 称其为“多面手”。

我怀疑谷歌希望这些代理最终能够在视频游戏之外工作,也许可以帮助代表用户使用网络或为他们操作软件。 但视频游戏通过提供可以测试和改进代理的复杂环境,为开发和测试代理提供了良好的沙箱。 “我们正在积极致力于让它们变得更加精确,”谷歌 DeepMind 的研究科学家 Tim Harley 告诉我。 “我们有各种各样的想法。”

在接下来的几个月里,您可以期待更多有关人工智能代理的新闻。 谷歌 DeepMind 首席执行官杰米斯·哈萨比斯 (Demis Hassabis) 最近告诉我 他计划将大型语言模型与他的公司之前进行的训练人工智能程序来玩视频游戏的工作结合起来,以开发更强大、更可靠的智能体。 “这绝对是一个很大的区域。 我们正在这个方向上投入巨资,我想其他人也是如此。” 哈萨比斯说道。 “当这些类型的系统开始变得更像代理时,这将是其功能的一个阶跃变化。”


1710474896
#忘记聊天机器人吧 #人工智能代理是未来
2024-03-14 16:00:00

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​