4. 什么是 AI 理解上下文 | Business Insider Japan

苹果的新人工智能系统ReaLM(参考分辨率作为语言建模)可以理解屏幕上图像和对话的上下文。

SOPA 图片来自 Getty Images

  • 苹果研究人员开发了一种新的人工智能系统,可以“看到”并理解屏幕内容的上下文。
  • 该系统称为 ReALM(参考解析作为语言建模),可以实现与人工智能更自然的交互。
  • RealLM 背后的研究人员表示,他们的系统在理解上下文方面优于 OpenAI 的 GPT-4。

旨在与OpenAI的GPT产品竞争苹果新的AI开发这可以使与 Siri 等虚拟助手的交互更加直观。

“ReALM”系统代表“参考解析作为语言建模”,是一个系统会话上下文这将使与人工智能的交互更加自然。

据开发该系统的研究人员介绍,苹果的新系统:GPT-4据说,与其他大规模语言模型(LLM)(例如 .它也比其他法学硕士(例如 OpenAI 的 GPT 系列)复杂度较低,这使其成为“可以驻留在设备上而不牺牲性能”的上下文解码系统的“理想选择”。

例如,假设您要求 Siri 显示当地药店的列表。列表出现后,您可能会要求他们“致电彩虹路的药房”或“致电底部的药房”。据开发该系统的苹果研究人员称,ReALM 需要大量详细信息。错误信息Siri 比 GPT-4 能够更好地破译执行此类任务所需的上下文。

研究人员说:“人类对话通常包括诸如‘他们’和‘那个’之类的模糊表达,但考虑到上下文,它们的含义(对人类来说)是明确的。”RealLM 的功能我正在写关于。

“能够理解包含这些引用的上下文对于会话助理至关重要,它旨在帮助用户自然地向代理传达他们的请求并与代理进行对话。”

研究人员表示,ReALM 系统可以解释嵌入文本中的图像,并可用于从页面图像中提取电话号码或食谱等信息。

OpenAI 的 GPT-3.5 仅接受文本输入。 GPT-4 是将图像置于情境中也是可能的,但它是一个大型系统,主要根据自然的、真实的图像而不是屏幕截图进行训练。苹果研究人员表示,这会影响实际性能,从而使 ReALM 能够更好地理解屏幕上的信息。

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​