Siri 和 Google Assistant 期待生成式人工智能带来新生命

下周的 WWDC 2024 主题演讲意义重大。演讲的重要性远高于标准的会后市场动向。蒂姆·库克和团队交付成果的压力实际上甚至比去年 Vision Pro 发布前的压力还要大。 周一,苹果将公布其人工智能计划。过去几年,这一主题一直是笼罩在库比蒂诺的巨大问号,因为谷歌和微软等竞争对手已经接受了生成式人工智能。业界普遍认为,由 ChatGPT 和 Gemini 等大型语言模型驱动的系统将深刻影响我们与设备的交互方式。 苹果预计将宣布与 OpenAI 合作,将公司的智能技术引入 iPhone 和 Mac。苹果的近期战略是深度整合现有资产和生成式人工智能,以 Siri 为核心。自 2011 年首次亮相以来,苹果一直致力于将语音助手打造为其所有操作系统不可或缺的一部分。 然而,在这 13 年里,Siri 未能实现苹果承诺的革命。造成这种情况的原因有很多,但主要原因是能力不足。人工语音助手的概念比 Siri 早了几十年,但没有人完全破解它,这是有原因的。随着手机制造商和应用程序开发商将智能手机变成了万能设备,这些助手的工作变得越来越复杂。 令人印象深刻的是 斯坦福研究所 问题是,实现无摩擦体验所需的技术尚未成熟。Siri 联合创始人 Norman Winarsky 解决了 2018 年,苹果公司曾试图解决这一潜在问题,并指出苹果最初的计划是打造一个功能极其有限的助手,用于处理娱乐和旅行等事务。“这些都是难题,当你的公司要与多达 10 亿人打交道时,问题就变得更加棘手了,”维纳斯基当时指出。“他们可能在寻求一种无法达到的完美水平。” 生成式人工智能也还没有达到那种完美程度——至少现在还没有。幻觉仍然是一个问题。这就是为什么,即使在过去几年的轰动之后,我们仍然感觉自己处于起步阶段。如果非要说有什么不同的话,我会说谷歌在某些方面过于激进。最好的例子就是该公司决定将 Gemini 搜索结果显示在搜索结果顶部。 当某个东西被列为世界主导搜索引擎的可信资源的优先内容时,它需要尽可能地把事情做好,而不是,你知道的,告诉人们 吃胶水。Google 将 Gemini 搜索结果标记为其“搜索实验室”的产品,但大多数用户肯定不明白这意味着什么,从产品成熟度来看,他们也不愿意点击查看更多信息。 过去几年,我遇到过几位研究人员,他们用“魔法”一词来形容大型语言模型的“黑匣子”结果。这并不是对这个领域所有令人惊叹的工作的打击,而是意识到我们对这项技术还有很多不了解的地方。 阿瑟·克拉克(Arthur C. Clarke)的说法最好:“任何足够先进的技术都与魔法无异。” 然而,谷歌更用心的一个地方是将 Gemini 集成到 Android […]