合作对话:思科 Javed Kahn 谈论幕后默默工作的人工智能

作为 Enterprise Connect 2024 的主题演讲者之一,思科协作高级副总裁兼总经理 Javed Khan 发表了前瞻性演讲,介绍了思科如何看待人工智能增强和扩展协作——重点关注清晰的转录和灵活、反应迅速的助手。 我们与 Khan 进行了交谈,讨论了思科在音频领域的强大背景以及其在转录功能中对人工智能的巧妙运用,以及这些技术如何为该公司在 Webex 和联络中心产品中提供的人工智能助手奠定了基础。Khan 还强调,要使人工智能发挥良好作用,它必须无缝且透明地发挥作用,以简化最终用户的工作——这是当今许多联络中心经理最关心的问题。 以下是我们关于人工智能助手和联络中心的对话部分的记录。 无抖动(NJ): 我真正想问你的第一件事是网络埃x 会议 AI 助手。您认为它比任何同类产品做得更好吗? 贾维德·汗(JK): 三年多来,我们一直在使用音频智能记录会议内容。现在,我们正在在此基础上构建人工智能系统。第一步是获得一份干净的记录,然后获得见解。我认为,从某种程度上来说,驱动见解的部分变得更容易了,因为我选择了你最喜欢的语言模型训练器。而且,我们也已经这样做了一段时间。 很多人不知道,但我们有一个大型语言模型 [LLM] 在我们的转录器中,因为有时你可能听不到一个词,但 LLM 会修复分辨率。因此,我们拥有完整的端到端系统:清晰地捕捉语音,转录,然后应用各种模型。 我们的助理有一个 实时媒体模型,因此它不仅可以捕捉对话的语音部分和文本部分,还可以捕捉其他视觉和音频交互。 新泽西州:因为如果你有一个基于文本而不是语音的法学硕士学位,那么说“哦,我很高兴”和(讽刺地)“哦,我很高兴。”那么你必须在那里添加额外的数据层吗? JK: 这就是音频和视频智能。我们将我们的功能与数据联系起来,除非它达到一定的采用水平,否则我们会不断对其进行迭代,我们的转录和背景噪音就是如此。它必须是无缝和透明的。如果你必须点击一堆按钮才能真正让它工作,人们就不会使用它,所以它必须在后台悄悄发生。它必须一路让你感到高兴。你不应该说,“人工智能,让我的生活更美好。” NJ:确保我理解正确:您说的是 Webex 助手和您所有的人工智能的不同之处在于您选择专注于音频质量和转录。这是因为,除非您有非常好的转录,否则其他一切都行不通,因为它不准确,然后您就无法训练语言模型并做出适当的反应。 JK: 是的,在音频方面, [but it’s the] 视频方面也一样。我们希望用音频和视频的细微差别来修饰基于文本的交互版本,因为它们传达了不同的含义。 NJ:您曾使用过“技术带来的体验”这一短语。当您谈论技术带来的体验时,它是什么? JK: 以联系中心为例,我们曾举过一个例子,AI 技术为客服人员提供了体验,当客户打电话进来时,由于他们有特定的个人资料——例如“客户不满意”——我们会将他们转接给更有能力处理他们的客服人员。在幕后,技术将客户与客服人员进行匹配 [the customer] 更好的代理提供更好的答案,并且客户拨打电话和获得帮助的体验也变得更好。 NJ:我们看到很多供应商都强调客户体验,以及如何取悦客户,如何让客户满意,如何让客户满意。但我们如何应用技术,让客服人员与客户打交道的体验更好,因为客户并不总是令人愉悦的? JK: 这些代理必须处理的人际互动有时会被忽略,但同样的技术也适用。就像你试图评估客户的情绪一样,代理的福祉是 [also] 非常重要。 [You also […]

奥利弗·卡恩 (Oliver Kahn) 希望通过花园上方的天空来赚钱

多特蒙德的一家初创公司赢得了奥利弗·卡恩 (Oliver Kahn) 的广告推荐。 他对 Skynopoly 的想法深信不疑:业主将飞越权出售给无人机操作员。 世界门将、国家队球员、拜仁慕尼黑足球俱乐部前首席执行官奥利弗·卡恩和博士。 康拉德·德雷尔 (Conrad Dreier),公证人兼 Skynopoly 创始人。 斯凯诺波利 你也可以听听这篇文章。 只需点击播放器即可。