aiOla 的语音 AI 技术在行话识别方面优于 OpenAI 的 Whisper

aiOla 的模型可自动创建定制流程和工作流程,用于跨行业(例如制造、供应链和物流、制药等)进行报告和检查

以色列特拉维夫,2024 年 4 月 18 日 /美通社/ — 艾奥拉是一种人工智能驱动的技术,通过捕获语音数据实现业务工作流程自动化,宣布了语音识别领域的一个重要里程碑。 aiOla 的解决方案由新颖的关键词识别模型提供支持,在理解行业特定术语方面已经达到了人类的水平。 获得专利的 AdaKWS 模型在关键词识别方面实现了 95% 的准确率,超过了 OpenAI 业界领先的 Whisper 模型(88% 的准确率)。

关键词识别是语音识别的一个重要方面,它通过检测预定义的单词和短语来解决识别行话的问题。 “想象一下您的包裹到达时已损坏的快递递送情况。快递员需要使用描述情况的特定代码和首字母缩略词提交报告 – 这些代码和首字母缩略词就是关键字。行业术语无处不在,在许多领域,它主导着沟通,包括多达一半的员工讲话。”aiOla 首席执行官兼联合创始人 Amir Haramaty 说道。 “识别关键词的能力可以实现各行各业的日常流程自动化,从提交包裹损坏报告到完成食品制造工厂的安全检查,将言论转化为行动。”

该应用程序利用 aiOla 科学家团队开发的专有模型来识别语音中预定义的关键字列表。 这使得 aiOla 的解决方案能够立即适应任何行业的术语,而无需重新训练其人工智能模型。 在包含 16 种语言的关键字和行话检测基准上,Whisper 最大的模型的准确率达到 88%,而 aiOla 的模型准确率达到 95%。 此外,在最近由英语有声读物中难以检测的关键字组成的基准测试中,苹果研究人员团队的 CED 模型准确率达到 92.7%,而 aiOla 的 AdaKWS 准确率达到 95.1%。

aiOla 首席科学家、教授表示:“由于训练数据的稀缺,尤其是不同语言和方言的训练数据的缺乏,关键词识别面临着巨大的挑战。它通常需要针对特定​​行业进行微调,以使模型能够识别日常言语中不常见的术语。”约瑟夫·凯谢特. “我们的模型始终大幅超越 OpenAI Whisper 基线,与表现最佳的基线相比,实现了实质性改进。此外,我们的模型效率更高,使用的参数减少了 15 倍。”

要了解有关 aiOla 技术的更多信息,请访问:

探索 aiOla 的关键词识别研究:

关于艾奥拉:

aiOla的专利技术可以理解100多种语言,并能识别行话、缩写词和首字母缩略词,即使在嘈杂的环境中也能表现出较低的错误率。 aiOla 的技术通过尖端的语音识别将关键行业的手动流程转换为数据驱动、无纸化、人工智能驱动的工作流程。

消息来源艾奥拉

1713452226
2024-04-18 14:46:00
#aiOla #的语音 #技术在行话识别方面优于 #OpenAI #的 #Whisper

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​