奥斯汀东部可持续发展社区 Whisper Valley 迎来新的国际住宅建筑商

这家新建筑商将采用模块化建筑技术,可在 8 到 12 小时内建造一栋房屋。它还将利用 Whisper Valley 的太阳能和地热系统来促进可持续发展。这家公司很快将推出更多产品,因为它还将把奥斯汀作为其美国总部。在本报告的最后,请查看奥斯汀都会区最繁忙的房屋建筑商名单。

认识 Whisper Web — 一种新的免费音频转录方式

那些正在寻找完美的转录工具来加速工作流程的人可能会注意到一种名为 私语网. 本质上是一种浏览器内的转录服务,它承诺提供准确的设备处理,从而可以为我们节省大量时间。 到目前为止,一切似乎都平淡无奇。但这就是人工智能发挥作用的地方。由于该工具已经过机器学习训练,因此它支持 100 种不同语言的多语言转录和翻译。而且它不仅限于您自己录制的语音笔记。您可以输入 URL 或上传文件,让 Whisper Web 在几秒钟内创建转录。 该工具于上周推出,现已添加到开源 AI 平台 Hugging Face 中,可供使用。所以,我自然而然地尝试了一下。 终于可以实现:使用 OpenAI Whisper 实现实时浏览器内语音识别!🤯 该模型使用 Transformers.js 和 ONNX Runtime Web 在设备上运行,并支持 100 种不同语言的多语言转录!🔥查看演示(+ 源代码)!👇 pic.twitter.com/W9CSM9zPwB2024 年 6 月 7 日 它有用吗? (图片来源:未来) 多年来,我使用过很多转录应用程序来帮助记录采访、起草电子邮件或只是记录自己的笔记和想法。到目前为止,我最喜欢的产品之一是 Google Pixel 手机独有的 Recorder 应用程序。当然,它的缺点是你需要有一部 Pixel 手机在手边。 Whisper Web 能够从我的笔记本电脑麦克风中截取一段 25 秒的音频片段(包括背景噪音),并在大约 10 秒内生成一个完美的文字转录。生成的文本被分解成片段,可以 TXT […]

aiOla 的语音 AI 技术在行话识别方面优于 OpenAI 的 Whisper

aiOla 的模型可自动创建定制流程和工作流程,用于跨行业(例如制造、供应链和物流、制药等)进行报告和检查 以色列特拉维夫,2024 年 4 月 18 日 /美通社/ — 艾奥拉是一种人工智能驱动的技术,通过捕获语音数据实现业务工作流程自动化,宣布了语音识别领域的一个重要里程碑。 aiOla 的解决方案由新颖的关键词识别模型提供支持,在理解行业特定术语方面已经达到了人类的水平。 获得专利的 AdaKWS 模型在关键词识别方面实现了 95% 的准确率,超过了 OpenAI 业界领先的 Whisper 模型(88% 的准确率)。 关键词识别是语音识别的一个重要方面,它通过检测预定义的单词和短语来解决识别行话的问题。 “想象一下您的包裹到达时已损坏的快递递送情况。快递员需要使用描述情况的特定代码和首字母缩略词提交报告 – 这些代码和首字母缩略词就是关键字。行业术语无处不在,在许多领域,它主导着沟通,包括多达一半的员工讲话。”aiOla 首席执行官兼联合创始人 Amir Haramaty 说道。 “识别关键词的能力可以实现各行各业的日常流程自动化,从提交包裹损坏报告到完成食品制造工厂的安全检查,将言论转化为行动。” 该应用程序利用 aiOla 科学家团队开发的专有模型来识别语音中预定义的关键字列表。 这使得 aiOla 的解决方案能够立即适应任何行业的术语,而无需重新训练其人工智能模型。 在包含 16 种语言的关键字和行话检测基准上,Whisper 最大的模型的准确率达到 88%,而 aiOla 的模型准确率达到 95%。 此外,在最近由英语有声读物中难以检测的关键字组成的基准测试中,苹果研究人员团队的 CED 模型准确率达到 92.7%,而 aiOla 的 AdaKWS 准确率达到 95.1%。 […]