系统从视频记录中提取口语，并将其转换为可搜索的文本

图片来源：Unsplash/CC0 公共领域

韩国的一个团队开发出了一种搜索视频内容的新方法。系统，描述于 国际计算机视觉与机器人杂志，从视频记录中提取口语，将其转换为文本，然后使该文本可搜索。重要的是，该系统不依赖嵌入的关键字或精选标签或与视频内容相关联的主题标签。

这种方法显然依赖于与用户可能希望搜索的视频场景相关的项目的对话或口头评论。当然，如果视频已经内置了字幕，那么这是多余的。尽管如此，对于希望搜索数据库、流媒体服务和互联网其他地方的数百万小时视频的用户来说，它将是一种福音，并可用于帮助对视频进行分类。

首尔汉城大学计算机工程学院的 Kitae Hwang、In Hwan Jung 和 Jae Moon Lee 开发了一款适用于相应智能手机的 Android 应用。但值得注意的是，至少还有一款同名应用，因此如果这款应用在 Google Play 安卓应用商店中上架，可能需要改名。

这款新应用的工作原理是，使用 FFmpeg 代码从视频中提取音频，并以 10 秒为增量将其转换为文本。该团队解释说，这为视频创建了一个可搜索的时间线。然后，先进的语音识别技术会生成这些音频片段的转录，这些转录会在视频时间线上编入索引。

对于 20 分钟的视频，该过程只需两到三分钟即可完成，并在视频播放时在后台运行。该团队指出，用户可以搜索特定术语并查找视频中的所有提及内容。

该应用将应用于教育、新闻分析和其他需要快速访问特定信息的信息密集型视频。例如，查看讲座录音的学生或搜索采访中特定陈述的记者可以使用此应用。在许多其他场景中，以这种方式搜索视频会很有用。

更多信息：
Kitae Hwang 等，可搜索视频播放器的实现， 国际计算机视觉与机器人杂志 (2024)。 DOI：10.1504/IJCVR.2024.138324

引用：系统从视频记录中提取口语，将其转换为可搜索的文本（2024 年 5 月 23 日）于 2024 年 5 月 25 日检索自

本文件受版权保护。除出于私人学习或研究目的的合理使用外，未经书面许可不得复制任何部分。内容仅供参考。

1716643410
#系统从视频记录中提取口语并将其转换为可搜索的文本
2024-05-23 15:36:30

Tags: 信息技术, 创新, 发明, 电脑新闻, 系统从视频记录中提取口语并将其转换为可搜索的文本, 高科技, 高科技新闻

系统从视频记录中提取口语，并将其转换为可搜索的文本

Related

相关新闻

比特币将达到 44,000 美元？著名分析师警告“双顶”

太空时代将于 10 月发布。捷克沙盒的扩展将是一个真正的享受，它的价格与基本游戏相同 – Doupě.cz

凯特王妃有危险？秘密转会和动情告别

维格加德回应埃文普尔和波加查的批评，范阿尔特抨击 Strava

世卫组织称滑石粉“可能致癌”，对人类和儿童的风险提出警告

人工智能初创公司 Hebbia 获得由 a16z 领投的 1.3 亿美元 B 轮融资

冰辣妹对那些对她与泰勒·斯威夫特合作的歌曲《Karma》报以嘘声的粗鲁粉丝做出回应

联邦预算：2024 年预算：100 万卢比的保险是印度医疗保健系统所需的维生素吗？

关于与 Rishabh Pant、Sanju Samson 和 Ishan Kishan 的诚实回应的竞争

初创公司的估值已悄然回升至历史最高水平。一些投资者表示，低迷期已经结束。

为什么《内战》中增强萨满最近的改动没有被注意到 – 指南作者反馈

英国大选后，居住在英国的美国人即将面临加税

Leave a Reply Cancel reply

近期新闻

比特币将达到 44,000 美元？著名分析师警告“双顶”

太空时代将于 10 月发布。捷克沙盒的扩展将是一个真正的享受，它的价格与基本游戏相同 – Doupě.cz

凯特王妃有危险？秘密转会和动情告别

维格加德回应埃文普尔和波加查的批评，范阿尔特抨击 Strava

世卫组织称滑石粉“可能致癌”，对人类和儿童的风险提出警告

人工智能初创公司 Hebbia 获得由 a16z 领投的 1.3 亿美元 B 轮融资

编辑精选

信息

More Interesting News

比特币将达到 44,000 美元？著名分析师警告“双顶”

太空时代将于 10 月发布。捷克沙盒的扩展将是一个真正的享受，它的价格与基本游戏相同 – Doupě.cz

系统从视频记录中提取口语，并将其转换为可搜索的文本

Share this:

Related

相关新闻

Leave a Reply Cancel reply

近期新闻​

编辑精选​

Tags

信息

More Interesting News

近期新闻

编辑精选