新的计算机视觉工具可以计算危机地区受损的建筑物并准确估计鸟群大小

2018 年袭击印度尼西亚的巴鲁海啸。数据由 113 张高分辨率卫星图像组成。 使用灾前和灾后卫星图像收集每块建筑物的数量及其损坏程度。 颜色表示不同程度的损坏(红色 = 被摧毁),DISCount 给出了每个子区域受损建筑物的估计值。 信用: AAAI 人工智能会议论文集 (2024)。 DOI:10.1609/aaai.v38i20.30235

马萨诸塞大学阿默斯特分校的一个计算机科学家团队正在研究两个不同的问题——如何快速检测危机地区受损的建筑物以及如何准确估计鸟群的大小——最近宣布了一个可以同时解决这两个问题的人工智能框架。 该框架名为 DISCount,将人工智能的速度和大量数据处理能力与人类分析的可靠性相结合,快速提供可靠的估计,从而可以从大量图像中快速查明和计算特定特征。

这个调查, 发表AAAI 人工智能会议论文集,已获得该协会认可,授予人工智能社会影响最佳论文奖。

“DISCount 是两个截然不同的应用程序,”麻省大学阿默斯特分校信息和计算机科学副教授、该论文的作者之一 Subhransu Maji 说道。 “通过麻省大学阿默斯特分校的数据科学中心,我们多年来一直与红十字会合作,帮助他们构建一种计算机视觉工具,可以准确计算在地震或战争等事件中受损的建筑物。同时,我们也在帮助鸟类学家科罗拉多州立大学和俄克拉荷马大学的研究人员对使用天气雷达数据来准确估计鸟群的大小感兴趣。”

Maji 和他的合著者、主要作者古斯塔沃·佩雷斯 (Gustavo Pérez) 和丹·谢尔顿 (Dan Sheldon) 认为他们可以解决受损建筑物的问题。计算机视觉的鸟群问题是一种人工智能,可以扫描大量图像档案以寻找特定的东西(一只鸟、一堆瓦砾)并对其进行计数。

但团队在每个项目上都遇到了相同的障碍。 “标准计算机视觉模型不够准确,”佩雷斯说。 “我们希望构建可供非人工智能专家使用的自动化工具,但可以提供更高程度的可靠性。”

谢尔顿说,答案是从根本上重新思考解决计数问题的典型方法。

“通常,要么让人类对一个非常小的数据集进行耗时且准确的手工计数,要么让计算机视觉对庞大的数据集进行不太准确的自动计数,”谢尔顿说。 “我们想:为什么不两者都做呢?”

DISCount 是一个可以与任何现有的 AI 计算机视觉模型配合使用的框架。 它的工作原理是使用人工智能来分析非常大的数据集(例如,十年内特定区域拍摄的所有图像),以确定人类研究人员应该查看哪些特定的较小数据集。

例如,这个较小的集合可以是计算机视觉模型确定的最能显示该地区建筑物损坏程度的几个关键日子的所有图像。 然后,人类研究人员可以从更小的图像集中手工计算受损的建筑物,算法将使用它们来推断整个区域受影响的建筑物的数量。 最后,DISCount 将估计人工估计的准确度。

“对于我们考虑的任务,DISCount 的效果明显优于随机抽样,”Pérez 说。 “我们框架的优点之一在于它与任何计算机视觉模型兼容,这让研究人员可以根据自己的需求选择最佳的人工智能方法。因为它还给出了置信区间,所以它使研究人员能够做出明智的决策判断他们的估计有多好。”

“回想起来,我们有一个相对简单的想法,”谢尔顿说。 “但是,我们不必在人类和人工智能之间做出选择,这一小小的心理转变让我们构建了一种比单独使用任何一种方法更快、更全面、更可靠的工具。”

更多信息:
Gustavo Perez 等人,DISCount:使用基于检测器的重要性采样对大型图像集合进行计数, AAAI 人工智能会议论文集 (2024)。 DOI:10.1609/aaai.v38i20.30235

由马萨诸塞大学阿默斯特分校提供


引文:新的计算机视觉工具可以计算危机地区受损的建筑物,并准确估计鸟群大小(2024 年,4 月 11 日),检索于 2024 年 4 月 15 日

本文件受版权保护。 除出于私人学习或研究目的的公平交易外,未经书面许可不得复制任何部分。 内容仅供参考。

1713226019
#新的计算机视觉工具可以计算危机地区受损的建筑物并准确估计鸟群大小
2024-04-11 20:41:36

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​