新研究增强了身体活动跟踪

在最近发表在该杂志上的一项研究中 NPJ数字医学研究人员使用英国 (UK) Biobank 的大规模加速度计数据集(包含 700,000 人日的未标记数据)来构建模型,以更准确和更通用的方式监测身体活动水平。

学习: 使用 700,000 人日的可穿戴数据进行人类活动识别的自监督学习。 图片来源:sutadimages / Shutterstock

背景

医疗保健领域带有传感器的可穿戴设备的开发和使用迅速增加,这些设备可用于健康和健身跟踪、患者远程监控、需要实时数据的临床试验、疾病早期检测、个性化医疗,并进行大规模的健康研究。 这些设备提供有关运动、睡眠质量、步数、配速和久坐时间的汇总指标。 然而,需要可靠的算法来从传感器收集的数据中获取有关人类活动的信息。

虽然自然语言处理和计算机视觉等领域由于可以使用剩余数据来训练这些学习模型而取得了显着进步,但可用于训练算法的大规模数据集的缺乏限制了开发可靠且可靠的模型的进展。准确识别人类活动。 缺乏足够的数据来训练这些模型也混淆了深度学习模型的研究结果,这表明深度学习模型的表现并不比简单统计等传统方法更好。

关于该研究

在本研究中,研究人员使用英国生物银行的加速度计数据集来训练深度学习模型,以准确识别身体活动。 英国生物银行进行了一项大规模的加速度计研究,招募了近 50 万名参与者。 超过十万名参与者在自然环境中(而不是在实验室环境中)在手腕上佩戴加速计一周。 这提供了大约 700,00 人日的自由活动人体运动数据。

第 1 步涉及对来自英国生物银行的 700,000 人日数据进行多任务自我监督学习。 在步骤 2 中,我们通过迁移学习评估预训练网络在八个基准人类活动识别基线中的效用。拟议的自我监督学习流程概述。 第 1 步涉及对来自英国生物银行的 700,000 人日数据进行多任务自我监督学习。 在步骤 2 中,我们通过迁移学习评估预训练网络在八个基准人类活动识别基线中的效用。

研究人员使用了自我监督学习方法,该方法已成功用于生成预训练 Transformer 或 GPT 等示例。 最近的研究使用了许多自我监督学习方法,例如掩模重建、多任务自我监督、引导和对比学习来检查可穿戴传感器数据的分析。 本研究将多任务自我监督方法应用于大型英国生物银行数据集,以展示如何将预训练模型推广到具有健康和临床意义的各种基于活动的数据集。

多任务自监督学习方法首先应用于英国生物银行的大规模加速度计数据集来训练深度卷积神经网络。 随后,使用八个基准数据集来评估预训练神经网络的性能并评估不同人群和活动类型的表示质量。

标记数据集用于评估模型在迁移学习中的成功。 此外,该研究还使用了加权抽样方法来规避低流动期的无信息问题。 从运动传感器收集的现实世界数据有不活动的时期,并且这种静态信号在转换过程中不会改变,这给自监督学习任务带来了问题。 因此,为了提高训练过程的收敛性和稳定性,研究人员采用了加权采样方法,即按比例对数据窗口进行采样,并使用这些样本的标准差进行分析。

结果

结果表明,当本研究中训练的模型在八个基准数据集上进行测试时,它们的表现优于基线,中位相对改进为 24.4%。 此外,该模型可以推广到各种运动传感器设备、生活环境、群体和外部数据集。

研究还发现,即使在未标记的小型数据集中,多任务自我监督的预训练方法也能有效提高人类活动的下游识别能力。 自监督预训练也可以比监督方法表现得更好。

研究人员表示,这项研究表明,多任务自我监督学习方法可以应用于可穿戴传感器的数据集,并使用深度学习算法构建准确且可泛化的活动识别模型。

研究人员团队还向数字健康领域的研究界发布了预先训练的模型,以便基于它们构建高性能模型,以用于涉及有限标记数据的各种其他领域。

结论

总而言之,该研究使用了英国生物银行的一个由加速度计数据组成的大规模、未标记的数据集,通过自我监督的方法来预训练深度学习模型。 这些预先训练的模型在准确分析不同群体、传感器设备和生活环境中不同数据集的运动传感器数据方面表现超出了基线水平。 研究人员认为,这些模型可以构建并用于涉及有限数量标记数据的各种场景。

期刊参考:

  • Yuan, H.、Chan, S.、Creagh, AP、Tong, C.、Acquah, A.、Clifton, DA 和 Doherty, A. (2024)。 使用 700,000 人日的可穿戴数据进行人类活动识别的自我监督学习。 Npj数字医学7(1), 91.DOI: 10.1038/s41746024010623,

2024-04-22 02:09:00
1713753515
#新研究增强了身体活动跟踪

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​