使用人工智能中红外光谱法筛查具有不同寄生虫密度和贫血状况的人类血液样本中的疟疾感染 | 《疟疾杂志》

生成不同寄生虫密度和贫血状况的样本

为了确定最低可检测的疟原虫浓度并评估贫血对 MIRs-ML 预测疟疾感染准确性的影响,用来自 70 名志愿者的疟疾阴性血液稀释培养的恶性疟原虫环期寄生虫,以产生四种不同的寄生虫密度(图 1)。选择两种最低疟疾寄生虫血症(0.002% 或 50-100 寄生虫/μL 和 0.00003% 或 1-3 寄生虫/μL)分别对应 RDT/显微镜和 PCR 的近似检测限。此外,选择 6% 和 0.1% 的寄生虫血症水平来捕捉训练数据集中最高的寄生虫对比度。血细胞比容设定为 50%、25% 和 12.5%,分别代表正常、中度和重度贫血。 因此,生成了一个双向矩阵,该矩阵由四个疟疾阳性寄生虫血症水平(6%、0.1%、0.002% 和 0.00003%)和一个阴性类别(0%)以及三个贫血类别组成(表 S1)。总共创建了 4655 个 DBS,并使用 MIR 光谱仪进行了扫描,用于训练和评估 ML 分类器。随机选择样本以确认稀释成功(图 S2 和 S3)。

机器学习分类器的选择和训练

分析了 4559 个光谱,这些光谱具有不同的疟原虫密度和血细胞比容。其中,12 个来自非贫血样本的光谱、35 个来自中度贫血样本的光谱和 49 个来自严重贫血样本的光谱被丢弃,原因是血浆和大气干扰导致水分含量过高(表 S2)。不同贫血条件下每种寄生虫血症类别的平均光谱揭示了恶性疟原虫感染的特征性生化特征,例如酰胺、脂质和疟色素(图 S1) [32]。为了确保 ML 分类器能够学习与疟疾感染相关的特征,消除了没有关键生化信息的红外区域(从 2799 到 1801 cm-1) [21]并选择 3100–2800 cm-1 和 1800–900 cm-1 区域来训练和验证 ML 分类器。

首先,使用十倍分层混洗分割交叉验证 (SSS-CV),LR 在所有三个数据集中都获得了最高的 SSS-CV 准确度得分,在高对比度、所有浓度组合和低对比度训练集中分别达到 97.61%、71.14% 和 70.87% (图 2a-c)。

图 2

通过对非贫血样本进行交叉验证,评估了七个 ML 分类器的性能,采用三种方法。a 高对比度下分类器相对于阴性类别的准确度得分。b​​ 对所有浓度进行评估,将所有寄生虫密度结合为阳性,而无。c 低对比度下对阴性进行评估。在 20% 测试集上训练和微调的 LR 模型的混淆矩阵,寄生虫血症类别与训练集相似,显示在面板 d、e 和 f 中。高对比度 (g)、所有浓度 (h) 和低对比度 (i) 下显示了三个调整后的 LR 模型的接收者操作特性 (ROC) 和曲线下面积 (AUC)

保留 LR 算法进行进一步调整,利用网格搜索方法对广泛的超参数值进行调整。调整后的模型在拟合高对比度场景(特征为 6% 的寄生虫血症水平与未感染样本)时,表现出区分疟疾阳性和阴性样本的出色能力,准确率分别达到 100% 和 91%(图 2d)。在评估调整后的模型在所有寄生虫血症浓度下的性能时,正确识别阳性和阴性样本的准确率分别为 82% 和 73%(图 2e)。即使在低对比度模型下,使用 0.0003% 的寄生虫血症对阴性进行训练,该模型仍保持了强劲的性能,阳性和阴性检测准确率分别为 78% 和 65%(图 2f)。

即使在调整 LR 以优化其超参数计之后,使用高对比度进行训练仍具有最大的曲线下面积 (AUC) 估计值,为 0.98(图 2g),优于使用组合浓度和低对比度数据集训练的模型,后者的 AUC 得分分别为 0.85 和 0.82(图 2h、i)。表 1 总结了验证集上三个模型的训练测试规模、精度、召回率和 F1 分数。

表 1 使用实验室数据对 20% 训练测试分割的三个 LR 模型进行测试的汇总分数(精确度、召回率和 F1 分数)

此外,为了了解影响预测的特定生化贡献,提取了波数值和相应的系数,这些系数对三个经过训练的 LR 分类器的性能影响最大。所有三个分类器都从与主要与脂质(3100-2800 cm-1)和蛋白质(1800-600 cm-1)相关的生化信号相关的波数值中学习(图 3a-c),与疟疾感染的预期信号一致 [16, 21]。

图 3

图 3

对三个模型性能影响最大的光谱特征,a 高对比度,b 所有浓度组合,c 低对比度训练集,用于预测正类(红色圆圈)和负类(蓝色圆圈)。圆圈的大小代表系数得分

对比度最高的模型似乎主要学会了根据与蛋白质相关的波数对疟疾感染进行分类,特别是酰胺 III 和酰胺 I 振动(1185-1191 cm-1、1199-1201 cm-1、1619-1617 cm-1 和 1687-1671 cm-1),这些振动表明了蛋白质的二级结构。波数值 997、1125-1139 cm-1 突出了模型对蛋白质(肽)的 CN 拉伸振动和磷酸二酯拉伸(1201、1071 和 1263 cm-1)的使用,表明了核酸(图 3A)。 高对比度模型有效地识别了与脂质、烷烃和碳水化合物相关的波数,这些波数由 2917 cm-1、2843 cm-1、2967 cm-1 和 2955 cm-1 处的关键 C-H 拉伸振动以及 1491 cm-1 和 1493 cm-1 处的 C-H 弯曲振动指示。图 3B、C 还直观地显示了其他 LR 模型的最佳波数值,涵盖了所有浓度和低对比度场景。

对空白滤纸进行可视化后发现,在疟疾阳性和疟疾阴性血液样本中,1700 和 1200 cm−1 之间的波数均出现了明显峰值(图 4),这三个分类器的大部分重要特征都集中在该区域(图 3A-C)。此外,在空白滤纸以及疟疾阳性和疟疾阴性样本的 1100–500 cm−1 范围内也观察到了类似的光谱趋势(图 4)。然而,在使用高对比度样本训练的分类器识别出的 40 个关键特征中(图 3A),只有 6 个落在这个重叠区域内,其中 4 个具有正系数。另外两个分类器(一个在所有浓度上进行训练,另一个使用低对比度与阴性样本进行训练)来自该区域的特征较少(图 3B、C)。这表明,滤纸成分纤维素对分类器的准确性没有显著影响。

图 4

图 4

直观比较空白滤纸的中红外光谱与疟疾阳性血液(6%、0.1%、0.002% 和 0.00003%)和疟疾阴性血液(0%)中含有不同水平疟原虫血症的滤纸的光谱。该图代表 10 张滤纸的平均光谱,每张滤纸扫描 32 次,即 320 次光谱扫描

检测不同寄生虫血症和贫血条件下的疟疾感染

在确定高对比度训练集在预测相同寄生虫血症水平的数据集方面具有最佳性能后,使用 100 个引导随机重采样针对各种寄生虫血症和贫血状况验证了三种经过训练的 LR 算法的准确性。为此,在训练之前将 30% 的完整数据集单独保留为未见数据。

针对阴性类别,使用高对比度数据集训练的 MIRs-ML 识别出非贫血样本中的疟疾感染,在测试的两个最高寄生虫血症水平(6% 和 0.1%)下准确率为 100%。在对中度和低度寄生虫血症进行分类时,以及在评估所有浓度的组合光谱时,准确率下降到 92-91%(图 5a)。同样,当使用高对比度模型预测中度和重度贫血的寄生虫感染时,也观察到了较高的准确率(图 5b、c)。

图 5

图 5

三个 LR 模型在训练前完全未见过的数据集上的表现,针对非贫血(a)、中度(b)和重度贫血(c)。d-f 分别表示高对比度、所有浓度和低对比度模型在验证集上的 LR 性能的三维表示

在所有组合浓度上训练的模型和使用低对比度训练的模型也经过验证,可用于预测未见数据集中的各种寄生虫血症。无论贫血如何,在所有浓度上训练的 MIRs-ML 都能准确分类不同的寄生虫血症,平均准确率为 75.33% [70.07–80.8%] (图 5a-c)。在最低对比度上训练的模型平均准确率为 62.73% [56.53–74.00%] 在不同寄生虫血症和贫血条件下。当在新数据中验证不同寄生虫血症和贫血条件下的低对比度模型时,发现预测与训练集(中度和低度寄生虫血症)相似的寄生虫血症水平的准确性有所提高(图 5a-c)。

总体而言,高对比度模型在所有测试的寄生虫血症和贫血条件下预测疟疾感染方面均优于其他两个模型(图 5d-f),这表明这种方法在实现普遍性方面最为稳健。

拟合了广义线性模型,以估计训练方法、寄生虫血症水平和贫血对 MIRs-ML 诊断疟疾感染的预测准确性的影响。分析表明,贫血和不同程度的寄生虫血症均不会显著影响 MIRs-ML 模型区分感染和未感染样本的能力(贫血情况:χ2 = 0.01,p = 0.99;寄生虫强度:χ2 = 0.24,p = 0.99)。然而,训练方法的选择会显著影响模型性能(χ2 = 201.62,p < 0.001)。 使用 Post-Hoc Tukey 检验对三种训练方法进行比较的进一步分析表明,使用高对比度样本进行训练显著提高了 MIRs-ML 的预测准确性,与使用所有浓度进行训练相比,平均差异为 19.93% (p < 0.001),与使用低对比度样本进行训练相比,平均差异为 32.53% (p < 0.001)。此外,与使用低对比度样本进行训练相比,使用所有浓度进行训练都表现出显著的积极效果,平均差异为 12.59% (p < 0.001)。

使用现场采集的干血斑光谱验证 MIRs-ML 识别疟疾感染的能力

使用从患者身上采集的真实样本评估实验室训练模型的性能。为了便于比较,在两种情况下测试了创建的模型。首先,使用前面几节中详述的实验室数据。其次,利用从现场获得的真实数据集(见图 6a)。在模拟现场条件的模拟中,将实验室产生的所有寄生虫血症水平合并并视为阳性,高对比度训练模型以 88% 和 92% 的准确率区分阳性样本和阴性样本(图 6b)。

图 6

图 6

评估三种经过训练的逻辑回归 (LR) 模型对实验室和患者样本中疟疾感染进行分类。a 使用实验室和现场收集的 DBS,对各种寄生虫血症水平的每种贫血水平的平均准确度。b 高对比度模型的混淆矩阵,预测非贫血条件下的实验室组合寄生虫血症与阴性,模拟真实的现场收集。c 混淆矩阵表明高对比度模型在现实的现场收集的 DBS 中检测疟疾感染的性能。d 使用实验室和现场样本,按贫血条件平均高对比度模型的假阳性和假阴性预测

表 2 用于验证现场采集样本的三个 LR 模型的汇总分数(精确度、召回率和 F1 分数)

为了了解 MIRs-ML 在即时诊断或人口调查中的潜在应用,我们计算了最高对比度模型在预测实验室样本和现场数据集中的所有寄生虫血症时的假阴性和假阳性(图 6d)。该模型在现场样本中的假阴性预测误差为 14%,假阳性预测误差为 21%,初步表明这种方法在人口调查中可能最有用,尤其是在低传播环境中,因为假阴性率较低。

2024-06-17 03:29:56
1718596227
#使用人工智能中红外光谱法筛查具有不同寄生虫密度和贫血状况的人类血液样本中的疟疾感染 #疟疾杂志

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​