使用人工智能中红外光谱法筛查具有不同寄生虫密度和贫血状况的人类血液样本中的疟疾感染 | 《疟疾杂志》

生成不同寄生虫密度和贫血状况的样本 为了确定最低可检测的疟原虫浓度并评估贫血对 MIRs-ML 预测疟疾感染准确性的影响,用来自 70 名志愿者的疟疾阴性血液稀释培养的恶性疟原虫环期寄生虫,以产生四种不同的寄生虫密度(图 1)。选择两种最低疟疾寄生虫血症(0.002% 或 50-100 寄生虫/μL 和 0.00003% 或 1-3 寄生虫/μL)分别对应 RDT/显微镜和 PCR 的近似检测限。此外,选择 6% 和 0.1% 的寄生虫血症水平来捕捉训练数据集中最高的寄生虫对比度。血细胞比容设定为 50%、25% 和 12.5%,分别代表正常、中度和重度贫血。 因此,生成了一个双向矩阵,该矩阵由四个疟疾阳性寄生虫血症水平(6%、0.1%、0.002% 和 0.00003%)和一个阴性类别(0%)以及三个贫血类别组成(表 S1)。总共创建了 4655 个 DBS,并使用 MIR 光谱仪进行了扫描,用于训练和评估 ML 分类器。随机选择样本以确认稀释成功(图 S2 和 S3)。 机器学习分类器的选择和训练 分析了 4559 个光谱,这些光谱具有不同的疟原虫密度和血细胞比容。其中,12 个来自非贫血样本的光谱、35 个来自中度贫血样本的光谱和 49 个来自严重贫血样本的光谱被丢弃,原因是血浆和大气干扰导致水分含量过高(表 S2)。不同贫血条件下每种寄生虫血症类别的平均光谱揭示了恶性疟原虫感染的特征性生化特征,例如酰胺、脂质和疟色素(图 S1) [32]。为了确保 ML 分类器能够学习与疟疾感染相关的特征,消除了没有关键生化信息的红外区域(从 2799 到 1801 […]