遗传病诊断的一次飞跃,准确率超过 98%

在最近发表的一项研究中 NEJM人工智能研究人员开发了基于人工智能(AI)的稀有变异探索模型生物聚合资源(MARRVEL)模型,根据临床特征和基因序列选择孟德尔疾病的致病基因及其突变。

​​​​​​​研究: AI-MARRVEL — 用于诊断孟德尔疾病的知识驱动型人工智能系统。 图片来源:Antiv/Shutterstock.com

背景

全球有数百万人出生时患有遗传疾病,通常是由单基因突变引起的孟德尔疾病。 识别这些突变需要付出努力并且需要大量的专业知识。

全面、系统、高效的程序可以提高诊断速度和准确性。 人工智能已显示出潜力,但在初步诊断方面只取得了平庸的成功。

基于生物信息学的重新评估成本较低,但准确性有限,使得对非编码变异进行优先级排序变得乏味,并且需要使用模拟数据。

关于该研究

在本研究中,研究人员引入了知识驱动的 MARRVEL 基于人工智能的模型 (AIM) 来识别孟德尔疾病。

AIM 是一种机器学习分类器,结合了来自数千个已识别病例的超过 350 万个变异和专家设计的变量,以增强分子诊断。 该团队将 AIM 与来自三个队列的患者进行了比较,并制定了置信度评分,以在未解决的池中找到可诊断的实例。

他们使用高质量样本和专业开发的功能来训练 AIM。 他们在三个患者数据集上测试了该模型的各种应用,例如显性、隐性、三重诊断、新疾病基因识别和大规模重新评估。

研究人员从三个患者组收集了人类表型本体 (HPO) 关键词和外显子组序列:DiagLab、未确诊疾病网络 (UDN) 和破译发育障碍 (DDD) 项目。 他们将 DiagLab 数据分为训练数据集和测试数据集,并分别测试 DDD 和 UDN。

他们通过知识驱动的特征工程指导 AIM,利用临床专业知识和遗传原理选择 56 个原始特征,如次要等位基因频率、疾病数据库、进化保守、变异影响、表型匹配、遗传模式、变异致病性估计分数、基因约束、测序质量和剪接预测。

该团队创建了 6 个用于基因诊断决策的模块,产生了 47 个额外特征。 他们使用随机森林分类器作为主要人工智能算法,并咨询了基准出版物和表现最佳的算法。

他们使用 SpliceAI 等特征来确定拼接变化的优先级。 他们开发了 AIM-without-VarDB 模型来检查错误表型数据的影响。

他们使用“特征攀爬”方法来评估每个特征的贡献,并根据其生物学意义对所有特征进行分类。

研究人员开发了一种跨样本评分来估计使用 AIM 成功诊断患者的诊断变异的机会。

他们根据患者的置信度将患者分为两组:置信度高的组进行人工审核,置信度低的组进行重新分析。

他们构建了四个置信度,将其应用于 UDN 和 DDD 样本,并通过区分阳性患者、阴性患者以及新发患者的未受影响的亲属来对其进行评估。

结果

AIM 极大地提高了基因诊断的准确性,相对于三个现实世界队列中的基准方法,解决的病例数量增加了两倍。 AIM 的准确率达到 98%,并在 871 个病例中检测出 57% 的可诊断病例。

它还通过准确预测未诊断疾病网络最近报告的两个基因,在发现新疾病基因方面显示出前景。 AIM 在三个独立数据集上的表现优于现有方法,在 UDN 和 DiagLab 队列中的表现优于 Genomiser。

AIM 方法成功区分了 ClinVar 中的非诊断性和诊断性致病变异。 AIM-without-VarDB 的性能略有下降,但优于其他基准测试技术。

专家特征开发提高了目标模型的准确性,同时延迟了训练饱和度。 使用 20% 的训练数据,AIM 保持了 54% 的 top-1 诊断准确性。 通过更多的训练样本,使用工程变量训练的模型显示出 66% 的准确度,而没有工程特征的模型的准确度为 58%。

研究人员发现 top-1 诊断准确性下降了 11%,这表明精确的表型注释至关重要。 即使有无用的表型信息,AIM 也获得了 78% 的 top-5 诊断准确率,凸显了分子证据的重要性。

基于 OMIM 的表型相似性评分从 0 增加到 0.25,预测结果增加了 60.0% 到 90.0%。 然而,随后超过 0.3 的增量仅导致轻微上升,表明缺乏与 OMIM 表型精确匹配的要求。

三重奏分类器 (AIM-Trio) 优于 Exomiser 和 Genomiser Trio 模型,同时略胜于仅先证者模型 (AIM)。 AIM-NDG 模型删除了与公认疾病数据库相关的特征。

根据研究结果,AIM 是一种机器学习遗传诊断工具,能够识别新的疾病基因并在几天内分析数千个样本。 它非常准确,有利于初步诊断、未解决病例的重新分析以及识别新的疾病基因。

AIM 分析来自数千个诊断病例的大约 350 万个变异数据点,并为用户提供一个 Web 界面来提交病例和检查结果。

然而,局限性包括不评估结构或拷贝数变化以及关注编码突变的情况。 大型语言模型,例如 PhenoBCBERT 和 PhenoGPT,已经表现出了更高的性能。

2024-04-30 09:12:00
1714469013
#遗传病诊断的一次飞跃准确率超过

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​