遗传病诊断的一次飞跃,准确率超过 98%

在最近发表的一项研究中 NEJM人工智能研究人员开发了基于人工智能(AI)的稀有变异探索模型生物聚合资源(MARRVEL)模型,根据临床特征和基因序列选择孟德尔疾病的致病基因及其突变。 ​​​​​​​研究: AI-MARRVEL — 用于诊断孟德尔疾病的知识驱动型人工智能系统。 图片来源:Antiv/Shutterstock.com 背景 全球有数百万人出生时患有遗传疾病,通常是由单基因突变引起的孟德尔疾病。 识别这些突变需要付出努力并且需要大量的专业知识。 全面、系统、高效的程序可以提高诊断速度和准确性。 人工智能已显示出潜力,但在初步诊断方面只取得了平庸的成功。 基于生物信息学的重新评估成本较低,但准确性有限,使得对非编码变异进行优先级排序变得乏味,并且需要使用模拟数据。 关于该研究 在本研究中,研究人员引入了知识驱动的 MARRVEL 基于人工智能的模型 (AIM) 来识别孟德尔疾病。 AIM 是一种机器学习分类器,结合了来自数千个已识别病例的超过 350 万个变异和专家设计的变量,以增强分子诊断。 该团队将 AIM 与来自三个队列的患者进行了比较,并制定了置信度评分,以在未解决的池中找到可诊断的实例。 他们使用高质量样本和专业开发的功能来训练 AIM。 他们在三个患者数据集上测试了该模型的各种应用,例如显性、隐性、三重诊断、新疾病基因识别和大规模重新评估。 研究人员从三个患者组收集了人类表型本体 (HPO) 关键词和外显子组序列:DiagLab、未确诊疾病网络 (UDN) 和破译发育障碍 (DDD) 项目。 他们将 DiagLab 数据分为训练数据集和测试数据集,并分别测试 DDD 和 UDN。 他们通过知识驱动的特征工程指导 AIM,利用临床专业知识和遗传原理选择 56 个原始特征,如次要等位基因频率、疾病数据库、进化保守、变异影响、表型匹配、遗传模式、变异致病性估计分数、基因约束、测序质量和剪接预测。 该团队创建了 6 个用于基因诊断决策的模块,产生了 47 个额外特征。 他们使用随机森林分类器作为主要人工智能算法,并咨询了基准出版物和表现最佳的算法。 他们使用 SpliceAI 等特征来确定拼接变化的优先级。 […]