拼接 - Mandarinian

遗传病诊断的一次飞跃，准确率超过 98%

在最近发表的一项研究中 NEJM人工智能研究人员开发了基于人工智能（AI）的稀有变异探索模型生物聚合资源（MARRVEL）模型，根据临床特征和基因序列选择孟德尔疾病的致病基因及其突变。研究： AI-MARRVEL — 用于诊断孟德尔疾病的知识驱动型人工智能系统。图片来源：Antiv/Shutterstock.com 背景全球有数百万人出生时患有遗传疾病，通常是由单基因突变引起的孟德尔疾病。识别这些突变需要付出努力并且需要大量的专业知识。全面、系统、高效的程序可以提高诊断速度和准确性。人工智能已显示出潜力，但在初步诊断方面只取得了平庸的成功。基于生物信息学的重新评估成本较低，但准确性有限，使得对非编码变异进行优先级排序变得乏味，并且需要使用模拟数据。关于该研究在本研究中，研究人员引入了知识驱动的 MARRVEL 基于人工智能的模型 (AIM) 来识别孟德尔疾病。 AIM 是一种机器学习分类器，结合了来自数千个已识别病例的超过 350 万个变异和专家设计的变量，以增强分子诊断。该团队将 AIM 与来自三个队列的患者进行了比较，并制定了置信度评分，以在未解决的池中找到可诊断的实例。他们使用高质量样本和专业开发的功能来训练 AIM。他们在三个患者数据集上测试了该模型的各种应用，例如显性、隐性、三重诊断、新疾病基因识别和大规模重新评估。研究人员从三个患者组收集了人类表型本体 (HPO) 关键词和外显子组序列：DiagLab、未确诊疾病网络 (UDN) 和破译发育障碍 (DDD) 项目。他们将 DiagLab 数据分为训练数据集和测试数据集，并分别测试 DDD 和 UDN。他们通过知识驱动的特征工程指导 AIM，利用临床专业知识和遗传原理选择 56 个原始特征，如次要等位基因频率、疾病数据库、进化保守、变异影响、表型匹配、遗传模式、变异致病性估计分数、基因约束、测序质量和剪接预测。该团队创建了 6 个用于基因诊断决策的模块，产生了 47 个额外特征。他们使用随机森林分类器作为主要人工智能算法，并咨询了基准出版物和表现最佳的算法。他们使用 SpliceAI 等特征来确定拼接变化的优先级。 […]