新的统计工具提高了发现导致疾病的遗传变异的能力

芝加哥大学研究人员开发的一种新统计工具提高了发现导致疾病的遗传变异的能力。 2024 年 1 月 26 日发表的一篇新论文中描述了该工具 自然遗传学结合全基因组关联研究 (GWAS) 的数据和基因表达的预测,以限制假阳性的数量并更准确地识别疾病的致病基因和变异。

GWAS 是一种常用的方法,用于尝试识别与一系列人类特征(包括最常见的疾病)相关的基因。 例如,研究人员将一大群患有特定疾病的人的基因组序列与另一组来自健康个体的序列进行比较。 在疾病组中发现的差异可能表明遗传变异会增加该疾病的风险,并值得进一步研究。

然而,大多数人类疾病并不是由单一遗传变异引起的。 相反,它们是多个基因、环境因素和许多其他变量复杂相互作用的结果。 因此,GWAS 通常会识别出基因组中许多区域与疾病相关的许多变异。 然而,GWAS 的局限性在于它只能识别关联性,不能识别因果关系。 在典型的基因组区域中,由于连锁不平衡的现象,许多变体彼此高度相关。 这是因为DNA是在整个区块中而不是单个基因中从一代传给下一代的,因此彼此邻近的变异往往是相关的。

您可能在一个区块中有许多与疾病风险相关的遗传变异,但您不知道哪一个实际上是因果变异。 这是 GWAS 的根本挑战,即我们如何从关联转向因果关系。”

Xin He,博士,人类遗传学副教授,新研究的资深作者

使问题变得更加困难的是,大多数遗传变异都位于非编码基因组中,使其影响难以解释。 应对这些挑战的常见策略是使用基因表达水平。 表达数量性状基因座(eQTL)是与基因表达相关的遗传变异。

使用 eQTL 数据的基本原理是,如果与疾病相关的变异是某个基因 X 的 eQTL,那么 X 可能是该变异与疾病之间的联系。 然而,这种推理的问题在于,其他基因的附近变异和 eQTL 可能与 X 基因的 eQTL 相关,同时直接影响疾病,从而导致假阳性。 人们已经开发出许多方法来使用 eQTL 数据从 GWAS 中提名风险基因,但它们都面临着邻近关联混淆这一基本问题。 事实上,现有方法在超过 50% 的情况下会产生假阳性基因。

在这项新研究中,何教授和马修·斯蒂芬斯博士(Ralph W. Gerard 教授、统计学系主任兼人类遗传学教授)开发了一种称为因果转录组范围关联研究 (cTWAS) 的新方法,使用先进的统计技术来降低误报率。 新的 cTWAS 模型不再一次只关注一个基因,而是考虑了多个基因和变异。 使用贝叶斯多元回归模型,它可以消除混淆的基因和变异。

“如果你一次看一个,你会出现误报,但如果你一起观察所有附近的基因和变异,你更有可能找到因果基因,”他说。

该论文通过研究低密度脂蛋白胆固醇水平的遗传学来展示这项新技术的实用性。 举个例子,现有的 eQTL 方法提名了一个参与 DNA 修复的基因,但新的 cTWAS 方法指出了他汀类药物靶基因的不同变体,他汀类药物是一种用于治疗高胆固醇的常用药物。 cTWAS 总共鉴定了 35 个 LDL 的推定致病基因,其中一半以上以前从未报道过。 这些结果指出了 LDL 的新生物学途径和潜在治疗靶点。

cTWAS 软件现在可以从贺实验室网站下载。 他希望继续研究它,以扩展其整合其他类型组学数据的能力,例如剪接和表观遗传学,以及使用来自多种组织类型的 eQTL。

“该软件将允许人们进行将遗传变异与表型联系起来的分析。这确实是整个领域面临的关键挑战,”他说。 “我们现在有了更好的工具来建立这些联系。”

来源:

期刊参考:

赵S., 等人。 (2024)。 在全转录组关联研究中调整遗传混杂因素可以改善复杂性状风险基因的发现。 自然遗传学doi.org/10.1038/s41588-023-01648-9

2024-01-27 03:51:00
1706330174
#新的统计工具提高了发现导致疾病的遗传变异的能力

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​