牦牛(Bos grunniens)在高海拔地区营养同化适应的基因组学见解

基因组比较和对高海拔的适应

牛和牦牛基因组之间的比较分析揭示了明显的差异,凸显了牦牛对高海拔生活的独特适应。 具体来说,我们在牦牛中发现了数量增加的基因家族,这些基因家族主要与感官知觉和能量代谢相关。 这种基因组特征表明,进化对高海拔缺氧条件带来的挑战有潜在的反应。 此外,牦牛谱系内的蛋白质结构域显着富集,在检测缺氧应激和监测细胞外条件方面发挥着关键作用,这说明了牦牛对其环境的复杂生物适应。

与营养和缺氧相关的功能类别和途径

我们的研究结果强调了经过正向选择和快速进化的基因的大量富集,主要属于与营养代谢和缺氧反应相关的功能类别和途径。 这些遗传适应对于牦牛至关重要,因为它们增强了牦牛有效代谢营养物质的能力,并在低氧条件下茁壮成长,这是高海拔栖息地的特征。 这一见解不仅增进了我们对动物适应极端环境的理解,而且对解决与缺氧相关的人类疾病也具有潜在的意义。

营养途径基因的进化史

为了揭示哺乳动物营养途径基因的进化史,我们以牦牛作为参考基因组,对 48 个哺乳动物基因组中存在的两个消化酶基因进行了全面的进化分析。补充文件)。 该分析总结于表中 1,对于了解这些基因如何进化和适应不同的饮食需求至关重要,特别是对于居住在高海拔地区的物种。 选择压力评估表明这些消化酶基因经历了适应性进化,这可能归因于这些物种的饮食多样化。

表 1 aBSREL 在系统发育的 57 个分支中的 10 个分支上发现了情景多样化选择的证据。

牦牛营养途径基因的正向选择

我们的数据强调了正向选择在牦牛营养途径基因适应性进化中的关键作用,有助于它们在高海拔地区增强营养同化。 值得注意的是,乳糖酶基因等基因经历了正选择,使牦牛能够在成年后继续产生乳糖酶,并有效消化富含乳糖的乳制品。 这种适应对于它们的生存至关重要,为它们在充满挑战的环境中提供了可靠的必需营养来源。 此外,参与脂肪酸、碳水化合物和氨基酸代谢的基因也显示出正选择的迹象,进一步支持牦牛在高海拔地区繁衍生息的非凡能力。

蛋白激酶的结构分析

蛋白激酶的结构分析揭示了对其功能至关重要的保守区域。 如图所示。 12,这些激酶的催化结构域具有几个保守区域。 两个特定位置已被识别为具有特征模式:靠近 N 末端的富含甘氨酸的片段对于 ATP 结合至关重要,以及中间区域的保守天冬氨酸残基对于催化活性至关重要。 了解这些保守的模式可以深入了解驱动牦牛适应性进化的分子机制,为未来旨在揭示高海拔生活复杂性的研究奠定基础。

图1

牦牛 CAMK2B 蛋白的结构域结构和选择分析。 该图由 DOG 1.0 illustrator 创建,展示了 CAMK2B 蛋白的结构域结构,并强调了对其保守结构域的分析。 特别关注蛋白激酶结构域,其中已确定正选择位点。 这些位点被映射到牦牛 CAMK2B 蛋白的三维结构上,揭示了分子水平的适应性进化。 选择分析通过颜色编码方案可视化,其中将序列与比对的核苷酸编码序列进行比较以推断选择压力。 正选择下的密码子以黄色和棕色突出显示,表明适应性变化。 中性选择下的密码子标记为灰色和白色,表示进化中性,纯化选择下的密码子标记为紫色,表示有害突变的去除。 这种颜色编码可以让您一目了然地了解作用于 CAMK2B 蛋白的选择性力。

图2

牦牛 glul 蛋白的结构域结构分析。 该图使用 DOG 1.0 插画绘制,展示了 GLUL 蛋白的分子结构及其功能域,重点是保守域的分析。 值得注意的是,已在 ATP 结合域内鉴定出正选择位点。 牦牛 GLUL 蛋白的三维结构已被注释,以指示来自选择分析的正选氨基酸位点。 该图采用颜色编码方案来表示密码子选择压力的类型:黄色和棕色表示正选择,表明适应性进化变化; 灰色和白色代表中性选择,表明进化停滞; 紫色表示纯化选择,有害变异被选择性消除。 这种颜色编码有助于在蛋白质结构中的不同选择压力之间进行视觉区分。

此外,我们利用 MG94xREV 基线模型研究了自适应选择,该模型估计每个分支的单个速率类别。 随后,我们采用自适应 aBSREL 模型(称为完全自适应模型)来确定每个分支的最佳速率类别数量。 值得注意的是,ABSREL 在系统发育的 57 个分支中的 10 个分支中发现了情景多样化选择的证据。 对所有 57 个分支机构进行了正式的多元化选择测试。 为了评估结果的统计显着性,我们采用似然比检验,考虑 p < 0.05 的显着性水平,同时调整重复检验的影响(表 1)。 详细的数据表提供了对每个分支推断的速率类别的重要性和数量的见解。

适应性进化和多样化选择

牦牛(B. grunniens)是非常适应喜马拉雅地区高海拔生活的家养动物。 它们适应的一个重要方面是它们从主要是低质量的饲料中有效地吸收营养。 我们的分析表明,牦牛的营养途径基因经历了适应性进化,增强了高海拔地区的营养同化。

具体来说,与低海拔地区的同类(例如牛)相比,牦牛负责碳水化合物和脂质代谢以及营养吸收和运输的基因经历了正选择。 这种适应性进化使牦牛能够在高海拔环境中茁壮成长。 例如,编码钙/钙调蛋白依赖性蛋白激酶 II β 和谷氨酰胺合成酶(氮代谢中的关键酶)的 CAMK2B 和 GLUL 基因属于 CaM 激酶家族。 这些基因在牦牛(B. grunniens)中经历了正选择,凸显了它们在牦牛适应高海拔方面的重要性。

我们的研究发现,与黄牛相比,牦牛的 CAMK2B 和 GLUL 基因中存在一些明显的氨基酸变化。 这些修饰可能会影响 CAMK2B 和 GLUL 蛋白的结构和功能,从而影响其活性和调节。 这表明,使牦牛能够在高海拔地区繁衍生息的独特生理和代谢适应可能是 CAMK2B 和 GLUL 基因适应性进化的结果。

我们使用 BUSTED 进行系统发育树分析,以检测各个节点的正选择实例。 该分析评估了每个位点的同义变化与非同义变化的比率,以确定这些位点是否经历了正选择。 测试考虑了 59 个中值分支/分区的三类非同义速率变化。 我们的调查基于似然比检验,确定了数据集中情景多样化选择的迹象(表 2)。

表 2 FEL 分析的详细逐位点结果。

“情景多样化选择”是指正选择间歇性地作用于系统发育树的众多谱系或分支的特定位置,从而导致遗传多样化的现象。 根据我们的分析,CAMK2B基因内的43个位点可能在进化过程中的某个时刻经历了正选择,表明它们潜在的功能或适应性意义(图1)。 3)。 对这些位点的进一步研究和表征可以为驱动数据集中进化变化的分子机制提供有价值的见解。

图3

按各个站点的贡献细分的 BUSTED 测试的似然比测试的累积分布。

进化指纹分析

家养牦牛(B. grunniens)对喜马拉雅地区高海拔地区的生活有着显着的适应能力,其特点是它们能够从典型的低质量饲料中有效地吸收营养。 我们的分析表明,这些牦牛在与营养途径相关的基因中经历了适应性进化,显着增强了它们在缺氧高海拔环境中吸收营养的能力。 特别是,参与碳水化合物和脂质代谢的基因,以及那些对营养吸收和运输至关重要的基因,在牦牛中显示出正选择的迹象。 这与牛等低海拔动物形成鲜明对比。 例如,CAMK2B 和 GLUL 基因分别编码钙信号传导和氮代谢的关键成分,在牦牛中被积极选择(图 1)。 4)。 这一发现强调了它们在生理适应中的关键作用,使牦牛能够在高海拔的挑战性条件下繁衍生息。 与牛相比,我们发现牦牛的 CAMK2B 和 GLUL 基因中存在一些独特的氨基酸变化,这可能会导致它们各自蛋白质的结构和功能发生变化。 这些变化可能会影响酶的活性和调节机制,强调牦牛卓越的高海拔适应性可能源于这些关键基因的适应性进化。 为了进一步阐明发挥作用的选择力,我们利用 BUSTED 方法进行了系统发育树分析,该方法检测树的不同节点之间的正选择。 通过评估每个位点同义变化与非同义变化的比率,我们的分析旨在查明正选择下的位点(图 1)。 4)。 考虑到 59 个中值分支/分区的三类非同义率变化,我们的似然比测试发现了数据集中情景多样化选择的证据(表 2)。

图4

牦牛 CAMK2B 和 GLUL 基因同义和非同义变异比率的系统发育分析。该图展示了牦牛 CAMK2B 和 GLUL 基因的系统发育分析,重点关注同义(沉默)与非同义(氨基酸)的比率-改变)变体。 该图以对数刻度显示,提供了从基因比对推断出的这些比率的估计分布。 每个椭圆近似于速率估计周围的高斯方差,颜色梯度表示每个速率估计分布内后验样本的密度。 位于对角线上方的点表示正选择(ω > 1),表明适应性进化变化。 相反,线下方的点表示负选择或纯化选择 (ω < 1),表示去除不利的变体。 对角线本身代表中性进化的阈值(ω = 1),其中同义变异和非同义变异的比率相等,意味着没有选择压力。

“情景多样化选择”的特点是系统发育树上特定位点的零星正选择,导致遗传变异。 我们的研究表明,CAMK2B 基因内多达 43 个位点可能在牦牛进化过程中受到正向选择,这表明它们在功能或适应过程中发挥着至关重要的作用(见图 1)。 3 了解具体站点的详细信息)。 对这些地点的进一步研究有望揭示塑造牦牛遗传学的进化压力和分子机制,增强我们对适应高海拔环境的理解。

重组分析

为了评估牦牛的遗传多样性和潜在的适应机制,我们使用重组检测遗传算法(GARD)程序对 CAMK2B 和 GLUL 基因进行了重组分析。 GARD 系统地扫描了这些基因的序列比对,以检测指示过去重组事件的片段,这对于引入遗传变异至关重要。

我们的分析专门旨在识别这些基因内的重组断点,这表明它们可能在牦牛的整个进化史上经历过重组。 这种方法以每秒 4.30 个模型的速度处理数据,总共审查了 16,515 个模型。 序列比对表明有 3524 个潜在的重组断点,创建了超过 4.5 万亿个模型的广泛搜索空间,这些基因内可能有多达 5 个断点(图 1)。 5)。

图5

牦牛基因的遗传重组显示了基因组中的进化断点。 左:对于所考虑的每个断点数量,算法的最大断点位置。 右图:对数标度 c-AIC 分数在连续的断点值之间上升。 支持根据分区的整个树的平均模型长度来放置断点。

在牦牛的 CAMK2B 和 GLUL 基因中检测到这些重组断点表明可能存在影响这些动物表型表达的遗传变异。 CAMK2B 基因编码参与多种生理过程(包括突触可塑性和学习)的蛋白激酶,而 GLUL 基因负责谷氨酰胺合成,两者都是谷氨酰胺代谢不可或缺的一部分。 这些基因内重组的发生可能导致蛋白质功能或表达模式的变化,从而影响关键的生物过程,例如学习和记忆、激素代谢和氨基酸合成。 这些重组事件的影响取决于精确的断点和由此产生的遗传变化。

对这些重组事件及其对牦牛表型的影响的持续研究将加深我们对特定性状遗传基础的理解,特别是与认知功能、激素调节和新陈代谢相关的性状。 这些信息对于旨在增强牦牛种群内某些性状的选择性育种策略具有无价的价值,从而优化它们在恶劣高海拔环境中的适应性和生产力。

泛函分析

短链脱氢酶/还原酶 (SDR) 家族涵盖广泛的酶,这些酶通常充当 NAD 或 NADP 依赖性氧化还原酶。 典型地,该家族中的脱氢酶由至少两个结构域构成:第一个用于辅酶结合,通常是 NAD,第二个用于底物识别和结合。

在我们的研究中,我们重点关注谷氨酰胺合成酶,这种酶普遍存在于生命的各个领域,并且在氮代谢中至关重要,它有助于将铵同化为谷氨酸。 这种酶的功能对于牦牛在高海拔地区管理氮的能力至关重要,其中氮利用效率是一个关键的适应性特征(表 S3S4)。

为了深入研究配体结合相互作用(这取决于氨基酸的理化性质),我们使用了专用的网络服务器(http://crdd.osdd.net/raghava/lpicom)。 我们的研究表明,CAMK2B 蛋白与五个不同的配体相互作用,而 GLUL 蛋白与四个不同的配体相互作用。 CAMK2B 配体中值得注意的是 ATP、IOD、MD 和 PEPTIDE,以及 GLUL、Mn、ADP 和 P3S。 这些配体与多种关键氨基酸残基结合,包括丙氨酸、半胱氨酸、天冬氨酸、甘氨酸、组氨酸、赖氨酸、亮氨酸、精氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸(图1)。 6)。 我们发现带电残基,特别是碱性残基,主要参与这些相互作用,这可能表明高海拔地区的高能量需求。

图6

彼此相互作用的氨基酸残基的簇。 左侧显示了各种配体结合残基的结构,右侧显示了根据配体相互作用残基的理化性质进行的氨基酸聚类。

对于蛋白激酶,丝氨酸/苏氨酸和酪氨酸激酶共享保守的催化核心。 我们的分析指出了该领域内的两个特定区域。 第一个靠近 N 末端,具有与 ATP 结合所必需的赖氨酸残基相邻的富含甘氨酸的序列,并具有丝氨酸/苏氨酸和酪氨酸激酶特有的特征模式。 该结构域的中心部分含有保守的天冬氨酸,对于催化功能是不可或缺的(图1)。 6)。 这些发现强调了激酶活性的潜在适应性,这对于牦牛的能量调节至关重要(表 S3S4)。

利用 STRING 数据库,我们探索了与食物代谢、氧气运输、能量产生和体温调节(高海拔生存的关键过程)相关的网络内的蛋白质相互作用。 我们确定了参与氧运输、缺氧反应和能量代谢的途径,例如 AMPK 和 HIF-1 途径,以及血红蛋白相关基因(图 1)。 7)。 这些途径及其相互作用揭示了牦牛对其缺氧和营养缺乏环境的复杂遗传适应,为了解牦牛卓越的高海拔适应性的分子基础提供了更深入的见解。

图7

营养途径中蛋白质-蛋白质相互作用的分析。 该图可视化了牦牛营养途径中涉及的蛋白质之间的蛋白质-蛋白质相互作用网络。 圆圈代表的节点对应于蛋白质; 绿色节点是具有明确功能的蛋白质,而红色节点表示功能尚未完全阐明的蛋白质。 连接节点的黑线或边缘代表蛋白质之间的相互作用。 每条线的长度表明蛋白质之间的相对相互作用距离或功能关系强度——较短的线意味着更接近或更直接的相互作用。 该网络提供了对控制营养过程的蛋白质复杂相互作用的见解,突出了有助于牦牛高海拔适应性的已知和潜在新颖的相互作用。

我们的研究强调了牦牛营养途径基因之间的相互作用以及相关的蛋白质-蛋白质相互作用,为理解高海拔地区的营养同化和代谢适应提供了有价值的框架。 这些见解具有更广泛的影响,可能为保护工作、牲畜管理和缺氧相关疾病的医学研究提供信息。

转录组表达

GTEx 数据库通过其表达数量性状基因座 (eQTL) 浏览器,提供了遗传变异与组织特异性表达表型之间复杂关系的宝贵可视化。 该浏览器封装了来自一项综合性国家研究项目的数据,该项目旨在以高通量规模阐明遗传多态性和表达模式之间的关联。 值得注意的是,它揭示了多种组织类型涉及多种基因。 我们对该存储库的探索强调了 CAMK2B 基因主要在大脑、心脏、垂体和骨骼肌中表达,表明它参与与这些组织相关的关键功能。 相反,GLUL 在一组不同的组织中表达,包括动脉、脂肪组织、结肠和皮肤(图 1)。 8)。 这些表达模式强调了这些基因在不同生理过程中发挥的不同作用。

图8

牦牛营养途径基因的组织特异性表达模式。 该图显示了牦牛营养途径相关基因在一系列组织类型中的差异表达,数据来自 GTEx 联盟。 图形表示说明了这些基因的相对表达水平,突出显示了每个基因转录最活跃的组织。 这种组织特异性表达谱提供了对这些基因在牦牛不同生物过程和系统中的功能作用的见解。 了解这些模式对于阐明牦牛能够适应其居住的高海拔环境并茁壮成长的遗传机制至关重要。

为了测量一组重要基因的平均表达,我们采用了各种富集分析。 这些分析提供了一系列结果,但这些结果并不能统一表明与特定疾病或明确的生物功能相关的组织富集。 跨组织基因表达模式的这种变异性暗示了遗传因素之间复杂的相互作用,而多种环境和生理背景可能会影响这种相互作用。 这些背景可能对基因表达的调控机制产生微妙的影响。

从 GTEx 数据库收集的数据,特别是有关 CAMK2B 和 GLUL 等基因表达的数据,强化了基因调控和表达是上下文相关且多方面的概念。 这些表达谱与特定组织功能或疾病状态之间的关联很复杂,需要进一步研究以揭示起作用的调控网络。

1709832879
2024-03-07 17:10:25
#牦牛Bos #grunniens在高海拔地区营养同化适应的基因组学见解

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​