游离寡糖和粘蛋白型 O-聚糖的模拟消化揭示了产气荚膜梭菌的潜在作用

如方法中所述,从 UniProt(版本 2023_02)中提取与子亚类 EC 3.2.1(糖苷水解酶)和 EC 3.1.6(硫酸酯水解酶)活性相关的细菌蛋白。 从 EC 3.2.1 的 CAZy(2023 年 5 月更新)中提取了类似的数据。 当与 BRENDA 交叉引用时,在这些蛋白质中发现了 155 个完整的 EC 编号31 存储库,其中 30 个是 UniProt 独有的,20 个是 BRENDA 独有的(图 1)。 1B)。 发现了 12 种与硫酸酯水解酶(硫酸酯酶)活性相关的蛋白质,所有这些蛋白质都存在于 UniProt 中,其中 6 个蛋白质存在于 BRENDA 中(图 1)。 1A)。

图1

UniProt 中不同细菌硫酸酯酶 (EC 3.1.6.-) 和糖苷水解酶 (EC 3.2.1.-) 活性的数量,与 BRENDA 数据库和 CAZy 交叉引用。 硫酸酯酶并非完全具有碳水化合物活性,因此 CAZy 数据库中未列出 EC 3.1.6 的成员。 BRENDA 值并非直接源自 BRENDA 数据库,而是代表 UniProtKB 中交叉引用的 EC 编号。

酶和反应

基于已知的 12 种糖苷水解酶和 1 种硫酸酯酶参与肠道花菌消化 HMO 和粘蛋白的情况,开发了 12 种糖苷水解酶和 1 种硫酸酯酶的糖基模拟物24,25,32。 模型的酶见表 1,编号 1-13,具有 EC 编号(如果有),包含一种唾液酸酶(酶 1)、两种半乳糖苷酶(2 和 3)、两种 N-乙酰氨基半乳糖苷酶(4、8)、两种 N-乙酰氨基葡萄糖苷酶(5、13),一种 β-N-乙酰氨基己糖苷酶 (7)、一种硫酸酯酶 (9)、三种岩藻糖苷酶 (6、10、11) 和内切糖苷酶乳糖-N-二糖苷酶 (12)。 相应的活动在 Glycoogue 中建模33 符号,它使用单糖的单字符编码系统。 使用 ChEBI 交叉检查反应和聚糖底物34 和瑞亚。 土卫五登录号(如有)包含在表中 1

表1 模型的酶。

CAZy 家族和生物分类学分类

从 UniProt 数据集(发布 2023_02)中,在细菌中鉴定出了 95 个不同的 CAZy 糖苷水解酶家族。 对各个物种可用的不同模拟 EC 数进行了计数。 根据 UniProt 或 BRENDA 中完整 EC 编号的分配,没有发现任何生物体具有模拟器的全部 11 种完全特征酶,排名最高的是两歧双歧杆菌,有 10 个与其 GH 编码蛋白相关的完整 EC 编号。

在 UniProt/BRENDA 中与糖苷水解酶 (GH) 或硫酸酯水解酶 (SH) 活性相关的 8368 种细菌中,448 种经手动鉴定与人类肠道菌群相关,其余 7920 种被归类为非肠道菌种(通常来自环境样本) )。 166 种肠道物种的一个子集已被确定为潜在病原体35

从表 1 可以根据 UniProt 数据中是否存在特定酶活性将酶谱分配给每个物种。 该酶谱值是代表酶活性状态的整数(参见方法,酶谱),通过本工作表示为 pX,其中 X 是从 0 到 ({sum }_{i=1}^{13 }{2}^{i-1})= 8191。从肠道细菌中鉴定出了 40 种独特的酶谱,而非肠道物种中则有 79 种酶谱。 互动克朗36 补充信息中显示了肠道、非肠道和所有物种(组合)的 SVG(可缩放矢量图形)图。 通过比较肠道和非肠道微生物子集,鉴定出 4 种肠道物种特有的酶谱,12 种酶谱是非肠道细菌特有的。 发现非肠道 (n = 7920) 和肠道 (n = 448) 物种可用的模拟特征水解酶的中位数分别为 2 和 3。

将 HMO 喂入模拟微生物组

包含 226 种经过实验确定的 HMO 的库17 号 对于物种数据的每个子集中的每个物种,用作 Glycologue GH 模拟器的输入。 每个 GH 反应都与先天酶谱值中的一位信息相关。 一旦所有底物在模拟器内尽可能被消化,这些底物上使用的酶的子集将被存储为消化曲线值。 并非模型的所有酶活性都被 HMO 组激活。 例如,三个物种:Bacteroides caccae、Adhaeribacter pallidiroseus 和 Zobellia galactanivorans,表达酶 1 至 8(见表 1),这是酶谱值 p7936。 模拟消化后,由于没有一个 HMO 具有 α-半乳糖或 α-N-乙酰氨基葡萄糖苷酶残基,因此与去除这些糖单位相对应的酶,即 α-半乳糖苷酶和 α-N-乙酰氨基葡萄糖苷酶从未被激活,从而导致进一步消除酶 2 和 5。因此,这些细菌的底物特异性或环境特异性谱值计算为 p7954。 图 1 总结了先天特征值与 HMO 训练特征值的映射。 2。 发现六个物种拥有独特的模拟酶子集,包括益生菌物种两歧双歧杆菌和长双歧杆菌,以及两种潜在的病原体,产气荚膜梭菌和窦杆菌。

图2

将碳水化合物 (HMO) 消化中使用的酶映射到生物体可用的全部模拟糖苷水解酶。 (A) 克朗图显示内环上的 GH 酶谱,反映了 HMO 异质群体的模拟消化,映射到外环中可用酶的一种或多种谱,与细菌种类相对应。 (B) 属于 (A) 中的六个命名空间的独特酶谱值:两歧双歧杆菌、长双歧杆菌、丁酸梭菌、产气荚膜梭菌、窦杆菌和琥珀色密螺旋体。 酶谱值由细胞向量说明(1 至 13,从左到右,代表表中的酶 1)根据代表去除的取代基或断裂的键的颜色填充:红色(L-岩藻糖); 黄色(d-半乳糖); 橙(GalNAc); 蓝色 (GlcNAc/HexNAc) 品红色(唾液酸); 灰色(乳-N-二糖); 白色(无活动)。 一组完整的酶谱值如图 1 所示。 9,而补充信息(Krona)中提供了交互式克朗图,其中每个部分都可以扩展以显示与每个配置文件相关的物种。

HMO 消化的模拟网络如图 1 所示。 3。 作为实验确定的 HMO 集一部分的节点以比中间体更大的节点尺寸绘制,并根据核心类型着色(图 1)。 4) 与之前使用的表示方式一致17 号 用于 HMO 生物合成。 当前版本的 GH 酶模拟器无法将所有 HMO 完全消化为乳糖,因为它无法处理 3-岩藻糖基化乳糖 (3-FL)。 然而,网络的大小和不相交子网的数量都可以与某些配置文件值相匹配。 随着生物体可用酶数量的减少,反应子网络的数量会增加(图 1)。 3广告; 另请参阅补充信息)。 最完整的消化曲线(所有 GH 酶均处于活性状态)如图 1 所示。 3A),具有一个水解酶反应的主要网络和几个较小的岛。 B. bifidum 和 B. longum 物种的网络分为两个大子网和五个小子网(图 1)。 3B)。 (如图。 3B),与产气荚膜梭菌酶谱密切匹配(图 1)。 3C)。 图 1 显示了代表多个物种的假定消化网络。 3D,包括大肠杆菌,但也包括 24 个其他物种,其中 7 个与肠道微生物有关,其中包括来自肠杆菌目同一目的另外两个物种:阴沟肠杆菌和肠沙门氏菌,其中两个来自拟杆菌目(Parabacteroides distasonis 和 Bacteroides stercoris)以及真细菌目内的两种(Eisenbergiella tayi 和 Blautia wexlerae)。 与 B 组中的 8 和 10 种活性相比,可用 5 种 GH 酶活性,该图明显比双歧杆菌的更加分散,表明仅部分消化了 HMO 底物。 其他 HMO 降解网络显示在补充信息(网络)中。

图3

当将 226 种独特的母乳低聚糖中的每一种提交给模拟器时,模拟细菌中表达的糖苷水解酶降解 HMO 的网络。 (A) 使用可用模型的所有酶获得的网络。 (B) 对应于酶谱 p4360 和 p4888 的网络,代表双歧杆菌属。 分别为 bifidum 和 longum。 (C) 网络 p6912(产气荚膜梭菌)。 (D) 网络 p7984(大肠杆菌和其他物种)。 在面板 (A–D) 之间,随着对 HMO 底物具有活性的可用 GH 酶数量减少 (B–D),网络的碎片化增加。 节点根据基于 HMO 还原端的核心结构类型进行着色17 号:红色(乳-N-四糖)、青色(乳-N-新四糖)、蓝色(乳-N-六糖)、橙色(乳-N-新六糖)、灰色(其他)。

图4

母乳寡糖和粘蛋白型 O-聚糖中常见单糖和核心的符号。

在图中。 5,HMO生物合成过程中糖基转移酶作用的模拟网络17 号 与本研究中模拟的糖苷水解酶的预测网络进行了对比。 TFS-LNO 的结构,乳糖-N-八糖的三岩藻糖基、单唾液酸衍生物37,38,被用作参考。 在这两个网络中,遇到的几种中间体先前已被表征,并在图中突出显示,包括 F-LND III39DF-LNH c40,41TF-LNO II39TF-LNH40,41,42 和 DF-LNH II40,42。 并非所有通过网络的路径都是同样可能的,并且在生物合成网络中,通过酶活性及其在高尔基体内的时空定位进行动力学调节43

图5

人乳寡糖 TFS-LNO 生物合成和糖苷水解酶催化降解的模拟途径。 在生物合成网络中,仅包含导致 TFS-LNO 的产物。 根据假定在路径的这些步骤中活跃的酶来标记选定的边缘。 突出显示的节点代表实验表征的结构:灰色节点(LNTri II),蓝色节点代表具有乳-N-六糖核心的结构(图1)。 4)。 使用的缩写:LNTri II(乳-N-丙糖 II); TFS-LNO(一种三岩藻糖基、单唾液酸乳糖-N-八糖)。

还观察到生物合成途径和降解途径之间中间体的差异。 当 HMO-Glycolog 最小生物合成网络的计算中间体时,先前发表17 号,与作用于同一组初始 HMO 底物的 GH 模拟器进行比较,发现两个网络共有的中间体百分比为 59.1%,差异部分归因于以 6-连接 GlcNAc 终止的产物,由于 βHexNAcH 活性(酶 7)可从支链寡糖中去除 β3 连接的 GlcNAc。

潜在能量分数

为了量化以 HMO 底物为食的先天糖苷水解酶装置的影响,并且更容易地比较物种在这些饮食寡糖上茁壮成长的能力,为每个模拟消化开发了一个评分系统,如方法中所述(潜在的计算)能量分数)。 首先,确定了模拟器在所有酶均处于活性状态下消化 226 种 HMO 的最大得分,并且所有独特酶谱值的得分都被分配了相对于该最大值的势能 (PE) 得分(从 0 到 1)。

肠道亚类中得分最高的物种是双歧双歧杆菌和长双歧杆菌,相对PE得分分别为0.9888和0.8210,而产气荚膜梭菌得分为0.8089。 在图 1 中,这些颜色为蓝色或紫色。 6B(按分类顺序分组),而得分最接近的物种来自上面提到的 7 种细菌(图 1)。 3D),相应​​的 PE 得分为 0.6983,其他几种 GH 酶谱也达到了该值,例如 p8072,它与 Akkermansia muciniphila、Bacteroides reticulotermitis、Bacteroides xylanisolvens 和 Phocaeicola vulgatus 相匹配。 这些底物得分最低的生物体(PE 值为 0.0012)包括肠球菌和伤寒沙门氏菌,从 UniProt/BRENDA 中仅检索到两种酶:α-半乳糖苷酶和 β-N-乙酰己糖胺酶。 对于非肠道细菌亚类的 79 个谱,PE 评分范围为 0.0007(副炭疽杆菌)至 0.7688(苍白粘杆菌和半乳糖杆菌)。 非肠道细菌根据图 1 中的分类学类别进行分组。 6答:在 HMO 和 O-聚糖模拟消化中,相似的谱聚类模式是明显的,但表现最高的物种仅出现在肠道类别中。 肠道和非肠道细菌物种中势能得分的频率分布如图 1 所示。 6D,以及每个部门内可用的模拟酶的数量。

图6

分配给喂食母乳寡糖和粘蛋白型 O-聚糖群体的细菌的预测势能 (PE) 分数。 对于每个独特的酶谱,使用模拟酶的子集,生成模拟糖苷水解酶降解网络,并计算释放的单糖数量(乳糖-N-二糖苷酶的作用计算为 0.5,而不是 1)。 然后根据该值与 HMO 数据集的最大可能值(所有酶均处于活性状态)的比率对每个概况进行评分。 PE 分数的颜色从灰色到蓝色 (0-1)。 (A) 非肠道物种,按分类类别分组。 (B) 肠道细菌种类,按分类顺序分组。 产气荚膜梭菌的位置由箭头指示。 C 可用于肠道和非肠道物种的模拟酶的数量。 D HMO 喂养的细菌势能分数的频率分布。 在计算机中以 HMO 喂养的高评分肠道物种(A,右)是 B. bifidum (p4360)、B. longum (p4888) 和 C. perfringens (p6912); 粘蛋白型 O-聚糖(B,右)得分最高的是 B. bifidum (p4360) 和 C. perfringens (p6912)。 数据来源于 UniProtKB (https://uniprot.org)。 与 CAZy 数据集的比较,请参见扩展数据图 2。 E2

模拟营养

表达胞外糖苷水解酶的细菌可以释放底物,以造福群落中的其他物种,这一过程称为交叉喂养或互养27,28,44。 为了在计算机上研究这种现象,我们利用 UniProt 中的数据,以成对的方式将模拟器中的每种酶谱与其他酶谱进行了比较。 使用布尔异或 (XOR) 和合取 (AND) 按位比较肠道物种的糖苷水解酶谱,如方法(潜在互养的计算)中所述。 当发现一种酶活性在一种生物体中缺乏但在另一种生物体中存在时,当提供适合该酶分解代谢的底物时,分数会增加,作为潜在合作的证据。 当两个谱(每个谱代表一个或多个物种)具有相同的酶活性时,分数被递减,作为对相同底物的竞争潜力的指示。 两种谱中不存在的酶均进行中性处理。 因此,可以仅根据 UniProt 和 BRENDA 中的 GH 数据为每对分配总体分数,而无需模拟消化。 潜在的互养分数如图 1 所示。 7,其中潜在的合作用绿色像素表示,竞争对手用红色表示,中性互动用白色表示。 种内竞争45 由对角线表示,其中比较相同的轮廓值。

图7

根据可用的酶谱预测肠道细菌之间的竞争和共生。 对于配置文件 p1 和 p2 中的每一位,当按位比较 p1 XOR p1 = 1(布尔 true)时,互增分数增加 1,当 p1 AND p2 = 1(布尔 true)时,互增分数减少 0.5,当 p1 AND p2 时保持不变= 0(布尔假)。 图中显示了互养物种对(绿色)和竞争物种对(红色)。 详情请参阅文字。

发现互养分数 (x) 的范围为 − 6.0 至 + 8.0。 图 1 数据的一般特征 7 重要的是,在绿色像素占主导地位的区域中,对于那些表达更多种类的 GH 酶的物种来说,物种之间存在合作的潜力。 一个可能的例外是长双歧杆菌的概况,它与其他物种的概况相比得分往往是中性的。 突出显示了丁酸梭菌 (p8152) 和短短波单胞菌 (p7991) 之间存在共生潜力,其中表中的六种酶 1 存在于其中一个而不存在于另一个中。 蜡样芽孢杆菌 (p8059) 和约氏不动杆菌 (p8127) 之间的竞争潜力也表明,两者具有相似的总体特征。

p8072 和 p7991 的得分为 4.50,同样是互补的,这表明与这些谱相关的肠道物种,例如 Akkermansia muciniphila 和 B. diminuta 可能在宿主肠道内合作,C. butyricum 和 B. diminuta 也可能在宿主肠道内合作 (p8072和 p8152),其中 x = 4.0。 A. muciniphila 和 C. butyricum(p8072 和 p8152)的成对 x 值为 -1.5,因此根据图 2 被归类为竞争性。 7。 基于酶互补性的结合或解离的强度将与从给定底物组提取的势能相关。

将粘蛋白型 O-聚糖喂入模拟微生物组

为了与 HMO 群体进行比较,使用一组 434 个来自不同物种的粘蛋白型 O-聚糖作为模拟器的输入。 当所有酶都可用时,消化网络如图 1 所示。 8 获得的结果显示所有底物几乎完全消化。 尽管模拟消化不完整,但计算了非肠道和肠道细菌的势能得分,如图 1 所示。 6。 由于大量细菌出现在前一类中,为了在热图中保持相同的纵横比,非肠道数据在分类单元级别上进行聚类,在肠道物种的情况下按顺序进行聚类。 再次,双歧杆菌属。 与产气荚膜梭菌一样,得分很高,尽管不如喂食 HMO 底物群体时的得分高,这可能是因为双歧杆菌缺乏 LNB 底物。 在这些 PE 分数的上四分位数 (PE > 0.6128) 中,值在 0.7 和 0.8 之间,分布图为 p8072、p7944、p7952 和 p7936,在从 UniProt 提取的数据中,它们与 A. muciniphila(以及其他 3 个spp.)、粪副杆菌、多形拟杆菌(以及其他 3 种)和 caccae 拟杆菌。

图8

糖苷水解酶的 O-聚糖降解网络。 将 434 个粘蛋白型 GalNAc 连接的聚糖提交给糖基糖苷水解酶模拟器,通过表中的酶进行消化 1。 较大的节点是实验观察到的 O-聚糖,根据核心类型着色(参见图 4):核心1(黄色); 核心 2(绿色); 核心 3(青色); 核心 4(蓝色); 核心 5(橙色); 较小的灰色节点是推断的中间体。

使用 CAZy 数据库进行验证

先前已注意到手动或通过软件分配 EC 编号错误的问题46,47,48。 由于 UniProt 导出的数据中可能存在误报或错误注释,因此将此处描述的方法应用于从 CAZy 获得的相应数据,作为独立验证结果的一种方式。 在一组平行实验中,根据各自拥有的模拟糖苷水解酶的数量对肠道和非肠道细菌物种进行排序,并指定酶谱值。 CAZy 中有 3,009,944 个细菌条目,发现了 6,814 个独特物种,其中 5,690 个被指定为 GH 家族。 与 UniProt/BRENDA 相比,CAZy 中的 EC 编号分配数量要少得多,因此选择了 134 个物种进行模拟,其中 44 个分配给肠道微生物群,94 个分配给非肠道微生物群。 对于肠道和非肠道相关子集,可用模拟酶的中位数数量也低于 UniProt/BRENDA 衍生数据集,每个物种 1 个酶。

使用 CAZy 数据集重复进行模拟,包括 HMO(扩展数据图 1)。 E1)和O-聚糖消化网络,相对势能分数的计算(扩展数据图1) E2)和成对酶谱比较(扩展数据图 1) E3)。 尽管注释存在差异,但出现了类似的模式:肠道物种在酶的数量和由此产生的 PE 评分方面始终排名较高,如图 1 所示。 9,与非肠道物种相比。 UniProt 和 CAZy 来源的微生物群的酶谱值是不同的,如两歧双歧杆菌的谱所示,在 CAZy 数据中,该双歧杆菌不具有唾液酸酶 EC 3.2.1.18(表中的酶 1) 1),而 UniProtKB 中的 10 个蛋白质条目与此活动相关。 肠道细菌和非肠道细菌之间的区别在扩展数据图的热图中清晰可见。 E2。 尽管注释存在差异,但在两个数据集中,产气荚膜梭菌对 HMO 具有活性的糖苷水解酶数量均排名第二,在 CAZy 中,与 A. muciniphila 一起,排名第三。

图9

比较 UniProt 和 CAZy 衍生的细菌酶谱以及基于 HMO 的模拟势能得分。 模拟酶数量排名前十的物种列表如表所示 1,以及酶谱值和根据代表移除的取代基或键断裂的颜色填充的单元格向量(1 到 13,从左到右)。 色键:红色(l-岩藻糖); 黄色(d-半乳糖); 橙(GalNAc); 蓝色 (GlcNAc/HexNAc) 品红色(唾液酸); 灰色(乳-N-二糖); 白色表示完全没有活动。 酶谱值是根据每个生物体的源数据库计算的。 相对势能 (PE) 得分与以 HMO 混合物为食的物种的酶谱相匹配。 从 UniProt/BRENDA(左图)和 CAZy(右图)获得的独特 GH 酶谱值如下所示,分为肠道和非肠道类别。 每个热图都拥有作为参考点 p0,这是所有可用酶的默认值。

1705597601
2024-01-18 16:30:36
#游离寡糖和粘蛋白型 #O聚糖的模拟消化揭示了产气荚膜梭菌的潜在作用

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​