神经网络产生的酶的计算评分和实验评估

请参阅补充方法以了解全文的其他详细信息。 数据管理 第一轮 CuSOD 尤尼普罗特74 恰好包含一个 Sod_Cu Pfam 的序列75 域已下载。 嗯搜索(嗯, http://hmmer.org/; 参考号 76)确定了 Sod_Cu 域包络。 序列被截断以去除超出 Sod_Cu 匹配范围的无关序列。 进行了额外的质量过滤。 使用 CD-HIT 删除序列重复项77 同一性阈值为 80%,80% 和 20% 分别被随机分为“训练”集和“测试”集。 使用 MUSCLE (v3.8) 通过迭代过程生成训练 MSA78。 第一轮MDH 下载包含 Ldh_1_N Pfam 域和后跟 Ldh_1_C 域的所有 UniProt 序列。 LDH 和 MDH 酶,基于酶委托编号79、LDH 为 1.1.1.27 和 MDH 为 1.1.1.37,从 SwissProt 下载。 MUSCLE […]