中国 GPU 制造商 Moore Threads 宣布对其 KUAE 数据中心服务器进行重大升级。该公司现在能够在单个集群中连接多达 10,000 个 GPU,这标志着其在人工智能和高性能计算应用方面的横向扩展能力有了巨大飞跃。增强版 KUAE 服务器集成了八个 MTT S4000 GPU,利用 Moore Threads 专有的 MTLink 互连技术。这些基于 MUSA 架构的 GPU 各自具有 128 个张量核心和 48 GB GDDR6 内存,可提供 768 GB/s 的带宽。虽然 10,000 个 GPU 集群的全部性能指标仍未披露,但 1,280,000 个张量核心的规模表明其具有不错的计算潜力。Moore Threads 的 GPU 目前在性能方面落后于 NVIDIA 的 GPU 产品。 不过,该公司声称其 MTT S4000 仍然与某些 NVIDIA 模型具有竞争力,特别是在大型语言模型训练和推理任务方面。

由于被列入美国商务部的实体名单,这家中国公司面临着重大挑战,无法获得先进的制造工艺。尽管存在这些障碍,该公司仍与中国主要国有电信运营商和科技公司建立了合作伙伴关系,专注于开发新的计算集群项目。最近一轮融资筹集了约 3.437 亿美元,这将有助于 Moore Threads 雄心勃勃的扩张计划。然而,无法获得尖端半导体制造技术可能会限制该公司未来的增长。尽管如此,创建一个拥有多达 10,000 个 GPU 的横向扩展服务器基础设施对于 LLM 训练和推理至关重要,尤其是在中国人工智能实验室在人工智能模型性能方面赶超西方实验室的情况下。

1720515946
#Moore #Threads #MTLink #在 #集群中可扩展至 #个自主研发的 #GPU
2024-07-09 08:21:34

Leave a Reply

Your email address will not be published. Required fields are marked *