AWS 定制硅芯片系列预示着亚太地区云计算的发展方向

由于需求超过供应,人工智能计算的激增导致人工智能芯片的供应延迟。全球巨头微软、谷歌和 AWS 正在加大定制硅片的生产,以减少对 GPU 主要供应商 NVIDIA 和 AMD 的依赖。

因此,亚太地区企业可能很快就会发现,他们在云数据中心使用的芯片类型越来越多。他们选择的芯片将取决于不同应用工作负载所需的计算能力和速度、成本和云供应商关系。

主要云计算供应商正在投资定制硅芯片

训练 AI 大型语言模型等计算密集型任务需要大量计算能力。随着对 AI 计算的需求不断增长,NVIDIA 和 AMD 等公司的超先进半导体芯片变得非常昂贵且难以获得。

主要的超大规模云供应商已做出回应,将在 2023 年和 2024 年加速生产定制硅片。这些计划将减少对主要供应商的依赖,以便他们能够为全球和亚太地区的客户提供人工智能计算服务。

谷歌

谷歌在 2024 年 4 月的 Cloud Next 大会上发布了 Axion 处理器,首次推出了其首款基于 ARM 的定制 CPU。在过去十年的定制硅片工作的基础上,谷歌逐步生产自己的 CPU,旨在支持各种通用计算,包括基于 CPU 的 AI 训练。

对于谷歌在亚太地区的云客户,该芯片预计将增强谷歌在其数据中心范围内的人工智能能力,并将于 2024 年晚些时候向谷歌云客户推出。

微软

同样,微软也推出了自己的首款内部定制加速器,专门针对人工智能和生成式人工智能任务进行了优化,并被微软评为 Azure Maia 100 人工智能加速器. 微软还推出了基于 ARM 的 CPU Cobalt 100,这两款产品均于 2023 年 11 月在 Microsoft Ignite 大会上正式发布。该公司为 AI 定制的芯片已经用于运行 OpenAI 的 ChatGPT 3.5 大型语言模型等任务。这家全球科技巨头表示,预计从 2024 年开始,该产品将更广泛地推广到 Azure 云数据中心供客户使用。

AWS

AWS 对定制硅片的投资可以追溯到 2009 年。该公司目前已发布了四代 Graviton CPU 处理器,这些处理器已在全球各地的数据中心推出,包括亚太地区;这些处理器旨在提高云工作负载的性价比。此外,还有两代用于深度学习和 AI 推理的 Inferentia 和两代用于训练 100B+ 参数 AI 模型的 Trainium。

AWS 为亚太地区云客户提供硅片选择

在最近于澳大利亚举行的 AWS 峰会上,AWS 计算和网络服务副总裁 Dave Brown 告诉 TechRepublic,云提供商设计定制硅片的原因是为了向客户提供选择并提高可用计算的“性价比”。

“提供选择非常重要,”布朗说。“我们的客户可以找到最适合其工作负载的处理器和加速器。而且,通过我们生产自己的定制硅片,我们可以以更低的价格为他们提供更多的计算能力,”他补充道。

NVIDIA、AMD 和英特尔是 AWS 芯片供应商之一

AWS 与主要的半导体芯片供应商有着长期的合作关系。例如, AWS 与 NVIDIA 的关系如今在人工智能领域占据主导地位的英特尔的历史可以追溯到 13 年前,而发布了用于人工智能的 Gaudi 加速器的英特尔则一直是 自云提供商成立以来一直是半导体供应商. AWS 一直在提供来自 自 2018 年起,AMD 进入数据中心

由于成本压力,定制硅片选项需求旺盛

布朗表示,随着全球经济放缓,过去两年来成本优化热潮席卷了各大机构,包括亚太地区在内的各个地区的客户都转向了 AWS Graviton。他说,这些芯片已被市场广泛采用——全球有超过 50,000 个客户——包括这家超大规模公司的所有前 100 名客户。他说:“最大的机构正在转向 Graviton,因为它具有性能优势和成本节省。”

查看:云成本优化工具不足以控制云支出。

用户包括韩国和澳大利亚公司

定制 AWS 芯片的广泛部署让亚太地区的客户得以利用这些选项。

  • 莱昂纳多.艾: 总部位于澳大利亚的高速增长图像生成器初创公司 Leonardo.Ai 已在生成式 AI 模型的训练和推理中使用了 Inferentia 和 Trainium 芯片。Brown 表示,他们的推理成本降低了 60%,延迟改善了 55%。
  • Kakaopay证券: 布朗表示,韩国金融机构 Kakaopay Securities 一直在“大力使用 Graviton”。布朗表示,这使得该银行的运营成本降低了 20%,绩效提高了 30%。

定制硅片对企业云客户的优势

亚太地区的企业客户可以从不断扩大的计算选项中受益,无论是以性能、成本还是对不同云工作负载的适用性来衡量。定制硅片选项还可以帮助组织实现可持续发展目标。

改善性能和延迟结果

云提供商与芯片供应商之间的竞争可能会推动芯片性能的进步,无论是在用于人工智能模型训练的高性能计算类别中,还是在延迟是一个重要考虑因素的推理创新中。

进一步优化云成本的潜力

云成本优化一直是企业面临的主要问题,因为不断扩大的云工作负载导致客户的成本不断膨胀。更多的硬件选项为客户提供了更多降低总体云成本的选择,因为他们可以更明智地选择合适的计算。

能够将计算与应用程序工作负载相匹配

云服务中定制硅片的数量不断增加,将使企业能够更好地将其应用程序工作负载与底层硬件的具体特性相匹配,确保他们能够根据所追求的用例使用最合适的硅片。

通过减少电力来提高可持续性

预计到 2028 年,可持续性将成为客户采购云供应商的五大因素之一。供应商正在做出回应:例如,AWS 表示,使用 Graviton4 芯片可以减少碳排放,该芯片的效率提高了 60%。定制硅片将有助于提高整体云可持续性。

1717920920
#AWS #定制硅芯片系列预示着亚太地区云计算的发展方向
2024-06-07 20:50:34

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​