打造更好的人工智能超级计算机,要有光

GlobalFoundries 是一家为 AMD 和通用汽车等其他公司生产芯片的公司,此前宣布与 Lightmatter 建立合作伙伴关系。 哈里斯表示,他的公司正在“与世界上最大的半导体公司以及超大规模企业合作”,指的是微软、亚马逊和谷歌等最大的云公司。

如果 Lightmatter 或其他公司能够重新发明巨型人工智能项目的布线,那么智能算法开发的一个关键瓶颈可能会消失。 更多计算的使用是 ChatGPT 进步的基础,许多人工智能研究人员认为硬件的进一步扩展对于该领域的未来进步至关重要,并且对于实现人工智能模糊指定的目标至关重要。通用智能(AGI),意味着在各方面都可以与生物智能相媲美或超越的程序。

Lightmatter 首席执行官尼克·哈里斯 (Nick Harris) 表示,将一百万个芯片与光连接在一起可能会产生比当今最先进的算法好几代的技术。 “通道将使 AGI 算法成为可能,”他自信地表示。

训练巨型人工智能算法所需的大型数据中心通常由装满数万台运行专用硅芯片的计算机的机架以及它们之间的意大利面条式电气连接组成。 在如此多的系统(所有系统都通过电线和交换机连接)上维护人工智能的训练运行是一项艰巨的工程任务。 电子信号和光信号之间的转换也对芯片作为一体进行计算的能力造成了根本性的限制。

Lightmatter 的方法旨在简化人工智能数据中心内棘手的流量。 “通常情况下,你有一堆 GPU,然后是一层交换机、一层交换机、一层交换机,你必须遍历这棵树”才能在两个 GPU 之间进行通信,Harris 说。 Harris 表示,在通过 Passage 连接的数据中心中,每个 GPU 都可以与其他每个芯片建立高速连接。

Lightmatter 在 Passage 上的工作就是一个例子,说明人工智能最近的蓬勃发展如何激励大大小小的公司尝试重新发明 OpenAI 的 ChatGPT 等先进技术背后的关键硬件。 人工智能项目 GPU 的领先供应商英伟达上个月举行了年会,首席执行官黄仁勋 (Jensen Huang) 公布了该公司最新的用于训练人工智能的芯片:一款名为 布莱克威尔。 Nvidia 将出售“超级芯片”中的 GPU,该芯片由两个 Blackwell GPU 和一个传统 CPU 处理器组成,所有这些都使用该公司名为“超级芯片”的新型高速通信技术进行连接。 NVLink-C2C

芯片行业以寻找方法在不增大芯片尺寸的情况下从芯片中获取更多计算能力而闻名,但英伟达选择逆这一趋势而行。 该公司超级芯片内的 Blackwell GPU 的性能是前代产品的两倍,但它是通过将两个芯片连接在一起制成的,这意味着它们消耗更多的电量。 这种权衡,加上英伟达努力将其芯片与高速链路粘合在一起,表明对人工智能超级计算机其他关键组件的升级(如 Lightmatter 提出的那样)可能变得更加重要。

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​