英特尔 Xeon 6 芯片:为企业 AI 革新数据中心

时间快到了!只剩一周时间可以申请 6 月 5 日的 AI Impact Tour 邀请。不要错过这个探索审核 AI 模型的各种方法的绝佳机会。 在此了解如何参加。


随着越来越多的公司开始部署 AI 应用和模型,英特尔宣布推出 Xeon 6 芯片,以确保数据中心能够处理所需的工作负载。该处理器配备两种微架构,一个高效核心 (E 核心) 和一个性能核心 (P 核心),将在 6700 和 6900 平台产品中提供。不过,只有 6700 E 核心版本将于 6 月 4 日推出。6900 P 核心版本将于 2024 年第三季度首次亮相,其他版本将于 2025 年第一季度推出。

英特尔副总裁兼总经理马特·朗曼 (Matt Langman) 在新闻发布会上表示:“这一切都是为了让行业客户能够实现真正的业务成果。我们看到每家公司都在成为一家人工智能公司,无论这些公司是希望提高运营效率、产品开发效率、客户互动效率,还是提高效率。”

除了 Xeon 6 处理器外,英特尔还首次公布了其 Gaudi 2 和 Gaudi 3 加速器芯片的定价。标准 AI 套件包含 Gaudi 2、 2022 年推出,售价为 65,000 美元,而 4 月份发布的 Gaudi 3 的售价为 125,000 美元。

Xeon 6:你需要知道什么

英特尔至强 6 性能核心处理器。图片来源:英特尔

英特尔称 Xeon 6 是一个“强大的计算平台”,它“在性能和效率方面都表现出色”,并声称这两个方面对于“满足数据中心不断增长的需求”至关重要。该处理器支持广泛的用例,从计算密集型人工智能和高性能计算到传统企业应用程序以及节能和高密度的应用程序。


6 月 5 日:纽约人工智能审计

欢迎下周在纽约与我们一起与高层领导交流,探讨审核 AI 模型的策略,以确保整个组织的最佳性能和准确性。确保您能参加这场仅限受邀者参加的独家活动。


该计划旨在让企业利用 Xeon 6 芯片对其老化的数据中心系统进行现代化改造,这有望增加成本节约、帮助实现可持续发展目标、优化物理地板和机架空间并产生新的数字功能。

Xeon 6 P 核和 E 核(以前代号为 Granite Rapids 和 Sierra Forest)共享硬件平台基础和软件堆栈。它们能够支持更多核心数,通过 DDR5 提供更大的内存带宽,具有多路复用组合等级 DIMM,通过 UPI 2.0、Compute Express Link 2.0、通用操作系统和固件增加插槽间带宽等。

考虑到数据中心可能需要的不同要求,英特尔为其 Xeon 6 提供了两种不同的微架构。这归结为工作负载和功能。P 核可能更适合处理高性能计算和计算密集型 AI 的用户。但是,它对“最广泛的企业应用程序”也很有用。Langman 解释说:“对于这些对延迟敏感的工作负载,P 核的优势确实有助于满足或超越这些高单线程和高每核性能的使用。”但是,涉及云原生 Web、微服务和数字服务的工作负载可能会受益于 Xeon 6 E 核,“利用更高的密度和更高的每瓦性能。”

那么,Xeon 6 6700系列和6900系列有什么区别呢?

Xeon 6 处理器(6700 系列)

  • 高达 144 个高效核心 / 86 个性能核心
  • 套接字支持: 支持 1S/2S 和 4S/8S(仅限 P 核)
  • 最大 TDP: 每个 CPU 最高 350W
  • 内存通道: 8 通道内存,最高 6400 MT/s DDR5 内存,8000 MT/s MCR DIMM 内存(P 核)
  • PCIe/CXL: 最多 88 条 PCIe 5.0/CXL 2.0 通道
  • UPI 链接: 4 条 UPI 2.0 链路,最高 24 GT/s

Xeon 6 处理器(6900 系列)

  • 最多 288 个高效核心 / 128 个性能核心
  • 套接字支持: 1S/2S 支持
  • 最大 TDP: 每个 CPU 最高 500W
  • 内存通道: 12 通道内存,最高可达 6400 MT/s DDR5 内存,8800 MT/s MCR DIMM 内存(P 核)
  • PCIe/CXL: 最多 96 条 PCIe 5.0/CXL 2.0 通道
  • UPI 链接: 6 条 UPI 2.0 链路,最高 24 GT/s

交错发布是怎么回事?

并非所有 Xeon 6 变体都会在今天上市。英特尔表示,它故意错开不同处理器 SKU 的发布时间,因为这显然是客户想要的。“对于我们用 Xeon 6 覆盖的各种客户来说,最有意义的事情就是您看到的那种错开的顺序。令人兴奋的是,随着我们越来越接近推出第一款产品,它的顺序非常好,我们得到了很多市场关注,看着它发生很有趣,”英特尔副总裁兼 E-core 产品线总经理 Ryan Tabrah 澄清道。

Xeon 6 E核心的炫耀权

由于 Xeon 6 E-core 是首次亮相,也是第一个拥有 E-core 的 Xeon 版本,英特尔提供了一些指标,称与第二代英特尔至强处理器相比,它能够实现 3 比 1 的机架级整合,机架级性能提升高达 4.2 倍,每瓦性能提升高达 2.6 倍,在媒体转码工作负载方面。

“我们来看看今天的数据中心,假设你使用大约 200 个机架,这将是一个典型的中型数据中心部署,大约有 15 千瓦的机架和 22 u 的服务器,你看看它们如何在第二代英特尔至强处理器上每秒传输媒体流。看看我们在英特尔至强 6 上实现的进步,包括每瓦性能和整体性能的改进,你将 3 比 1 的机架整合减少到 66 个机架——机架空间和机架容量节省巨大,令人惊叹,”Langman 说。

“但是……这不仅仅是机架的节省,也是能源的节省和碳足迹的减少。从机队能源使用情况来看,我们看到在四年内节省了 84,000 兆瓦时的电量——显著的能源节省——同时在同一时期内减少了 34,000 公吨的碳排放……因此,我们获得了机架整合的好处并实现了行业可持续发展目标。”

Gaudi 3:定价和新系统提供商

英特尔的 Gaudi 3 AI 加速器。图片来源:英特尔

除了 Xeon 6 新闻外,英特尔还公布了两款最新 Gaudi 产品的定价。这些加速器芯片旨在与 Nvidia 的 H100 竞争,有助于训练和推断大型语言模型,但总运营成本较低。

使用配备八个英特尔 Gaudi 2 加速器和通用基板的标准 AI 套件的公司将支付 65,000 美元,英特尔估计这相当于同类产品成本的三分之一。配备八个英特尔 Gaudi 3 加速器的类似套件将售价 125,000 美元,约为英特尔竞争对手价格的三分之二。

尽管英特尔披露了定价,但除了表示该芯片将于 2024 年第三季度发布之外,并未提供有关 Gaudi 3 上市时间的更多细节。

为了助力其市场进入战略,该公司正在与至少十家系统提供商合作,包括戴尔、惠普企业、联想、超微,以及新加入的华硕、富士康、技嘉、英业达、广达和纬创。

Xeon 和 Gaudi 的 AI 用例

当被问及 Xeon 和 Gaudi 将如何合作时,Tabrah 称这种关系是互补的。“它正在释放客户的数据中心,”他表示。“他们正面临这些电力瓶颈。数据中心本身几乎成为瓶颈。如果你能通过快速轻松地转移到非常高效的通用计算架构而无需触及任何东西来释放数据中心,那么你就可以继续创新其余基础设施以进行更多 AI;这真是太棒了。”

英特尔的另一位副总裁 Anil Nanduri 指出,这一切都是为了帮助企业解锁其数据。随着生成式人工智能的引入,组织正在寻找利用大型语言模型的最佳方法,以创建适合其所需工作负载的解决方案,以及最适合他们愿意投资的计算成本的解决方案。“你将会看到加速器仍将在哪里运行这些 [LLMs],而是一个类似 RAG 的用例,我可以让我的数据集保持最新,并且可以为进行知识发现或其他用例的客户获得更好的结果,将他们的向量嵌入保留在 Xeon 上,然后将其连接到在加速器上运行的模型,”他分享道。“这是一个很好的用例,我们期待看到 Xeon 和 Gaudi 可以带来很多良好的兼容性、性能和价值。”

英特尔首席执行官帕特·基辛格在一份声明中表示:“英特尔是全球仅有的几家在人工智能市场机遇的整个领域进行创新的公司之一,从半导体制造到个人电脑、网络、边缘和数据中心系统。我们最新的 Xeon、Gaudi 和 Core Ultra 平台,结合我们硬件和软件生态系统的强大功能,正在为客户提供灵活、安全、可持续且经济高效的解决方案,以最大限度地利用未来的巨大机遇。”

1717478094 #英特尔 #Xeon #芯片为企业 #革新数据中心 2024-06-04 03:00:00

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​