TOPS 数据显示,英特尔 Lunar Lake 处理器在 GPU 游戏性能方面可以碾压 AMD

微软正与笔记本电脑和处理器制造商一起计划所谓的AI PC的到来(据说苹果在发布M4处理器时也正在准备自己的版本)。 这些设备需要更高的性能才能在自己的硬件上本地运行先进的神经网络。 英特尔现在夸耀即将推出的 Lunar Lake 处理器的性能,该处理器将于今年年底作为第二代 Core Ultra 应用于移动设备。

Lunar Lake是采用台积电3nm制造工艺的小芯片处理器,将于2024年底或2025年初作为第二代Core Ultra发布,并将专门针对移动领域,而更强大的处理器将由Arrow Lake姐妹架构提供同一代人。

英特尔最近宣布,Lunar Lake 在 TOPS 方面的 AI 性能应该是第一代 Core Ultra(Meteor Lake)的三倍以上,后者只有 10 TOPS,但没有透露具体数字。 现在在 Vision 2024 活动期间,他还宣布了 LGA 1851 插槽的 4nm Meteor Lake 处理器,但首席执行官 Patrick Gelsinger 透露性能将达到 45 TOPS,这应该是微软本地人工智能的基准。

但基辛格现在说了另一个更有趣的数字——整个平台的总体性能,这意味着包括 CPU 和 GPU 核心。 这就是 Lunar Lake 移动处理器应该达到 100 TOPS 以上的原因。 如果我们认为仅具有 256 位 SIMD AVX2 和 VNNI256 指令的 CPU 内核可能只能提供 TOPS 单位,那么集成的 Lunar Lake 显卡可以为 AI 应用程序提供大约 50 TOPS(如果不是更多)的性能。

Lunar Lake 中有很多优质的 iGPU?

如果我们暂时将人工智能放在一边,这可能意味着该处理器拥有非常强大的 GPU,例如在游戏手持设备中,它可能会带来惊喜(是否足以让 AMD 措手不及是另一个问题)。 TOPS 中的 AI 性能通常意味着使用 8 位整数值(INT8)进行运算。 如果这种性能是在 XMX 单元上提供的,那么它并没有过多说明标准图形性能,但要注意 – 对于 Meteor Lake 中的集成图形,Intel 已经抛弃了 XMX,因为它们复制了 NPU 的功能。 因此,Lunar Lake 也可以做同样的事情,但它已经使用了新的 Xe2 LPG(Battlemage)架构,因此基于当今一代 Intel Arc 和 Meteor Lake GPU 的假设可能不适用(无论好坏)。

英特尔 Lunar Lake 处理器在 CES 2024 上展示。可见封装内存

作者:英特尔

如果 Lunar Lake 没有 XMX,并在其经典计算单元上实现 50 TOPS,那么 FP32 值下的 GPU 性能可能约为 12.5 TFLOPS(因为 SIMD 单元在四分之一宽度数据类型运算时性能提高 4 倍)。 对于集成 GPU 来说,这一点也不差,Ryzen 8000“Hawk Point”在 Radeon 780M 显卡上应该具有 8.3 TFLOPS,而且这是在考虑双发 RDNA 3 架构之后的结果。 如果没有这个功能,其实际好处是有限的,它会减半(尽管它可以与Battlemage和Lunar Lake的TFLOPS类似)。 顺便说一句,移动版 Ryzen 9 8945HS(目前 AMD 系列中最强大的笔记本电脑处理器)官方宣称的总平台性能为 39 TOPS,而 Lunar Lake 的总平台性能则超过 100 TOPS。但 AMD 也可能会发布新一代 Strix Point到时。

因此,Lunar Lake 显卡可能会出现令人惊讶的臃肿现象,如果英特尔能够及时实现良好的稳定性和驱动程序优化,它可能会成为如此小的移动游戏怪物。 因此,还有一种可能性需要注意:如果 100 TOPS 是在 INT4 运算中,那么 FP32 中的图形性能将仅为其一半,即大约 100 TOPS。 6.25 万亿次浮点运算)。 让我们看看这是否有陷阱……

据此,矛盾的是,Lunar Lake 可能与你对英特尔历史上的预期完全相反——即它可能主要在 CPU 性能上较弱(与高 GPU 和 NPU 性能相比),它只提供四个大核心和四个小型 E 核,从传统角度来看,可能相当于 6 个大核。

不过,据说 Lunar Lake 和 Arrow Lake 处理器的 E-Core 架构有了很大的改进(有传言甚至可能比新的 P-Core 表现出更多的进步),因此 SoC 有可能能够它具有 4+4 配置,比从干巴巴的信息中看到的更强大。 当然,我们不知道 Lunar Lake 在笔记本电脑上运行的有限功耗内能够如何实现潜在的性能。

人工智能的整体表现可能是一个棘手的指标

需要注意的是,是否有任何应用程序能够使用以这种方式表示的整个“平台性能”,例如这100 TOPS,即CPU、GPU和NPU的综合性能,这是一个相当大的问题。 这是因为它们需要在具有不同内存访问和不同架构的不同计算后端之间分散计算,更不用说它们是不以任何方式连接在一起的不同设备。

DT24

通常,应用程序可能不会遇到这个问题,并且将仅在 GPU 上或仅在 NPU 上运行,可能需要处理器或 GPU 的帮助来完成部分辅助计算、预处理和各种不会直接运行在 GPU 上的服务操作。 NPU 矩阵硬件或 GPU 上。 当然,很大程度上还取决于应用程序将针对哪些后端进行编写和调试,因此,理论上可以驱动某些人工智能的专用硬件有时可能会保持未使用状态。

来源: 汤姆的硬件

1713282179
#TOPS #数据显示英特尔 #Lunar #Lake #处理器在 #GPU #游戏性能方面可以碾压 #AMD
2024-04-16 08:09:59

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​