英特爾正式推出了全球首款配備 HBM 內存的 x86 CPU——Intel Xeon Max 系列,也就是之前我們稱之為 Sapphire Rapids(HBM)的旗艦級產品線。
新至強中的 56 個內核均為 P 核,可提供 112 個線程和 350W TDP。它采用基于 EMIB 的設計,分為四個集群。但最有趣的是,它還具有 64 GB 的 HBM2e 內存,分為 4 個 16 GB 的集群,總內存帶寬為 1 TB / s,每個內核的 HBM 都超過 1 GB。
英特爾還表示,HBM 內存的集成不需要更改代碼,并且應該對用戶實現無縫透明。
據介紹,這 56 個內核由四個 Die 構成,并使用英特爾的多芯片互連橋 (EMIB) 進行連接,其中封裝了 64GB HBM 內存,該平臺將采用 PCIe 5.0 和 CXL 1.1 I / O 接口。
在 HCPG 性能相同的情況下,功耗比 AMD Milan-X 集群低 68%。
AMX 擴展可提高 AI 性能,并為 INT8 和 INT32 累積操作提供比 AVX-512 高 8 倍的峰值吞吐量。
提供在不同 HBM 和 DDR 內存配置中運行的靈活性。
工作負載基準:
氣候建模:僅使用 HBM 在 MPAS-A 上比 AMD Milan-X 快 2.4 倍。
分子動力學:在 DeePMD 上,與具有 DDR5 內存的競爭產品相比,性能提高了 2.8 倍。
在性能方面。它與舊的英特爾至強 8380 系列處理器或 AMD EPYC 7773X 相比,可在某些工作負載中提供 5 倍的性能。
值得注意的是,AMD 明天將發布基于 Genoa 的數據中心 CPU,兩大系列 CPU 均已向 OEM 交付,因此這些數值對比其實沒什么用。
新 CPU 中還包含 20 個加速引擎,主要是用于 AVX-512、AMX、DSA 和英特爾 DL Boost 工作負載。據稱,英特爾在 MLPerf DeepCAM 訓練中的性能比 AMD 7763 提升了 3.6 倍,比 NVIDIA 的 A100 提升了 1.2 倍。
據介紹,英特爾至強 Max CPU 將在 Aurora 超級計算機中首次亮相,目前正在阿貢國家實驗室建造。IT之家了解到,Aurora 有望成為第一臺超過 2 exaflops 峰值雙精度計算性能的超級計算機。
此外,Aurora 還將率先展示在單個系統中將 Max 系列 GPU 和 CPU 配對的強大功能,擁有超過 10000 個“刀片”,每個“刀片”包含六個 Max 系列 GPU 和兩個至強 Max CPU。