來源:聚大模型前言
在 Hot Chips 2024 上,IBM 宣布了其下一代大型機技術,其中包括 Telum II 處理器和 Spyre AI 加速器。這兩款產品將顯著提高 IBM Z 系統上的 AI 功能,滿足企業對高效、安全和可擴展 AI 解決方案的需求。
IBM Telum II 處理器是 IBM z16 的核心,集成了深度學習推理能力,通過硬件直接集成了 AI 加速功能,企業在無需額外硬件的情況下,即可實現實時數據分析和決策制定。Telum II 處理器的 AI 加速計算能力比上代 Telum 處理器提升四倍,并且通過一致性連接的處理集群,進一步提升了性能。
Telum II 處理器通過增加 L2、L3 和 L4 緩存的大小,緩存容量較上代增加了 40%,顯著改善了芯片外帶寬和延遲性能。此外,Telum II 處理器的時鐘頻率達到 5.5 GHz ,可以提供更快的處理速度。Telum II 還增加了用于 I/O 加速的新數據處理單元 (DPU)。該單元可以提高數據處理效率,I/O 密度提高 50%。DPU 可以簡化系統操作并提高數據密集型應用程序和人工智能工作負載的性能。
安全性方面,Telum II 處理器支持包括量子安全加密在內的高級加密技術。此外,Telum II 處理器在 A 和 Z 總線鏈接上提供了改進的安全性能,進一步保護了企業的數據安全。能效方面, Telum II 處理器通過優化功率消耗,有效降低了 IBM z16 的能源消耗。基于集中式 IO 和 DPU 設計,Telum II 降低了高達 15% 的核心功率,進一步提高了能源效率。
與 Telum II 處理器一同推出的還有 IBM Spyre AI 加速器。Spyre 加速器擁有 32 個獨立的加速器核心,并且包含 25.6 億個晶體管,支持 int4、int8、fp8 和 fp16 數據類型,使用 5 納米工藝生產。每個 Spyre 加速器都安裝在 PCIe 卡上,這些卡可以集群化,為單個 IBM Z 系統增加大量的加速器核心。
Spyre 加速器支持在本地進行生成式 AI 和模型微調,使 IBM Z 系統能夠處理更復雜的 AI 工作負載。Spyre 加速器的架構可以直接將數據從一個計算引擎發送到下一個,從而節省了能源。此外,Spyre 加速器使用一系列較低精度的數值格式,如 int4 和 int8,這使得運行 AI 模型更加節能且對內存的需求更少。
Telum II 處理器和 Spyre AI 加速器的結合,企業用戶能夠直接在 Z 平臺上安全高效地運行人工智能應用程序。Telum II 可以處理大規模 AI 工作負載和數據密集型業務需求,而 Spyre 加速器可以處理復雜的 AI 模型和生成式 AI 用例,所有這些都不會影響 IBM Z 環境的安全性和可靠性。
Telum II處理器和Spyre加速器都將采用三星代工廠的5納米工藝技術制造。預計這些產品將于 2025 年向客戶提供。
【近期會議】
10月30-31日,由寬禁帶半導體國家工程研究中心主辦的“化合物半導體先進技術及應用大會”將首次與大家在江蘇·常州相見,邀您齊聚常州新城希爾頓酒店,解耦產業鏈市場布局!https://w.lwc.cn/s/uueAru
11月28-29日,“第二屆半導體先進封測產業技術創新大會”將再次與各位相見于廈門,秉承“延續去年,創新今年”的思想,仍將由云天半導體與廈門大學聯合主辦,雅時國際商訊承辦,邀您齊聚廈門·海滄融信華邑酒店共探行業發展!誠邀您報名參會:https://w.lwc.cn/s/n6FFne
聲明:本網站部分文章轉載自網絡,轉發僅為更大范圍傳播。 轉載文章版權歸原作者所有,如有異議,請聯系我們修改或刪除。聯系郵箱:viviz@actintl.com.hk, 電話:0755-25988573
審核編輯 黃宇
-
處理器
+關注
關注
68文章
19404瀏覽量
230880 -
IBM
+關注
關注
3文章
1763瀏覽量
74814 -
AI
+關注
關注
87文章
31491瀏覽量
270002 -
人工智能
+關注
關注
1796文章
47642瀏覽量
239788
發布評論請先 登錄
相關推薦
評論