泽塔奥特曼普通话免费版在线观看,色哟哟视频在线,四虎永久免费影院

英特爾產品在全新MLCommons AI推理性能測試中盡顯優勢

今日，MLCommons公布針對 60 億參數大語言模型及計算機視覺與自然語言處理模型GPT-J的 MLPerf推理v3.1 性能基準測試結果，其中包括英特爾所提交的基于Habana?Gaudi?2 加速器、第四代英特爾?至強?可擴展處理器，以及英特爾?至強?CPU Max 系列的測試結果。該結果顯示了英特爾在AI推理方面極具競爭力的表現，并進一步加強了其對加速從云到網絡到邊緣再到端的工作負載中大規模部署AI的承諾。

英特爾執行副總裁兼數據中心與人工智能事業部總經理Sandra Rivera表示：“正如最新的 MLCommons結果顯示，我們擁有強大的、具有競爭力的人工智能產品組合以滿足客戶對高性能、高效率的深度學習推理及訓練的需求，同時，針對各種規模的人工智能模型，英特爾產品組合均具有領先的性價比優勢。”

根據6月披露的MLCommonsAI訓練結果和Hugging Face性能基準測試驗證，Gaudi2 在先進的視覺語言模型上，性能可以超越英偉達的H100處理器，而今天的結果進一步證明了英特爾能夠提供滿足AI計算需求的、英偉達H100和A100的唯一可行的替代方案。

考慮到客戶的個性化需求，英特爾正在通過能夠幫助解決AI工作負載中推理與訓練問題的產品，讓AI無處不在。英特爾的AI產品為客戶提供了可根據各自性能、效率及目標成本進行靈活匹配以獲取最佳AI解決方案的理想選擇，同時亦幫助客戶開放生態系統。

關于Habana Gaudi2的測試結果：

Habana Gaudi2在GPT-J模型上的推理結果強有力地驗證了其具有競爭力的性能。

·Gaudi2 在GPT-J-99 和GPT-J-99.9 上的服務器查詢和離線樣本的推理性能分別為78.58 次/秒和84.08 次/秒。

·與英偉達H100相比，Gaudi2提供了令人信服的卓越性能，H100相對于Gaudi2僅表現出 1.09 倍（服務器）和 1.28 倍（離線）的輕微性能優勢。

·Gaudi2 擁有高于英偉達A100 2.4 倍（服務器）、 2 倍（離線）的性能。

·Gaudi2 提交的結果采用 FP8數據類型，并在這種新數據類型上達到了 99.9% 的準確率。

隨著每6-8周公布的 Gaudi2 軟件更新，英特爾將繼續在 MLPerf 基準測試中展現其產品的性能提升，以及持續擴大的模型覆蓋范圍。

Habana Gaudi2 在GPT-J模型上的推理結果驗證了其具有競爭力的性能

關于第四代至強可擴展處理器的測試結果：

英特爾提交了基于第四代英特爾至強可擴展處理器的7個推理基準測試，其中包括GPT-J模型。結果顯示，包括視覺、語言處理、語音和音頻翻譯模型，以及更大的 DLRM v2 深度學習推薦模型及ChatGPT-J 模型在內，第四代至強處理器對于通用 AI 工作負載擁有出色的性能。此外，截至目前，英特爾仍是唯一一家使用行業標準的深度學習生態系統軟件提交公開 CPU 結果的廠商。

·第四代英特爾至強可擴展處理器是通過流行的AI框架與庫構建及部署通用AI工作負載的理想選擇。對于GPT-J對約 1000-1500 字新聞稿進行100 字總結的任務，第四代至強可擴展處理器可在離線模式下完成每秒兩段的總結提要，在實時服務器模式下完成每秒一段的總結提要。

·英特爾首次提交了英特爾至強CPU Max 系列的MLPerf 結果，該系列可提供高達64 GB的高帶寬內存。對于 GPT-J而言，它是僅有的能夠達到 99.9% 準確度的 CPU，這對于對精度要求極高的應用來說至關重要。

·英特爾與OEM廠商合作提交了測試結果，進一步展示了其AI性能的可擴展性，以及基于英特爾至強處理器的通用服務器的可獲取性，充分滿足客戶服務水平協議 (SLA)。

第四代至強可擴展處理器是構建及部署通用AI工作負載的理想選擇

MLPerf 是業內享有盛名的 AI 性能基準測試，旨在實現公平、可重復的產品性能比較。英特爾計劃為下一個 MLPerf測試提交新的AI訓練性能結果。持續的性能更新彰顯了英特爾致力于幫助客戶、助力AI技術演進所邁出的每一步，無論是低成本的AI處理器，還是面向網絡、云和企業用戶的高性能AI硬件加速器或是 GPU。

更多內容：基于MLPerf v.31 推理的性能指標（基準結果）|MLCommons公告

說明：相關配置說明，請查看MLCommons網頁。結果可能不同。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

處理器

處理器

+關注

關注
68

文章
19404

瀏覽量
230768
GPT

GPT

+關注

關注
0

文章
359

瀏覽量
15465
MLPerf

MLPerf

+關注

關注
0

文章
35

瀏覽量
647

如何在邊緣端獲得GPT4-V的能力：算力魔方+MiniCPM-V 2.6

GPT4-V的能力：MiniCPM-V 2.6 。 MiniCPM-V 2.6是MiniCPM-V系列最新、性能最佳的

發表于 01-20 13:40 ?95次閱讀

如何在邊緣端獲得<b class='flag-5'>GPT4-V</b>的能力：算力魔方+MiniCPM-<b class='flag-5'>V</b> 2.6

助力AIoT應用：在米爾FPGA開發板上實現Tiny YOLO V4

受限的設備上運行，尤其在低功耗、實時檢測的邊緣計算設備中表現出色。相比傳統 GPU，FPGA 能在小面積和低功耗下實現類似的推理性能，非常契合 AIoT 應用。像米爾 ZU3EG 這樣的 FPGA

發表于 12-06 17:18

Arm KleidiAI助力提升PyTorch上LLM推理性能

熱門的深度學習框架尤為突出，許多企業均會選擇其作為開發 AI 應用的庫。通過部署 Arm Kleidi 技術，Arm 正在努力優化 PyTorch，以加速在基于 Arm 架構的處理器上運行 LLM 的性能。Arm 通過將 Kle

發表于 12-03 17:05 ?890次閱讀

Arm KleidiAI助力提升PyTorch<b class='flag-5'>上</b>LLM<b class='flag-5'>推理性能</b>

澎峰科技高性能大模型推理引擎PerfXLM解析

自ChatGPT問世以來，大模型遍地開花，承載大模型應用的高性能推理框架也不斷推出，大有百家爭鳴之勢。在這種情況下，澎峰科技作為全球領先的智能計算服務提供商，

發表于 09-29 10:14 ?545次閱讀

澎峰科技高<b class='flag-5'>性能</b>大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>引擎PerfXLM解析

浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

眾，在3D-UNet和CosmoFlow兩個模型共計八項測試中，斬獲五項冠軍。 MLPerf? Storage v1.0 AI存儲基準

發表于 09-28 16:46 ?240次閱讀

浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲基準<b class='flag-5'>測試</b>五項<b class='flag-5'>性能</b>全球第一

英偉達發布AI模型 Llama-3.1-Nemotron-51B AI模型

模型在單個H100 GPU上的表現非常優秀，在推理過程中可以在單個 GPU

發表于 09-26 17:30 ?643次閱讀

開箱即用，AISBench測試展示英特爾至強處理器的卓越推理性能

。中國電子技術標準化研究院賽西實驗室依據國家標準《人工智能服務器系統性能測試規范》（征求意見稿）相關要求，使用AISBench?2.0測試工具，完成了第五代英特爾至強可擴展處理器的AI大模型

發表于 09-06 15:33 ?404次閱讀

魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

“魔搭社區是中國最具影響力的模型開源社區，致力給開發者提供模型即服務的體驗。魔搭社區利用NVIDIA TensorRT-LLM，大大提高了大語言模型的推理性能，方便了

發表于 08-23 15:48 ?492次閱讀

摩爾線程與智譜AI完成大模型性能測試與適配

近日，摩爾線程與智譜AI在人工智能領域開展了一輪深入的合作，共同對GPU大模型進行了適配及性能測試。此次測試不僅涵蓋了大

發表于 06-14 16:40 ?1134次閱讀

【大語言模型：原理與工程實踐】大語言模型的應用

類任務上表現出色，甚至在零樣本條件下也能取得良好效果。另一類則需要逐步推理才能完成的任務，類似于人類的系統2，如數字推理等。然而，隨著參數量的增加，大語言

發表于 05-07 17:21

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

的進步，大語言模型的應用范圍和影響力將持續擴大，成為AI領域的重要推動力。其中，GPT系列模型的發展尤為引人注目，從GPT到GPT-2，再到

發表于 05-04 23:55

自然語言處理應用LLM推理優化綜述

當前，業界在將傳統優化技術引入 LLM 推理的同時，同時也在探索從大模型自回歸解碼特點出發，通過調整推理過程和引入新的

發表于 04-10 11:48 ?657次閱讀

蘋果ReALM模型在實體識別測試中超越OpenAI GPT-4.0

“我們的模型在識別各種類型實體方面都有顯著提升，即使是小尺寸模型，在屏幕實體識別準確性上也已超過原有的系統5%以上。

發表于 04-02 11:23 ?528次閱讀

UL Procyon AI 發布圖像生成基準測試，基于Stable Diffusion

UL去年發布的首個Windows版Procyon AI推理基準測試，以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統一、精確且易于理解的工作負載，用以保證各支持硬件間

發表于 03-25 16:16 ?943次閱讀

瑞薩電子宣布推出一款面向高性能機器人應用的新產品—RZ/V2H

具有10TOPS/W能效的新一代AI加速器無需冷卻風扇即可提供高達80TOPS的AI推理性能

發表于 03-01 10:41 ?884次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

最新MLPerf v3.1測試結果認證，Gaudi2在GPT-J模型上推理性能驚人

評論

如何在邊緣端獲得GPT4-V的能力：算力魔方+MiniCPM-V 2.6

助力AIoT應用：在米爾FPGA開發板上實現Tiny YOLO V4

Arm KleidiAI助力提升PyTorch上LLM推理性能

澎峰科技高性能大模型推理引擎PerfXLM解析

浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

英偉達發布AI模型 Llama-3.1-Nemotron-51B AI模型

開箱即用，AISBench測試展示英特爾至強處理器的卓越推理性能

魔搭社區借助NVIDIA TensorRT-LLM提升LLM推理效率

摩爾線程與智譜AI完成大模型性能測試與適配

【大語言模型：原理與工程實踐】大語言模型的應用

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

自然語言處理應用LLM推理優化綜述

蘋果ReALM模型在實體識別測試中超越OpenAI GPT-4.0

UL Procyon AI 發布圖像生成基準測試，基于Stable Diffusion

瑞薩電子宣布推出一款面向高性能機器人應用的新產品—RZ/V2H