在400億美元收購Arm的6個月后,NVIDIA連發(fā)三款基于Arm IP打造的處理器,包括全球首款專為TB級加速計算而設計的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業(yè)界首款1000TOPS算力的自動駕駛汽車SoC。此外,還公布了與亞馬遜AWS、Ampere Computing、聯(lián)發(fā)科和Marvell等基于Arm的CPU平臺的合作伙伴關(guān)系。
黃仁勛表示:“我們每年都會發(fā)布激動人心的新品。三類芯片,逐年飛躍,一個架構(gòu)。”NVIDIA數(shù)據(jù)中心路線圖包括CPU、GPU和DPU這三類芯片,每個芯片架構(gòu)歷經(jīng)兩年的打磨周期(周期內(nèi)可能出現(xiàn)轉(zhuǎn)變),一年專注于x86平臺,另一年專注于Arm平臺。
Grace:專為大型應用建立的數(shù)據(jù)中心CPU
專攻GPU的英偉達在這次GTC大會上推出了基于Arm架構(gòu)的中央處理器(CPU)—— Grace,用于大規(guī)模人工智能和高性能計算應用。
黃仁勛表示,“這是英偉達第一個數(shù)據(jù)中心CPU,專為大型應用建立”。
?
這款CPU以美國海軍少將、計算機編程先驅(qū)Grace Hopper的名字命名。Grace Hopper是計算機科學的先驅(qū)之一,也是哈佛Mark 1的第一批程序員和第一個鏈接器的發(fā)明者。她在20世紀50年代開創(chuàng)了計算機編程,發(fā)明了世界上第一個編譯器,被稱為“計算機軟件工程第一夫人”。
這款名為Grace的CPU使用了節(jié)能 Arm 核心—— Neoverse,為系統(tǒng)訓練大型人工智能模型提供了巨大的性能飛躍,每個CPU能在SPECrate2017_int_base基準測試中分數(shù)超過300分。
具體講,基于Grace的系統(tǒng)與NVIDIA GPU緊密結(jié)合,性能將比目前最先進的NVIDIA DGX系統(tǒng)(在x86 CPU上運行)高出10倍。
它能夠滿足世界上最先進應用的計算需求,包括自然語言處理、推薦系統(tǒng)和人工智能超級計算,這些應用分析需要超快計算性能和大容量內(nèi)存中的巨大數(shù)據(jù)集。
Grace還是一款高度專用型處理器,主要面向大型數(shù)據(jù)密集型HPC和AI應用。新一代NLP模型的訓練會有超過一萬億的參數(shù)。
這款CPU的基本性能是第四代Nvidia NVLink互連技術(shù),從CPU到GPU連接速度超過900GB/s,達到相當于目前服務器14倍的帶寬;從CPU到CPU的速度超過600GB/s。
擁有最高的內(nèi)存帶寬,采用的新內(nèi)存LPDDR5x技術(shù),帶寬是LPDDR4的兩倍,能源效率提高了10倍,能提供更多計算能力。
?
英偉達表示,新產(chǎn)品將于2023年初上市。
黃表示,使用經(jīng)過授權(quán)的 ARM IP,英偉達將 Grace 設計成專門用于大規(guī)模人工智能和高性能計算的 CPU。
作為首批客戶,瑞士超級計算中心(CSCS)和美國洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory)將是第一個使用由惠普打造的Grace驅(qū)動的超級計算機的機構(gòu)。
Grace將為世界上最快的超級計算機提供驅(qū)動力。這臺被稱為阿爾卑斯山的超算將具有20億億次浮點運算的能力。
這比當今領(lǐng)先的人工智能超級計算機——2.8億億次運算的 Nvidia Seline 超級計算機的計算能力高出約7倍。
基于Arm架構(gòu)的新數(shù)據(jù)中心CPU Nvidia Grace的發(fā)布,或?qū)⒅苯犹魬?zhàn)英特爾在服務器和數(shù)據(jù)中心計算領(lǐng)域的主導地位,搶占英特爾最賺錢的市場領(lǐng)域。
BlueField-3 DPU:220億晶體管
在黃仁勛看來,負責在數(shù)據(jù)中心傳輸和處理數(shù)據(jù)的數(shù)據(jù)處理單元(DPU),正與CPU、GPU共同組成“未來計算的三大支柱”。
?
他宣布NVIDIA BlueField-3 DPU包含220億個晶體管,采用16個Arm A78 CPU核心、18M IOPs彈性塊存儲,加密速度是上一代的4倍,并完全向下兼容BlueField-2。將為構(gòu)建超大規(guī)模數(shù)據(jù)中心、工作站和超級計算機所需的基礎(chǔ)設施提供進一步的加速。
這款新一代數(shù)據(jù)處理器將提供最強大的軟件定義網(wǎng)絡、存儲和網(wǎng)絡安全加速功能。
BlueField-2能夠卸載相當于30個CPU核的工作負載,而BlueField-3實現(xiàn)了10倍的性能飛躍,能夠替代300個CPU核,以400Gbps的速率,對網(wǎng)絡流量進行保護、卸載和加速。
業(yè)界首款1000TOPS算力的自動駕駛汽車SoC
NVIDIA DRIVE Atlan是NVIDIA新一代車載系統(tǒng)級芯片,為汽車帶來真正的數(shù)據(jù)中心。
?
Atlan可以達到每秒超過1000萬億次(TOPS)運算次數(shù),約是上一代Orin處理器的4倍,超過了絕大多數(shù)L5無人駕駛出租車的總計算能力。
這是DRIVE平臺首次集成DPU,通過Arm核為自動駕駛汽車帶來數(shù)據(jù)中心級的網(wǎng)絡,致力于應用到2025年的車型。
該SoC采用下一代GPU的體系結(jié)構(gòu)、新型Arm CPU內(nèi)核、新深度學習和計算機視覺加速器,并內(nèi)置為先進的網(wǎng)絡、存儲和安全服務的BlueField DPU,網(wǎng)絡速度可達400Gbps。
黃仁勛夸贊說:“Atlan集NVIDIA在AI、汽車、機器人、安全和BlueField安全數(shù)據(jù)中心領(lǐng)域的所有技術(shù)之大成,堪稱一項技術(shù)奇跡。”
軟硬件雙管齊下,便捷式AI數(shù)據(jù)中心和DGX SuperPod雙升級
軟硬件雙管齊下,黃仁勛宣布升級NVIDIA專為工作組打造的“便攜式AI數(shù)據(jù)中心”——NVIDIA DGX Station,以及NVIDIA專為密集型AI研發(fā)打造的AI數(shù)據(jù)中心產(chǎn)品——NVIDIA DGX SuperPod。
?
全新DGX Station 320G借助320GB超快速HBM2e連接至4個NVIDIA A100 GPU,內(nèi)存帶寬達到每秒8TB。然而,僅需將其插入普通的壁裝電源插座即可使用,耗電量只有1500瓦。
DGX SuperPOD使用全新80GB NVIDIA A100,將其HBM2e內(nèi)存提升至90TB,實現(xiàn)2.2EB/s的總帶寬。要實現(xiàn)如此的帶寬,需要11000臺CPU服務器,大約相當于有250個機柜的數(shù)據(jù)中心,比SuperPOD多15倍。
目前它已經(jīng)升級至采用NVIDIA BlueField-2,且NVIDIA如今還為該產(chǎn)品提供配套的NVIDIA Base Command DGX管理和編排工具。
NVIDIA Drive Orin:汽車的中央大腦
黃仁勛表示,自動駕駛汽車領(lǐng)域是“機器學習和機器人技術(shù)所面對的最嚴峻的挑戰(zhàn)之一,同時也是最棘手、影響最大的挑戰(zhàn)之一。”
黃仁勛表示,將于2022年投產(chǎn)的NVIDIA自動駕駛汽車計算系統(tǒng)級芯片——NVIDIA DRIVE Orin,旨在成為汽車的“中央電腦”。
?
此次黃仁勛還推出了Hyperion 8 AV平臺,包括參考傳感器、自動駕駛汽車和中央計算機、3D地面真實數(shù)據(jù)記錄儀、網(wǎng)絡以及所有必要的軟件。
并宣布沃爾沃汽車擴大與NVIDIA的合作。
沃爾沃從2016年開始應用NVIDIA DRIVE的算力,基于NVIDIA DRIVE Xavier,為新車型開發(fā)AI輔助駕駛功能,軟件則由沃爾沃汽車旗下的自動駕駛軟件開發(fā)公司Zenseact自主研發(fā)。
沃爾沃新一代汽車的自動駕駛計算機將配備NVIDIA DRIVE Orin。
這也是英偉達和合作伙伴致力推廣的“軟件定義車型”的概念。
黃仁勛還宣布DRIVE Sim將于今年夏季開放供業(yè)界使用。
? ? ? ?責任編輯:pj
評論
查看更多