NVIDIA的下一代GeForce游戲卡遲遲不肯露面,一方面是缺乏足夠的競爭刺激,另一方面則是NVIDIA的業(yè)務(wù)重心早已經(jīng)轉(zhuǎn)移,不再只盯著游戲卡,更關(guān)注的是計(jì)算平臺,畢竟那里發(fā)展空間更大,利潤也高得多。
NVIDIA今天宣布推出新一代計(jì)算平臺“HGX-2”,擁有多達(dá)16塊頂級計(jì)算卡Tesla V100,而且第一次將AI人工智能、HPC高性能計(jì)算融合在了統(tǒng)一架構(gòu)之內(nèi)。
Tesla V100基于新一代GPU架構(gòu)“Volta”(伏特),采用臺積電12nm FFN(16nm加強(qiáng)版)工藝制造,擁有5120個CUDA核心、640個Tensor深度學(xué)習(xí)核心,面積達(dá)815平方毫米,集成了210億個晶體管。
其浮點(diǎn)性能高達(dá)半精度30TFlops、單精度15TFlops、雙精度7.5TFlops,Tensor性能則有120TFlops,同時搭配4096-bit位寬的16GB HBM2高帶寬顯存,頻率1.75GHz,帶寬900GB/s。
NVIDIA此前的計(jì)算平臺HGX-1整合了8塊Tesla V100,總計(jì)40960個CUDA核心、5120個Tensor核心、256GB顯存,通過300GB/s雙線帶寬的NVLink總線相連,浮點(diǎn)性能單精度125TFlops、雙精度62TFlops,Tensor性能1PFlops。
而新一代HGX-2則用上了16塊Tesla V100,規(guī)模和性能輕松翻番,總計(jì)81920個CUDA核心、10240個Tensor核心、512GB顯存,浮點(diǎn)性能單精度250TFlops、雙精度125TFlops,Tensor性能2PFlops。
NVIDIA還在系統(tǒng)內(nèi)部署了12顆NVSwitches開關(guān),用于GPU之間的直接互聯(lián),NVLink總線雙向帶寬高達(dá)2.4TB/s。
除了高性能,HGX-2平臺的最大優(yōu)點(diǎn)是支持多種精度計(jì)算,可適應(yīng)不同需求,比如在科學(xué)計(jì)算和模擬中,可使用FP64、FP32高精度計(jì)算,而在AI訓(xùn)練和推理中,則可使用FP16浮點(diǎn)、Int8整數(shù)精度計(jì)算。
聯(lián)想、超微、QCT、Wiwynn四大服務(wù)器廠商都將在今年晚些時候發(fā)售各自的HGX-2系統(tǒng)。
富士康、英業(yè)達(dá)、廣達(dá)、緯創(chuàng)四大ODM廠商則正在設(shè)計(jì)基于HGX-2的系統(tǒng),將在今年晚些時候面世,可用于云計(jì)算數(shù)據(jù)中心。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5025瀏覽量
103266 -
人工智能
+關(guān)注
關(guān)注
1792文章
47442瀏覽量
238994 -
計(jì)算卡
+關(guān)注
關(guān)注
0文章
14瀏覽量
3446
原文標(biāo)題:合體!16塊Tesla V100計(jì)算卡 NVIDIA造頂級計(jì)算平臺
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論