與NVIDIA MIG的集成可通過(guò)一鍵式交付按需的ML / DL工作負(fù)載的單個(gè)GPU的多個(gè)實(shí)例,從而提高性能
cnvrg.io用于機(jī)器學(xué)習(xí)的AI OS宣布將NVIDIA多實(shí)例GPU(MIG)技術(shù)與其數(shù)據(jù)科學(xué)平臺(tái)進(jìn)行了原生集成。cnvrg.io是第一個(gè)集成MIG的ML平臺(tái),這是一項(xiàng)突破性的新功能,可以將每個(gè)NVIDIA A100 GPU劃分為多達(dá)七個(gè)加速器,以實(shí)現(xiàn)最佳利用率,從而有效地?cái)U(kuò)展對(duì)每個(gè)用戶和應(yīng)用程序的訪問(wèn)權(quán)限。此次集成是在發(fā)布NVIDIA A100 Tensor Core GPU和NVIDIA DGX A100系統(tǒng)以及cnvrg.io的NVIDIA DGX-Ready Software程序作為AI工作流解決方案的認(rèn)證之后進(jìn)行的。
NVIDIA GPU是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)工作負(fù)載的強(qiáng)大動(dòng)力。全新的NVIDIA A100 Tensor Core GPU在AI,數(shù)據(jù)分析和HPC工作負(fù)載的各個(gè)規(guī)模上均提供了前所未有的加速,以應(yīng)對(duì)全球最棘手的計(jì)算挑戰(zhàn)。作為NVIDIA數(shù)據(jù)中心平臺(tái)的引擎,A100可以有效地?cái)U(kuò)展至數(shù)千個(gè)GPU,并且借助MIG,可以將其劃分為七個(gè)獨(dú)立的GPU實(shí)例,以加速各種規(guī)模的AI工作負(fù)載。
由于存在如此巨大的可變性,因此資源管理至關(guān)重要。基礎(chǔ)架構(gòu)團(tuán)隊(duì)需要MLOps,以及分配,安排,共享和監(jiān)視MIG資源利用率的方法。這就是cnvrg.io數(shù)據(jù)科學(xué)平臺(tái)快速發(fā)展的地方,并提供了具有自助服務(wù)資源管理,元計(jì)劃和MLOps功能的MIG集成。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132928 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5512瀏覽量
121410 -
數(shù)據(jù)科學(xué)
+關(guān)注
關(guān)注
0文章
166瀏覽量
10082
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論