今年GTC,英偉達將所有加速計算庫綁定到一個單一的品牌:CUDA-X AI庫;推出用于數(shù)據(jù)科學的“數(shù)據(jù)科學家工作站”;還發(fā)布了99美元的人工智能計算機Jetson Nano。英偉達的轉(zhuǎn)型路線也浮出水面。
GTC十年,英偉達開了一場“三無”發(fā)布會。
無新架構(gòu),無新GPU,無新戰(zhàn)略。
不過,這并不意味著英偉達CEO黃仁勛沒有對未來的思考。發(fā)布會上,英偉達將所有加速計算庫綁定到一個單一的品牌:CUDA-X AI庫;推出用于數(shù)據(jù)科學的“數(shù)據(jù)科學家工作站”;還發(fā)布了99美元的人工智能計算機Jetson Nano。
盡管發(fā)布會沒有出現(xiàn)外界期待的新架構(gòu),黃仁勛也沒有發(fā)布7納米GPU,但是整場發(fā)布會透露的關(guān)鍵詞正成為目前英偉達最重要、最急需的事情:新生態(tài)。
黃仁勛認為生態(tài)系統(tǒng)是GPU計算成功的關(guān)鍵,這種新生態(tài)系統(tǒng)需要幾個關(guān)鍵詞:
Domains(域)
Architecture(架構(gòu))
以下是黃仁勛的演講。
大秀英偉達顯卡特效,光線追蹤技術(shù)驚艷四射
黃仁勛的整場演講分三個章節(jié):計算機圖形、AI和HPC、機器人。
在第一章之前,黃仁勛首先推出CUDA-X AI,這是加速數(shù)據(jù)科學的唯一端到端平臺。
CUDA-X AI能夠?qū)?a target="_blank">機器學習和數(shù)據(jù)科學工作負載加速多達50倍,由十幾個專用加速庫組成。這些庫包括用于加速深度學習的cuDNN、用于加速數(shù)據(jù)科學工作流和機器學習算法的cuML、用于優(yōu)化經(jīng)過訓練的推理模型的TensorR、用于訪問數(shù)據(jù)科學API的cuDF、用于在graph上執(zhí)行高性能分析的cuGraph,以及其他13個庫。
此外,軟件加速庫集成到所有深度學習框架中,包括TensorFlow,PyTorch和MXNet。
接下來正式進入第一章計算機圖形主題,黃仁勛不出所料的對英偉達的顯卡特效又大秀了一番。
現(xiàn)在實時播放Unity上運行的部分視頻,實時并不能提供足夠的空間分辨率。Unity的實驗包將于4月4日推出。
Unity增加了對Nvidia光線跟蹤技術(shù)的預覽支持,以推動游戲的真實性。
下圖的車燈照片,左右兩張幾乎一模一樣,你覺得哪張是假的呢?
答案是:右邊的車燈是假的。
黃仁勛說,這種逼真效果得益于英偉達圖靈RTX架構(gòu),畫面是實時渲染的。
Epic Games已經(jīng)宣布了Unreal Engine 4.22對英偉達RTX光線追蹤的支持,Unity也只是時間問題,但現(xiàn)在這項技術(shù)正式進入了Unity的高清渲染管道(HDRP)預覽版。
這項技術(shù)的重點在于游戲如何更逼真地呈現(xiàn)照明,顯示光線如何與大氣及其撞擊物體的相互作用。這種技術(shù)已經(jīng)在其他地方使用過,但所有這些都可能是資源密集型的,這使得過去幾年的進步將其作為一個實時系統(tǒng)如此引人矚目。
專注AI和HPC,收購Mellanox對抗英特爾
在演講了一個小時之后,黃仁勛終于開講第二章:AI和HPC。這部分主要由DGX和HGX組成。
數(shù)據(jù)科學是當今計算機科學領(lǐng)域不斷增長的領(lǐng)域,所有關(guān)于從數(shù)據(jù)中學習并從中做出預測的方法形成了AI。英偉達對待AI有了新的態(tài)度和行為:重新梳理數(shù)據(jù)科學領(lǐng)域和所有機器學習工具,從Hadoop到Spart再到TensorFlow。
英偉達擁有實現(xiàn)AI所有步驟和工具的庫,即黃仁勛之前強調(diào)的CUDA-X AI庫,而黃仁勛也在思考,如何把當前的這么龐大的生態(tài)系統(tǒng)以及硬件和軟件結(jié)合在一起。做法有二:
Tensor Cores Mixed Precision.已經(jīng)添加到TensorFlow、PyTorch和MXNet中;
NVIDIA RAPIDS與Databricks的分析平臺集成。
目前,谷歌云和微軟云也添到RAPIDS中,TensorRT也已集成到Microsoft Onyx中。
除了集成和結(jié)合之外,英偉達還推出一款新的AI工具包,稱之為Clara,其核心是一系列預先訓練過的模型。
Clara是一個開放、可擴展的計算平臺,包含13個最先進的分類和分割AI的工具包,以及為放射科醫(yī)生構(gòu)建的軟件工具,能夠讓開發(fā)人員將醫(yī)療成像應用程序構(gòu)建和部署到混合(嵌入式、內(nèi)部部署或云)計算環(huán)境中,以創(chuàng)建智能儀器和自動化醫(yī)療保健工作流程。
有了這些工具,英偉達在數(shù)據(jù)科學領(lǐng)域不斷突破。黃仁勛說,僅去年一年,英偉達的深度學習研究所通過各種形式培訓了10萬名數(shù)據(jù)科學家,基于此,英偉達決定為數(shù)據(jù)科學家提供一個定制的工作站。
這個工作站核心是GPU和CUDA-X AI庫,主打高性能計算和高速I/O。
黃仁勛認為,數(shù)據(jù)科學是新的HPC,超算和超大規(guī)模集群的區(qū)別在于,超算實際上做了很少的任務(wù),而超大規(guī)模集群都是關(guān)于容量的,但是做了很多小工作。兩者需要不同的系統(tǒng)/集群架構(gòu)。
而數(shù)據(jù)科學處于兩者中間位置,數(shù)據(jù)科學的任務(wù)比超大規(guī)模集群的任務(wù)更重,但比更少;比超級計算機更廣泛,這就是英偉達的DGX-2設(shè)備現(xiàn)在適用的地方。
在發(fā)布會現(xiàn)場,不久前被英偉達以69億美元收購的Mellanox公司CEO也上臺,闡述為什么Mellanox愿意賣身英偉達,以及他們?nèi)绾慰创?a href="http://m.1cnz.cn/v/tag/1722/" target="_blank">網(wǎng)絡(luò)成為數(shù)據(jù)中心計算基礎(chǔ)設(shè)施的一部分。
英偉達的計算平臺和Mellanox的互聯(lián)網(wǎng)連接了全球250多臺TOP500超級計算機,并為每個主要的云服務(wù)提供商和計算機制造商提供服務(wù)。而隨著摩爾定律的結(jié)束,CPU性能的提升正在放緩,這導致大家會采用英偉達GPU和Mellanox智能網(wǎng)絡(luò)解決方案加速計算。滿足這種需求將需要整體架構(gòu),通過智能網(wǎng)絡(luò)結(jié)構(gòu)連接大量快速計算節(jié)點,形成一個巨大的數(shù)據(jù)中心規(guī)模的計算引擎。
兩個小巨人聯(lián)手,英特爾在HPC領(lǐng)域的日子會難過嗎?
邊緣計算產(chǎn)品Jetson Nano:99美元的人工智能計算機
黃仁勛演講的第三章:機器人。為什么要為機器人提供邊緣算力?黃仁勛說,復雜的人工智能通常不適合自制設(shè)備,因為微型計算機很少能處理除了基本功能之外的東西。
因此,英偉達推出了入門級人工智能計算機Jetson Nano。
英偉達聲稱,Nano的128核基于maxwell的GPU和四核ARM A57處理器可以為神經(jīng)網(wǎng)絡(luò)、高分辨率傳感器和其他機器人功能提供472GFLOPS的處理能力,同時只消耗很少的5W。
Jetson Nano關(guān)鍵特性:
GPU: 128-core NVIDIA Maxwell? architecture-based GPU
CPU: Quad-core ARM? A57
視頻: 4K @ 30 fps (H.264/H.265) / 4K @ 60 fps (H.264/H.265) 編碼&解碼
攝像頭: MIPI CSI-2 DPHY lanes, 12x (Module) and 1x (Developer Kit)
內(nèi)存: 4 GB 64-bit LPDDR4; 25.6 gigabytes/second
Connectivity: Gigabit Ethernet
OS 支持: Linux for Tegra?
Module Size: 70mm x 45mm
Developer Kit Size: 100mm x 80mm
該套件可以直接運行Linux,并支持大量的AI框架(當然包括NVIDIA自己的框架)。 它配備了4GB的RAM,千兆以太網(wǎng)以及相機和其他附件所需的I/O。
雖然Nano的功能遠不如高端的Jetson強大,但目前個人版售價僅為99美元,面向企業(yè)的“production-ready”版售價為129美元。
未來的測試艦隊是虛擬的
黃仁勛在GTC大會上推出了NVIDIA DRIVE Constellation仿真平臺。
DRIVE Constellation是一個數(shù)據(jù)中心解決方案,包括兩個并排服務(wù)器:
第一臺服務(wù)器——DRIVE Constellation Simulator,從虛擬汽車生成傳感器輸出;
第二臺服務(wù)器——DRIVE Constellation Vehicle,包含DRIVE AGX Pegasus AI車載電腦。
DRIVE AGX Pegasus接收傳感器數(shù)據(jù)、做出決定,然后將車輛控制命令發(fā)送回模擬器。這種閉環(huán)過程可實現(xiàn)位精確,定時精確的硬件在環(huán)測試。
這個驗證過程是實時運行的,可以按比例執(zhí)行,多個單元并行運行各種測試。
有了這樣的效率水平,DRIVE Constellation可以實現(xiàn)大量的駕駛體驗——3000個單元每年可以行駛超過10億英里。更重要的是,DRIVE Constellation中的每一英里都包含有趣的事件——包括罕見或危險的場景。
基于云的端到端工作流程
黃仁勛演示了DRIVE Constellation平臺如何執(zhí)行駕駛測試并在無縫工作流程中提供結(jié)果。
DRIVE Constellation用戶可以通過云遠程訪問任何平臺。 開發(fā)人員可以提交一個特定的模擬場景——例如,在潮濕的道路上霧蒙蒙的夜晚,一輛自動駕駛汽車對另一輛汽車在交通繁忙時切入車道作出反應。
為了確定AV的性能,開發(fā)人員可以設(shè)置特定的評估程序,例如碰撞時間、跟隨距離和乘客舒適度,在運行時查看測試,并可視化結(jié)果。
具有特定變化的相同測試可突出極端和危險條件 - 如密集交通,惡劣天氣和低能見度 - 可以并行運行。 這種大規(guī)模的驗證功能就像運行大量的測試車輛虛擬車隊,在很短的時間內(nèi)完成數(shù)月或數(shù)年的測試。
開放平臺
DRIVE Constellation是一個開放的平臺,這意味著它提供了一個編程接口,允許DRIVE Sim生態(tài)系統(tǒng)的合作伙伴集成他們的環(huán)境模型、車輛模型、傳感器模型和交通場景。通過合并各種合作伙伴,平臺可以生成全面、多樣和復雜的測試環(huán)境。
由以色列仿真公司Cognata開發(fā)的詳細流量和場景模型由DRIVE Constellation平臺提供支持。 該公司使用世界各地的交通攝像頭捕獲的真實數(shù)據(jù)來創(chuàng)建準確的大規(guī)模交通模型。
利用Cognata的流量模型,開發(fā)人員可以根據(jù)實際流量數(shù)據(jù)定義其他車輛和道路使用者的數(shù)量及其行為。
汽車仿真公司IPG Automotive也與DRIVE Constellation合作,提供高保真車型。 它使開發(fā)人員能夠準確地模擬車輛對各種DRIVE Sim命令的反應,例如轉(zhuǎn)向、制動和油門以及各種道路狀況。
為了準確模擬從攝像頭,雷達或激光雷達傳感器收集的數(shù)據(jù)如何送入車輛,DRIVE Constellation還可以支持傳感器模型,如攝像頭,激光雷達和雷達。 安森美半導體是半導體和傳感器供應商,正與DRIVE Constellation合作,提供高精度的相機型號。
同時,開放平臺也是第三方和監(jiān)管自主車輛標準的關(guān)鍵組成部分。
數(shù)據(jù)中心+邊緣,英偉達轉(zhuǎn)型路線圖浮出水面
自從去年10月英偉達股價腰斬之后,就從AI芯片王座之上跌落,外界對于英偉達依賴游戲、挖礦等業(yè)務(wù)不看好,而英偉達在本月收購Mellanox,似乎也給外界回應:轉(zhuǎn)型路線圖浮出水面。
黃仁勛在收購Mellanox的新聞稿中說,“數(shù)據(jù)中心比以往任何時候都重要”。借助Mellanox,英偉達將優(yōu)化整個計算、網(wǎng)絡(luò)和存儲堆棧中的數(shù)據(jù)中心規(guī)模工作負載,二者聯(lián)合形成一個巨大的數(shù)據(jù)中心規(guī)模的計算引擎,為各類計算源源不斷提供低成本算力。
另一方面,Jetson Nano為機器人和其他人工智能設(shè)備提供大腦,在邊緣計算中,英偉達也占有一席之地,從而建立起以GPU算力為核心,諸多設(shè)備為護城河的生態(tài)系統(tǒng)。
至于有沒有7納米GPU、有沒有新架構(gòu),這不是英偉達最緊急的事情。
-
英偉達
+關(guān)注
關(guān)注
22文章
3839瀏覽量
91662 -
深度學習
+關(guān)注
關(guān)注
73文章
5512瀏覽量
121398 -
光線追蹤
+關(guān)注
關(guān)注
0文章
183瀏覽量
21519
原文標題:99美元!黃仁勛發(fā)布人工智能計算機,GTC十周年沒有核彈
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論