- GPU要超越CPU擠身一線主角還得靠AI
今年GTC大會聚焦AI、VR/AR與無人汽車應用
今年在美國圣荷西舉行的GTC技術大會(GPU Technology Conference),也因為AI、VR/AR、無人汽車的關系而格外備受矚目。今年總共吸引了全球超過5千人參加,更有將近上百位的全球媒體、分析師到場,還有多達2百家廠商參展,規模是歷年來最大。而做為主辦方的Nvidia今年氛圍也很不一樣,Nvidia不僅在現場同時發布多款與深度學習和AI有關GPU新品,還針對了原本就擅長的VR/AR與自動駕駛應用領域推出了新的開發工具和產品,希望就此能讓VR/AR與自動駕駛可以更進一步應用。
也正因為AI、VR/AR與自駕車讓GPU的應用更廣了,因而造就了GPU在這次GTC大會扮演的重要性和應用性明顯提高不少,特別是AI與深度學習的應用方面,今年更成為會場上最炙手可熱的技術話題,在為期4天超過240場大小場的GPU主題講座中,有半數以上都圍繞著AI與深度學習而打轉,這還不包括了來自2位人工智慧界的重量級AI大師,分別是IBM人工智慧研究和技術策略的IBM Watson 技術長Rob High與豐田汽車研究機構執行長Gill Pratt,今年都親自到場分享他們所觀察到的最夯AI技術和應用新進展。
Nvidia執行長黃仁勛在今年主題演說中也強調GPU未來角色的重要性,將替深度學習與AI開啟一種前所未有的全新運算模式(Computing Model),將促使深度學習成為未來企業甚至每個人,都不能加以忽視的大事(Big Deal ),甚至將開啟另一種AI即平臺的新服務模式(AI-as-a-Platform)。而為了搶攻AI與深度學習市場,Nvidia今年甚至還罕見地,首度發表世上第一臺整套式深度學習專用的超級電腦DGX-1。
Nvidia執行長黃仁勛在今年主題演說中數度強調GPU未來角色的重要性,將替深度學習與AI開啟一種前所未有的全新運算模式(Computing Model),將促使深度學習成為未來所有企業甚至每個人,都不能加以輕忽的大事(Big Deal ),甚至帶來一種AI即平臺的新服務模式(AI-as-a-Platform)。而為了搶攻AI與深度學習市場,Nvidia今年甚至還罕見地,首度發表世上第一臺整套式深度學習專用的超級電腦DGX-1。
AI專用服務器將助企業加快深度學習應用
Nvidia在這臺深度學習專用的超級電腦DGX-1內,使用了服務器專用的GPU加速器Tesla P100為基礎而打造完成,Tesla P100采用了新一代Pascal架構設計,比前一代Maxwell架構的GPU加速器,在用來訓練神經網路的效能方面,Nvidia宣稱,Tesla P100足足有提升12倍之多。
Nvidia在這組超級電腦內總共裝入8張Tesla P100加速卡,使得DGX-1在半精度(FP16)的浮點運算次數每秒高達有170TFLOPS,如此高度的運算能力,Nvidia甚至宣稱,只要有了DGX-1,就等同于擁用了250臺x86服務器而搭建的運算叢集規模,將有助于企業在深度學習方面獲得更好的應用效果。
而靠著DGX-1的高度運算能力,也因而縮短了過去用來做為深度學習訓練所需花費的冗長時間,若以單組2路Xeon E5服務器和DGX-1進行比較的話,根據Nvidia測試的結果,在做為AlexNet機器學習的模型訓練方面,DGX-1完成訓練所花費的時間要遠比Xeon E5服務器還快許多,Xeon級服務器得要花150小時才能做完的訓練,DGX-1只須2小時就能完成。若以訓練機器辨識照片來舉例的話,所代表的是,每天被喂給DGX-1機器做訓練的照片,數量高達有13億張。
除了GPU以外,這臺DGX-1還有配置了一個2路Xeon E5 CPU處理器,系統記憶體部分最大則可支援512GB DDR4的記憶體容量,并也配備有7TB大小的SSD硬碟,至于電力供給部份則是使用一臺3U高度3,200瓦的電源供應設備,還支援了NVLink 混合式立方網格 (NVLink Hybrid Cube Mesh)技術,可提供更高速GPU互連的能力,網路部分則提供了雙10GbE連接埠和一個100Gb的Quad InfiniBand高速網路介面,而使得每臺DGX-1機器的總傳輸頻寬,每秒最高可達768GB。
不僅如此,Nvidia在這臺DGX-1中加入許多新的深度學習軟體功能,像是新增加的Nvidia深度學習GPU訓練系統(Deep Learning GPU Training System,DIGITS),可用來協助企業設計一個完整且互動的神經網路,還支援了 CUDA深度神經網路圖庫(CUDA Deep Neural Network library,cuDNN )的v5新版本,可用來做為設計神經網路時可供GPU加速的函式圖庫。DGX-1系統內也提供了一些深度學習優化的框架,例如Caffe、Theano與Torch等,另還搭配一套云端管理存取的工具和一個容器應用儲存庫(Repository )。
Nvidia這臺深度學習專用的超級電腦DGX-1,主要是使用了服務器專用GPU加速器Tesla P100來打造完成的AI專用服務器,因而在這臺機器內總共裝入8張Tesla P100加速顯卡,使得DGX-1在半精度(FP16)的浮點運算次數每秒可高達170TFLOPS,如此高度的運算能力,Nvidia甚至宣稱,這幾乎等同于用250臺x86服務器而搭建的運算叢集規模,將助企業獲得更好的深度學習作用。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
相關閱讀:
- [電子說] Blackwell GB100能否在超級計算機和AI市場保持領先優勢? 2023-10-24
- [電子說] 如何使用Rust創建一個基于ChatGPT的RAG助手 2023-10-24
- [電子說] 訊飛星火大模型V3.0正式發布,全面對標ChatGPT 2023-10-24
- [電子說] 如何創建FPGA控制的機器人手臂 2023-10-24
- [電子說] 亞馬遜云科技生成式AI最新案例分析,助力企業業務創新迭代 2023-10-24
- [電子說] 怎樣延長半導體元器件的壽命呢? 2023-10-24
- [電子說] 新思科技攜手臺積公司加速N2工藝下的SoC創新 2023-10-24
- [電子說] 服務器硬盤通用基礎知識 2023-10-24
( 發表人:包永剛 )