一年一度的GTC至今已經迎來了第十個年頭,雖然它每年或多或少的給網友一些“失望”,但它也終究是代表著GPU行業的高水平技術大會。那么,今年的GTC大會,英偉達又給業界帶來了哪些驚喜呢?
日前,英偉達公司創始人兼首席執行官黃仁勛宣布了該公司在芯片、AI 平臺、自動駕駛上的一系列新動作。
一、光線追蹤(ray-tracing)
開場介紹的第一個項目就是英偉達在前不久GDC上發布的NVIDIA RTX光線追蹤技術(ray-tracing),這項技術是英偉達耗時10年打造的,能夠提供電影級畫質的實時渲染,渲染出逼真的反射、折射和陰影畫面,幾乎與真實世界的照片或視頻很難區分開來。現場展示的視頻片段就是用光線追蹤技術實時渲染的,而且并不需要一個超級強大的超算電腦,只需要一臺DGX-Station。
在真實世界中,我們看到的3D物體被光源照亮,且光子可以在到達觀看者的眼睛以前從一個物體反彈到另一個物體。光線追蹤技術則是反過來,通過從我們的眼睛(觀景式照相機)反向追蹤光線捕捉這些效果,通過追蹤2D視表面上每個像素的光線的路徑,并應用到場景的3D模型中。
可想而知,這種技術的計算量非常大,一般渲染復雜的特殊效果可能需要花上幾天甚至幾周的時間,所以此前該項技術一直僅限于高成本的電影制作中。
不過,目前,隨著GPU性能日益強悍,能夠支持光線追蹤的電腦也越來越多,通過Volta架構的GPU配合英偉達的RTX技術,產品設計師、游戲設計師、建筑師們能夠在幾秒內即可生成逼真的產品模型。
二、新版Quadro GV100,首次采用Volta架構
Quadro GV100 具有 32GB 內存,且可借助 NVIDIA NVLink 2 互聯技術,通過并聯兩塊 Quadro GPU 擴展至 64GB,在所有適用于此類應用的平臺中其性能最高。
在性能方面,GV100 基于 NVIDIA Volta GPU 架構,可提供每秒 7.4 萬億次浮點運算的雙精度性能、每秒 14.8 萬億次浮點運算的單精度性能、以及每秒 118.5 萬億次浮點運算的深度學習性能。NVIDIA RTX 內置的 NVIDIA OptiX AI-denoiser 可實現實時的 AI 去噪,英偉達表示且其性能相當于采用 CPU 時的 100 倍。
三、醫療圖像處理超級電腦Clara
黃仁勛在現場推出了第一款專用于醫療圖像處理的超級電腦Clara,它能夠支持CUDA、CUDNN、TensorRT、OGL、RTX技術。
在現場,黃仁勛展示了一個醫療圖像實時處理的影像片段。這個段影像是用十幾年的超聲波老設備拍攝而成,本來只能看到2D的黑白圖像。然而當數據傳進Clara后,配合人工智能軟件,可以在2D圖像中分析出3D的腔膛形狀(圖中紅色部分)。因此,醫院可以在現有醫療設備上直接接入這臺電腦。
目前,英偉達正在和眾多醫療廠商合作,除了GE通用電氣、三星電子等大廠外,還有像圖瑪深維、推想科技等AI醫療創業公司。
四、新版 TensorRT 推理軟件 TensorRT 4,并將 TensorRT 集成至谷歌的 TensorFlow 框架。
這是一款可編程應用平臺(Programmable Inference Platform),當你將一個神經網絡訓練好了之后,可以通過TensorRT可編程平臺,簡便快捷地將這個訓練好了的神經網絡部署(Deploy)到英偉達的GPU上。
新版TensorRT 4能夠支持INT8和FP16精度運算,能夠將數據中心的功耗降低70%。
而且,英偉達還與谷歌進行了深度合作,將TensorRT整合進如今最廣泛應用的AI開源框架谷歌TensorFlow 1.7中。而且現在還能夠加速圖像、視頻、語言、NLP等AI應用。
英偉達表示,TensorRT 4 可用于快速優化、驗證及部署在超大規模數據中心、嵌入式與汽車 GPU 平臺中經過 訓練的神經網絡。相比 CPU,針對計算機視覺、神經網絡機器翻譯、自動語音識別、語音合成 與推薦系統等常見應用,該軟件最高可將深度學習推理的速度加快 190 倍。而且為了進一步精簡開發,英偉達與谷歌的工程師已將 TensorRT 集成至 TensorFlow 1.7,使得在 GPU 上運行深度學習推理應用更加容易。
五、AI平臺新進展
如同往屆,黃仁勛對英偉達 AI 平臺做了介紹,公布了其中的一系列重要進展,包括全新 Tesla V100 32GB GPU 的 2 倍內存、革命性的 NVSwitch 結構、以及全面的軟件堆棧推動性能提升、深度學習工作站 DGX-2 成為首款性能高達每秒 2 千萬億次浮點運算的深度學習系統、發布深度學習引擎 TensorRT 4 等。英偉達表示,相較于六個月前發布的上一代產品 DGX-1,其深度學習工作負載性能實現了 10 倍提升。
在大會上,黃仁勛宣布,新版的 Tesla V100 內存擴容了一倍。「5 年前 AlexNet 在 ImageNet 上展示了突破性的能力,」黃仁勛說道,「它有 8 層,數百個參數。而今天我們能夠看到數百層的神經網絡,內含數十億參數,深度學習模型經過五年的發展,體量擴大了 500 倍。」
而這樣的計算需求可由「世界上最大的 GPU」DGX-2 進行處理,它是由 16 塊 32GB 內存的 Tesla V100 計算卡通過 NVSwitch 進行連接(顯卡間的通信速度是 PCI 的 20 倍,每秒 300Gbyte)所組成的,共擁有 2000TFPLOS 的 Tensor Core 算力,售價 39.9 萬美元。NVSwitch 是今天黃仁勛宣布的全新的 GPU 互聯結構。
DGX-2 是首款能夠提供每秒兩千萬億次浮點運算能力的單點服務器,具有 300 臺服務器的深度學習處理能力,占用 15 個數據中心機架空間,而體積則縮小 60 倍,能效提升 18 倍。
而后,黃仁勛宣布了英偉達在 AI 推理上的一系列動作。黃仁勛表示,基于在數據中心、汽車應 用、以及包括機器人和無人機等嵌入式設備領域中,諸如語音識別、自然語言處理、推薦系統、 以及圖像識別等新功能的支持,面向深度學習推理的 GPU 加速正在獲得越來越多的關注。
「我們需要超級計算機來幫助自己尋找更高效的能源存儲方法,探索地球的內部,預測未來的自然災害,以及模擬微觀世界的變化。」黃仁勛說道。
六、下一代DRIVE Orin自動駕駛芯片
黃仁勛在現場還展示了英偉達感知基礎(Perception Infrastructure)項目,這是一個大型的深度學習模型,能夠收集并分析不同傳感器(如攝像機、雷達等等)得出的距離、天氣、雷達感知、高精地圖等等不同數據。
在接下來2-3年間,英偉達還將技術研發這一技術,直到最后能夠搭載在所有新車上。黃仁勛說,這是我們至今遇到的最為復雜的問題之一。
七、推出 DRIVE Constellation 仿真系統
自動駕駛一直是 GTC 大會的重要部分,今天,英偉達展示了一套用于使用照片級真實感模擬,基于云的自動駕駛汽車測試系統。
該系統被稱為 NVIDIA DRIVE Constellation,是一種基于兩種不同服務器的計算平臺。第一臺服務器運行 NVIDIA DRIVE Sim 軟件,用以模擬自動駕駛汽車的傳感器,如攝像頭、激光雷達和雷達。第二臺服務器搭載了 NVIDIA DRIVE Pegasus AI 汽車計算平臺,可運行完整的自動駕駛汽車軟件堆棧,并能夠處理模擬數據,這些模擬數據如同來自路面行駛汽車上的傳感器。
要實現自動駕駛汽車的量產部署,我們需要一種能夠在數十億英里的行駛中進行測試和驗證的解決方案,以實現足夠安全性和可靠性。黃仁勛介紹說,DRIVE Constellation 可以將視覺計算和數據中心方面的專業知識相結合以實現這一目標。借助虛擬現實技術,測試者可通過對數十億英里的自定義場景和極端情況進行測試,從而提高算法的穩定性,而花費的時間和成本僅為實際道路測試的一小部分。
八、聯合芯片巨頭ARM打造AI芯片專用IP
英偉達重磅宣布,將聯合芯片巨頭ARM打造AI芯片專用IP,這款IP屬于ARM幾年2月公布的Trillium項目的一部分,其技術源于英偉達Xavier芯片以及去年開源的DLA深度學習加速器項目。
英偉達本次宣布同ARM合作,將在數十億物聯網設備上實現深度學習。NVIDIA深度學習加速器IP將集成到Arm的Project Trillium平臺中,以便于構建深度學習IoT芯片。
去年,英偉達也正式免費開源了完整版DLA(Deep Learning Accelerator,深度學習加速器),讓廠商可以免費下載使用,打造屬于自己的低功耗AI芯片(比如IoT芯片)。
今年2月,芯片巨頭ARM公布了其人工智能項目Trillium,同時推出兩款專用IP,分別為物體檢測OD處理器和機器學習ML處理器。
ARM是全球智能設備第一大主流芯片架構提供商,全球超過90%的智能設備采用了ARM的芯片架構,包括手機、平板、手表、電視、無人機等等。而英偉達,作為全球AI浪潮的引領者,能夠為人工智能提供強大的計算力,二者一拍即合。
本次ARM牽手英偉達推出專用的IOT設備人工智能IP,將會有助于人工智能在終端設備廣泛鋪開,使得上億、甚至數十億臺IOT設備都能夠用上低功耗、低成本的AI芯片,使物聯網芯片公司能夠輕松地將AI集成到它們的設計中,并幫助它們將智能且價格實惠的產品帶給全球數十億的消費者。
NVIDIA副總裁兼自主機器事業部總經理Deepu Talla表示:“推理將成為每個物聯網設備的核心能力。我們將與ARM一同推進這一趨勢的發展,幫助數百家芯片公司輕松采用深度學習技術。”
-
芯片
+關注
關注
456文章
51155瀏覽量
426440 -
ARM
+關注
關注
134文章
9164瀏覽量
368717 -
NVIDIA
+關注
關注
14文章
5075瀏覽量
103558 -
AI
+關注
關注
87文章
31491瀏覽量
269991
原文標題:GTC2018八大熱點:發布多項黑科技,聯合芯片巨頭ARM打造AI芯片專用IP
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論