(文章來源:鎂客網)
英偉達發布了用于自動駕駛和機器人的軟件定義平臺——NVIDIA DRIVE AGX Orin。該平臺內置全新Orin系統級芯片,Orin由170億個晶體管組成,集成了NVIDIA新一代GPU架構和Arm Hercules CPU內核以及全新深度學習和計算機視覺加速器,每秒可運行200萬億次計算,是上一代Xavier系統級芯片性能的7倍。
Orin可處理在自動駕駛汽車和機器人中同時運行的大量應用和深度神經網絡,并且達到了ISO 26262 ASIL-D等系統安全標準。值得注意的是,Orin支持可編程,并且有豐富的工具和軟件庫支持,與之前的Xavier處理器兼容,支持從L2到L5級別的自動駕駛。而且由于Orin和Xavier均可通過開放的CUDA、TensorRT API及各類庫進行編程,因此開發者能夠在一次性投資后使用跨多代的產品。
英偉達創始人兼首席執行官黃仁勛表示:“打造安全的自動駕駛汽車,也許是當今社會所面臨的最大計算挑戰。實現自動駕駛汽車所需的投入呈指數級增長,面對復雜的開發任務,像Orin這樣的可擴展、可編程、軟件定義的AI平臺不可或缺。”
硬件之外,英偉達還發布了一套使用主動學習、聯邦學習和遷移學習來訓練深度神經網絡的工具。以聯邦學習為例,可以讓多個組織和公司在不移動或共享數據的情況下進行合作,英偉達將訓練模型發送給各個合作伙伴,每個合作伙伴在自己的數據上訓練模型。
Isaac SDK包括Isaac Robotics Engine(提供應用程序框架),Isaac GEM(預先構建的深度神經網絡模型、算法、庫、驅動程序和API),用于室內物流的參考應用程序以及訓練機器人Isaac Sim的第一個版本(提供導航功能)。
對象檢測——識別用于導航、交互或操控的對象;自由空間分割——檢測和分割外部世界,例如確定人行道在哪里,以及機器人可以在哪里行駛;3D姿態估計——了解目標的位置和方向,從而實現諸如機械臂拾取物體的任務;2D人體姿態估計——將姿態估計應用于人,這對于與人互動的機器人(例如配送機器人)和協作機器人(專門設計用于與人合作)非常重要。
以新推出Isaac Sim機器人為例,它可以將所生成的軟件部署到在現實世界中運行的真實機器人中。通過仿真,開發人員可以在極端情況下(即困難或異常情況下)對機器人進行測試,以進一步加強對它的訓練。這有望大大加快機器人的開發速度,從而實現綜合數據的訓練。另外,Isaac SDK還支持多機器人仿真。這使開發人員可以將多個機器人放入仿真環境中進行測試,以便它們學會彼此相關的工作。
英偉達在去年的GTC China上發布了支持自動低精度推理的TensorRT 5,今天英偉達發布了TensorRT 7,內置新型深度學習編譯器,支持各種類型的RNN、CNN和Transformer,相較于TRT 5只支持30種變換,TRT 7可以支持1000多種不同的計算變換和優化。TRT 7可為開發者設計的大量RNN配置自動生成代碼,逐點融合LSTM單元,甚至可跨多個時間步長進行融合,并且盡可能做自動低精度推理。
借助TRT 7,全球各地的開發者都可以實現會話式AI應用,大幅減少推理延遲。舉個例子,通常情況下,一套端到端的自然語言理解流程可能由幾十種模型構成,比如RNN、CNN、自編碼器等等,TRT 7可對所有模型進行編譯,使其在英偉達GPU上運行。基于英偉達T4的推理會話AI只需要0.3秒,而CPU的推理延遲卻高達3秒。
如今,英偉達已經售出了15億塊GPU,在使用的每塊GPU都兼容CUDA。英偉達的CUDA平臺具有豐富的庫、工具和應用程序。僅在去年,英偉達發布了500多個SDK和庫,通過優化軟件棧,英偉達提高了GPU的性能,讓深度學習訓練在三年內提高了4倍,深度學習推理在一年內提高了2倍。
HPC應用方面,NASA在英偉達GPU上通過FUN3D軟件運行火星著陸情景模擬,產生高達150TB的數據,英偉達借助DGX-2上運行的Magnum IO GPU Direct Storage技術,可“實時”對這些數據進行可視化處理。另外,由于GPU的訓練成本只有傳統CPU的十分之一,并且可支持更大規模的模型訓練,英偉達發布了深度推薦系統,百度以及阿里均有采用。
CUDA方面,英偉達發布了由CUDA加速的Parabricks基因組分析工具包,可實現30到50倍的加速,目前華大基因已經采用Parabricks來進行基因變異檢測,除此之外,CUDA新增加了對5G vRAN應用的支持。
(責任編輯:fqj)
-
英偉達
+關注
關注
22文章
3778瀏覽量
91149 -
自動駕駛
+關注
關注
784文章
13826瀏覽量
166493
發布評論請先 登錄
相關推薦
評論