3月27日美國圣何塞報道,今天早上,英偉達GTC 2018年度大會的最重磅環節——創始人&CEO黃仁勛主題演講——正式開始。
每年的GTC大會上,這位被粉絲們愛稱為“老黃”的黑色皮衣愛好者CEO都會帶來一場重磅主題演講,通常來說不僅會發布新型GPU與超算電腦,還會宣布一些AI/VR/自動駕駛等領域重磅合作。
不過,今年的GTC 2018比較神奇,最為重磅的消息選擇了在提前秘密發布,而不是在GTC Keynote現場——英偉達重磅宣布,將聯合芯片巨頭ARM打造IOT設備的AI芯片專用IP,這款機器學習IP集成到Arm的Project Trillium平臺上,以實現機器學習,其技術源于英偉達Xavier芯片以及去年開源的DLA深度學習加速器項目。
ARM是全球智能設備第一大主流芯片架構提供商,全球超過90%的智能設備采用了ARM的芯片架構,包括手機、平板、手表、電視、無人機等等。本次ARM牽手英偉達推出專用的IOT設備人工智能IP,將會有助于人工智能在終端設備廣泛鋪開,使得上億、甚至數十億臺IOT設備都能夠用上低功耗、低成本的AI芯片,使物聯網芯片公司能夠輕松地將AI集成到它們的設計中,并幫助它們將智能且價格實惠的產品帶給全球數十億的消費者。
NVIDIA副總裁兼自主機器事業部總經理Deepu Talla表示:“推理將成為每個物聯網設備的核心能力。我們將與ARM一同推進這一趨勢的發展,幫助數百家芯片公司輕松采用深度學習技術。”
此外,在今天的GTC 2018上,黃仁勛還宣布了英偉達的以下進展:
1、推出光線追蹤RTX技術(ray-tracing),能夠提供電影級畫質的實時渲染,渲染出逼真的反射、折射和陰影畫面。這一技術由英偉達在前不久的GDC全球游戲開發者大會上展示過;
2、推出第一款采用Volta架構的Quadro GV100 GPU,由兩個GV100連接而成;
3、推出了第一款專用于醫療圖像處理的超級電腦Clara;
4、新版Tesla V100內存升為32G,可與舊版無縫換插,支持更多人工智能的工作負載;
5、推出DGX-2超級電腦,采用了最新的NVSwitch鏈接,最多可同時連接16塊Tesla V100 GPU,其速度可以達到DGX-1的10倍,算下來可以每秒下載14000 部電影,售價39.9萬美元;
6、推出新版機器學習應用平臺TensorRT 4,支持INT8與FP16精度,并與谷歌合作,將其整合進AI開源框架谷歌TensorFlow 1.7中;
7、宣布打造下一代名為DRIVE Orin的自動駕駛芯片,但除了名字外沒有透露更多信息;
8、正式推出3D仿真自動駕駛測試平臺DRIVE Constellation,這一測試平臺英偉達在CES上展示過,能夠幫助自動駕駛系統提升“姿勢水平”;
9、推出ISAAC機器人仿真訓練平臺SDK,將訓練機器人的技術開放出去;
值得一提的是,智東西去年5月時也對GTC 2017進行了一線深入報道,在去年的CEO主題演講開場前,英偉達的股價一路飆升至121美元,總市值達到了714億美元。而在今年開場前一晚,英偉達的股價已經沖到了244美元,總市值超過1479億美元。在這10個月內,英偉達的股價與市值再次翻倍。
光線追蹤(ray-tracing)技術開場
今天一大早,智東西來到了GTC大會現場,準備參加每年GTC的最重磅環節——CEO黃仁勛主題演講。此時是早上8點,離9點開場還有整整一小時前,但是入口處已經排起了巨長的隊伍。
今天,老黃依舊是萬年不變的一身黑皮衣+黑褲子開場。
他開場介紹的第一個項目就是英偉達在前不久GDC上發布的NVIDIA RTX光線追蹤技術(ray-tracing),這項技術是英偉達耗時10年打造的,能夠提供電影級畫質的實時渲染,渲染出逼真的反射、折射和陰影畫面,幾乎與真實世界的照片或視頻很難區分開來。現場展示的視頻片段就是用光線追蹤技術實時渲染的,而且并不需要一個超級強大的超算電腦,只需要一臺DGX-Station。
在真實世界中,我們看到的3D物體被光源照亮,且光子可以在到達觀看者的眼睛以前從一個物體反彈到另一個物體。光線追蹤技術則是反過來,通過從我們的眼睛(觀景式照相機)反向追蹤光線捕捉這些效果,通過追蹤2D視表面上每個像素的光線的路徑,并應用到場景的3D模型中。
可想而知,這種技術的計算量非常大,一般渲染復雜的特殊效果可能需要花上幾天甚至幾周的時間,所以此前該項技術一直僅限于高成本的電影制作中。
不過,目前,隨著GPU性能日益強悍,能夠支持光線追蹤的電腦也越來越多,通過Volta架構的GPU配合英偉達的RTX技術,產品設計師、游戲設計師、建筑師們能夠在幾秒內即可生成逼真的產品模型。
此外,英偉達還宣布GameWorks SDK 將添加一個光線追蹤降噪模塊。更新版 GameWorks SDK 即將推出,其中包含光線追蹤區域陰影和光線追蹤光澤反射。
新版Quadro GV100,首次采用Volta架構
與此同時,英偉達還在現場推出了Quadro GV100 GPU,同時也是同系列產品中第一個采用Volta架構的,因此能夠搭載RTX技術的。
Quadro GV100由兩個GV100連接而成,一共擁有10240個CUDA核,可達236 TFLOPS Tensor Cores。與此同時,老黃又玩起了“買GPU省錢”的梗——“你買的GPU越多,就越省錢(The more you buy, the more you save.)”,這一個梗再次貫穿了全場。
推出醫療專用超級電腦Clara,日常diss摩爾定律
接著,話鋒一轉,老黃開始談起了計算力,我們也進入了GTC的必備環節——diss摩爾定律。
在將近10年的GTC上,每年老黃都會提到同一主題——摩爾定律。在過去30年里,我們受益于摩爾定律,芯片所提供的計算能力每年都高速增長。然而在最近的幾年里,摩爾定律開始失靈,芯片發展的速度已經跟不上我們需要的計算力增長速度。
因此,我們需要新定律。
而隨著數據量與計算量爆發式地增長,人工智能、GPU、CUDA正在以一種極快的速度崛起,以GPU驅動的人工智能計算已經隨處可見,并且滲入到各行各業當中去,教育、娛樂、工業、制造……這也引出了我們下一個話題——醫療。
老黃在現場推出了第一款專用于醫療圖像處理的超級電腦Clara,它能夠支持CUDA、CUDNN、TensorRT、OGL、以及剛剛提到的RTX技術。
在現場,老黃展示了一個醫療圖像實時處理的影像片段。這個段影像是用十幾年的超聲波老設備拍攝而成,本來只能看到2D的黑白圖像。然而當數據傳進Clara后,配合人工智能軟件,可以在2D圖像中分析出3D的腔膛形狀(圖中紅色部分)。因此,醫院可以在現有醫療設備上直接接入這臺電腦。
目前,英偉達正在和眾多醫療廠商合作,除了GE通用電氣、三星電子等大廠外,還有像圖瑪深維、推想科技等AI醫療創業公司。
新品升級:新版Tesla V100、DGX-2超級電腦、TensorRT 4
在去年的GTC 2017上,老黃發布了一款名為Tesla V100的新版GPU,使用Volta架構,采用的是臺積電的12nm Finfet工藝,具有5120個CUDA處理內核,16GB內存,能夠為訓練、推理應用提供120 tensor TFLOPS算力。
今天,老黃宣布,新版Tesla V100將內存升級一倍,達到32GB。
由于這幾年間,CNN、RNN、GANs、Deep Q-Learning等算法不斷變得復雜,更是對深度學習計算硬件提出了新挑戰。因此,新版Tesla V100擁有更大的內存,使得它能夠運行更大、更復雜的神經網絡,在某些HPC應用上能夠提供高于之前16GB版本50%的性能。微軟已經宣布采用了新版Tesla V100,能夠更快速地訓練更加強大的深度神經網絡。
此外,英偉達本次還推出的NVSwitch高速互聯技術。此前英偉達曾經推出NVLink,支持最多8塊GPU高速互聯;如今NVSwitch技術可將這個數字翻上一倍,支持最多16塊GPU同時互聯。每一個GPU都能和另一個GPU進行超低延遲的通訊。
在去年GTC上,英偉達推出了搭載8塊Tesla V100的超級電腦DGX-1,今天在GTC 2018現場老黃宣布,推出能夠搭載16塊新版Tesla V100的超級電腦DGX-2,比DGX-1還要快10倍。
DGX-2能夠進行2 PFLOPS的計算,算下來可以每秒下載14000部電影,擁有512GB HBM2,功耗為10kw,350lbs,能夠支持更大數據集、更復雜神經網絡的計算。售價399000美元,今年Q3上市。
它其中搭載著被老黃稱為“世界上最大的GPU”,共有81920個CUDA核,可達2000 TFLOPS Tensor Cores,擁有512GB HBM2。
此外,去年的GTC上,英偉達推出了“英偉達GPU云(NVIDIA GPU Cloud)”,但它不是一個云計算“云”,而是一個能讓人輕易地從零開始搭建一個深度學習的項目。今天老黃宣布,AWS、阿里云、DGX、GCP、Oracle Cloud上都開始支持英偉達GPU云了。
而且,從CNN到LSTM再到GANs,現在的深度學習神經網絡框架正變得越來越復雜、越來越多樣、而且在日新月異地變化著,訓練環節變得復雜了,應用(Inference)環節自然也變得非常復雜。
因此,老黃還在現場推出了最新版本的TensorRT——TensorRT 4,這是一款可編程應用平臺(Programmable Inference Platform),當你將一個神經網絡訓練好了之后,可以通過TensorRT可編程平臺,簡便快捷地將這個訓練好了的神經網絡部署(Deploy)到英偉達的GPU上。
新版TensorRT 4能夠支持INT8和FP16精度運算,能夠將數據中心的功耗降低70%。而且,英偉達還與谷歌進行了深度合作,將TensorRT整合進如今最廣泛應用的AI開源框架谷歌TensorFlow 1.7中。而且現在還能夠加速圖像、視頻、語言、NLP等AI應用。
同時,老黃還在現場宣布,KUBERNETES現在能夠支持GPU了。KUBERNETES能夠在主機集群之間提供一個能夠自動化部署、可拓展、應用容器可運營的平臺,通常結合docker容器工具工作,并且整合多個運行著docker容器的主機集群,不僅能夠提供更大的計算力,還能夠有更大的容錯空間。
打造下一代DRIVE Orin自動駕駛芯片
老黃在現場還展示了英偉達感知基礎(Perception Infrastructure)項目,這是一個大型的深度學習模型,能夠收集并分析不同傳感器(如攝像機、雷達等等)得出的距離、天氣、雷達感知、高精地圖等等不同數據。
在接下來2-3年間,英偉達還將技術研發這一技術,直到最后能夠搭載在所有新車上。老黃說,這是我們至今遇到的最為復雜的問題之一。
在現場,老黃還展示了英偉達DRIVE的研發路徑,它們都基于同一框架、滿足ADSL-D的安全標準、并且性能/功耗比非常高:從DRIVE PX Parker、到DRIVE PX 2、再到DRIVE Xavier、再到DRIVE Pegasus……
老黃說,雖然DRIVE Pegasus已經非常強大了,但是,英偉達還會打造下一代名為DRIVE Orin的芯片,不過現場沒有透露更多信息。
推出自動駕駛仿真測試平臺DRIVE Constellation
在今年1月的CES上,老黃曾經展示了一個全新的3D自動駕駛仿真測試平臺。而今天,老黃正式推出了這款名為DRIVE SIM and Constellation的3D自動駕駛仿真測試平臺。
這款平臺包括兩個部分,先是在云端模擬照片級真實的圖像,生成傳感器數據(包括攝像頭、雷達等)第二部分則包括將這些數據傳到英偉達DRIVE Pegasus中,并運行全套自動駕駛軟件,以幫助訓練該自動駕駛系統提升“姿勢水平”。
在實際演示中,英偉達的新仿真平臺顯得十分強大,不僅有傳統一點的實時車導線規劃、其他車輛識別,而且對環境的還原相當真實,復雜的光線條件也能夠被模擬。測試人員還能夠在平臺內操縱、變化車輛傳感器的探測范圍。
另外,這個平臺還支持開發人員在虛擬環境中“人為駕駛”一輛車作出各種危險動作來考驗測試車,來考驗測試車的算法。
會上,老黃還宣布,目前英偉達自動駕駛合作伙伴的數量已經達到了370家,其中包括整車廠、一級供應商、以及200+家創企。
與自動駕駛仿真測試平臺相似的,英偉達還在去年推出了專用于機器人的仿真測試平臺——ISAAC機器人訓練模擬世界。你可以用這個虛擬世界來訓練機器人前進、后退、轉彎、躲避行人等。
今天,老黃宣布將ISAAC平臺的技術開放出去,推出ISAAC SDK。
此外,英偉達此前還推出過一款VR多人交互平臺Holodeck。在今天的GTC 2018上,英偉達還展示了一個非常有趣、也非常’黑科技“的DEMO:在Holodeck虛擬世界里遠程控制現實世界里的汽車。(看過《黑豹》的同學大概可以理解一下)
上文提到,今年的GTC 2018比較神奇,最為重磅的消息選擇了在提前秘密發布,而不是在GTC Keynote現場——英偉達重磅宣布,將聯合芯片巨頭ARM打造AI芯片專用IP,這款IP屬于ARM幾年2月公布的Trillium項目的一部分,其技術源于英偉達Xavier芯片以及去年開源的DLA深度學習加速器項目。
英偉達本次宣布同AEM合作,將在數十億物聯網設備上實現深度學習。NVIDIA深度學習加速器IP將集成到Arm的Project Trillium平臺中,以便于構建深度學習IoT芯片。
去年,英偉達也正式免費開源了完整版DLA(Deep Learning Accelerator,深度學習加速器),讓廠商可以免費下載使用,打造屬于自己的低功耗AI芯片(比如IoT芯片)。
今年2月,芯片巨頭ARM公布了其人工智能項目Trillium,同時推出兩款專用IP,分別為物體檢測OD處理器和機器學習ML處理器。
ARM是全球智能設備第一大主流芯片架構提供商,全球超過90%的智能設備采用了ARM的芯片架構,包括手機、平板、手表、電視、無人機等等。而英偉達,作為全球AI浪潮的引領者,能夠為人工智能提供強大的計算力,二者一拍即合。
本次ARM牽手英偉達推出專用的IOT設備人工智能IP,將會有助于人工智能在終端設備廣泛鋪開,使得上億、甚至數十億臺IOT設備都能夠用上低功耗、低成本的AI芯片,使物聯網芯片公司能夠輕松地將AI集成到它們的設計中,并幫助它們將智能且價格實惠的產品帶給全球數十億的消費者。
NVIDIA副總裁兼自主機器事業部總經理Deepu Talla表示:“推理將成為每個物聯網設備的核心能力。我們將與ARM一同推進這一趨勢的發展,幫助數百家芯片公司輕松采用深度學習技術。”
結語:更多精彩敬請期待
今年,共有超過8000人來到了GTC 2018現場,150個展位。值得一提的是,英偉達也在推動女性在科技行業中的力量,今年女性占據了GTC 2018總開發者的8%,總參會者的10%,以及11%的演講者。
每年的GTC上,除了英偉達的各類主業務負責人的交流溝通會議、來自大大小小各類開發者或技術大牛的主題演講外、還有150家英偉達的合作企業布設展位,以供開發者與媒體參觀交流。
-
ARM
+關注
關注
134文章
9153瀏覽量
368507 -
人工智能
+關注
關注
1793文章
47604瀏覽量
239530 -
英偉達
+關注
關注
22文章
3833瀏覽量
91649
原文標題:英偉達GTC 2018最全記錄,十大亮點都在這里!
文章出處:【微信號:Anxin-360ic,微信公眾號:芯師爺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論