HPE、IBM、Oracle、開源社區、創業公司采用RAPIDS,顯著提升端到端預測數據分析能力。
NVIDIA今日發布了一款針對數據科學和機器學習的GPU加速平臺,該平臺已為多個行業領先者所采用,并能幫助超大規模公司以前所未有的速度分析海量數據并進行精準的業務預測。
RAPIDS? 開源軟件幫助數據科學家顯著地提高了工作績效,對于這些數據科學家來說,種種業務挑戰應接不暇,其中包括預估信用卡詐騙、預測零售存貨及理解顧客購買行為等等。眾多公司——無論是Databricks和Anaconda等開源社區先驅還是Hewlett Packard Enterprise、IBM和Oracle等技術領袖——在GPU對數據分析的重要性方面日益達成共識,并對RAPIDS表現出越來越多的支持。
據分析師估計,面向數據科學和機器學習的服務器市場每年價值約為200億美元,加上科學分析和深度學習市場,高性能計算市場總價值大約為360億美元。
“數據分析和機器學習是高性能計算市場中最大的細分市場,不過目前尚未實現加速,”NVIDIA創始人兼首席執行官黃仁勛在GPU技術大會主旨演講中發布RAPIDS時表示,“全球最大的行業均在海量服務器上運行機器學習算法,目的在于了解所在市場和環境中的復雜模式,同時迅速、精準地做出將直接影響其基礎的預測 。”
黃仁勛表示,“得益于CUDA及其全球生態系統以及與開源社區緊密合作,我們已創建了RAPIDS GPU加速平臺。該平臺已與全球最流行的數據科學庫及工作流無縫整合,可加速機器學習。如同深度學習一樣,我們正在不斷地為機器學習提速。”
RAPIDS已為GPU加速分析和機器學習提供了一整套開源庫,數據可視化即將是下一個目標。RAPIDS由NVIDIA工程師與主要的開源貢獻者在過去兩年的合作成果。
RAPIDS第一次為數據科學家提供了他們需要用來在GPU上運行整個數據科學管線的工具。最初的RAPIDS基準分析利用了XGBoost機器學習算法在NVIDIA DGX-2? 系統上進行訓練,結果表明,與僅有CPU的系統相比,其速度能加快50倍。這可幫助數據科學家將典型訓練時間從數天減少到數小時,或者從數小時減少到數分鐘,具體取決于其數據集的規模。
與開源社區開展緊密合作
RAPIDS構建于Apache Arrow、pandas和scikit-learn等流行的開源項目之上,為最流行的Python數據科學工具鏈帶來了GPU提速。為了將更多的機器學習庫和功能引入RAPIDS,NVIDIA廣泛地與開源生態系統貢獻者展開合作 ,其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 負責人兼Apache Arrow締造者Wes McKinney以及迅速增長的Python數據科學庫pandas等等。
McKinney表示,“作為GPU加速的數據科學平臺,RAPIDS是由Apache Arrow驅動的新一代的計算生態系統。NVIDIA與Ursa Labs的合作將加速Arrow核心數據庫的創新步伐,并有助于大幅提升分析及特征工程的績效。”
為了推動RAPIDS的廣泛應用,NVIDIA正努力將RAPIDS與Apache Spark進行整合,后者是分析及數據科學方面領先的開源框架。
Databricks聯合創始人、首席技術官兼Apache Spark 創始人Matei Zaharia表示,“在Databricks公司中,我們對RAPIDS在加速Apache Spark工作量方面的潛力感到非常興奮。我們目前開展的多個項目都意在將Spark更好地與本地加速器進行整合,其中包括借助Project Hydrogen實現的Apache Arrow的支持以及GPU調度。我們相信,就擴大我們客戶數據科學及AI工作量來說,RAPIDS將是全新的、振奮人心的機會。”
廣泛的生態系統支持及應用
各個行業技術領先的企業均是NVIDIA GPU加速平臺及RAPIDS的率先應用者。
沃爾瑪執行副總裁兼首席技術官Jeremy King表示,“NVIDIA的GPU加速平臺及RAPIDS軟件極大改進了我們使用數據的方式,幫助我們實現了復雜模式大規模地運行,同時進行更加精準的預測。RAPIDS的應用得益于NVIDIA和沃爾瑪工程師之間的深度合作,我們準備繼續推進這種合作關系。”
此外,一些全球領先的技術公司也力圖通過全新的系統、數據科學平臺和軟件解決方案支持RAPIDS:
“HPE致力于改進客戶生活和工作的方式。人工智能、分析和機器學習技術能在揭示洞察方面扮演關鍵的角色,這有助于幫助客戶實現突破性的成果,同時改善我們所生存的世界。HPE提供全面的人工智能和數據分析解決方案并在市場中保持獨一無二的優勢,其中既包括戰略咨詢,也包括專為特定需求開發的GPU加速器技術、運行支持以及強大的伙伴生態系統;我們旨在為每位客戶定制合適的解決方案。我們對與NVIDIA在RAPIDS方面的合作感到非常興奮,此舉能加快數據科學和機器學習的應用,推動我們的客戶更快地實現更具洞察力的成果。”——惠普企業首席執行官Antonio Neri
“IBM已為企業人工智能構建了全球領先的、在任何部署模式上均能運行的平臺。我們期望能拓展與NVIDIA已有的成功合作,利用RAPIDS來為客戶提供全新的機器學習工具。”——Hybrid Cloud高級副總裁兼IBM Research董事 Arvind Krishna
“當今的計算領域要要強大的處理能力,以便應對數據科學和分析智能等紛繁復雜的工作,而這正是NVIDIA GPU的優勢。RAPIDS正在不斷加速處理和機器學習培訓的速度。能在Oracle Cloud Infrastructure上支持這套全新的開源軟件讓我們感到非常興奮,我們也希望能與NVIDIA繼續合作,以在我們的Oracle Data Science Cloud等各種平臺上支持RAPIDS,并進一步加速客戶端到端數據科學工作流。RAPIDS軟件在Oracle Cloud上無縫運行,這使客戶得以支持各種高性能計算、人工智能和數據科學需求,同時利用Oracle Cloud Infrastructure 上可獲得的GPU實例組合。”——Oracle Cloud Infrastructure軟件開發部門高級副總裁Clay Magouyrk
本新聞稿得到包括Cisco、DELL EMC、聯想、NERSC, NetApp, Pure Storage, SAP和SAS等其它領先創新者以及諸多數據科學先驅的支持。
供貨
全套RAPIDS開源庫現在即可在http://www.rapids.ai上獲得,代碼經Apache許可公布。容器化RAPIDS版本本周內可在NVIDIA GPU Cloud container registry (https://www.nvidia.com/en-us/gpu-cloud/)上獲得。
-
NVIDIA
+關注
關注
14文章
5075瀏覽量
103613 -
機器學習
+關注
關注
66文章
8438瀏覽量
132998
原文標題:GTC Europe | NVIDIA針對大規模數據分析和機器學習推出RAPIDS開源GPU加速平臺
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論