在各行各業,AI 正在用機器驅動的計算來推動創新。在金融領域,銀行正在使用 AI 更快地檢測欺詐行為并確保賬戶安全;電信公司正在使用 AI 優化網絡以提供優質服務;科學家正在使用 AI 開發治療罕見病的新療法;公共事業正在使用 AI 建設更清潔、更可靠的能源網絡,汽車行業正在利用 AI 使自動駕駛汽車更安全、更便捷。
數據是各種大型 AI 用例的基礎。有效且精確的 AI 模型需要使用廣泛的數據集進行訓練。企業要想利用 AI 的力量,就必須建立一個數據流,從各種來源提取數據,并將其轉換成一致的格式并進行有效存儲。
數據科學家通過多次實驗完善數據集以微調 AI 模型,從而在真實應用中實現其最佳性能。從語音助手到個性化推薦系統,這些應用都需要快速處理大量數據,以保障實時性能。
隨著 AI 模型變得越來越復雜,并開始處理文本、音頻、圖像和視頻等各類數據,滿足快速數據處理的需求變得更加關鍵。對于繼續依賴傳統 CPU 計算的機構而言,數據瓶頸、數據中心成本不斷攀升和算力不足阻礙了其創新發展和性能提升。
許多企業正轉向加速計算以將 AI 融入其業務運營中。這種方法充分利用 GPU、專用硬件、軟件和并行計算技術,將計算性能提升最高達 150 倍,能效提升高達 42 倍。
各行各業的領先企業正在利用加速數據處理來實施其開創性的 AI 計劃。
金融機構瞬間檢測到欺詐行為
由于需要對大量交易數據進行快速分析,金融機構在檢測欺詐方式時面臨巨大挑戰。此外,由于缺乏真實欺詐案例的標記數據,也給 AI 模型的訓練造成了困難。在處理與欺詐檢測相關的大量數據時,傳統的數據科學工作流缺乏所需的加速能力。這導致數據處理緩慢,阻礙了實時數據分析和欺詐檢測。
為了克服這些挑戰,每年處理超過 80 億筆交易的美國運通使用加速計算來訓練和部署長短期記憶(LSTM)模型。這些模型用于順序分析和異常檢測,并能夠適應新數據和從中學習,是打擊欺詐的理想選擇。
利用 GPU 上的并行計算技術,美國運通大幅加快了 LSTM 模型的訓練速度。GPU 還使已經投入使用的模型能夠處理大量交易數據,以進行高性能的計算,從而實時檢測欺詐行為。
該系統可在低于兩毫秒的延遲中運行,以更好地保護客戶和商家,與基于 CPU 的配置相比性能提高了 50 倍。通過將加速的 LSTM 深度神經網絡與其現有方法相結合,美國運通在特定領域的欺詐檢測準確率提高了 6%。
金融公司還可以使用加速計算來降低數據處理成本。通過在 NVIDIA GPU 上運行涉及大量數據的 Spark3 工作負載,PayPal 證實了其有望將大數據處理和 AI 應用的云成本降低 70%。
通過更高效地處理數據,金融機構可以實時檢測欺詐行為,從而在不干擾交易流的情況下更快決策,并將財務損失的風險降至最低。
電信公司簡化復雜的人員調派
電信公司的各項業務產生了海量數據,包括網絡設備、客戶交互、計費系統以及網絡性能和維護。
每天處理數百 PB 數據的全國性網絡需要進行復雜的技術人員調派,以確保服務。為了優化技術人員調度,先進的調派引擎需要執行數萬億次計算,并充分考慮天氣、技術人員技能、客戶需求和車隊分布等因素。這些操作的成功取決于細致的數據準備和充足的算力。
AT&T 擁有美國最大的現場調度服務團隊之一。該公司正在通過 NVIDIA cuOpt 改善數據密集型人員調派,依靠啟發式、元啟發式和優化來計算復雜的車輛調派問題。
在早期試驗中,cuOpt 在 10 秒內就提供了調派解決方案,將云計算成本降低了 90%,這使技術人員每天能夠完成更多的服務呼叫。NVIDIA RAPIDS是一套能夠加速數據科學和分析數據流的軟件庫,它進一步加速了 cuOpt,使企業能夠集成 本地搜索啟發式算法和元啟發式算法(如 Tabu 搜索),以持續地優化人員調派。
AT&T 正在采用 NVIDIA RAPIDS Accelerator for Apache Spark,以增強基于 Spark 的 AI 和數據流的性能。這有助于該公司從訓練 AI 模型到保持網絡質量,再到減少客戶流失和改進欺詐檢測的運營效率全方位提升。通過 RAPIDS 加速器,AT&T 正在減少目標工作負載的云計算支出,同時實現更高的性能并減少碳排放量。
基于電信公司對提高運營效率同時提供高質量服務的需求,加速數據流的傳輸和處理將至關重要。
生物醫學研究人員縮短新藥研發時間
研究人員對人類基因組中大約 25000 個基因進行了研究,以了解它們與疾病之間存在何種關系,這使得醫學數據和同行評審的研究論文數量激增。生物醫學研究人員依靠這些論文來縮小開發新療法的研究范圍。然而,對數量如此龐大且仍在不斷增加的相關研究進行文獻綜述,已成為一項不可能完成的任務。
領先的制藥公司阿斯利康開發了一個生物學洞察知識圖譜(BIKG),從文獻綜述到篩選命中率評級、靶點識別等整個藥物發現過程為科學家提供幫助。該圖譜將公共和內部數據庫與科學文獻中的信息進行整合,模擬了 1000 萬至 10 億種復雜的生物關系。
BIKG 已被有效地用于基因排序,幫助科學家假設高潛力靶點以研發新療法。在今年的 NVIDIA GTC 上,阿斯利康團隊介紹了一個項目,該項目成功識別了與肺癌治療耐藥性相關的基因。
為了縮小潛在基因的范圍,數據科學家和生物學研究人員共同定義了相關標準和基因特征,以確定理想的開發療法靶點。他們訓練了一種機器學習算法,在 BIKG 數據庫中搜索具有文獻中提到的可治療基因的特征。通過利用 NVIDIA RAPIDS 來加快計算速度,該團隊將初始基因庫從 3000 個減少到僅僅 40 個目標基因,以前完成這項任務需要耗時幾個月,但現在只需要幾秒鐘。
通過用加速計算和 AI 助力藥物研發,制藥公司和研究人員最終可以利用醫學領域積累的大量數據,更快、更安全地開發新藥,幫助挽救生命。
公共事業公司創造清潔能源的未來
能源部門正大力推動碳中和能源轉型。在過去的 10 年里,隨著太陽能等可再生能源的使用成本大幅下降,清潔能源未來的實現取得了重大的進展。
然而,在整合來自風力發電廠、太陽能發電廠和家用電池的清潔能源時,電網管理面臨著新的復雜性考驗。在能源基礎設施多元化并且需要雙向輸電的情況下,電網管理變得更加數據密集化。因此,現在需要新的智能電網來處理汽車充電的高壓充電區,此外還必須管理分布式儲能的可用性,并適應整個電網的各種用電情況。
知名電網邊緣軟件公司 Utilidata 與 NVIDIA 合作,使用定制的 NVIDIA Jetson Orin 邊緣 AI 模塊,為電網邊緣開發了分布式 AI 平臺 Karman。這種嵌入電表的定制芯片和平臺將每個電表轉化為一個數據收集和控制終端,支持每秒處理數千個數據點。
Karman 處理來自電網邊緣電表的實時高分辨率數據。這使公共事業公司能夠在幾秒鐘內(而不是幾分鐘或幾小時)詳細了解電網狀況,預測用電情況,并無縫整合分布式能源。此外,通過邊緣設備上的推理模型,電網運營商可以預測并快速識別線路故障,以預測潛在的停電,并進行預防性維護,從而提高電網的可靠性。
通過集成 AI 和加速數據分析,Karman 幫助公共事業公司將現有的基礎設施改造成高效的智能電網。這樣即可實現量身定制、本地化的電力分配,以滿足波動的用電需求,而無需大規模地升級實體基礎設施,從而實現更具成本效益的電網現代化。
汽車制造商使自動駕駛汽車
更安全、更便捷
汽車廠商正在努力實現全自動駕駛。為此,車輛必須能夠實時檢測物體和進行導航。這就需要高速的數據處理,包括將攝像頭、激光雷達、雷達和 GPS 的實時數據輸入 AI 模型,以做出導航決策,確保道路安全。
自動駕駛的推理工作流非常復雜,包括多個 AI 模型以及必要的預處理和后處理步驟。傳統上,這些步驟是在客戶端使用 CPU 處理的。然而,這可能會導致處理速度出現重大瓶頸,對于快速處理等同于安全的應用來說是不可接受的缺點。
為了提高自動駕駛工作流的效率,智能電動汽車制造商蔚來將 NVIDIA Triton 推理服務器集成到其推理工作流中。NVIDIA Triton 是一款開源、多框架的推理服務軟件。通過整合數據處理任務,蔚來在一些核心領域將延時降低至原來的 1/6,并將總體數據吞吐量提高最多達 5 倍。
蔚來以 GPU 為中心的方法使更新和部署全新 AI 模型變得更容易,并無需對車輛進行任何改動。此外,該公司還可以在同一組圖像上同時使用多個 AI 模型,而無需通過網絡來回發送數據,從而節省了數據傳輸成本并提高了性能。
通過使用加速的數據處理,自動駕駛汽車軟件開發人員可確保他們能夠達到高性能標準,以避免交通事故,降低運輸成本,從而助力用戶更好地出行。
零售商提升需求預測能力
在快節奏的零售環境中,快速處理和分析數據的能力對于調整庫存水平、個性化客戶互動和動態地優化定價策略至關重要。零售商的規模越大,銷售的產品越多,其數據操作就越復雜,同時計算密集程度也更高。
世界上最大的零售商沃爾瑪通過使用加速計算,顯著地提高了對其 4500 個商店中 5 億種商品組合的預測準確性。
隨著現有的計算環境開始出現無法完成工作或產生不準確結果的問題,沃爾瑪的數據科學團隊構建了更強大的機器學習算法,以來應對這一巨大的預測挑戰,他們發現,數據科學家必須從算法中刪除一些特征,才能順利運行。
為了改進預測,沃爾瑪開始使用 NVIDIA GPU 和 RAPIDS。該公司現在使用的預測模型擁有 350 種數據特征,可以預測所有產品類別的銷量情況,包括銷售數據、促銷活動以及影響需求的外部因素(如天氣狀況和超級碗等重大活動)。
先進的模型幫助沃爾瑪將預測準確率從 94% 提高到 97%,同時消除了約 1 億美元的生鮮產品浪費,減少了缺貨和降價的情況。GPU 運行模型的速度也提高了 100 倍,只需 4 小時即可完成各項作業,而這在 CPU 環境中則花費數周的時間。
通過將數據密集型操作轉移到 GPU 和加速計算,零售商可以降低成本和碳排放量,同時為消費者提供最適合的選擇和更低的價格。
公共部門提高防災能力
無人機和衛星拍攝了大量航空圖像數據,公共和私營機構則使用這些數據來預測天氣模式、追蹤動物遷徙和觀察環境變化。這些數據對研究和規劃非常寶貴,可以幫助農業、災害管理和應對氣候變化等領域做出更加明智的決策。然而,如果缺乏特定的位置元數據,則這些圖像發揮的價值可能會受到限制。
與 NVIDIA 合作的一家美國機構正在探索一種方法來自動確定缺少地理空間元數據的圖像位置,這對搜救、應對自然災害和監測環境等任務至關重要。然而,使用沒有元數據的航空圖像識別更大的區域內的一塊小區域,這種挑戰有如大海撈針。設計有助于地理定位的算法,必須解決圖像光照的變化以及在不同時間、日期和角度拍攝圖像所造成的差異。
為了識別無地理標記的航空圖像,NVIDIA、Booz-Allen 公司和當地政府機構合作開發了一種解決方案,即通過使用計算機視覺算法從圖像像素數據中提取信息,以解決圖像相似性搜索問題。
在試圖解決此問題時,一位 NVIDIA 解決方案架構師首先使用了基于 Python 的應用程序。最初在 CPU 上運行時,其處理時間超過 24 小時。而 GPU 可將處理時間壓縮到僅幾分鐘,且并行執行數千個數據操作,而在 CPU 上只能執行少量操作。通過將應用程序代碼轉移到開源 GPU 加速庫 CuPy 中,該應用程序驚人地提速了 180 萬倍,在 67 微秒內就返回了結果。
借助可以在幾分鐘內處理大面積陸地圖像和數據的解決方案,各個組織或機構就可以獲得其所需的關鍵信息,從而更快、更有效地應對緊急情況,并積極主動地制定計劃,從而有望挽救生命、保護環境。
加速 AI 計劃,交付業務成果
使用加速計算進行數據處理的企業正在推進 AI 計劃,以實現其在業內更高水平的創新并取得更好的成果。
加速計算可以更高效地處理大型數據集,更快地實現模型訓練和精選的優化算法,并為實時 AI 解決方案提供更精確的結果。
與基于 CPU 的傳統系統相比,使用加速計算的企業可以實現更高的性價比,并增強其向客戶、員工和合作伙伴提供卓越結果和優質體驗的能力。
-
cpu
+關注
關注
68文章
10901瀏覽量
212640 -
NVIDIA
+關注
關注
14文章
5072瀏覽量
103516 -
AI
+關注
關注
87文章
31463瀏覽量
269859
原文標題:為什么加速數據處理對各行各業的 AI 創新都至關重要
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論