機器學習的進步,無人駕駛汽車背后的人工智能形式以及許多其他高科技應用已經引領了計算的新時代,這是以數據為中心的時代,并迫使工程師們重新考慮計算架構的各個方面在過去的75年中,這些技術幾乎沒有受到挑戰。
“問題在于,對于當今機器學習最先進的大規模深度神經網絡而言,運行整個系統所需的90%以上的電力都消耗在存儲器和處理器之間的數據移動中”,電氣與計算機工程學助理教授林穎妍說。
Lin和合作者提出了兩種互補的方法來優化以數據為中心的處理,這兩種方法都在6月3日的國際計算機體系結構研討會(ISCA)上進行了介紹,這是有關計算機體系結構新思想和研究的主要會議之一。
以數據為中心的體系結構的驅動與一個稱為von Neumann瓶頸的問題有關,這種效率低下的原因是自數學家約翰馮諾伊曼于1945年發明內存以來,計算結構中內存和處理的分離一直占主導地位。從程序和數據來看,馮諾依曼架構使單臺計算機具有難以置信的通用性。根據從內存中加載的存儲程序,可以使用計算機進行視頻通話,準備電子表格或模擬火星上的天氣。
但是將內存與處理分開也意味著即使簡單的操作(如加2加2)也需要計算機的處理器多次訪問內存。深度神經網絡中的大量操作使該存儲瓶頸變得更糟,深度神經網絡是通過“研究”大量先前示例來學習做出人性化決策的系統。網絡越大,它可以完成的任務就越困難,并且顯示的網絡示例越多,它的執行效果就越好。深度神經網絡培訓可能需要專門的處理器庫,這些處理器需要全天候運行一周以上。在智能手機上基于學習到的網絡執行任務(稱為推理)可以在不到一個小時的時間內耗盡電池電量。
賴斯的高效和智能計算(EIC)實驗室主任Lin說:“眾所周知,在機器學習時代,以數據為中心的算法,我們需要創新的以數據為中心的硬件架構。“但是,機器學習的最佳硬件架構是什么?
“沒有一個萬能的答案,因為不同的應用需要機器學習算法,這些算法在算法結構和復雜性方面可能有很大差異,同時具有不同的任務準確性和資源消耗,例如能源成本,延遲和吞吐量- -權衡要求,”她說。“許多研究人員正在為此進行研究,而英特爾,IBM和Google等大公司都有自己的設計。”
Lin小組在ISCA 2020上的演講之一提供了TIMELY的結果,TIMELY是她和她的學生為“內存中處理”(PIM)開發的一種創新體系結構,這種非馮諾依曼方法將處理引入內存陣列。一種有前途的PIM平臺是“電阻式隨機存取存儲器”(ReRAM),這是一種類似于閃存的非易失性存儲器。雖然提出了其他ReRAM PIM加速器架構,但Lin表示,在10多個深度神經網絡模型上進行的實驗發現,TIMELY的能源效率高18倍,并且交付的計算密度是最有競爭力的最新技術的30倍以上ReRAM PIM加速器。
TIMELY代表“時域,內存中執行,LocalitY”,通過消除導致效率低下的主要因素來實現其性能,這種效率低下是由于頻繁訪問主存儲器以處理中間輸入和輸出以及本地與主存儲器之間的接口而引起的。
在主存儲器中,數據以數字方式存儲,但是當將其帶入本地存儲器以進行內存中處理時,必須將其轉換為模擬量。在現在的ReRAM PIM加速器中,結果值從模擬轉換為數字,然后發送回主存儲器。如果將它們從主存儲器調用到本地ReRAM以進行后續操作,它們將再次轉換為模擬信號,依此類推。
通過使用本地存儲器內的模擬格式緩沖區,及時避免了不必要的訪問主存儲器和接口數據轉換的開銷。這樣,TIMELY幾乎可以將所需的數據保留在本地存儲陣列中,從而大大提高了效率。
該小組在ISCA 2020上提出的第二個建議是SmartExchange,該設計結合了算法和加速器硬件創新以節省能源。
“訪問主內存(DRAM)的能量要比執行計算多200倍,因此SmartExchange的關鍵思想是在算法中強制執行結構,使我們可以將成本較高的內存換成很多,成本更低的計算,”林說。
她補充說:“例如,我們的算法有1000個參數。” “在傳統方法中,我們將所有1,000個存儲在DRAM中,并根據計算需要進行訪問。通過SmartExchange,我們搜索以找到這1,000個中的某些結構。然后,我們只需要存儲10個,因為如果我們知道它們之間的關系, 10和其余的990,我們可以計算990中的任何一個,而不必從DRAM調用它們。
她說:“我們將這10個稱為“基本”子集,其想法是將它們存儲在靠近處理器的本地位置,以避免或大幅度減少為訪問DRAM支付的費用。
研究人員使用SmartExchange算法及其自定義的硬件加速器對七個基準深度神經網絡模型和三個基準數據集進行了實驗。他們發現,與最新的深度神經網絡加速器相比,該組合將等待時間減少了多達19倍。
該研究得到了美國國家科學基金會和美國國立衛生研究院的支持。
責任編輯:tzh
-
機器人
+關注
關注
211文章
28632瀏覽量
208013 -
AI
+關注
關注
87文章
31490瀏覽量
269919 -
人工智能
+關注
關注
1795文章
47642瀏覽量
239704
發布評論請先 登錄
相關推薦
評論