色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么AI 加速器要減少 GPU 等高能耗硬件的使用?

lhl545545 ? 來源:與非網 ? 作者:與非網 ? 2020-08-24 16:22 ? 次閱讀

由于大部分繁重的 AI 任務都是在云端完成的,因此人們很容易忘記 AI 需要大量的計算資源及電力。

馬薩諸塞州大學阿默斯特分校去年的一項研究發現,訓練一個大型自然語言處理(BERT)AI 模型因消耗電力而產生的二氧化碳(CO2),相當于跨大西洋往返航班對每個乘客所產生的 CO2。那只是一個模型,雖然是變換網絡,但只需訓練一次。開發過程中通常會對模型進行多次調整和反復訓練。如果將神經網絡結構搜索(一種使用 AI 來調整模型的 AutoML 技術)加入一個大小適中的轉換器中,其 CO2 總排放量將猛升到幾乎與 5 輛美國汽車的終身排放量相同。

圖 1:訓練一個大型的自然語言處理 AI 模型時,其消耗電力所產生的 CO2 相當于跨大西洋往返航班對每個乘客所產生的 CO2。

AI 加速器有望提高 AI 處理的計算效率。隨著 AI 處理量的不斷增加,數據中心將會采用這些新的專用加速器。

但是 AI 加速器可以節省能源嗎?究竟是總的用電量下降了,還是數據中心只不過利用同樣的電力實現了更多的計算?

AI 訓練策略

“AI 計算使用的能量多少是由幾個因素決定的?!盜BM Cognitive Systems 技術計算副總裁 David Turek 解釋說,“采取什么樣的策略來訓練模型,會影響所消耗的能量。每瓦特的計算量并不是特別有用的指標,因為有很多種不同的方法可以降低總能耗?!?/p>

他補充說,整個系統架構和應用環境決定了實際上需要多少能源?!皬哪P陀柧毜侥P筒渴?,計算能力的不同級別直接影響其基礎架構,從而直接影響所消耗的能源。”

人們通常認為,AI 系統中一次只訓練一個模型,然后將其部署到其他地方進行推理。但事實并非如此,典型的 AI 系統會多次訓練很多模型,并且可能同時在多個模型上進行推理以獲得最佳結果。

完成部署后,有時會使用聯邦學習(federated learning)之類的技術,在邊緣而不是回到數據中心更新增量模型。需要消耗多少能量取決于在邊緣進行什么處理。

換句話說,訓練特定的 AI 模型所消耗的能量并不是直接就可以確定的?!暗珨祿行牡幕A設施是固定的,因此調整工作流程是節省能源的最好方法。”Turek 說。

可能的方法有:將 AI 模型與傳統的高性能計算融合,以減少所需的總計算量;縮短完成一項工作所花的時間,以減少 GPU 等高能耗 AI 加速器硬件的使用;避免在數據中心使用聯邦學習之類的技術重復訓練。

Turek 說:“這是從管理的角度來聰明地安排工作流程,利用最佳的方法為現有系統分配可用的能源。通過能源預算和能源消耗,運營商可以在其硬件基礎架構上進行調度分配?!?/p>

在更高的溫度下運行

服務器制造商 Supermicro 去年年底發布的數據中心環境實踐年度調查報告顯示,能源效率仍然有機會提高。Supermicro 營銷和網絡安全副總裁 Michael McNerney 認為,這些機會正在流失。

McNerney 說:“我們認為一些基本的最佳實踐可以為客戶帶來很大價值。其中的一條是,相比傳統的數據中心環境,我們今天構建的系統可以在更高的溫度下運行,許多長期從事數據中心運營的人卻沒有意識到這一點。”

在目前的設計中,不再需要將設備冷卻到 23~25°C 來確保其性能和可靠性。一些“綠色”數據中心處于極端溫度下,即便是很小的變化,例如減少空調的使用,也可以節省能源。

圖 2:現代服務器和基礎設施可以在更高的溫度下運行,并且切換為多節點系統,從而降低了總能耗。

多節點系統是節省能源的另一種方法,其中多臺服務器在共享的基礎架構上運行。這種配置減少了所需的大型電源和風扇數量。多節點系統具有更高的能源效率,可以在更高的溫度下運行,并提供更高的功率密度。

Supermicro 的調查還發現,目前每個機架的平均功率密度為 15kW,服務器進氣入口溫度為 23.5°C,服務器每 4.1 年更換一次。而在采用高度優化綠色設計的數據中心(占受訪者的 12%),每個機架的功率密度超過 25kW,平均入口溫度為 26.5°C,服務器每 2 至 3 年更換一次。因此,Supermicro 得出結論,大多數數據中心仍需繼續優化能效。

令人驚訝的是,大多數受訪者并不認為能耗是成功的關鍵指標?!拔覀円呀浛吹剑?a target="_blank">公司的設施預算與硬件及系統的資產購置成本是分開的,它們與人力成本也是分開的。我認為人們很清楚地知道這一點,但是并不會進行綜合考慮和優化?!盡cNerney 說。

“較大的數據中心更了解總運營成本,但若增加資產購置預算,能源預算就會減少,人們有時很難把這兩者關聯起來。”

McNerneyt 認為整個數據中心的功耗并不會很快下降。他說:“長期的發展趨勢是,一些在線服務的能耗會隨著效率的提升而改善,然而隨著 5G 和 AI 的逐漸普及,總體功耗仍將繼續增加?!?/p>

電費與能耗

英偉達加速計產品管理總監 Paresh Kharya 表示,數據中心運營商希望全面提高能效,因為電費占其運營成本的 25%。

能源使用效率(PUE)是一項廣泛使用的用來衡量能源節約的指標,表示計算所消耗的能源與數據中心基礎設施消耗的總能源之比。目標是 PUE 等級為 1。

Kharya 說:“多年來,超大規模數據中心的 PUE 接近 1 或 1.1,非常高效。企業數據中心也取得了很大進步,大多數情況下,其 PUE 等級已經從大于 2 降到了遠遠低于 2?!?/p>

超大規模數據中心采用優化的機架和散熱設計,可以大規模運行,其優化和使用復雜技術的能力是大多數企業數據中心不具備的。Kharya 表示:“許多企業已開始采用這些創新技術,能源效率得到了顯著提高?!?/p>

由于各家公司關注的是電費而不是功耗,所以 Kharya 認為,執行任務所花費的時間是一個重要因素?!袄?,在一臺只有 CPU 的服務器上訓練 ResNet-50 模型的圖像識別可能需要長達三周的時間,而配備英偉達 V100 GPU 的服務器可以在一天之內完成這一任務?!彼a充道。

“每臺配備英偉達 GPU 的服務器比配備 CPU 的服務器消耗的能源更多,但它完成任務的時間將大大縮短。因此,如果使用 GPU 加速器,用于完成 AI 處理的整體能耗將降低至原來的 20 到 25 分之一?!盞harya 強調。

了解數據中心工作負荷

英特爾數據平臺營銷總經理 Allyson Klein 表示,數據中心運營商會盡量確保所有系統高效運行,讓昂貴的基礎架構提供最大的計算能力。

“數據中心運營商的主要目標是使基礎架構的性能達到最好。”Klein 說,“性能高低取決于系統和機架的級別,同時還需要整個數據中心協同工作,使每瓦性能達到最高。”

因此,為了部署合適的基礎架構來滿足性能和能耗要求,全面了解數據中心的工作負荷非常重要。最理想的結果是計算容量更大,功耗更低,并且不會閑置基礎設施而白白消耗電力。

究竟是在 CPU 中集成加速功能還是采用分立的加速器,這通常需要進行權衡。Klein 說:“加速器會增加功耗,但如果它一直工作,則整體效率更高。如果加速器完成大量工作,利用率高,在客戶愿意投資基礎設施的情況下,使用分立的加速器是較好的方法。如果不能一直使用加速器,則采用 CPU 方法可能是更好的選擇,因為加速器經常會空閑,耗電卻不執行任何任務。”

Klein 表示,在大多數部署中,AI 只是數十萬種不同工作負荷的一種。盡管英特爾提供了 CPU 和專用 AI 加速器(通過 Habana Labs),但由于工作負荷種類很多,從功耗和投資角度來看,Xeon Scalable(CPU)平臺可以說是最高效的產品。

Klein 說:“英特爾的 AI 策略建立在 Xeon Scalable 處理器的基礎之上,Xeon Scalable 內部做了 AI 優化,并針對機器學習深度學習進行了大量軟件優化?!?/p>

提高效率

盡管 GPU 等 AI 加速器能耗很大,但進行 AI 處理時,它們的高計算效率可以降低總能耗。AI 處理在數據中心所占比例越來越高,但數據中心日常處理的負荷種類仍然多種多樣。

加速器使 AI 處理受益最大,CPU 則繼續在超大規模和企業數據中心市場贏得席位,因為 CPU 應用更加靈活。隨著 AI 應用的不斷擴大,以及新的 5G 應用產生更多的非結構化數據,數據中心的能耗不太可能很快下降。
責任編輯:pj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    800

    瀏覽量

    37905
  • 數據中心
    +關注

    關注

    16

    文章

    4792

    瀏覽量

    72173
  • AI
    AI
    +關注

    關注

    87

    文章

    30996

    瀏覽量

    269285
收藏 人收藏

    評論

    相關推薦

    GPU加速云服務怎么用的

    GPU加速云服務是將GPU硬件與云計算服務相結合,通過云服務提供商的平臺,用戶可以根據需求靈活租用帶有
    的頭像 發表于 12-26 11:58 ?71次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    許可證模型的加速令牌或SIMULIA統一許可證模型的SimUnit令牌或積分授權。 4. GPU計算的啟用 - 交互式模擬:通過加速對話框啟用,打開求解對話框,點擊“
    發表于 12-16 14:25

    英偉達AI加速器新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內存

    加速器設計的愿景。 英偉達認為未來整個 AI 加速器復合體將位于大面積先進封裝基板之上,采用垂直供電,集成硅光子 I/O 器件,GPU 采用多模塊設計,3D 垂直堆疊 DRAM 內存
    的頭像 發表于 12-13 11:37 ?207次閱讀
    英偉達<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內存

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創意加速器

    加速器
    龍智DevSecOps
    發布于 :2024年11月26日 13:42:47

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    場景精確投射到2D平面;最后在像素著色階段完成材質渲染和光照明細處理。DirectX API的迭代推動了可編程著色的發展,解放了GPU的通用計算潛能。特別是像素著色的設計,啟發了我在深度學習任務中
    發表于 11-24 17:12

    解決方案丨PPEC inside車載逆變器,車載高能耗設備需求的理想之選

    ,是滿足車載高能耗設備需求的理想車載電源解決方案。該方案已通過多家客戶項目檢驗,并獲得了用戶的高度認可。 PPEC車載逆變器拓撲框圖如下: 二、產品特色 ▍快速交付:繼承PPEC控制芯片免代碼開發
    發表于 09-27 18:13

    英特爾發布Gaudi3 AI加速器,押注低成本優勢挑戰市場

    英特爾近期震撼發布了專為AI工作負載設計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達熱門型號H100與H200 GPU,但英特爾巧妙地將競爭優勢聚焦于其更為親民的價格與總擁有成本(TCO)上。
    的頭像 發表于 09-26 16:16 ?835次閱讀

    什么是神經網絡加速器?它有哪些特點?

    )和圖形處理GPU)雖然可以處理神經網絡計算,但在能效比和計算密度上往往難以滿足特定應用場景的需求。因此,神經網絡加速器應運而生,它通過優化硬件架構和算法實現,針對神經網絡計算的特
    的頭像 發表于 07-11 10:40 ?507次閱讀

    西門子推出Catapult AI NN軟件,賦能神經網絡加速器設計

    西門子數字化工業軟件近日發布了Catapult AI NN軟件,這款軟件在神經網絡加速器設計領域邁出了重要一步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級系統(SoC)上實現神經網絡的高層次綜合(H
    的頭像 發表于 06-19 11:27 ?872次閱讀

    美國限制向中東AI加速器出口,審查國家安全

    AI加速器能協助數據中心處理大量人工智能聊天機器人和其他工具的開發信息。如今,它們已然成為構建AI基礎設施的企業和政府的必需品。
    的頭像 發表于 05-31 09:20 ?593次閱讀

    Arm發布新一代Ethos-U AI加速器 Arm旨在瞄準國產CPU市場

    Arm發布的新一代Ethos-U AI加速器確實在業界引起了廣泛關注。
    的頭像 發表于 04-18 15:59 ?769次閱讀

    Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構,性能提升四倍

    電子發燒友網報道(文/黃晶晶)在嵌入式領域,邊緣與端側AI推理需求不斷增長,Arm既有Helium 技術使 CPU 能夠執行更多計算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器
    的頭像 發表于 04-16 09:10 ?4631次閱讀
    Arm推動生成式<b class='flag-5'>AI</b>落地邊緣!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>支持Transformer 架構,性能提升四倍

    瑞薩發布下一代動態可重構人工智能處理加速器

    瑞薩最新發布的動態可重構人工智能處理(DRP-AI加速器,在業界引起了廣泛關注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統技術,效率提升了驚人的10倍。其獨特之處在
    的頭像 發表于 03-08 13:45 ?784次閱讀

    家居智能化,推動AI加速器的發展

    提高了系統的運算能力和數據處理能力,還為用戶帶來了更加智能化、個性化的生活體驗。 ? AI 加速器的發展 ? 在人工智能和機器學習任務變得日益復雜和密集之前,傳統的CPU和GPU已經足以處理這些任務。然而,隨著深度學習模型的出現
    的頭像 發表于 02-23 00:18 ?4602次閱讀

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場中的運動。本文將詳細介紹回旋加速器的原理以及影響因素。 一、回旋
    的頭像 發表于 01-30 10:02 ?4037次閱讀
    主站蜘蛛池模板: 夜夜穞狠狠穞| 色99蜜臀AV无码| 国产AV精品久久久毛片| 超碰人人澡人人胔| 冠希和阿娇13分钟在线视频| 免费看b站| 天天射天天爱天天干| 亚洲欧美国产综合在线一区| 中文无码第3页不卡av| proburn中文破解版下载| 国产亚洲精品久久久久久白晶晶| 精品无码无人网站免费视频| 欧美性xxxxxx爱| 亚洲国产中文在线视频| 97国产蝌蚪视频在线观看| 动漫美女被吸奶| 久久精品综合网中文字幕| 日本高清免费在线| 亚洲午夜精品AV无码少妇| 丰满老熟女白浆直流| 美女扒开屁股让男人桶| 少妇无码太爽了视频在线播放| 又黄又湿免费高清视频| 高H各种PLAY全肉NP| 色尼姑久久超碰在线| 国产a级黄色毛片| 亚洲 欧美 视频 手机在线| X8X8拨牐拨牐X8免费视频8午夜| 欧美精品高潮呻吟AV久久| 在线播放毛片| 国产亚洲欧洲日韩在线三区 | 国产成人精品视频| 美女张开大腿| 伊人综合在线影院| 蜜桃无码AV视频在线观看| ppypp午夜限制不卡影院私人| 三级黃60分钟| 九九热视频这里只有精| 新版孕妇bbwbbwbbw| 大香伊蕉在人线国产97| 新妺妺窝人体色WWW|