色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習如何滿足DNN推理的要求

lPCU_elecfans ? 來源:電子發燒友網 ? 作者:電子發燒友網 ? 2022-09-14 09:55 ? 次閱讀

電子發燒友網報道(文/周凱揚)10年前谷歌作為互聯網巨頭,就已經嗅到了機器學習的潛力,尤其是在深度神經網絡(DNN)模型上。就拿語音識別這樣的功能來說,如果要考慮到1億安卓用戶每天和手機對話三分鐘這樣的高并發情況,單單只靠CPU的話,他們需要將現有數據中心的規模擴大至兩倍,才能滿足DNN推理的要求。

但擴建數據中心是一個投入極高的工作,于是他們考慮用定制的特定域架構的硬件來減少完成推理任務的總擁有成本,而且又要能運行已經為CPU和GPU開發的應用。谷歌在2014年開啟了TPUv1的項目,15個月后,全新的TPU硬件就已經應用到了谷歌的數據中心里,連帶架構、編譯器、測試和部署都全部更新了一遍。

那時GPU在推理這塊的性能也還是超過CPU的,但TPU的出現改變了這個格局。與當時英特爾的Haswell CPU相比,TPUv1的能耗比有了80倍的提升,相較當時的英偉達Tesla K80 GPU,其能耗比也高達它的30倍。

8da5c3c4-33b8-11ed-ba43-dac502259ad0.png

每代TPU的性能指標 / 谷歌

谷歌此舉引爆了整個市場,大家發現了還有除了CPU、GPU之外的方案。英特爾察覺后也收購了一系列深度學習DSA芯片公司,比如Nervana、Movidius、Mobileye和Habana。谷歌在云服務上的競爭對手們,阿里巴巴和亞馬遜也開始打造自己的推理、訓練芯片。能耗比之戰下,大家很快也意識到機器學習帶來的碳足跡成了下一個急需解決的問題。

碳足跡的反噬

根據去年在IEEE Spectrum上發布的《深度學習受益遞減》一文中提到,隨著機器學習的發展,到了2025年,最強的深度學習系統在ImageNet數據集中進行物體識別時,錯誤率最高只有5%。但訓練這樣一個系統所需要的算力和能耗都是龐大的,更糟糕的是,其排放的二氧化碳將是紐約市一整個月的排放量。

機器學習的碳排放可以被分為兩種,一種是運營排放,也就是數據中心在運行機器學習硬件中產生的碳排放;第二種是整個生命周期內的排放,不僅包含運營排放,還包含了各個環節的碳排放,比如芯片制造、數據中心建造等等。考慮到后者涉及更加復雜的研究,所以大部分碳足跡的研究都集中在運營排放上。

至于如何記錄碳排放,這也很簡單,只需要將訓練/推理的時長x處理器數量x每個處理器的平均功耗x PUE x 每千瓦時的二氧化碳排放即可。除了最后一項參數需要從數據中心那獲取外,其他的數據基本都是公開,或取決于機器學習研究者自己的選擇。

如何減少機器學習的碳足跡圖靈獎得主、谷歌杰出工程師David Patterson教授對現有的機器學習的研究和工作提出了以下幾點建議。首先,從模型開始著手,機器學習研究者需要繼續開發效率更高的模型,比如谷歌去年發布的GLaM通用稀疏語言模型,相較GPT-3,它多出了7倍的參數,在自然語言推理等任務上都要優于GPT-3。但同樣重要的是它的能耗和碳足跡指標,根據谷歌公布的數據,與使用V100的GPT-3相比,使用TPUv4的GLaM二氧化碳排放減少了14倍,可見模型對于碳足跡的影響。其次,在發布新模型的時候,他建議也把能耗和碳足跡這樣的數據公開,這樣有助于促進機器學習模型在質量上的良性競爭。

接著是硬件,他指出我們需要像TPUv4或者A100 GPU等,這類機器學習能效比更高的硬件。其實這一點反倒是最不需要擔心的,這幾乎是每個初創AI芯片公司都在嘗試的做法,即便在峰值上不敵這些硬件,也絕對會在能效比上盡可能做大極致。

8de675fe-33b8-11ed-ba43-dac502259ad0.png

全球大規模數據中心的平均PUE / Uptime Institute

還有就是常見的能效衡量指標PUE,大型機器學習負載往往要在數據中心上運行,而要讓數據中心的PUE接近1并不是一件簡單的事。根據Uptime Institute的統計,各家廠商旗下最大數據中心的年度PUE為1.57,就連我國工信部印發的《新型數據中心發展三年行動計劃(2021-2023)》中提出的最終目標也只是將新建大型數據中心PUE降低至1.3以下。但好在新建的數據中心往往都不會只滿足于這個目標,而是往1.1乃至1.06這樣的指標推進。

可這個指標并不是一個死數據,隨著負載和用量的變動,PUE是在持續波動的,不少數據中心僅僅在建成時發布了能效指標,之后就再未公布過任何數據了。在這塊做得最好的也還是谷歌,谷歌每年都會發布年度能效報告,將各個數據中心每個季度的PUE公布出來。

不過僅僅只有極低的PUE只能體現出高能耗比,David Patterson教授認為還必須一并公布每個地區數據中心的清潔能源占比。比如阿里巴巴首次發布的《2022阿里巴巴環境、社會和治理報告》中就提到了2021年,阿里巴巴在中國企業可再生能源購買者中排名第一,2022財年阿里云21.6%的電力來自清潔能源。

在雙碳目標的提出下,我國其實已經落實到了機器學習的硬件上,但在軟件和碳足跡透明度這方面還有可以改善的空間。機器學習要想做到消耗更低的算力來實現更優的效果,就必須從各個環節做到節能減排。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10901

    瀏覽量

    212708
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101054
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    132953

原文標題:機器學習的雙碳目標

文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    嵌入式機器學習的應用特性與軟件開發環境

    設備和智能傳感器)上,這些設備通常具有有限的計算能力、存儲空間和功耗。本文將您介紹嵌入式機器學習的應用特性,以及常見的機器學習開發軟件與開發環境。 嵌入式
    的頭像 發表于 01-25 17:05 ?111次閱讀
    嵌入式<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的應用特性與軟件開發環境

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優勢,逐漸成為企業構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發表于 12-25 11:54 ?144次閱讀

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    醫療領域,手術輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用大模型優化手術路徑規劃。工業場景中,協作機器人面臨的主要挑戰是快速適應新工藝流程。具身智能通過在線學習
    發表于 12-24 15:03

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發表于 11-16 01:07 ?489次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    具身智能與機器學習的關系

    (如機器人、虛擬代理等)通過與物理世界或虛擬環境的交互來獲得、發展和應用智能的能力。這種智能不僅包括認知和推理能力,還包括感知、運動控制和環境適應能力。具身智能強調智能體的身體和環境在智能發展中的重要性。 2. 機器
    的頭像 發表于 10-27 10:33 ?474次閱讀

    深度學習編譯器和推理引擎的區別

    深度學習編譯器和推理引擎在人工智能領域中都扮演著至關重要的角色,但它們各自的功能、應用場景以及優化目標等方面存在顯著的差異。以下是對兩者區別的詳細探討。
    的頭像 發表于 07-17 18:12 ?1329次閱讀

    深度神經網絡(DNN)架構解析與優化策略

    深度神經網絡(Deep Neural Network, DNN)作為機器學習領域中的一種重要技術,以其強大的特征學習能力和非線性建模能力,在多個領域取得了顯著成果。
    的頭像 發表于 07-09 11:00 ?2126次閱讀

    滿足GMSL靜電防護要求的方案

    滿足GMSL靜電防護要求的方案
    的頭像 發表于 07-09 08:02 ?474次閱讀
    <b class='flag-5'>滿足</b>GMSL靜電防護<b class='flag-5'>要求</b>的方案

    BP神經網絡屬于DNN

    屬于。BP神經網絡(Backpropagation Neural Network)是一種基于誤差反向傳播算法的多層前饋神經網絡,是深度學習(Deep Learning)領域中非常重要的一種模型。而
    的頭像 發表于 07-03 10:18 ?846次閱讀

    機器學習在數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求機器學習作為一種強大的工具,通過訓練模型從數據中學習規律,為企業和組織提供了更高效、更準確的數據分析能力。本文將深入
    的頭像 發表于 07-02 11:22 ?762次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?1511次閱讀

    請問PSoC? Creator IDE可以支持IMAGIMOB機器學習嗎?

    。 我發現IMAGIMOB 是一個很好的解決方案來滿足我的需求,但現在的問題是, PSoC? Creator 不支持 IMAGIMOB! PSoC? Creator 可以支持機器學習或 IMAGIMOB 嗎?
    發表于 05-20 08:06

    機器學習(ML)推理主要計算之存內計算芯片

    機器學習(ML)應用已經在汽車、醫療保健、金融和技術等各個領域變得無處不在。這導致對高性能、高能效 ML 硬件解決方案的需求不斷增加。
    發表于 04-07 10:48 ?1310次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>(ML)<b class='flag-5'>推理</b>主要計算之存內計算芯片

    基于FPGA進行DNN設計的經驗總結

    DNN中應用最廣泛的是CNN和RNN,CNN是一種卷積網絡,在圖片識別分類中用的較多,RNN可以處理時間序列的信息,比如視頻識別和語音識別。
    發表于 04-07 10:23 ?613次閱讀
    基于FPGA進行<b class='flag-5'>DNN</b>設計的經驗總結

    基于OpenCV DNN實現YOLOv8的模型部署與推理演示

    基于OpenCV DNN實現YOLOv8推理的好處就是一套代碼就可以部署在Windows10系統、烏班圖系統、Jetson的Jetpack系統
    的頭像 發表于 03-01 15:52 ?1835次閱讀
    基于OpenCV <b class='flag-5'>DNN</b>實現YOLOv8的模型部署與<b class='flag-5'>推理</b>演示
    主站蜘蛛池模板: 语文老师扒开胸罩喂我奶 | 午夜视频在线网站 | 野花香在线观看免费观看大全动漫 | 和尚扒开双腿蹂躏 | 极品美女穴| 青青草国产精品 | 国产亚洲精品久久孕妇呦呦你懂 | 国产精品搬运 | 欧美三级黄色大片 | 亚洲伦理精品久久 | 亚洲 自拍 欧洲 视频二区 | 久久亚洲精品成人 | 午夜性伦鲁啊鲁免费视频 | 国产午夜精品一区二区理论影院 | 久久久久久电影 | 成年免费大片黄在线观看岛国 | 9久久99久久久精品齐齐综合色圆 | 亚洲精品第一综合99久久 | 亚洲成人免费看 | 国产人妻人伦精品98 | 久久久久久久久免费视频 | 欧美无码专区 | 国产毛多水多高潮高清 | 玉娇龙续集春雪瓶txt免费阅读 | 啊灬啊别停灬用力啊老师 | 俄罗斯老妇女BBXX | WWW久久只有这里有精品 | 久草精品视频 | 国产成人女人在线视频观看 | 97国内精品久久久久久久影视 | 999zyz色资源站在线观看 | 免费女人光着全身网站 | 又粗又大又爽又黄的免费视频 | 最近中文字幕在线中文高清版 | 四房播播最新地址 | 国产高潮国产高潮久久久久久 | 能看的黄页最新网站 | 偷拍国产精品在线播放 | 国产 欧美 亚洲 日韩视频 | 交换邻居波多野结衣中文字幕 | 男同志video最新猛男 |