色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google Brain和DeepMind聯(lián)手發(fā)布可以分布式訓(xùn)練模型的框架

中科院長(zhǎng)春光機(jī)所 ? 來源:reddit ? 作者:reddit ? 2021-06-26 15:42 ? 次閱讀

【導(dǎo)讀】AI模型進(jìn)入大數(shù)據(jù)時(shí)代,單機(jī)早已不能滿足訓(xùn)練模型的要求,最近Google Brain和DeepMind聯(lián)手發(fā)布了一個(gè)可以分布式訓(xùn)練模型的框架Launchpad,堪稱AI界的MapReduce。

正如吳恩達(dá)所言,當(dāng)代機(jī)器學(xué)習(xí)算法的成功很大程度上是由于模型和數(shù)據(jù)集大小的增加,在大規(guī)模數(shù)據(jù)下進(jìn)行分布式訓(xùn)練也逐漸變得普遍,而如何在大規(guī)模數(shù)據(jù)、大模型的情況下進(jìn)行計(jì)算,還是一個(gè)挑戰(zhàn)。

分布式學(xué)習(xí)過程也會(huì)使實(shí)現(xiàn)過程復(fù)雜化,這對(duì)于許多不熟悉分布式系統(tǒng)機(jī)制的機(jī)器學(xué)習(xí)從業(yè)者來說是個(gè)問題,尤其是那些具有復(fù)雜通信拓?fù)浣Y(jié)構(gòu)的機(jī)器學(xué)習(xí)從業(yè)者。

在arxiv上一篇新論文中,來自 DeepMind 和 Google Brain 的研究團(tuán)隊(duì)用 Launchpad 解決了這個(gè)問題,Launchpad 是一種編程模型,它簡(jiǎn)化了定義和啟動(dòng)分布式計(jì)算實(shí)例的過程。

論文的第一作者是來自DeepMind的華人Yang Fan,畢業(yè)于香港中文大學(xué)。

Launchpad 將分布式系統(tǒng)的拓?fù)涿枋鰹橐粋€(gè)圖形數(shù)據(jù)結(jié)構(gòu),這樣圖中的每個(gè)節(jié)點(diǎn)都代表一個(gè)服務(wù),即研究人員正在運(yùn)行的基本計(jì)算單元。

將句柄構(gòu)造為節(jié)點(diǎn)的引用,將客戶端表示為尚未構(gòu)造的服務(wù)。

圖的邊表示兩個(gè)服務(wù)之間的通信,并在構(gòu)建時(shí)將與一個(gè)節(jié)點(diǎn)相關(guān)聯(lián)的句柄給予另一個(gè)節(jié)點(diǎn)時(shí)創(chuàng)建。

通過這種方式,Launchpad 可以通過傳遞節(jié)點(diǎn)句柄來定義跨服務(wù)通信。Launchpad 的計(jì)算構(gòu)建塊由不同的服務(wù)類型表示,每種服務(wù)類型由特定于該類型的節(jié)點(diǎn)和句柄類表示。

8bf59634-d5af-11eb-9e57-12bb97331649.png

論文中提出的 Launchpad 的生命周期可以分為三個(gè)階段: 設(shè)置、啟動(dòng)和執(zhí)行。設(shè)置階段構(gòu)造程序數(shù)據(jù)結(jié)構(gòu); 在啟動(dòng)階段,處理這個(gè)數(shù)據(jù)結(jié)構(gòu)以分配資源、地址等,并啟動(dòng)指定服務(wù); 然后執(zhí)行階段運(yùn)行服務(wù),例如為服務(wù)通信創(chuàng)建客戶端。

Launchpad 是用流行的編程語言 Python 實(shí)現(xiàn)的,它簡(jiǎn)化了定義程序和節(jié)點(diǎn)數(shù)據(jù)結(jié)構(gòu)以及為單個(gè)平臺(tái)啟動(dòng)的過程。Launchpad 框架還可以很容易地用任何其他宿主語言實(shí)現(xiàn),包括 c/c + + 等低級(jí)編程語言。

8cd0f1fc-d5af-11eb-9e57-12bb97331649.png

Launchpad 編程模型非常豐富,足以容納各種各樣的分布式系統(tǒng),包括參數(shù)服務(wù)器、 MapReduce和 Evolution Strategies。

研究人員用簡(jiǎn)潔的代碼詳細(xì)描述了如何將 Launchpad 應(yīng)用到這些常見的分布式系統(tǒng)范例中,并說明了該框架在簡(jiǎn)化本研究領(lǐng)域常用機(jī)器學(xué)習(xí)算法和組件的設(shè)計(jì)過程方面的能力。

總的來說,Launchpad 是一個(gè)實(shí)用的、用戶友好的、表達(dá)性強(qiáng)的框架,用于機(jī)器學(xué)習(xí)研究人員和實(shí)踐者詳細(xì)說明分布式系統(tǒng),作者表示,這個(gè)框架能夠處理日益復(fù)雜的機(jī)器學(xué)習(xí)模型。其他框架

2020年,DeepMind 發(fā)布過一個(gè)強(qiáng)化學(xué)習(xí)優(yōu)化框架Acme,可以讓AI驅(qū)動(dòng)的智能體在不同的執(zhí)行規(guī)模上運(yùn)行,從而簡(jiǎn)化強(qiáng)化學(xué)習(xí)算法的開發(fā)過程。

強(qiáng)化學(xué)習(xí)可以讓智能體與環(huán)境互動(dòng),生成他們自己的訓(xùn)練數(shù)據(jù),這在電子游戲、機(jī)器人技術(shù)、自動(dòng)駕駛機(jī)器人出租車等領(lǐng)域取得了突破。

隨著所使用的訓(xùn)練數(shù)據(jù)量的增加,這促使設(shè)計(jì)了一個(gè)系統(tǒng),使智能體與環(huán)境實(shí)例相互作用,迅速積累經(jīng)驗(yàn)。DeepMind 斷言,將算法的單進(jìn)程原型擴(kuò)展到分布式系統(tǒng)通常需要重新實(shí)現(xiàn)相關(guān)的智能體,這就是 Acme 框架的用武之地。

DeepMind研究員寫道,「Acme 是一個(gè)用于構(gòu)建可讀、高效、面向研究的 RL 算法的框架。Acme 的核心是設(shè)計(jì)用于簡(jiǎn)單描述 RL 智能體,這些智能體可以在不同規(guī)模的執(zhí)行中運(yùn)行,包括分布式智能體。」

Determined AI也是一個(gè)深度學(xué)習(xí)神器。Determined使深度學(xué)習(xí)工程師可以集中精力大規(guī)模構(gòu)建和訓(xùn)練模型,而無需擔(dān)心DevOps,或者為常見任務(wù)(如容錯(cuò)或?qū)嶒?yàn)跟蹤)編寫代碼。更快的分布式訓(xùn)練,智能的超參優(yōu)化,實(shí)驗(yàn)跟蹤和可視化。

一萬億模型要來了?谷歌大腦和DeepMind聯(lián)手發(fā)布分布式訓(xùn)練框架Launchpad

Determined主要運(yùn)用了Horovod,以Horovod為起點(diǎn),研究人員運(yùn)用了多年的專業(yè)知識(shí)和經(jīng)驗(yàn),使得整個(gè)訓(xùn)練過程比庫(kù)存配置要快得多。

Horovod 是一套面向TensorFlow 的分布式訓(xùn)練框架,由Uber 構(gòu)建并開源,目前已經(jīng)運(yùn)行于Uber 的Michelangelo 機(jī)器學(xué)習(xí)即服務(wù)平臺(tái)上。Horovod 能夠簡(jiǎn)化并加速分布式深度學(xué)習(xí)項(xiàng)目的啟動(dòng)與運(yùn)行。當(dāng)數(shù)據(jù)較多或者模型較大時(shí),為提高機(jī)器學(xué)習(xí)模型訓(xùn)練效率,一般采用多 GPU 的分布式訓(xùn)練。TensorFlow 集群存在諸多缺點(diǎn),如概念太多、學(xué)習(xí)曲線陡峭、修改的代碼量大、性能損失較大等,而 Horovod 則讓深度學(xué)習(xí)變得更加美好,隨著規(guī)模增大,Horovod 性能基本是線性增加的,損失遠(yuǎn)小于 TensorFlow。

2019年,字節(jié)跳動(dòng)AI lab開源了一款高性能分布式框架BytePS,在性能上顛覆了過去幾年allreduce流派一直占據(jù)上風(fēng)的局面,超出目前其他所有分布式訓(xùn)練框架一倍以上的性能,且同時(shí)能夠支持Tensorflow、PyTorch、MXNet等開源庫(kù)。

BytePS 提供了 TensorFlow、PyTorch、 MXNet 以及Keras的插件,用戶只要在代碼中引用BytePS的插件,就可以獲得高性能的分布式訓(xùn)練。BytePS的核心邏輯,則實(shí)現(xiàn)在BytePS core里。具體的通信細(xì)節(jié),完全由BytePS完成,用戶完全不需要操心。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4754

    瀏覽量

    129085
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3371

    瀏覽量

    42584
  • 分布式
    +關(guān)注

    關(guān)注

    1

    文章

    911

    瀏覽量

    74566
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8428

    瀏覽量

    132807
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    13261
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    HarmonyOS Next 應(yīng)用元服務(wù)開發(fā)-分布式數(shù)據(jù)對(duì)象遷移數(shù)據(jù)權(quán)限與基礎(chǔ)數(shù)據(jù)

    使用分布式數(shù)據(jù)對(duì)象遷移數(shù)據(jù),當(dāng)需要遷移的數(shù)據(jù)較大(100KB以上)或需要遷移文件時(shí),可以使用分布式數(shù)據(jù)對(duì)象。原理與接口說明詳見分布式數(shù)據(jù)對(duì)象跨設(shè)備數(shù)據(jù)同步。 說明:自API 12起,由
    發(fā)表于 12-24 09:40

    大語言模型開發(fā)框架是什么

    大語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫(kù)。下面,AI部落小編為您介紹大語言模型開發(fā)
    的頭像 發(fā)表于 12-06 10:28 ?149次閱讀

    Google DeepMind發(fā)布Genie 2:打造交互3D虛擬世界

    在OpenAI宣布即將發(fā)布模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基礎(chǔ)世界模型——Genie 2。這款
    的頭像 發(fā)表于 12-05 14:16 ?540次閱讀

    分布式通信的原理和實(shí)現(xiàn)高效分布式通信背后的技術(shù)NVLink的演進(jìn)

    的大小已經(jīng)超出了單個(gè) GPU 的范圍。所以就需要實(shí)現(xiàn)跨多個(gè) GPU 的模型訓(xùn)練,這種訓(xùn)練方式就涉及到了分布式通信和 NVLink。 當(dāng)談及分布式
    的頭像 發(fā)表于 11-18 09:39 ?508次閱讀
    <b class='flag-5'>分布式</b>通信的原理和實(shí)現(xiàn)高效<b class='flag-5'>分布式</b>通信背后的技術(shù)NVLink的演進(jìn)

    分布式光纖測(cè)溫是什么?應(yīng)用領(lǐng)域是?

    時(shí),該處的散射光特性會(huì)受到影響。通過高速信號(hào)采集與數(shù)據(jù)處理技術(shù),可以準(zhǔn)確地定位發(fā)生溫度變化的位置,并給出實(shí)時(shí)的溫度信息。簡(jiǎn)而言之,分布式光纖測(cè)溫技術(shù)將整條傳輸光纖作為傳感器,光纖上的每一點(diǎn)都兼具“傳”和“感”
    的頭像 發(fā)表于 10-24 15:30 ?420次閱讀
    <b class='flag-5'>分布式</b>光纖測(cè)溫是什么?應(yīng)用領(lǐng)域是?

    NetApp與Google Cloud深化合作,強(qiáng)化分布式云存儲(chǔ)

    智能數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)導(dǎo)者NetApp?宣布,其與Google Cloud的戰(zhàn)略合作再升級(jí)。此次合作中,NetApp將統(tǒng)一數(shù)據(jù)存儲(chǔ)和智能服務(wù)融入Google Distributed Cloud架構(gòu),為分布式云基礎(chǔ)設(shè)施提供強(qiáng)大支撐。
    的頭像 發(fā)表于 10-11 17:21 ?515次閱讀

    分布式故障在線監(jiān)測(cè)|高精度技術(shù)選用 行波特征 故診模型

    輸電線路故障是電力系統(tǒng)中不可避免的問題,但通過深入分析其成因并采取有效的防范策略,我們可以最大限度地減少故障的發(fā)生,保障電網(wǎng)的安全穩(wěn)定運(yùn)行。以下是深圳鼎信智慧科技為您講述關(guān)于鼎信分布式故障在線監(jiān)測(cè)
    的頭像 發(fā)表于 10-11 12:00 ?119次閱讀

    摩爾線程攜手憨猴集團(tuán),深化AI算力戰(zhàn)略合作,成功實(shí)現(xiàn)大模型分布式訓(xùn)練

    摩爾線程與憨猴科技集團(tuán)日前宣布,采用搭載摩爾線程的夸娥(KUAE)千卡智算集群,已成功完成了多個(gè)大模型分布式訓(xùn)練,涵蓋7B、34B以及70B三個(gè)不同的計(jì)算規(guī)模等級(jí)。
    的頭像 發(fā)表于 05-17 17:24 ?699次閱讀

    浪潮信息發(fā)布AS13000G7-N系列分布式全閃存儲(chǔ)

    浪潮信息近日推出了專為大型AI模型優(yōu)化的AS13000G7-N系列分布式全閃存儲(chǔ)。該系列基于浪潮信息自研的分布式文件系統(tǒng),結(jié)合新一代數(shù)據(jù)加速引擎DataTurbo,為用戶提供卓越的存儲(chǔ)解決方案。
    的頭像 發(fā)表于 05-14 10:03 ?586次閱讀

    大語言模型:原理與工程時(shí)間+小白初識(shí)大語言模型

    分布式表示,基于預(yù)訓(xùn)練的詞嵌入表示。 獨(dú)熱表示就是在一個(gè)大的向量空間中,其中一個(gè)位1,其余都為0,這樣就會(huì)變成單獨(dú)的。 詞的分布式表示:根據(jù)上下文進(jìn)行推斷語義。 基于預(yù)訓(xùn)練的詞嵌入表
    發(fā)表于 05-12 23:57

    為大模型專門優(yōu)化 浪潮信息發(fā)布分布式全閃存儲(chǔ)AS13000G7-N系列

    北京2024年5月10日?/美通社/ -- 近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲(chǔ)AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統(tǒng),搭載新一代數(shù)據(jù)加速引擎
    的頭像 發(fā)表于 05-10 16:37 ?446次閱讀
    為大<b class='flag-5'>模型</b>專門優(yōu)化 浪潮信息<b class='flag-5'>發(fā)布</b><b class='flag-5'>分布式</b>全閃存儲(chǔ)AS13000G7-N系列

    浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲(chǔ)AS13000G7-N系列

    近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲(chǔ)AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統(tǒng),搭載新一代數(shù)據(jù)加速引擎DataTurbo,
    的頭像 發(fā)表于 05-08 09:38 ?581次閱讀
    浪潮信息<b class='flag-5'>發(fā)布</b>為大<b class='flag-5'>模型</b>專門優(yōu)化的<b class='flag-5'>分布式</b>全閃存儲(chǔ)AS13000G7-N系列

    【大語言模型:原理與工程實(shí)踐】大語言模型的預(yù)訓(xùn)練

    增長(zhǎng)。DeepMind在相關(guān)論文中指出,模型大小和訓(xùn)練Token數(shù)應(yīng)以相似速率增長(zhǎng),以確保最佳性能。因此,構(gòu)建與模型規(guī)模相匹配的預(yù)訓(xùn)練數(shù)據(jù)至
    發(fā)表于 05-07 17:10

    【大語言模型:原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

    概率推斷,利用共現(xiàn)矩陣學(xué)習(xí)每個(gè)詞的主題分布,進(jìn)而將其作為詞的表示向量。在大規(guī)模語料庫(kù)中進(jìn)行模型訓(xùn)練,使語義相似的詞具有相似的主題分布。然而,這類方法存在一個(gè)問題,即
    發(fā)表于 05-05 12:17

    鴻蒙OS 分布式任務(wù)調(diào)度

    鴻蒙OS 分布式任務(wù)調(diào)度概述 在 HarmonyO S中,分布式任務(wù)調(diào)度平臺(tái)對(duì)搭載 HarmonyOS 的多設(shè)備構(gòu)筑的“超級(jí)虛擬終端”提供統(tǒng)一的組件管理能力,為應(yīng)用定義統(tǒng)一的能力基線、接口
    的頭像 發(fā)表于 01-29 16:50 ?516次閱讀
    主站蜘蛛池模板: 亚洲娇小性色xxxx| 久久久久久久久人体| 国产啪精品视频网免费| 萝莉御姐被吸奶| 世界第一黄暴漫画家| 最近的2019中文字幕国语| 国产AV麻豆出品在线播放| 啦啦啦 中文 中国 免费 高清在线| 色99蜜臀AV无码| 91久久夜色精品| 精品无码日本蜜桃麻豆| 四虎免费影院| 背着老婆爆操性感小姨子| 久久天天躁狠狠躁夜夜呲| 亚洲国产高清视频在线观看| 爱情岛论坛网亚洲品质| 巨污全肉np一女多男| 亚洲大片免费观看| 国产99久久久国产精品成人| 青青久久久| 99热久久这里只精品国产WWW| 久久se精品一区二区国产| 亚洲 无码 制服 日韩| 成 人 色综合| 且试天下芒果免费观看| 97人妻AV天天澡夜夜爽| 久久免费黄色| 亚洲人精品午夜射精日韩| 国产午夜精品一区理论片飘花 | 中文字幕永久在线| 果冻传媒在线观看网站| 亚洲AV综合色一区二区三区| 国产精品久久久久久久久爆乳 | 国产真实夫妇交换视频| 午夜想想爱午夜剧场| 国产精品涩涩涩视频网站| 偷拍自偷拍亚洲精品| 国产精品观看视频免费完整版| 手机精品在线| 国产精品99久久久久久人韩国 | 538视频这里只有精品|