色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

HugeCTR系列第2部分:訓練大型深度學習推薦模型

星星科技指導員 ? 來源:NVIDIA ? 作者:Vinh Nguyen ? 2022-04-02 14:30 ? 次閱讀

在 Merlin HugeCTR 博文系列的第一部分,我們討論了訓練大型深度學習推薦系統所面臨的挑戰,以及 HugeCTR 如何解決這些問題。

深度學習推薦系統可能包含超大型嵌入表,這些嵌入表可能會超出主機或 GPU 顯存。

我們專為推薦系統設計了 HugeCTR。

這是一個專門用于在 GPU 上訓練和部署大型推薦系統的框架。

它為在多個 GPU 或節點上分配單個嵌入表提供了不同的策略。

HugeCTR 是 NVIDIA Merlin] 的主要訓練引擎,后者是一種 GPU 加速框架,旨在為推薦系統工作提供一站式服務,從數據準備、特征工程、多 GPU 訓練到本地或云中的生產級推理。

訓練性能和可擴展性一直是 HugeCTR 的突出特性,為 MLPerf 訓練 v0.7 推薦任務中的 NVIDIA 獲獎作品提供支持,但我們近期采納了早期采用者和客戶的反饋,以幫助改進易用性。

這篇博文將著重討論我們在易用性方面的持續承諾和近期改進。

HugeCTR 是一種定制的深度學習框架,使用 CUDA C++ 編寫,專用于推薦系統。

起初,超參數和神經網絡架構在 JSON 配置中定義,然后通過命令行接口執行。

近期,我們添加了 Python API,使其更易于使用。

表 1 匯總了命令行和 Python API 之間的主要區別。

我們建議使用 Python API,并將在后面部分中重點介紹。

但是,如果您對命令行界面感興趣,可以在此處找到一些示例。

表 1:HugeCTR 接口比較。

直接從 Python 配置和訓練 HugeCTR

自 v2.3 版本起,HugeCTR 開始提供易于使用的 Python 接口,用于定義模型架構、超參數、數據加載程序以及訓練循環。

此接口使 HugeCTR 更接近于數據科學 Python 生態系統和實踐。

利用此接口的方法有兩種:

1. 類似于 Keras 的高級 Python API

HugeCTR 現在提供了一個類似 Keras 的高級 Python API 套件,用于定義模型、層、優化器和執行訓練。

下文提供了一個示例代碼段。

如下所示,此 API 模擬熱門的 Keras 構建-編譯-適應范式。

2. 低級 Python API

HugeCTR 低級 Python API 允許從 JSON 文件讀取模型定義和優化器配置,從而提供向后兼容性。

此外,此 API 允許使用 Python 循環不斷手動執行訓練,從而獲得對訓練的精細控制。

在本博客的動手實踐部分中,我們將詳細介紹如何使用此 API 基于兩個數據集訓練模型。

我們將在以下示例中演示此 API。

使用預訓練的 HugeCTR 模型進行預測

隨著 v3.0 版本的發布,HugeCTR 增加了對基于 GPU 的推理的支持,可生成許多批次的預測。

HugeCTR 將參數服務器、嵌入緩存和推理會話分離開來,以便更好地管理資源以及更有效地利用 GPU。

參數服務器用于加載和管理嵌入表。

對于超過 GPU 顯存的嵌入表,參數服務器將嵌入表存儲在 CPU 內存上。

嵌入緩存為模型提供嵌入查找服務。活動嵌入條目存儲在 GPU 顯存上,以便快速查找。

推理會話將這兩者與模型權重和其他參數結合起來,以執行前向傳播。

下文提供了初始化 HugeCTR 推理的函數調用序列示例。

我們將使用 config_file、embedding_cache 和 parameter_server 初始化 InferenceSession。

HugeCTR Python 推理 API 需要一個 JSON 格式的推理配置文件,該文件類似于訓練配置 JSON。

但是,在添加推理子句時,我們需要省略優化器和求解器子句。

我們還需要將輸出層更改為 Sigmoid 類型。

推理子句中的 dense_model_file 和 sparse_model_file 參數應設置為指向由 HugeCTR 訓練的模型文件(_dense_xxxx.model 和 0_sparse_xxxx.model)。

我們在 Github 存儲庫中提供了多個完整示例:電子商務行為數據集和 Microsoft 新聞數據集。

我們一起來看一些示例

我們在 Github 存儲庫中提供了 HugeCTR API 的多個端到端示例。這些筆記本基于實際數據集和應用領域提供了完整的 Merlin 演練,從數據下載、預處理和特征工程到模型訓練和推理。

1. 高級 Python API 與 Criteo 數據集

Criteo 1TB Click Logs 數據集是公開可用于推薦系統的大型數據集。

它包含約 40 億個示例的 1.3TB 未壓縮點擊日志。

在我們的示例中,數據集使用 Pandas 或 NVTabular 進行預處理,以規范化連續特征,并對分類特征進行分類。

之后,我們使用 HugeCTR 的高級 API 訓練深度和交叉神經網絡架構。

首先,我們定義求解器和優化器,以使用它初始化 HugeCTR 模型。

然后,我們可以逐層添加,這類似于 TensorFlow Keras API。

最后,我們只需要調用 .fit() 函數。

2. 低級 Python API 與電子商務行為數據集

在此演示筆記本中,我們將使用 REES46 營銷平臺中的多品類商店的電子商務行為數據[/u]作為我們的數據集。

此筆記本基于 RecSys 2020 大會上的 NVIDIA 教程構建而成。

我們使用 NVTabular 進行特征工程和預處理,并使用 HugeCTR 訓練 Facebook 深度學習推薦系統模型 (DLRM)。

我們針對 Criteo 點擊日志數據集改編了一個示例 Json 配置文件。

需要編輯以與此數據集匹配的幾個參數為:

slot_size_array:分類變量的基數,可以從 NVTabular 工作流程對象獲取。

dense_dim:密集特征的數量

slot_num:分類變量的數量

以下 Python 代碼會按批執行參數更新。

同樣,我們針對 Microsoft 新聞數據集提供了第 2 個示例。

嘗試使用 HugeCTR 的命令行和 Python API 訓練推薦系統管線

我們致力于提供用戶友好且易于使用的體驗,以簡化推薦系統工作流程。

我們近期根據早期采用者和客戶的反饋對 HugeCTR 接口進行了改進。

HugeCTR Github 存儲庫提供了有關如何基于多個公共數據集(從小型到大型數據集都包含在內)使用此新接口的示例。

我們想邀請您針對您自己的領域改編這些示例,并見證 Merlin 的處理能力。

和往常一樣,我們希望通過 Github 以及其他渠道獲得您的反饋。

這是我們 HugeCTR 系列中關于“使用 HugeCTR 的新 API 訓練大型深度學習推薦系統模型”的第二篇博文。

下一篇博文將討論如何部署到生產。

關于作者

Vinh Nguyen 是一位深度學習的工程師和數據科學家,發表了 50 多篇科學文章,引文超過 2500 篇。在 NVIDIA ,他的工作涉及廣泛的深度學習和人工智能應用,包括語音、語言和視覺處理以及推薦系統。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5072

    瀏覽量

    103507
  • API
    API
    +關注

    關注

    2

    文章

    1509

    瀏覽量

    62263
  • 深度學習
    +關注

    關注

    73

    文章

    5511

    瀏覽量

    121392
收藏 人收藏

    評論

    相關推薦

    智能網聯汽車云控系統2部分:車云數據交互規范

    智能網聯汽車云控系統 2部分 車云數據交互規范
    發表于 11-18 15:04 ?0次下載

    AI大模型深度學習的關系

    人類的學習過程,實現對復雜數據的學習和識別。AI大模型則是指模型的參數數量巨大,需要龐大的計算資源來進行訓練和推理。
    的頭像 發表于 10-23 15:25 ?1076次閱讀

    直播預約 |數據智能系列講座4期:預訓練的基礎模型下的持續學習

    鷺島論壇數據智能系列講座4期「預訓練的基礎模型下的持續學習」10月30日(周三)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息
    的頭像 發表于 10-18 08:09 ?253次閱讀
    直播預約 |數據智能<b class='flag-5'>系列</b>講座<b class='flag-5'>第</b>4期:預<b class='flag-5'>訓練</b>的基礎<b class='flag-5'>模型</b>下的持續<b class='flag-5'>學習</b>

    優化多相穩壓器的高端FET電壓振鈴(2部分)

    電子發燒友網站提供《優化多相穩壓器的高端FET電壓振鈴(2部分).pdf》資料免費下載
    發表于 09-25 10:12 ?0次下載
    優化多相穩壓器的高端FET電壓振鈴(<b class='flag-5'>第</b><b class='flag-5'>2</b><b class='flag-5'>部分</b>)

    如何進行電源設計–2部分

    電子發燒友網站提供《如何進行電源設計–2部分.pdf》資料免費下載
    發表于 09-07 11:09 ?0次下載
    如何進行電源設計–<b class='flag-5'>第</b><b class='flag-5'>2</b><b class='flag-5'>部分</b>

    電源設計方法-5部分

    電子發燒友網站提供《電源設計方法-5部分.pdf》資料免費下載
    發表于 09-06 14:58 ?0次下載
    電源設計方法-<b class='flag-5'>第</b>5<b class='flag-5'>部分</b>

    電源設計方法-6部分

    電子發燒友網站提供《電源設計方法-6部分.pdf》資料免費下載
    發表于 09-06 14:57 ?0次下載
    電源設計方法-<b class='flag-5'>第</b>6<b class='flag-5'>部分</b>

    電源設計方法-3部分

    電子發燒友網站提供《電源設計方法-3部分.pdf》資料免費下載
    發表于 09-06 14:56 ?0次下載
    電源設計方法-<b class='flag-5'>第</b>3<b class='flag-5'>部分</b>

    電源設計方法-2部分

    電子發燒友網站提供《電源設計方法-2部分.pdf》資料免費下載
    發表于 09-06 11:42 ?1次下載
    電源設計方法-<b class='flag-5'>第</b><b class='flag-5'>2</b><b class='flag-5'>部分</b>

    電源設計方法-1部分

    電子發燒友網站提供《電源設計方法-1部分.pdf》資料免費下載
    發表于 09-06 11:40 ?0次下載
    電源設計方法-<b class='flag-5'>第</b>1<b class='flag-5'>部分</b>

    電源設計方法-4部分

    電子發燒友網站提供《電源設計方法-4部分.pdf》資料免費下載
    發表于 09-06 11:39 ?0次下載
    電源設計方法-<b class='flag-5'>第</b>4<b class='flag-5'>部分</b>

    深度學習模型中的過擬合與正則化

    測試數據或新數據上表現不佳的現象。為了解決這個問題,正則化(Regularization)技術應運而生,成為深度學習中不可或缺的一部分。本文將從過擬合的原因、表現、正則化的原理、方法及其在深度
    的頭像 發表于 07-09 15:56 ?1087次閱讀

    llm模型訓練一般用什么系統

    。 硬件系統 1.1 GPU(圖形處理器) 在訓練大型語言模型時,GPU是首選的硬件設備。相比于CPU,GPU具有更高的并行處理能力,可以顯著提高訓練速度。目前,NVIDIA的Tesl
    的頭像 發表于 07-09 10:02 ?473次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復雜且關鍵的過程,它涉及大量的數據、計算資源和精心設計的算法。訓練一個深度
    的頭像 發表于 07-01 16:13 ?1441次閱讀

    如何優化深度學習模型?

    因為大部分人使用的模型都是預訓練模型,使用的權重都是在大型數據集上訓練好的
    發表于 01-29 14:25 ?2939次閱讀
    如何優化<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>?
    主站蜘蛛池模板: 国产真实夫妇交换视频| www.久艹| 涩涩999| 男女牲交大战免费播放| 久久无码人妻AV精品一区| 精品含羞草免费视频观看| 国产亚洲人成网站在线观看播放| 久久影院一区| 女同给老师下媚药| 涩涩999| 97精品国产高清在线看入口 | 国产一区二区三区影院| 欧美00后rapper潮水| 伊久久| 99pao成人国产永久免费视频| www.av天堂网.com| 两性午夜刺激爽爽视频| 亲爱的妈妈6韩国电影免费观看 | 国产午夜在线观看视频 | 成人免费无毒在线观看网站| 国产精品人妻无码久久久2022| 国产小视频国产精品| 日韩精品 电影一区 亚洲高清| 性女传奇快播| 一级毛片视频免费| 国产精品一区二区在线播放| 久久超碰色中文字幕| 欧美色妞AV重囗味视频| 小sao货水好多真紧h的视频| 处女座历史名人| 久草免费视频在线观看| 青青操久久| 97精品视频| 美女撒尿无遮挡免费中国| 玩弄朋友娇妻呻吟交换电影| 亚洲中文字幕一二三四区苍井空| 97精品国产亚洲AV超碰| 巨污全肉np一女多男| 优优色影院| 国产人妻人伦精品836700| 久久久视频2019午夜福利|