色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Magnum IO存儲的優點和實施

星星科技指導員 ? 來源:NVIDIA ? 作者:Magnum IO存儲的優點 ? 2022-04-10 11:14 ? 次閱讀

這是世界上第四個帖子加速 IO系列它解決了存儲問題,并與我們的合作伙伴分享了最近的成果和方向。我們將介紹新的 GPU 直接存儲版本、優點和實施。

加速計算需要加速 IO 。否則,計算資源就會缺乏數據??紤]到所有工作流程中數據存儲在內存中的比例正在減少,優化存儲 IO 變得越來越重要。存儲數據的價值、竊取或破壞數據的行為以及保護數據的法規要求也在不斷增加。為此,人們對數據中心基礎設施的需求日益增長,這些基礎設施可以為用戶提供更大程度的隔離,使其與不應訪問的數據隔離開來。

GPU 直接存儲

GPU 直接存儲簡化了存儲和 GPU 緩沖區之間的數據流,適用于在 GPU 上消費或生成數據而無需 CPU 處理的應用程序。不需要增加延遲和阻礙帶寬的額外拷貝。這種簡單的優化導致了改變游戲規則的角色轉換,數據可以更快地從遠程存儲(而不是 CPU 內存)饋送到 GPU s 。

GPU 直系親屬的最新成員

GPUDirect系列技術能夠訪問 GPU 并有效地將數據移入和移出 GPU 。直到最近,它還專注于內存到內存的傳輸。隨著 GPU 直接存儲(GDS)的添加,使用存儲的訪問和數據移動也加快了。 GPU 直接存儲使在本地和遠程存儲之間向 CUDA 添加文件IO邁出了重要的一步。

使用 CUDA 11 . 4 發布 v1 . 0

GPU 直接存儲經過兩年多的審查,目前可作為生產軟件使用。 GDS 以前僅通過單獨安裝提供,現在已并入 CUDA 11 . 4 版及更高版本,它可以是 CUDA 安裝的一部分,也可以單獨安裝。對于 CUDA 版本X-Y的安裝,libcufile-X-Y. so 用戶庫gds-tools-X-Y默認安裝,nvidia-fs.ko內核驅動程序是可選安裝。有關更多信息,請參閱 GDS故障排除和安裝文檔。

GDS 現在在RAPIDS中提供。它還有PyTorch 集裝箱和MXNet 容器兩種版本。

GDS 說明和好處

GPU 直接存儲啟用存儲和 GPU 內存之間的直接數據路徑。在本地 NVMe 驅動器或與遠程存儲器通信的 NIC 中,使用直接內存訪問( DMA )引擎移動數據。

使用該 DMA 引擎意味著,盡管 DMA 的設置是一個 CPU 操作, CPU 和 GPU 完全不涉及數據路徑,使它們自由且不受阻礙(圖 1 )。在左側,來自存儲器的數據通過 PCIe 交換機進入,通過 CPU 進入系統內存,然后一直返回 GPU 。在右側,數據路徑跳過 CPU 和系統內存。下面總結了這些好處。

poYBAGJSS7KAX48qAAC598A-Hdw189.png

無 GPU 直接存儲

受進出 CPU 的帶寬限制。導致 CPU 反彈緩沖區的延遲。內存容量限制為 0 ( 1TB )。存儲不是 CUDA 的一部分。沒有基于拓撲的優化。

poYBAGJSS7qAbdDwAAC2KIb_tSk617.png

使用 GPU 直接存儲

GPU 的帶寬僅受 NIC 限制。由于直接復制,延遲更低。訪問 O ( PB )容量。簡單的 CUDA 編程模型。通過 NVLink 、 GPU 緩沖區自適應路由。

圖 1 . GDS 軟件堆棧,其中應用程序使用 cuFile API ,啟用 GDS 的存儲驅動程序調用nvidia-fs.ko內核驅動程序以獲得正確的 DMA 地址。

GPU 直接存儲提供了三個基本的性能優勢:

增加帶寬:通過消除通過 CPU 中的反彈緩沖區的需要,在某些平臺上可以使用備用路徑,包括通過 PCIe 交換機或 NVLink 提供更高帶寬的平臺。雖然 DGX 平臺同時具有 PCIe 交換機和 NVLink ,但并非所有平臺都具有。我們建議使用這兩種方法來最大限度地提高性能。火星著陸器的例子實現了 8 倍的帶寬增益。

潛伏期縮短:通過 CPU 內存避免額外拷貝的延遲和管理內存的開銷(在極端情況下可能非常嚴重),從而減少延遲。延遲減少 3 倍是常見的。

CPU 利用率降低:使用跳出緩沖區會在 CPU 上引入額外的操作,以執行額外的復制和管理內存緩沖區。當 CPU 利用率成為瓶頸時,有效帶寬會顯著下降。我們測量了多個文件系統的 CPU 利用率提高了 3 倍。

沒有 GDS ,只有一條可用的數據路徑:從存儲器到 CPU ,從 CPU 到具有 CUDA Memcpy 的相關 GPU 。對于 GDS ,還有其他可用的優化:

用于與 DMA 引擎交互的 CPU 線程與最近的 CPU 內核密切相關。

如果存儲器和 GPU 掛斷不同的插槽,并且 NVLink 是可用的連接,則數據可通過存儲器附近的 GPU 內存中的快速反彈緩沖區暫存,然后使用 CUDA 傳輸到最終的 GPU 內存目標緩沖區。這可能比使用 intersocket 路徑(例如 UPI )快得多。

沒有cudaMemcpy參與分割 IO 傳輸,以適應 GPU BAR1 孔徑,其大小隨 GPU SKU 變化,或者在目標緩沖區未固定cuFileBufRegister的情況下,分割到預固定緩沖區。這些操作由libcufile.so用戶庫代碼管理。

處理未對齊的訪問,其中要傳輸的文件中的數據偏移量與頁面邊界不對齊。

在未來的GDS版本中,cuFileAPI將支持異步和批處理操作。這使得 CUDA 內核能夠在 CUDA 流中的讀取之后對其進行排序,該 CUDA 流為該內核提供輸入,并且在生成要寫入的數據的內核之后對寫入進行排序。隨著時間的推移,cuFileAPI也將在 CUDA 圖形的上下文中可用。

表 1 顯示了 NVIDIA DGX-2 和 DGX A100 系統的峰值和測量帶寬。該數據表明,在理想條件下,從本地存儲到 GPU s 的可實現帶寬超過了 CPU 內存的最大帶寬,最高可達 1 TB 。通常從 PB 級遠程內存測量的帶寬可能是 CPU 內存實際提供帶寬的兩倍以上。

將 GPU 內存中無法容納的數據溢出到甚至 PB 的遠程存儲中,可能會超過將其分頁回 CPU 內存中 1 TB 的可實現性能。這是歷史的一次顯著逆轉。

poYBAGJSS8SAL2CoAABEJucZIes746.png

表 1 .在帶寬超過 CPU 內存 1 TB 的情況下,可以訪問數 PB 的數據。

*此處顯示的 NVIDIA GPU 直接存儲在 NVIDIA DGX A100 插槽 0-3 和 6-9 上的性能數字不是官方支持的網絡配置,僅供實驗使用。為計算和存儲共享相同的網絡適配器可能會影響 NVIDIA 先前在 DGX A100 系統上發布的標準或其他基準測試的性能。

GDS 的工作原理

NVIDIA 尋求盡可能采用現有標準,并在必要時明智地擴展這些標準。 POSIX 標準的pread和pwrite提供了存儲和 CPU 緩沖區之間的拷貝,但尚未啟用到 GPU 緩沖區的拷貝。隨著時間的推移, Linux 內核中不支持 GPU 緩沖區的缺點將得到解決。

一種稱為 dma _ buf 的解決方案正在進行中,該解決方案支持 NIC 或 NVMe 和 GPU 等設備之間的拷貝,它們是 PCIe 總線上的對等設備,以解決這一差距。同時, GDS 帶來的性能提升太大,無法等待上游解決方案傳播到所有用戶。多種供應商提供了支持 GDS 的替代解決方案,包括 MLNX _ OFED (表 2 )。 GDS 解決方案涉及與 POSIXpread和pwrite類似的新 APIcuFileRead或cuFileWrite。

動態路由、 NVLink 的使用以及 CUDA 流中使用的異步 API (僅可從 GDS 獲得)等優化使cuFileAPI 成為 CUDA 編程模型的持久特性,即使在 Linux 文件系統中的漏洞得到解決之后也是如此。

以下是GDS實現的功能。首先,當前Linux實現的基本問題是通過虛擬文件系統(VFS)向下傳遞 GPU 緩沖區地址作為DMA目標,以便本地NVMe或網絡適配器中的DMA引擎可以執行到 GPU 內存或從 GPU 內存的傳輸。這會導致出現錯誤情況。我們現在有辦法解決這個問題:在 CPU 內存中傳遞一個緩沖區地址。

當使用cuFileAPI (如cuFileRead或cuFileWrite)時,libcufile。因此,用戶級庫捕獲 GPU 緩沖區地址,并替換傳遞給 VFS 的代理 CPU 緩沖區地址。就在緩沖區地址用于 DMA 之前,啟用 GDS 的驅動程序對nvidia-fs.ko的調用識別 CPU 緩沖區地址,并再次提供替代 GPU 緩沖區地址,以便 DMA 可以正確進行。

libcufile.so中的邏輯執行前面描述的各種優化,如動態路由、預固定緩沖區的使用和對齊。圖 2 顯示了用于此優化的堆棧。cuFileAPI 是 Magnum IO 靈活抽象體系結構原則的一個示例,它支持特定于平臺的創新和優化,如選擇性緩沖和 NVLink 的使用。

pYYBAGJSS8yAc0sYAADSNoYO8SA949.png

圖 2 . GDS 軟件堆棧,其中應用程序使用 cuFile API ,啟用 GDS 的存儲驅動程序調用 NVIDIA -fs . ko 內核驅動程序以獲得正確的 DMA 地址。

關于作者

CJ Newburn 是 NVIDIA 計算軟件組的首席架構師,他領導 HPC 戰略和軟件產品路線圖,特別關注系統和規模編程模型。 CJ 是 Magnum IO 的架構師和 GPU Direct Storage 的聯合架構師,與能源部領導 Summit Dev 系列產品,并領導 HPC 容器咨詢委員會。在過去的 20 年里, CJ 為硬件和軟件技術做出了貢獻,擁有 100 多項專利。他是一個社區建設者,熱衷于將硬件和軟件平臺的核心功能從 HPC 擴展到 AI 、數據科學和可視化。在卡內基梅隆大學獲得博士學位之前, CJ 曾在幾家初創公司工作過,致力于語音識別器和 VLIW 超級計算機。他很高興能為他媽媽使用的批量產品工作。

Kiran K. Modukuri 是 NVIDIA 的首席軟件工程師,負責加速 IO 管道。他是 GPU 直接存儲產品的聯合架構師。在加入 NVIDIA 之前,他曾在 NetApp 擔任高級軟件工程師。他在亞利桑那大學獲得了計算機科學碩士學位。他在分布式文件系統和存儲技術方面擁有超過 15 年的經驗。

Kushal Datta 是 Magnum IO 的產品負責人,專注于加速多 GPU 系統上的 AI 、數據分析和 HPC 應用程序。他的興趣包括創建新的工具和方法,以提高復雜人工智能和大規模系統上的科學應用的總掛鐘時間。他發表了 20 多篇學術論文、多篇白皮書和博客文章。他擁有五項美國專利。他在北卡羅來納大學夏洛特分校獲得歐洲經委會博士學位,并在印度賈達夫普爾大學獲得計算機科學學士學位。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5024

    瀏覽量

    103265
  • 計算機
    +關注

    關注

    19

    文章

    7520

    瀏覽量

    88223
  • AI
    AI
    +關注

    關注

    87

    文章

    31154

    瀏覽量

    269481
收藏 人收藏

    評論

    相關推薦

    λ-IO:存儲計算下的IO棧設計

    動機和背景? ? 存儲計算存儲資源的充分利用。IO棧是管理存儲器的的基本組件,包括設備驅動、塊接口層、文件系統,目前一些用戶空間IO庫(如S
    的頭像 發表于 12-02 10:35 ?219次閱讀
    λ-<b class='flag-5'>IO</b>:<b class='flag-5'>存儲</b>計算下的<b class='flag-5'>IO</b>棧設計

    一文解讀Linux 5種IO模型

    Linux里有五種IO模型:阻塞IO、非阻塞IO、多路復用IO、信號驅動式IO和異步IO,我發現
    的頭像 發表于 11-09 11:12 ?351次閱讀
    一文解讀Linux 5種<b class='flag-5'>IO</b>模型

    華納云監視Linux磁盤IO性能命令:iotop,iostat,vmstat,atop,dstat,ioping

    以下介紹6個監視 Linux 磁盤IO性能的命令(工具),它們分別是iotop、iostat、vmstat、atop、dstat、ioping,以下將附上簡單的使用方法。 前言 磁盤IO
    的頭像 發表于 10-24 14:43 ?203次閱讀

    本地IO與遠程IO:揭秘工業自動化中的兩大關鍵角色

    在工業自動化領域,IO(Input/Output,輸入/輸出)模塊扮演著至關重要的角色。它們作為連接控制系統與現場設備的橋梁,負責數據的采集與指令的執行。然而,隨著技術的不斷進步,IO模塊也分為本地IO和遠程
    的頭像 發表于 10-08 18:06 ?461次閱讀

    服務器數據恢復—從數據恢復的角度討論RAID磁盤陣列的存儲安全問題

    出于盡可能避免數據災難的設計初衷,RAID解決了3個問題:容量問題、IO性能問題、存儲安全(冗余)問題。從數據恢復的角度討論RAID的存儲安全問題。
    的頭像 發表于 09-07 10:21 ?274次閱讀

    NAND Flash與其他類型存儲器的區別

    NAND Flash作為一種基于NAND技術的非易失性存儲器,具有多個顯著優點,這些優點使其在數據存儲領域得到了廣泛應用。以下是對NAND Flash
    的頭像 發表于 08-20 10:24 ?778次閱讀

    Linux磁盤IO詳細解析

      在講解磁盤IO前,先簡單說下什么是磁盤。磁盤是可以持久化存儲的設備,根據存儲介質的不同,常見磁盤可以分為兩類:機械磁盤和固態磁盤。
    的頭像 發表于 08-05 15:49 ?656次閱讀
    Linux磁盤<b class='flag-5'>IO</b>詳細解析

    IO與PLC的差異及應用

    為您介紹io模塊與PLC的差異及其各自的應用場景
    的頭像 發表于 07-18 15:54 ?1467次閱讀
    <b class='flag-5'>IO</b>與PLC的差異及應用

    rfid標簽具有哪些顯著的優點?

    RFID標簽具有眾多顯著的優點,這些優點使得RFID技術在各個領域得到廣泛應用。以下將對RFID標簽的主要優點進行詳細闡述。 首先,RFID標簽具有非接觸式識別能力。傳統的識別技術,如條形碼掃描
    的頭像 發表于 07-09 10:30 ?590次閱讀

    初識IO-Link及IO-Link設備軟件協議棧

    亞信IO-Link設備軟件協議棧是基于亞信電子AXM-IOLS IO-Link設備評估板設計的,搭載意法半導體 STM32F469AI微控制器,并在STM32CubeIDE開發環境中進行開發。此
    的頭像 發表于 07-08 13:55 ?2792次閱讀
    初識<b class='flag-5'>IO</b>-Link及<b class='flag-5'>IO</b>-Link設備軟件協議棧

    遠程IO與分布式IO的區別

    在工業自動化和控制系統設計中,遠程IO(Input/Output)和分布式IO是兩個重要的概念。它們各自具有獨特的特點和優勢,適用于不同的應用場景。本文將詳細探討遠程IO與分布式IO
    的頭像 發表于 06-15 15:57 ?2633次閱讀

    存儲虛擬化有哪些常見類型?有什么優點?

    存儲虛擬化是一種將多個存儲設備的物理存儲資源抽象出來、將它們集中在一起并將它們呈現為單個邏輯存儲單元的技術。此過程簡化了存儲管理,提高了資源
    的頭像 發表于 03-07 16:47 ?1223次閱讀

    什么是智能存儲系統?對比傳統存儲柜,智能存儲柜有哪些優點?

    智能存儲系統(IntelligentStorageSystem)是一種先進的數據存儲解決方案,它結合了硬件、軟件和自動化管理功能,以實現對數據存儲的高度優化、高效能、高可用性和可擴展性。是針對現代
    的頭像 發表于 03-05 13:53 ?528次閱讀
    什么是智能<b class='flag-5'>存儲</b>系統?對比傳統<b class='flag-5'>存儲</b>柜,智能<b class='flag-5'>存儲</b>柜有哪些<b class='flag-5'>優點</b>?

    EtherCAT IO的接線方法和流程是怎樣的?

    EtherCAT IO的接線方法和流程是怎樣的? EtherCAT是一種用于實時以太網通信的開放式通信協議,具有低延遲和高帶寬的優勢。 EtherCAT IO是EtherCAT網絡中連接到IO設備
    的頭像 發表于 02-02 16:57 ?2136次閱讀

    IO數據采集物聯網平臺有什么功能

    解決方案,實現多種設備、多種數據的可視化監控與數據分析,促進企業持續性發展。 IO數據采集物聯網平臺的核心功能是對各類數據進行采集、存儲和分析。通過數之能IO智能網關接入PLC、傳感器等設備并實現實時通信,平臺可以實時采
    的頭像 發表于 01-25 17:09 ?500次閱讀
    主站蜘蛛池模板: 草莓视频在线看免费高清观看 | 国产午夜精品久久理论片| 夜蒲团之5阳性之教| 少妇久久久久久被弄高潮| 邻家美姨在线观看全集免费| 国产第一页浮力影院| 91免费永久在线地址| 亚洲精品入口一区二区乱麻豆精品 | 欧美伦理片第7页| 久久视频这里只精品99热在线观看| 国产高清视频免费最新在线| 97人妻久久久精品系列A片| 亚洲无码小格式| 小小水蜜桃视频高清在线播放| 漂亮妈妈中文字幕版| 玛雅成人网| 九九热这里只有精品视频免费| 国产麻豆精品人妻无码A片| 成年妇女免费播放| CHINESE老阿姨免费视频| 799是什么意思网络用语| 在线观看免费精品国产| 亚洲精品午夜aaa级久久久久| 无羞耻肉动漫在线观看| 三八成人网| 日韩精品久久久久影院| 欧洲日韩av无线在码| 暖暖视频大全免费观看| 伦理片92伦理午夜| 久久青青草视频在线观| 久久电影午夜| 久久精品国产清白在天天线| 精品欧美一区二区三区四区| 国产一区私人高清影院| 国产乱码精品AAAAAAAA| 国产精品女上位在线观看| 国产 亚洲 另类 欧美 在线 | 成在线人免费| 成人国产在线观看| 都市妖奇谈有声| 国产 亚洲 中文字幕 在线|