色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU之間是怎么通信互聯的呢?

SDNLAB ? 來源:了不起的云計算 ? 2023-11-10 16:49 ? 次閱讀

今天想跟大家一起學習下GPU之間是怎么通信互聯的

自從GPU出現后,計算機愛好者和發燒友們就一直尋找新的方法來進一步提高系統GPU性能。

在單個GPU性能有限的情況下,將兩個或多個GPU連接起來這種在當時看起來非常荒謬的想法竟然漸漸成為提升系統GPU性能的主流方法。

特別是隨著游戲、圖形應用的發展,以及AI、HPC等新興應用的助推,多個GPU之間的互聯技術得到了快速迭代和發展,如今的GPU互聯已經成為系統內非常常見的一種技術。今天我們就來聊聊這些GPU互聯的那些技術。

第一個連接多個GPU解決方案:SLI

SLI,全稱為 " 可擴展的鏈接接口 "( Scalable Link Interface),最早是由 3DFx Interactive 開發。

然而,3DFx Interactive這家公司在2000年破產,NVIDIA公司收購了這家公司并獲得了多GPU技術的權利。

于是,在2004年,NVIDIA首次推出了SLI技術版本,同時發布了GeForce 6800 Ultra GPU。該技術允許兩個GeForce 6800 Ultra GPU一起工作,以增強游戲時的圖形性能**。**因此,SLI技術迅速在游戲玩家和愛好者中流行起來。

SLI采用主從配置方式在系統中實現使用多個GPU,這種配置的重點是使用一個GPU作為主車,其他GPU作為從卡,SLI能夠同時連接4個GPU。

**SLI是第一個連接多個GPU的解決方案。**但是與所有技術一樣,SLI也有各種優點和局限性。SLI配置必須選擇相同型號的兼容GPU。同時還需要分配一個單獨的PSU來滿足多個GPU的協調要求,導致GPU之間的通信延遲較高,且GPU之間的數據共享缺乏靈活性。

另外,NVIDIA大約在兩年前停止了對該技術的支持,為開發NVLink等新技術讓路。

SLI與CrossFire:多GPU解決方案之爭

雖然NVIDIA的SLI走在了多GPU互聯的前面,但也并非沒有競爭。

作為NVIDIA GPU市場上多年的老對手,AMD也推出了CrossFire這個技術來參與競爭。

與SLI技術類似,使用CrossFire技術時,用戶可選擇使用兩個或更多顯卡進行渲染,從而增加幀數和提高游戲運行效率。

CrossFire技術的一大優點是用戶可以使用不同型號的AMD顯卡,從而節省成本。

然而,CrossFire也有其自身的優勢和挑戰,CrossFire經常因其軟件堆棧而受到批評,一些用戶發現該軟件堆棧不如NVIDIA SLI可靠且配置更復雜。

盡管存在這些差異,但這兩種技術都致力于實現相同的目標:增強游戲和消費者圖形體驗。它們在處理更高級、數據密集型任務方面的局限性最終將為 NVLink等下一代解決方案鋪平道路。

隨著2010年代的到來,計算領域開始發生巨大變化。人工智能 (AI)、高性能計算(HPC)和大數據分析的興起需要更強大的多GPU解決方案。很明顯,最初設計時考慮到游戲和消費者工作負載的SLI不足以滿足這些計算密集型任務。NVIDIA需要一個新的GPU互聯技術。

雙GPU卡:多GPU計算的獨特存在

雖然SLI和CrossFire等技術專注于連接多個獨立GPU,但還有另一種不太常見或者可以說是奇葩的多 GPU配置方法:雙GPU卡。

這些專用顯卡在單個PCB(印刷電路板)上安裝了兩個GPU核心,有效地充當單張卡上的SLI或CrossFire 設置。NVIDIA GeForce GTX 690和AMD Radeon HD 6990等卡是這種方法的流行示例。

雙GPU卡具有多種優勢, 他們通過將兩個GPU壓縮到一個卡槽中來節省空間,這使得它們對小型PC很有吸引力。同時他們還無需將單獨的卡與外部連接器連接起來,從而簡化了設置。

然而,這些雙GPU卡散熱是一個重大問題,可以說每一個卡都是一個**"小火爐"****。**通常這種配置方式需要先進的冷卻解決方案。同時功耗也很高,需要強大的電源來提供穩定的電流

雙GPU卡的方式看起來是一種"兩全其美"的解決方案,將多GPU設置的原始功能與單卡的簡單性結合在一起。然而,由于其高成本和相關的技術挑戰,雙GPU卡經常被視為雞肋產品

隨著NVLink等多GPU技術不斷發展以提供更高的帶寬和更低的延遲,對雙 GPU卡的需求已經減少。盡管如此,它仍然是GPU發展史上一個獨特的存在。

****** NVLink 的誕生******

NVLink是2017年隨NVIDIA Volta架構推出的技術。這項技術不僅僅是SLI技術的升級,而且是對GPU如何互連的根本性重新思考

NVLink提供了更高的帶寬(最新版本高達900 GB/s)、更低的延遲以及允許GPU之間更復雜和大量互連的網狀拓撲。此外,NVLink引入了統一內存的概念,支持連接的 GPU 之間的內存池,這對于需要大型數據集的任務來說是一個至關重要的功能。

SLI與NVLink有何區別?

乍一看,人們可能會認為NVLink是SLI的簡單升級,但這過于武斷了。雖然這兩種技術都旨在連接多個GPU,但NVLink的設計考慮了不同的受眾。它專為科學研究、數據分析,尤其是人工智能和機器學習應用而設計。更高的帶寬、更低的延遲和統一的內存使NVLink成為應對當今計算挑戰的更加靈活和強大的解決方案。

雖然NVLink和SLI兩者均由Nvidia開發,但存在一些差異。S****LI按照主從關系原理運行,而NVLink通過網狀網絡運行。結果,SLI中形成了NVLink中不存在的數據瓶頸。

采用網狀網絡開發的并行連接可增強GPU的性能。因此,多個GPU作為一個單元,有助于提供增強的處理能力。連接的GPU擁有自己的內存,從而增加了系統的總可用內存。NVLink橋還支持20至30 GB/s 的帶寬,為4個GPU 的設置提供超過100GB/s 的速度。

網狀網絡消除 GPU之間的層級關系。計算數據因此連接到每個GPU的節點,從而提高了整體渲染速度。因此,150至200GB/s的帶寬也可以實現。與SLI 相比,NVLink的延遲非常低。

****** NVLink的技術原理******

NVLink代表了多GPU互聯技術的邏輯演變,不僅在速度方面,而且在架構設計方面。NVLink的結構由可以雙向傳輸數據的高速數據通道組成。與傳統的基于總線的系統不同,NVLink采用點對點連接,有效減少瓶頸并提高數據吞吐量。最新的迭代提供高達900GB/s的帶寬,比SLI的功能有了顯著增強。

NVLink與眾不同的關鍵功能之一是它支持網狀拓撲的能力。與舊技術的菊花鏈或中心輻射型拓撲相比,網格設置允許GPU之間實現更通用且數量更多的連接。這在數據中心和高性能計算應用程序中特別有用,在這些應用程序中,復雜的數據路由是常態。

統一內存是NVLink的另一個特點。這允許GPU共享公共內存池,從而實現更高效的數據共享并減少在GPU之間復制數據的需要。這對于機器學習和大數據分析等應用程序來說是一個巨大的推動,在這些應用程序中,大型數據集通常超過單個GPU的內存容量。

NVLink還改善了延遲,這是任何高性能計算設置中的一個關鍵因素。較低的延遲可確保GPU之間更快的數據傳輸和同步,從而實現更高效的并行計算。這是通過NVLink的直接內存訪問 (DMA) 功能實現的,允許GPU直接讀寫彼此的內存,而不需要CPU的參與。

NVlink的影響

鑒于人工智能在現代計算中的重要性日益增加,NVLink的優勢不僅是漸進式的,而且是變革性的。在AI模型訓練和數據創建中,NVLink可實現GPU之間更快的數據傳輸,從而實現更高效的并行處理。這在處理大型訓練數據集時尤其有用,這是一個與人工智能模型訓練數據創建的新興領域密切相關的主題。

隨著量子模擬、實時分析和下一代人工智能算法等先進計算的需求不斷增長,我們可以期待NVLink的功能進一步增強。無論是帶寬的增加還是促進GPU之間更好合作的新功能,NVLink或其后繼者無疑仍將是滿足未來計算需求的核心。

從SLI到NVLink的過渡是多GPU技術的一個重要里程碑,它反映了NVIDIA 對創新的承諾以及對不斷變化的計算環境的敏銳理解。從游戲到人工智能,從消費應用程序到數據中心,NVLink和SLI的發展歷程說明了需求對孕育創新、推動技術發展的重要價值。







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4978

    瀏覽量

    102993
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4729

    瀏覽量

    128892
  • HPC
    HPC
    +關注

    關注

    0

    文章

    315

    瀏覽量

    23755
  • PSU
    PSU
    +關注

    關注

    0

    文章

    42

    瀏覽量

    11880

原文標題:一文讀懂:多卡GPU是如何互聯通信的?

文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    常見GPU問題及解決方法

    各種問題。以下是一些常見的GPU問題及其解決方法: GPU驅動程序過時或不兼容 問題描述:GPU驅動程序是GPU與操作系統之間的橋梁,負責將
    的頭像 發表于 10-27 14:12 ?1235次閱讀

    GPU算力租用平臺是什么

    GPU算力租用平臺是一種基于云計算的服務模式,它允許用戶通過互聯網按需租用高性能GPU資源,而無需自行購買、部署和維護這些硬件。
    的頭像 發表于 10-16 10:15 ?205次閱讀

    數字信號處理與通信原理之間的關系

    數字信號處理(Digital Signal Processing,簡稱DSP)和通信原理是信息科學領域中兩個密切相關的領域。它們在理論和應用層面都有很多相互聯系和相互依賴的地方。 在現代通信系統中
    的頭像 發表于 08-09 09:35 ?783次閱讀

    暴漲預警!NVIDIA GPU供應大跳水

    gpu
    jf_02331860
    發布于 :2024年07月26日 09:41:42

    為什么GPU對AI如此重要?

    GPU在人工智能中相當于稀土金屬,甚至黃金,它們在當今生成式人工智能時代中的作用不可或缺。那么,為什么GPU在人工智能發展中如此重要?什么是GPU圖形處理器(
    的頭像 發表于 05-17 08:27 ?684次閱讀
    為什么<b class='flag-5'>GPU</b>對AI如此重要?

    常見的PLC通信指令有哪些

    PLC的通信指令用于實現PLC與其他設備或系統之間的數據交換。
    的頭像 發表于 05-10 11:01 ?2560次閱讀

    NVLink的演進:從內部互聯到超級網絡

    NVLink是NVIDIA開發的一種高速、低延遲的互聯技術,旨在連接多個GPU以實現高性能并行計算。與傳統的PCIe總線相比,NVLink提供了更高的帶寬和更低的延遲,使得GPU之間
    的頭像 發表于 04-13 11:22 ?1123次閱讀
    NVLink的演進:從內部<b class='flag-5'>互聯</b>到超級網絡

    深入探討常見的GPU系統架構

    同一主機內GPU之間通信:通過NVLink技術,雙向帶寬達到600GB/s,單向帶寬達到300GB/s。
    發表于 04-07 11:35 ?2002次閱讀
    深入探討常見的<b class='flag-5'>GPU</b>系統架構

    IPv6是互聯網通信的未來

    在當今數字化時代,互聯網已成為我們日常生活中不可或缺的一部分,隨著智能設備的興起,需要更多的IP地址。目前用于互聯網通信的協議是IPv4,但IPv4的可用地址已經耗盡,這就是為什么新的協議IPv6被
    的頭像 發表于 03-29 14:17 ?449次閱讀
    IPv6是<b class='flag-5'>互聯網通信</b>的未來

    NVLink技術之GPUGPU通信

    在多 GPU 系統內部,GPU通信的帶寬通常在數百GB/s以上,PCIe總線的數據傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉換會產生較大延時,影響GPU并行計算的效率和性能。
    發表于 03-27 09:40 ?3864次閱讀
    NVLink技術之<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>的<b class='flag-5'>通信</b>

    如何排查FPGA與USB之間的芯片通信問題?

    ”,而在SBBulkSourceSink固件中沒有顯示這個錯誤,可不可以證明我的FPGA和USB之間通信成功?另外,我該如何排查FPGA與USB之間的芯片通信問題?
    發表于 02-27 06:46

    詳解GPU硬件架構及運行機制

    為什么我們總說GPU比CPU要強大,既然GPU強大,為什么不能取代CPU
    的頭像 發表于 01-26 09:23 ?2285次閱讀
    詳解<b class='flag-5'>GPU</b>硬件架構及運行機制

    為什么GPU比CPU更快?

    大規模數據集時比CPU更快的根本原因。內存帶寬:GPU的內存帶寬比CPU高得多。內存帶寬是指數據在內存之間傳輸的速度。GPU可以更快地將數據從內存傳輸到核心,并更快地
    的頭像 發表于 01-26 08:30 ?2396次閱讀
    為什么<b class='flag-5'>GPU</b>比CPU更快?

    Matter 1.0、Matter 1.1和Matter 1.2之間有何區別

    一個構建新標準的工作團隊,旨在實現智能家居設備、移動應用程序和云服務之間基于IP的通信,最終實現智能家居各種生態系統的統一。
    的頭像 發表于 01-18 17:11 ?1139次閱讀

    單模藍牙模塊和雙模藍牙模塊指的是什么意思?它們之間有什么區別

    單模藍牙模塊和雙模藍牙模塊指的是什么意思?它們之間有什么區別? 單模藍牙模塊和雙模藍牙模塊是指用于無線通信的藍牙模塊的兩種不同類型。它們之間的主要區別在于其支持的藍牙技術版本和
    的頭像 發表于 01-15 14:59 ?5081次閱讀
    主站蜘蛛池模板: 人妻免费视频公开上传| 奇米精品一区二区三区在线观看| 久久欧洲视频| 午夜日韩久久影院| 大咪咪dvd| 日韩特黄特色大片免费视频| xfplay 无码专区 亚洲| 欧美日韩在线亚洲一| WWW国产亚洲精品久久久日本| 暖暖日本在线手机免费完整版 | 717影院理论午夜伦不卡久久| 精品欧美18videosex欧美| 亚洲色噜噜狠狠站欲八| 精品国产中文字幕在线视频| 伊人久久精品线影院| 久久久久青草大香线综合精品| 樱桃BT在线观看| 门事件快播| A级超碰视频在线观看| 热久久2018亚洲欧美| 纯肉高H放荡受BL文库| 卫生间被教官做好爽HH视频| 国产亚洲精品视频亚洲香蕉视| 亚洲AV怡红院影院怡春院| 久久99视热频国只有精品| 88蜜桃人妻无码精品系列| 欧美亚洲国产手机在线有码| 国产成人在线播放视频| 亚洲精品91| 毛片在线不卡| 成人午夜剧场| 亚洲国产精品自在自线观看| 久久久精品久久久久三级| 99热精品在线视频观看| 日韩综合网| 后入内射国产一区二区| 最近中文字幕免费高清MV视频| 皮皮在线精品亚洲| 国产亚洲精品久久久久苍井松| 中文字幕乱码在线人视频 | 啊灬啊灬啊灬快高潮视频 |