色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計算高速鏈路互連內(nèi)存和GPU以實(shí)現(xiàn)高性能

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Saumitra Jagdale ? 2022-10-24 16:29 ? 次閱讀

隨著云計算技術(shù)的進(jìn)步,數(shù)據(jù)中心的架構(gòu)內(nèi)存安排發(fā)生了重大變化。為了增強(qiáng)計算能力和廣泛的數(shù)據(jù)處理,需要集成擅長處理特定工作負(fù)載的加速器。雖然這些設(shè)備已經(jīng)通過PCI Express連接,但計算快速鏈路可以進(jìn)一步改善優(yōu)化,因?yàn)樗试S對各種系統(tǒng)組件進(jìn)行異構(gòu)處理。

PCI Express是用于將主機(jī)處理器連接到加速器設(shè)備的最常見技術(shù)。它是一種高性能、行業(yè)標(biāo)準(zhǔn)的串行 I/O 接口,專為在企業(yè)、桌面和嵌入式應(yīng)用中使用而開發(fā)。

同時,PCIe在具有大型共享內(nèi)存池和大量需要高帶寬的設(shè)備的系統(tǒng)中存在局限性。由于每個 PCIe 層次結(jié)構(gòu)都使用單個 64 位地址空間,因此 PCIe 未提供支持一致性的技術(shù),并且無法充分維護(hù)單獨(dú)的內(nèi)存池。此外,PCIe 鏈路具有太多的延遲,無法有效地管理系統(tǒng)中多個設(shè)備之間的共享內(nèi)存。

因此,計算密集型工作負(fù)載需要與更快的數(shù)據(jù)流連接,以有效地擴(kuò)展數(shù)據(jù)中心中的異構(gòu)計算。計算高速鏈路 (CXL) 通過利用 PCI 高速 5.0 的物理和電氣接口來挑戰(zhàn)一些限制。這項新技術(shù)提高了內(nèi)存容量和帶寬,并降低了延遲。它是高速通信的接口,因?yàn)榧铀倨髟絹碓蕉嗟赜糜谘a(bǔ)充CPU以支持新興應(yīng)用。

什么是斷續(xù)器?

計算高速鏈路 (CXL) 是一種開放的行業(yè)標(biāo)準(zhǔn)內(nèi)存互連。它旨在為當(dāng)今數(shù)據(jù)中心中使用的許多類型的內(nèi)存提供高性能連接,例如CPU,TPU,GPU和其他處理器類型。

CXL 利用 PCIe 5.0 的物理層基礎(chǔ)架構(gòu)在主機(jī)和所有設(shè)備之間創(chuàng)建公共內(nèi)存空間。緩存一致性標(biāo)準(zhǔn)可確保主機(jī)處理器和 CXL 設(shè)備在訪問數(shù)據(jù)時看到相同的數(shù)據(jù)。CPU 主機(jī)主要負(fù)責(zé)一致性管理,允許 CPU 和設(shè)備共享資源以獲得更高的性能并降低軟件堆棧的復(fù)雜性,從而降低設(shè)備總成本。

除了原始性能外,CXL還有其他優(yōu)勢。該技術(shù)是開源的,不像美光的3D Xpoint,這是迄今為止最接近高性能內(nèi)存互連的方法。美光和英特爾現(xiàn)在正在對沖他們對CXL的賭注,而不是專有技術(shù)。NVIDIA 和 AMD 的硬件系統(tǒng)還使用 CXL 來互連內(nèi)存和外部處理單元,以優(yōu)化性能。NVIDIA的GPU與CXL設(shè)計相結(jié)合,進(jìn)行了如此廣泛的計算,并在內(nèi)存設(shè)計中進(jìn)行了一些更改。

這種轉(zhuǎn)變的最重要結(jié)果將是CXL消除專有內(nèi)存互連。它是必不可少的,因?yàn)橛袔追N類型的企業(yè)存儲,每個處理器都通過專有連接訪問它們。這可能會使企業(yè)存儲基礎(chǔ)架構(gòu)變得復(fù)雜,并且無法預(yù)測其性能。

現(xiàn)在,由于CXL,每個處理器都將能夠訪問所有類型的內(nèi)存。這將允許單獨(dú)的處理器共享相同的內(nèi)存池。它不僅對于數(shù)據(jù)中心至關(guān)重要,而且對于開發(fā)通常使用CPU,GPU和TPU的AI神經(jīng)網(wǎng)絡(luò)和深度機(jī)器學(xué)習(xí)系統(tǒng)等技術(shù)也至關(guān)重要。

CXL 事務(wù)層協(xié)議

憑借與 PCIe 5.0 相似的帶寬,CXL 使用三種動態(tài)多路復(fù)用的事務(wù)層協(xié)議:CXL.io、CXL.緩存和 CXL.內(nèi)存,以在 PCIe 上獲得優(yōu)勢。

CXL.io 協(xié)議幾乎與 PCIe 5.0 相同。它用于設(shè)備發(fā)現(xiàn)、配置、寄存器訪問、中斷、虛擬化和批量 DMA

CXL.cache 是一種可選協(xié)議,用于定義主機(jī)和設(shè)備之間的交互。這允許連接的 CXL 設(shè)備使用請求和響應(yīng)方法以極低的延遲高效緩存主機(jī)內(nèi)存。

CXL.memory 是一種可選協(xié)議,它使用加載和存儲命令為主機(jī)處理器提供對加速器連接的內(nèi)存的直接訪問。加速器連接的內(nèi)存被 CPU、GPU 或 TPU 視為額外的地址空間,從而提高效率并降低延遲。

CXL 對存儲的影響

CXL依賴于存儲,并將對其產(chǎn)生影響。它將允許存儲系統(tǒng)使用更大的內(nèi)存池進(jìn)行緩存。該技術(shù)有利于使用內(nèi)存作為緩存的存儲應(yīng)用程序或系統(tǒng)。這一點(diǎn)至關(guān)重要,因?yàn)殡m然許多ISP定期限制帶寬,但臨時數(shù)據(jù)存儲正在成為數(shù)據(jù)中心性能的關(guān)鍵方面。

商用存儲系統(tǒng)中目前可用的最大 DRAM 緩存為 3 TB。盡管使用 MemVerge 或福爾穆盧斯黑色,但特定的軟件定義存儲可以使用英特爾傲騰 PMem 將該緩存擴(kuò)展到 4.5 TB。但是,這對除最富有的組織之外的所有組織的緩存內(nèi)存施加了硬性限制。幸運(yùn)的是,CXL 通過允許存儲軟件跨多個存儲介質(zhì)緩存數(shù)據(jù)來解決此問題。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19404

    瀏覽量

    231116
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    7855

    瀏覽量

    137827
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    4855

    瀏覽量

    72369
收藏 人收藏

    評論

    相關(guān)推薦

    EE-106:端口開放系統(tǒng)互連電纜標(biāo)準(zhǔn)

    電子發(fā)燒友網(wǎng)站提供《EE-106:端口開放系統(tǒng)互連電纜標(biāo)準(zhǔn).pdf》資料免費(fèi)下載
    發(fā)表于 01-05 10:05 ?0次下載
    EE-106:<b class='flag-5'>鏈</b><b class='flag-5'>路</b>端口開放系統(tǒng)<b class='flag-5'>互連</b>電纜標(biāo)準(zhǔn)

    《CST Studio Suite 2024 GPU加速計算指南》

    問題,但會降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些GPU計算需要啟用,可通過命令行
    發(fā)表于 12-16 14:25

    博威合金亮相互連大會,AI數(shù)字化大模型賦能高速互聯(lián)新材料研發(fā)

    數(shù)據(jù)中心和高性能計算需求等方面都具有極其重要的意義。但互連設(shè)備的不斷增多和數(shù)據(jù)量的爆發(fā)性增長,對互連技術(shù)的創(chuàng)新提出了更高要求。面對日益復(fù)雜的應(yīng)用場景,
    的頭像 發(fā)表于 12-12 15:08 ?386次閱讀
    博威合金亮相<b class='flag-5'>互連</b>大會,AI數(shù)字化大模型賦能<b class='flag-5'>高速</b>互聯(lián)新材料研發(fā)

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    對卷積核優(yōu)化的思考。 GPU的存儲體系采用了獨(dú)特的倒金字塔結(jié)構(gòu),在我看來這是其計算性能的關(guān)鍵。大容量寄存器設(shè)計破解了傳統(tǒng)馮諾依曼架構(gòu)的內(nèi)存瓶頸,合并訪存機(jī)制巧妙解決了
    發(fā)表于 11-24 17:12

    AI高性能計算平臺是什么

    AI高性能計算平臺不僅是AI技術(shù)發(fā)展的基石,更是推動AI應(yīng)用落地、加速產(chǎn)業(yè)升級的重要工具。以下,是對AI高性能計算平臺的介紹,由AI部落小編為您整理分享。
    的頭像 發(fā)表于 11-11 09:56 ?274次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    每個CUDA單元在 OpenCL 編程框架中都有對應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲體系 共享內(nèi)存是開發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    如何提高GPU性能

    學(xué)習(xí)和機(jī)器學(xué)習(xí)等領(lǐng)域發(fā)揮著重要作用。 1. 硬件升級 a. 更換高性能GPU 最直接的提高GPU性能的方法是升級到更高性能的顯卡。隨著技術(shù)的
    的頭像 發(fā)表于 10-27 11:21 ?946次閱讀

    GPU高性能服務(wù)器配置

    GPU高性能服務(wù)器作為提升計算速度和效率的關(guān)鍵設(shè)備,在各大應(yīng)用場景中發(fā)揮著越來越重要的作用。在此,petacloud.ai小編為你介紹GPU高性能
    的頭像 發(fā)表于 10-21 10:42 ?290次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片CPU

    本篇結(jié)合第1-5章,梳理了解學(xué)習(xí)CPU流水線、緩存硬件結(jié)構(gòu)、計算單元、邏輯拓?fù)浣Y(jié)構(gòu)等知識點(diǎn)。 █本書開篇將了TOP500超級計算機(jī)。TOP500使用HPL基準(zhǔn)測試來評估超級計算機(jī)的性能
    發(fā)表于 10-20 12:03

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    技術(shù) 11.1 從DDR到HBM 11.2 PCExpress總線概況 11.3擴(kuò)展技術(shù) 11.4 NVLink互連技術(shù)與GPU超級計算
    發(fā)表于 10-15 22:08

    米爾STM32MP2核心板首發(fā)新品上市!高性能+多接口+邊緣算力

    /1USB2.0 HOST/3SDIO3.0/9UART接口/8I2C/4個I3/8SPI/1
    發(fā)表于 09-20 18:24

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    力,在全球范圍內(nèi),對于推動科技進(jìn)步、經(jīng)濟(jì)發(fā)展及社會整體的運(yùn)作具有至關(guān)重要的作用。隨著信息技術(shù)的高速發(fā)展,高性能計算(HPC)和人工智能(AI)等技術(shù)在多個領(lǐng)域的應(yīng)用變得日益廣泛,芯片算力成為支持這些
    發(fā)表于 09-02 10:09

    存內(nèi)計算WTM2101編譯工具 資料

    出來再進(jìn)行計算,讀取時間與參數(shù)規(guī)模成正比,計算芯片的功耗和性能受限,GPU算力利用率甚至不到8%。 存內(nèi)計算芯片
    發(fā)表于 05-16 16:33

    業(yè)界首創(chuàng)512GB CXL AIC內(nèi)存擴(kuò)展卡,江波龍革新AI與高性能計算領(lǐng)域內(nèi)存技術(shù)

    人工智能大模型計算高性能計算(HPC)以及數(shù)據(jù)中心等行業(yè)的迅猛發(fā)展,對計算機(jī)系統(tǒng)內(nèi)存性能的需求
    發(fā)表于 04-17 14:40 ?532次閱讀
    業(yè)界首創(chuàng)512GB CXL AIC<b class='flag-5'>內(nèi)存</b>擴(kuò)展卡,江波龍革新AI與<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>領(lǐng)域<b class='flag-5'>內(nèi)存</b>技術(shù)

    什么是HPC高性能計算

    高性能計算(HighPerformanceComputing,簡稱HPC),是指利用集群、網(wǎng)格、超算等計算機(jī)技術(shù),通過合理地組織計算機(jī)資源以及運(yùn)用適合的算法和程序,提高
    的頭像 發(fā)表于 02-19 13:27 ?938次閱讀
    什么是HPC<b class='flag-5'>高性能</b><b class='flag-5'>計算</b>
    主站蜘蛛池模板: 久久中文字幕无码A片不卡 久久中文字幕人妻熟AV女蜜柚M | 两性午夜刺激爽爽视频 | 在线免费观看a视频 | 外国xxxx | 欧美精品九九99久久在观看 | 国色天香社区视频免费高清3 | 成人毛片18岁女人毛片免费看 | 秋秋影视午夜福利高清 | 亚洲精品久久午夜麻豆 | 又大又硬又爽免费视频 | 尤蜜网站在线进入免费 | 999久久国产精品免费人妻 | 看电影就来5566先锋av | 超碰97人人做人人爱网站 | 精品国产三级a | 午夜A级理论片左线播放 | 皮皮在线精品亚洲 | 国产精品99久久久久久宅男AV | 99久久精品免费看国产一区二区 | 免费成人高清在线视频 | 性色少妇AV蜜臀人妻无码 | 成人在线不卡视频 | 欧美午夜福利主线路 | 亚洲免费一区二区 | 云南14学生真实初次破初视频 | 国模啪啪久久久久久久 | 99热这里只有精品9 99热这里只有精品88 | 国产99热在线观看 | 黑色丝袜美腿美女被躁翻了 | 动漫美女被到爽了流 | 成人免费观看在线视频 | 亚洲人成无码久久久AAA片 | 伊人久久99热这里只有精品 | 精品亚洲麻豆1区2区3区 | 肉伦禁忌小说np | 久久欧洲AV无码精品色午夜麻豆 | 国产成人ae在线观看网站站 | 成人午夜精品久久久久久久秋霞 | 国产亚洲高清视频 | 乌克兰16~18sex | 久久伊人天堂视频网 |