在計(jì)算架構(gòu)和負(fù)載變得愈發(fā)復(fù)雜和多樣的情況下,處理器廠商紛紛開(kāi)始了自己的造詞之路。要想體現(xiàn)產(chǎn)品定位,又要讓大家對(duì)其縮寫(xiě)印象深刻,所以PU成了最常見(jiàn)的后綴。現(xiàn)在的處理器家族中已經(jīng)有了不少成員,除了常見(jiàn)的CPU、GPU、APU之外,按照處理對(duì)象的不同,在人工智能和深度學(xué)習(xí)的崛起下,NPU和TPU也紛紛出現(xiàn)。
DPU模糊的定義
不過(guò)這些已經(jīng)定義明確的處理單元并不是我們今天的主角,而是找到了全新定義的xPU。什么是xPU,其實(shí)很難定義,這其中有DPU(數(shù)據(jù)處理單元)、IPU(基礎(chǔ)設(shè)施處理單元)和FAC(功能加速卡),這些剛冒頭的產(chǎn)品就是xPU,它們代表了從SmartNIC演化過(guò)來(lái)并超越其定位的新時(shí)代加速器硬件。除了SmartNIC以外,這些xPU雖然命名不同,但其實(shí)很多時(shí)候,它們是完全重合的,現(xiàn)在為了方便,很多時(shí)候也以DPU統(tǒng)稱。
BlueField-3 DPU / 英偉達(dá)
這樣說(shuō)DPU的定義還是很模糊,我們就從其特點(diǎn)來(lái)看。SmartNIC往往需要主CPU來(lái)完成管理工作,DPU雖然往往也屬于一個(gè)主系統(tǒng)中的部件,但卻可以做到完全獨(dú)立,可以部署到邊緣、JBOF存儲(chǔ)和網(wǎng)關(guān)上,并為它們提供網(wǎng)絡(luò)接口和虛擬功能。它的另一項(xiàng)職責(zé)就是幫CPU減輕負(fù)擔(dān),節(jié)省服務(wù)器上有限的處理器核心。
因此,盡管DPU看起來(lái)和一些PCIe智能網(wǎng)卡或GPU差不多,但它本質(zhì)上就是一個(gè)為數(shù)據(jù)流和數(shù)據(jù)包處理提供加速、卸載和本地服務(wù)的微型服務(wù)器,在服務(wù)器中提供一個(gè)獨(dú)立單元的同時(shí),又不乏協(xié)助其他單元的處理能力。
什么樣的任務(wù)需要DPU?
至于為什么要用到DPU,這就不得不談到日益增加的數(shù)據(jù)密集型任務(wù)了,短視頻、實(shí)時(shí)金融交易的興起,高帶寬的數(shù)據(jù)流要求數(shù)據(jù)中心對(duì)網(wǎng)絡(luò)、存儲(chǔ)、安全和AI/ML進(jìn)行高效的處理。比如谷歌在數(shù)年前就提到,在他們的數(shù)據(jù)中心里,有三分之一的任務(wù)都是數(shù)據(jù)密集型的,這些都是交由底層基礎(chǔ)設(shè)施完成的,而且這類任務(wù)的占比是在逐步增加的。因?yàn)镃PU和GPU這樣的通用計(jì)算單元并不擅長(zhǎng),所以專門針對(duì)這類任務(wù)優(yōu)化的DPU就得出來(lái)?yè)?dān)此大任了。其次就是企業(yè)數(shù)據(jù)中心和公共數(shù)據(jù)中心也想獲得超大規(guī)模巨頭廠商那樣的效率,做到這一點(diǎn)就必須解聚那些昂貴的硬件資源,比如SSD、GPU等,DPU為數(shù)據(jù)中心的解聚提供了極高的效率,優(yōu)化了擁有成本、占用面積和安全性。
DPU可以完成各個(gè)方面的卸載與加速,尤其是在網(wǎng)絡(luò)、安全和存儲(chǔ)這三大塊。在網(wǎng)絡(luò)端,DPU可以有效實(shí)現(xiàn)虛擬路由器,輔助數(shù)據(jù)包交換、定義交換規(guī)則等工作,減少延遲的同時(shí)還能夠提高吞吐量;在安全上,DPU可以用于下一代防火墻(NGFW)的加速,完成數(shù)據(jù)包過(guò)濾、內(nèi)容檢測(cè)和報(bào)頭檢測(cè)與重寫(xiě),將性能提高數(shù)倍以上;在存儲(chǔ)上,DPU可以卸載高速NVMe/TCP,進(jìn)一步提升存儲(chǔ)性能。最關(guān)鍵的是,這三者都能有效地接管CPU控制面的負(fù)載,節(jié)省CPU本身的計(jì)算核心。
基于DPU的服務(wù)器存儲(chǔ)方案 / Fungible
以上是DPU為服務(wù)器提供的加強(qiáng),主要以PCIe加速卡的形式來(lái)提供,此外,還有單獨(dú)的DPU存儲(chǔ)產(chǎn)品。傳統(tǒng)的CPU存儲(chǔ)方案中,整個(gè)系統(tǒng)由DRAM、x86 CPU、SmartNIC、加速器和PCIe接口組成,而在未來(lái)的存儲(chǔ)方案,比如高性能存儲(chǔ)、計(jì)算型存儲(chǔ)和軟件定義網(wǎng)絡(luò)應(yīng)用的存儲(chǔ)中,單片集成的方案更能滿足要求,這就是與DRAM結(jié)合的DPU存儲(chǔ)產(chǎn)品。這種方案不僅可以提升IOPS,也能進(jìn)一步降低能耗。
正因如此,數(shù)據(jù)中心會(huì)用DPU來(lái)完成數(shù)據(jù)密集型任務(wù),從而減少功耗、擁有成本和占用空間。此外,他們也會(huì)用到基于DPU的存儲(chǔ)、GPU/TPU資源池和主機(jī)卡,來(lái)高效地完成高成本硬件資源的解聚。
DPU市場(chǎng)混戰(zhàn)
在不少?gòu)S商對(duì)DPU的宣傳中,往往都會(huì)提到這將是除了CPU和GPU之外的第三大硬件。大家可能覺(jué)得類似的承諾,好像一些AI處理器也有提到,但市面上還是GPU占據(jù)主導(dǎo)地位,DPU又會(huì)有何不同呢?事實(shí)證明,市場(chǎng)對(duì)DPU的信心很足,這我們從入局DPU的廠商就能看出。
云霄DPU / 云豹智能
如今制造DPU的企業(yè)分為三種,一是初創(chuàng)公司,比如:云豹智能、星云智聯(lián)、中科馭數(shù)、云脈芯聯(lián)、芯啟源、大禹智芯、Fungible等;二是市面上一些已有的服務(wù)器巨頭,比如AMD/Xilinx、英特爾、Marvel、英偉達(dá);三是CSP(云服務(wù)供應(yīng)商)廠商,比如亞馬遜AWS、微軟Azure、阿里云等等。后者更多是負(fù)責(zé)設(shè)計(jì)或者聯(lián)合設(shè)計(jì)這些xPU,好專用于自己的云服務(wù)器。最終售賣這些DPU的除了DPU廠商外,還有基礎(chǔ)設(shè)施的OEM和ODM,增值分銷商和集成方案廠商,CSP廠商在售賣服務(wù)器的時(shí)候,自然也會(huì)以間接的方式來(lái)體現(xiàn)DPU的價(jià)值。
隨著Mellanox被英偉達(dá)收購(gòu),Pensando被AMD收購(gòu),而Fungible的DPU主要針對(duì)存儲(chǔ)加速和卸載,雖然沒(méi)有被收購(gòu),但也收獲了軟銀的主導(dǎo)的融資。國(guó)內(nèi)的DPU廠商同樣備受青睞,比如騰訊屢次投資的云豹智能,字節(jié)跳動(dòng)投資的云脈芯聯(lián),美團(tuán)和百度投資的星云智聯(lián)等,這些投資方要么是CSP,要么擁有超大規(guī)模的數(shù)據(jù)中心,他們不像其他CSP大廠,硬件設(shè)計(jì)能力缺乏或有限,卻也看到了DPU的前景。
DPU并不完美
即便大廠看好,但從現(xiàn)狀來(lái)看,部署DPU對(duì)某些中小企業(yè)來(lái)說(shuō)依然是雙刃劍。固然,DPU可以卸載基礎(chǔ)設(shè)施的任務(wù),減輕其負(fù)擔(dān),讓服務(wù)器的CPU空出來(lái)專注在應(yīng)用本身,更高的效率、更低的擁有成本和更高的安全性也都隨之而來(lái),這些優(yōu)點(diǎn)是幾乎每個(gè)服務(wù)器都能享受到的。
但在部分服務(wù)器中,引入DPU不免增加了服務(wù)器的資本投入,而且相較于CPU、GPU這類硬件來(lái)說(shuō),它只能卸載和加速特定的負(fù)載,并不是一個(gè)通用加速單元。此外,部分服務(wù)器在增加DPU的情況下還是會(huì)導(dǎo)致功耗提升,在服務(wù)器、數(shù)據(jù)中心紛紛開(kāi)始節(jié)能減排的當(dāng)下,如何權(quán)衡各個(gè)組件的功耗無(wú)疑會(huì)是一個(gè)大問(wèn)題。還有就是相關(guān)的開(kāi)發(fā),DPU的靈活性體現(xiàn)在可編程上,但這需要進(jìn)行一定的編程能力,加上目前每家廠商都在單干,也沒(méi)有一個(gè)標(biāo)準(zhǔn)的接口,所以在適配上絕對(duì)不輕松,這也是不少DPU選擇Arm作為核心架構(gòu)的原因,就是為了減少其編程的難度。
也正是因?yàn)橐陨线@些理由,從市場(chǎng)滲透率上來(lái)看,DPU主要是還是大規(guī)模的CSP廠商用的更多一點(diǎn),加上托管應(yīng)用的增加,這一塊未來(lái)也會(huì)驅(qū)動(dòng)DPU產(chǎn)品的銷售。對(duì)于自研DPU的CSP來(lái)說(shuō),他們肯定會(huì)繼續(xù)加大這方面的投入,進(jìn)一步降低成本,而對(duì)于第三方廠商來(lái)說(shuō),英偉達(dá)、AMD和英特爾這些服務(wù)器CPU、GPU廠商無(wú)疑會(huì)更有優(yōu)勢(shì),因?yàn)樗麄兲峁└?jìng)爭(zhēng)力更強(qiáng)的集成方案。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9295瀏覽量
85882 -
DPU
+關(guān)注
關(guān)注
0文章
368瀏覽量
24231 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3842瀏覽量
91696
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
IBM將在云平臺(tái)部署AMD加速器
IBM與AMD近期宣布了一項(xiàng)重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺(tái)上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶在生成式AI模型方面的性能和能效,進(jìn)一步推動(dòng)AI技術(shù)的創(chuàng)新與應(yīng)用。
磁調(diào)制式電流傳感器在粒子加速器中的應(yīng)用
粒子加速器是一種利用電磁場(chǎng)加速帶電粒子(如質(zhì)子、電子、離子等)至極高速度的裝置。其工作原理基于洛倫茲力定律,即當(dāng)帶電粒子在電磁場(chǎng)中運(yùn)動(dòng)時(shí),會(huì)受到垂直于其速度方向的力作用,從而改變其運(yùn)動(dòng)狀態(tài)。粒子
具有邊沿速率加速器的TXB和TXS電壓電平轉(zhuǎn)換器的注意事項(xiàng)
電子發(fā)燒友網(wǎng)站提供《具有邊沿速率加速器的TXB和TXS電壓電平轉(zhuǎn)換器的注意事項(xiàng).pdf》資料免費(fèi)下載
發(fā)表于 09-04 09:52
?0次下載
利用邊沿速率加速器和自動(dòng)感應(yīng)電平轉(zhuǎn)換器
電子發(fā)燒友網(wǎng)站提供《利用邊沿速率加速器和自動(dòng)感應(yīng)電平轉(zhuǎn)換器.pdf》資料免費(fèi)下載
發(fā)表于 09-02 11:58
?1次下載
IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書(shū)
數(shù)據(jù)中心的第三顆“主力芯片”,主要通過(guò)其專用處理器優(yōu)化數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)、安全等處理性能,助力服務(wù)器運(yùn)行效率顯著提升,有效降低成本。因此,在新型數(shù)據(jù)中心建設(shè)時(shí),圍繞 DPU 構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)的基礎(chǔ)設(shè)施
發(fā)表于 07-24 15:32
什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點(diǎn)?
神經(jīng)網(wǎng)絡(luò)加速器是一種專門設(shè)計(jì)用于提高神經(jīng)網(wǎng)絡(luò)計(jì)算效率的硬件設(shè)備。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展和廣泛應(yīng)用,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和計(jì)算量急劇增加,對(duì)計(jì)算性能的要求也越來(lái)越高。傳統(tǒng)的通用處理器(CPU
西門子推出Catapult AI NN軟件,賦能神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)
西門子數(shù)字化工業(yè)軟件近日發(fā)布了Catapult AI NN軟件,這款軟件在神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)領(lǐng)域邁出了重要一步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級(jí)系統(tǒng)(SoC)上實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的高層次綜合(HLS),為機(jī)器學(xué)習(xí)應(yīng)用提供了硬件
Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國(guó)產(chǎn)CPU市場(chǎng)
Arm發(fā)布的新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
中科馭數(shù)DPU技術(shù)開(kāi)放日秀“肌肉”:云原生網(wǎng)絡(luò)、RDMA、安全加速、低延時(shí)網(wǎng)絡(luò)等方案組團(tuán)亮相
DPU技術(shù)開(kāi)放日既是對(duì)DPU技術(shù)應(yīng)用的典型方案展示,也是DPU技術(shù)在重要細(xì)分場(chǎng)景走向成熟的標(biāo)志。
Hitek Systems開(kāi)發(fā)基于PCIe的高性能加速器以滿足行業(yè)需求
Hitek Systems 使用開(kāi)放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開(kāi)發(fā)基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網(wǎng)絡(luò)、計(jì)算和高容量存儲(chǔ)應(yīng)用的需求。
瑞薩發(fā)布下一代動(dòng)態(tài)可重構(gòu)人工智能處理器加速器
瑞薩最新發(fā)布的動(dòng)態(tài)可重構(gòu)人工智能處理器(DRP-AI)加速器,在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統(tǒng)技術(shù),效率提升了驚人的10倍。其獨(dú)特之處在于,它能在低功耗的傳統(tǒng)嵌入式處理
家居智能化,推動(dòng)AI加速器的發(fā)展
電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執(zhí)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的ASIC或定制化處理器。在智能家居中,AI加速
回旋加速器原理 回旋加速器的影響因素
回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強(qiáng)磁場(chǎng)中的運(yùn)動(dòng)。本文將詳細(xì)介紹回旋加速器的原理以及影響因素。 一、回旋
評(píng)論