談到如何設(shè)計(jì)AI加速器,許多工程師都會(huì)給出不同的答案,但歸根結(jié)底仍是在一顆先進(jìn)制程的芯片上排列組合數(shù)十億個(gè)晶體管。然而當(dāng)前超大規(guī)模的AI推理依然面臨著不少挑戰(zhàn),比如成本和復(fù)雜度高居不下,傳統(tǒng)架構(gòu)下的性能、功耗和可編程性無(wú)法滿(mǎn)足超大規(guī)模的要求等。初創(chuàng)公司Esperanto作為去年才開(kāi)始冒頭的初創(chuàng)企業(yè),卻打算用RISC-V來(lái)解決這一問(wèn)題。
Esperanto創(chuàng)立于2014年,其董事長(zhǎng)Dave Ditzel曾在英特爾負(fù)責(zé)下一代微處理器架構(gòu)的設(shè)計(jì)。Esperanto的工作方向是基于RISC-V這一開(kāi)放架構(gòu),開(kāi)發(fā)高性能、高效率的計(jì)算方案。為此,他們打造了ET-SoC-1,一個(gè)千核的RISC-V處理器,也是他們開(kāi)發(fā)的首個(gè)AI加速器。
ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統(tǒng)的SoC,而是面向超大規(guī)模數(shù)據(jù)中心的“片上超級(jí)電腦”。它包含了近乎1100個(gè)RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個(gè)AI推理加速器,并不是訓(xùn)練加速器。
據(jù)CEO Art Swift介紹,該芯片采用了臺(tái)積電7nm制程,在特定的工作任務(wù)上,能耗效率提高可至100倍。ET-SoC-1在其他關(guān)鍵工作任務(wù)上,性能提升要遠(yuǎn)高于傳統(tǒng)的CPU加GPU方案。比如在模擬測(cè)試中,用于推薦網(wǎng)絡(luò)時(shí),其性能提升高達(dá)50倍,在圖像分類(lèi)上,性能提升高達(dá)30倍。雖然這些暫時(shí)只是紙面測(cè)試參數(shù),但這樣的性能和功耗無(wú)疑可以給AI客戶(hù)帶來(lái)很大的吸引力。
據(jù)了解,這一芯片直至2021年第二季度才正式流片,預(yù)計(jì)2022年早期才會(huì)開(kāi)始量產(chǎn)。這是因?yàn)镋speranto花了很多時(shí)間在驗(yàn)證上,作為一家初創(chuàng)公司,Esperanto采用了架構(gòu)、硬件和軟件聯(lián)合設(shè)計(jì)的方式,這樣一來(lái)雖然節(jié)省了時(shí)間,卻也讓規(guī)格一直在持續(xù)變動(dòng)。因此Esperanto在驗(yàn)證團(tuán)隊(duì)上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯(cuò)和除錯(cuò)時(shí)間。
ET-SoC-1芯片架構(gòu) / Esperanto
ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個(gè)ET-Maxion(超標(biāo)量亂序核)和1089個(gè)ET-Minion(順序多線(xiàn)程核心)。ET-Maxion是一顆可以運(yùn)行Linux的大核心,核心頻率超過(guò)2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機(jī)器學(xué)習(xí)數(shù)據(jù)處理。
ET-Maxion作為核心頻率超過(guò)2GHz的10級(jí)流水線(xiàn)RISC-V核心,其實(shí)原本是伯克利大學(xué)Boom V2開(kāi)源核心的的分支,但Esperanto對(duì)此進(jìn)行了大刀闊斧的改進(jìn)。在SPEC2006測(cè)試下,其性能已經(jīng)超過(guò)了Cortex-A57,不過(guò)還是次于Cortex-A72以及SiFive最近公布的P550。
雖然是一個(gè)小核,但ET-Minion也是一個(gè)64位RISC-V核心。ET-SoC-1內(nèi),32個(gè)ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個(gè)Shire采用Mesh的方式連接在一起,多出來(lái)的一個(gè)ET-Minion則用作服務(wù)處理器。Esperanto用這一千多個(gè)ET-Minion做到了強(qiáng)大的浮點(diǎn)性能,某些傳統(tǒng)加速器僅支持INT8運(yùn)算,而ET-SoC-1在FP16或FP32上都能展現(xiàn)出不俗的優(yōu)勢(shì)。
搭載6個(gè)ET-SoC-1的Glacier Point v2 / Esperanto
Art Swift提到,F(xiàn)acebook推出的開(kāi)源AI板卡Glacier Point v2可以搭載6個(gè)ET-SoC-1芯片,這樣以來(lái)就可以直接接入已有的開(kāi)源計(jì)算項(xiàng)目(OCP)設(shè)備中。這一張卡上就包含了6558個(gè)RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達(dá)822GB/s的同時(shí)還擁有較低的功耗。據(jù)估計(jì),這一設(shè)計(jì)的板卡峰值性能可達(dá)800 TOPS(INT8)以上。
在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見(jiàn)的機(jī)器學(xué)習(xí)框架提供了支持。只需采用Facebook的開(kāi)源編譯器,就可以在多個(gè)ET-SoC-1芯片上運(yùn)行機(jī)器學(xué)習(xí)模型。
結(jié)語(yǔ)
RISC-V雖然在傳統(tǒng)的CPU與GPU市場(chǎng)還未徹底崛起,但在AI加速上,已經(jīng)以其獨(dú)到的優(yōu)勢(shì)迅速攻城略地。這種千核式的設(shè)計(jì)其實(shí)已經(jīng)應(yīng)用于Arm等架構(gòu),不少數(shù)據(jù)中心、超算卻依然在嘗試用RISC-V作為加速器。
RISC-V憑借其開(kāi)放性、擴(kuò)展性和自主性,并沒(méi)有像Arm那樣由低至高地發(fā)展市場(chǎng),而是低端和高端兩頭抓,一旦消費(fèi)市場(chǎng)也開(kāi)始普及RISC-V生態(tài),那時(shí)的RISC-V就有與Arm全市場(chǎng)爭(zhēng)霸的希望了。
Esperanto創(chuàng)立于2014年,其董事長(zhǎng)Dave Ditzel曾在英特爾負(fù)責(zé)下一代微處理器架構(gòu)的設(shè)計(jì)。Esperanto的工作方向是基于RISC-V這一開(kāi)放架構(gòu),開(kāi)發(fā)高性能、高效率的計(jì)算方案。為此,他們打造了ET-SoC-1,一個(gè)千核的RISC-V處理器,也是他們開(kāi)發(fā)的首個(gè)AI加速器。
ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統(tǒng)的SoC,而是面向超大規(guī)模數(shù)據(jù)中心的“片上超級(jí)電腦”。它包含了近乎1100個(gè)RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個(gè)AI推理加速器,并不是訓(xùn)練加速器。
據(jù)CEO Art Swift介紹,該芯片采用了臺(tái)積電7nm制程,在特定的工作任務(wù)上,能耗效率提高可至100倍。ET-SoC-1在其他關(guān)鍵工作任務(wù)上,性能提升要遠(yuǎn)高于傳統(tǒng)的CPU加GPU方案。比如在模擬測(cè)試中,用于推薦網(wǎng)絡(luò)時(shí),其性能提升高達(dá)50倍,在圖像分類(lèi)上,性能提升高達(dá)30倍。雖然這些暫時(shí)只是紙面測(cè)試參數(shù),但這樣的性能和功耗無(wú)疑可以給AI客戶(hù)帶來(lái)很大的吸引力。
據(jù)了解,這一芯片直至2021年第二季度才正式流片,預(yù)計(jì)2022年早期才會(huì)開(kāi)始量產(chǎn)。這是因?yàn)镋speranto花了很多時(shí)間在驗(yàn)證上,作為一家初創(chuàng)公司,Esperanto采用了架構(gòu)、硬件和軟件聯(lián)合設(shè)計(jì)的方式,這樣一來(lái)雖然節(jié)省了時(shí)間,卻也讓規(guī)格一直在持續(xù)變動(dòng)。因此Esperanto在驗(yàn)證團(tuán)隊(duì)上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯(cuò)和除錯(cuò)時(shí)間。
ET-SoC-1芯片架構(gòu) / Esperanto
ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個(gè)ET-Maxion(超標(biāo)量亂序核)和1089個(gè)ET-Minion(順序多線(xiàn)程核心)。ET-Maxion是一顆可以運(yùn)行Linux的大核心,核心頻率超過(guò)2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機(jī)器學(xué)習(xí)數(shù)據(jù)處理。
ET-Maxion作為核心頻率超過(guò)2GHz的10級(jí)流水線(xiàn)RISC-V核心,其實(shí)原本是伯克利大學(xué)Boom V2開(kāi)源核心的的分支,但Esperanto對(duì)此進(jìn)行了大刀闊斧的改進(jìn)。在SPEC2006測(cè)試下,其性能已經(jīng)超過(guò)了Cortex-A57,不過(guò)還是次于Cortex-A72以及SiFive最近公布的P550。
雖然是一個(gè)小核,但ET-Minion也是一個(gè)64位RISC-V核心。ET-SoC-1內(nèi),32個(gè)ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個(gè)Shire采用Mesh的方式連接在一起,多出來(lái)的一個(gè)ET-Minion則用作服務(wù)處理器。Esperanto用這一千多個(gè)ET-Minion做到了強(qiáng)大的浮點(diǎn)性能,某些傳統(tǒng)加速器僅支持INT8運(yùn)算,而ET-SoC-1在FP16或FP32上都能展現(xiàn)出不俗的優(yōu)勢(shì)。
搭載6個(gè)ET-SoC-1的Glacier Point v2 / Esperanto
Art Swift提到,F(xiàn)acebook推出的開(kāi)源AI板卡Glacier Point v2可以搭載6個(gè)ET-SoC-1芯片,這樣以來(lái)就可以直接接入已有的開(kāi)源計(jì)算項(xiàng)目(OCP)設(shè)備中。這一張卡上就包含了6558個(gè)RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達(dá)822GB/s的同時(shí)還擁有較低的功耗。據(jù)估計(jì),這一設(shè)計(jì)的板卡峰值性能可達(dá)800 TOPS(INT8)以上。
在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見(jiàn)的機(jī)器學(xué)習(xí)框架提供了支持。只需采用Facebook的開(kāi)源編譯器,就可以在多個(gè)ET-SoC-1芯片上運(yùn)行機(jī)器學(xué)習(xí)模型。
結(jié)語(yǔ)
RISC-V雖然在傳統(tǒng)的CPU與GPU市場(chǎng)還未徹底崛起,但在AI加速上,已經(jīng)以其獨(dú)到的優(yōu)勢(shì)迅速攻城略地。這種千核式的設(shè)計(jì)其實(shí)已經(jīng)應(yīng)用于Arm等架構(gòu),不少數(shù)據(jù)中心、超算卻依然在嘗試用RISC-V作為加速器。
RISC-V憑借其開(kāi)放性、擴(kuò)展性和自主性,并沒(méi)有像Arm那樣由低至高地發(fā)展市場(chǎng),而是低端和高端兩頭抓,一旦消費(fèi)市場(chǎng)也開(kāi)始普及RISC-V生態(tài),那時(shí)的RISC-V就有與Arm全市場(chǎng)爭(zhēng)霸的希望了。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
AI
+關(guān)注
關(guān)注
87文章
31429瀏覽量
269825 -
RISC-V
+關(guān)注
關(guān)注
45文章
2317瀏覽量
46351
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
Imagination放棄RISC-V處理器內(nèi)核開(kāi)發(fā)
電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)根據(jù)外媒的最新報(bào)道,半導(dǎo)體IP大廠Imagination Technology已經(jīng)停止了RISC-V處理器內(nèi)核的開(kāi)發(fā),轉(zhuǎn)而更加專(zhuān)注于其核心的GPU和AI產(chǎn)品
Andes晶心科技推出D45-SE RISC-V處理器
Andes晶心科技(TWSE:6533; SIN US03420C2089; ISIN:US03420C1099)是全球高效能、低功耗 32/64 位 RISC-V 處理器的領(lǐng)導(dǎo)廠商,也是
Rivos全新產(chǎn)品采用Andes晶心科技NX45 RISC-V處理器
專(zhuān)注于加速數(shù)據(jù)分析和生成式AI工作負(fù)載的RISC-V主要會(huì)員公司Rivos與32/64位RISC-V處理器內(nèi)核的領(lǐng)先供貨商、RISC-V創(chuàng)始
《RISC-V能否復(fù)制Linux 的成功?》
,創(chuàng)建實(shí)現(xiàn)自有加速器算法的自定義異構(gòu)集群。RISC-V作為一種ISA,我們一開(kāi)始是在處理器內(nèi)核中采用吸引人的通用構(gòu)建塊,然后在此基礎(chǔ)上進(jìn)行構(gòu)建,同時(shí)還利用最好的商業(yè)工具增強(qiáng)使用者的信心。所以,IP
發(fā)表于 11-26 20:20
RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期
計(jì)算機(jī)由控制整體的CPU(中央處理器)和加速器兩部分構(gòu)成。在AI計(jì)算中,功耗和效率是兩個(gè)關(guān)鍵因素。RISC-V架構(gòu)通過(guò)其簡(jiǎn)潔的設(shè)計(jì)和定制化的擴(kuò)展,可以實(shí)現(xiàn)高效的能量使用。該架構(gòu)能夠通過(guò)
發(fā)表于 10-31 16:06
RISC-V擁有巨大市場(chǎng)潛力的原因
旬發(fā)布了第三代“香山”開(kāi)源高性能RISC-V處理器核,其性能水平已進(jìn)入全球第一梯隊(duì),可廣泛應(yīng)用于服務(wù)器芯片、AI芯片、GPU、DPU等高端芯
發(fā)表于 09-30 14:20
淺談國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢(shì)和應(yīng)用場(chǎng)景
關(guān)于國(guó)產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢(shì)和應(yīng)用場(chǎng)景淺談如下:
優(yōu)勢(shì)
異構(gòu)計(jì)算能力 :
異構(gòu)雙核設(shè)計(jì)結(jié)合了RISC-V
發(fā)表于 08-31 08:32
萬(wàn)物智聯(lián)時(shí)代,RISC-V與AI的融合之路該如何走?
人工智能與機(jī)器學(xué)習(xí)專(zhuān)委會(huì)主席謝濤發(fā)表了《萬(wàn)物智聯(lián)時(shí)代RISC-V+AI之路》演講,分析了RISC-V與AI技術(shù)的結(jié)合及其發(fā)展路徑探索。他在發(fā)言中,盡管?chē)?guó)產(chǎn)
RISC-V適合什么樣的應(yīng)用場(chǎng)景
設(shè)計(jì)使得開(kāi)發(fā)者可以靈活選擇所需的指令集和模塊,以滿(mǎn)足嵌入式系統(tǒng)的各種性能要求。
3. 人工智能(AI)和機(jī)器學(xué)習(xí)(ML)
高性能計(jì)算:RISC-V結(jié)合AI加速器或協(xié)
發(fā)表于 07-29 17:16
RISC-V在中國(guó)的發(fā)展機(jī)遇有哪些場(chǎng)景?
。RISC-V結(jié)合AI加速器,可以在AI領(lǐng)域提供高效的計(jì)算解決方案。
定制化需求:RISC-V允許添加專(zhuān)門(mén)的加速
發(fā)表于 07-29 17:14
risc-v多核芯片在AI方面的應(yīng)用
得RISC-V多核芯片能夠更好地適應(yīng)AI算法的不同需求,包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等,從而提高芯片的性能和效率,降低成本,使AI邊緣計(jì)算晶片更具競(jìng)爭(zhēng)力。
再者,RISC-V的多核設(shè)計(jì)可以進(jìn)
發(fā)表于 04-28 09:20
第三代“香山”RISC-V 開(kāi)源高性能處理器核性能進(jìn)入全球第一梯隊(duì)
中科院計(jì)算技術(shù)研究所、北京開(kāi)源芯片研究院共同創(chuàng)新,成功推出第三代“香山”開(kāi)源高性能RISC-V處理器核,這也是首個(gè)基于開(kāi)源模式、采用敏捷開(kāi)發(fā)方法、多方協(xié)作開(kāi)發(fā)的處理器
fpga和risc-v處理器的區(qū)別
FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)和RISC-V處理器在多個(gè)方面存在顯著的區(qū)別。
芯來(lái)科技正式發(fā)布基于RISC-V處理器的HSM子系統(tǒng)解決方案
本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來(lái)科技正式發(fā)布基于RISC-V處理器的HSM子系統(tǒng)解決方案,提供專(zhuān)業(yè)有效的信息安全保護(hù)以及加解密功能。
芯來(lái)科技發(fā)布AI專(zhuān)用RISC-V處理器內(nèi)核NI900系列
在AI技術(shù)迅速發(fā)展的當(dāng)下,RISC-V CPU IP領(lǐng)域的領(lǐng)軍企業(yè)芯來(lái)科技,正式發(fā)布了針對(duì)人工智能應(yīng)用的專(zhuān)用處理器產(chǎn)品線(xiàn)——Nuclei Intelligence (NI)系列。作為該系列的首款產(chǎn)品,NI900系列內(nèi)核,專(zhuān)為
評(píng)論