電子發(fā)燒友網(wǎng)報道(文/周凱揚)數(shù)據(jù)中心作為CPU、GPU和加速器廠商最為關注的市場,自然也少不了RISC-V這個新架構來摻和一腳。我們在之前的文章中也對RISC-V在數(shù)據(jù)中心的進展做了一些介紹,RISC-V雖然在服務器通用CPU上發(fā)力跡象不明顯,但要說AI加速器這類產(chǎn)品,很有可能會是RISC-V打入數(shù)據(jù)中心市場的最佳方向。
谷歌的RISC-V戰(zhàn)略
自己設計芯片的服務器廠商之一,谷歌,似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上,SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器,用于在數(shù)據(jù)中心上運行TensorFlow、Pytorch和JAX等機器學習框架。
而TPU的主要計算單元就是矩陣乘法打算(MXU),由脈動陣列中的128x128乘法/累積器組成,在最小配置v4版TPU中包含4個TPU芯片,每個TPU芯片都有8個MXU,是TPU v3版的兩倍,而且每個MXU都能使用BF16執(zhí)行每周期16K的乘積累加運算。
然而,谷歌發(fā)現(xiàn)雖然TPU的機器學習算力雖然夠用,但客戶在利用這類大型AI加速器時,往往無法用它來完成其他的復雜計算負載,所以谷歌的做法是將SiFive的X280處理器核心,作為TPU的協(xié)處理器,用來提供維護和運行代碼,跑加速器沒法運行的內(nèi)核。
雖然SiFive的X280主打的是加速AI/ML計算,但主要是針對邊緣端,比如AR/VR、數(shù)碼相機等等,并非用于數(shù)據(jù)中心的大型AI加速器。但在與谷歌等廠商的合作下,SiFive推出了一個名為矢量定制協(xié)處理器接口(VCIX)的技術,可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。
這相比其他方案來說,矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲,還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作,前者負責運行完整的Linux系統(tǒng)和虛擬機管理程序,后者負責密集的機器學習運算。
英特爾HorseCreek初見端倪
早在去年,英特爾就宣布將會用到SiFive的P550高性能RISC-V核心,以及自己的7nm工藝(即現(xiàn)在的Intel4工藝)來打造一款RISC-V SoC,代號名為HorseCreek。雖然到了2022年,SiFive最高性能的核心已經(jīng)成了P650。但作為一個十三級流水線、三發(fā)射、亂序的64位RISC-V核心,P550的性能仍然是相當能打的,SiFive給到的定位也是對標ARM的Cortex-A75,同時只需不到一半的面積。
不過消息公布后,英特爾雖然又開展了一系列與RISC-V相關的行動,比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發(fā)平臺等等,但HorseCreek卻始終不見蹤影。
而在今年的IntelInnovation大會上,英特爾的不少合作伙伴都在現(xiàn)場搭建了展臺,也有參會者終于在現(xiàn)場看到了HorseCreek的真面目。在Intel4工藝的加持下,HorseCreek將4個2.2GHz的SiFiveP550核心、DDR5和PCIe5集成到了4mmx4mm的單個裸片上,連英特爾CEO PatGelsinger本人也親自來展臺查看HorseCreek的開發(fā)平臺。
根據(jù)展臺上公開的數(shù)據(jù),HorseCreek配備了三級緩存,包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內(nèi)存控制器,支持到5600頻率的DDR5內(nèi)存,PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內(nèi)存編譯器、標準單元等數(shù)模IP以外,HorseCreek還用到了其他的IP,比如西門子的DFT和新思的NOC Fabric。
從以上數(shù)據(jù)可以看出,HorseCreek是一個集SiFive、英特爾和EDA廠商IP大成的SoC。如此強大的SoC加上豐富的接口支持,完全可以用于數(shù)據(jù)中心里。不過,HorseCreek的首個終端產(chǎn)品形態(tài)應該是SiFive的下一代HiFive開發(fā)板。上一代的HiFive Unmatched開發(fā)板已經(jīng)售罄了,在疫情相關的供應鏈問題下,SiFive已經(jīng)放棄了補貨的打算,轉(zhuǎn)而全力去打造下一代基于HorseCreek的HiFive開發(fā)板。
又一個千核RISC-V芯片
在戴爾的HPC社區(qū)大會上,來自美國的初創(chuàng)半導體公司InspireSemiconductor公布了他們?yōu)閿?shù)據(jù)中心提供的RISC-V加速器方案,同時還給出了另一個有趣的說法,那就是現(xiàn)有的高性能計算方案已經(jīng)“不夠好”了。
在他們看來,目前的主流數(shù)據(jù)中心CPU都太慢了,無論有無加速器的輔助都是如此,而在有了加速器以后,90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案,InspireSemiconductor指出這兩者的編程太復雜了,不僅鎖定了軟件棧,而且需要特定的技能才能獲得足夠好的計算結(jié)果。而ASIC和AI加速器的風險又太高了,從成本、時間上看都是如此。
為此,InspireSemiconductor推出了他們的RISC-V加速器方案,Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心,單個PCIe加速卡上的核心數(shù)量更是超過5000個。InspireSemiconductor稱他們用到了創(chuàng)新的高速互聯(lián)方案,在高效利用這么多核心的同時,最高可以組成256個芯片的陣列。
相較其他加速器和GPU方案,Thunderbird加速器也有著功耗上的優(yōu)勢,單芯片的功耗在175W左右,同時他們給出了20W/Tflops的能效比,看來Thunderbird的峰值算力大概就在8.75Tflops左右了。雖然會上InspireSemiconductor也展示了谷歌、聯(lián)想和IBM等客戶或合作伙伴的一些反饋,但這些不少是客套話,是否已經(jīng)用于這些公司的數(shù)據(jù)中心方案中還不好說。
InspireSemiconductor同時承諾了一個對開發(fā)者友好的軟件生態(tài)系統(tǒng),但他們并沒有給出自己的軟件方案,而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態(tài)系統(tǒng),比如OneAPI等,所以不必像競品芯片那樣去開發(fā)一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發(fā)者,無需像GPU那樣去學習CUDA、OpenCL,而是可以用Pragma和MPI這樣的標準編譯器方案。
AI編程上也是如此,InspireSemiconductor指出流行的AI框架,諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持,Linux也在操作系統(tǒng)支持的行列中。如此看來,InspireSemiconductor目前應該只提供了純硬件方案,而這樣的產(chǎn)品是否能在市面上取得成功,目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態(tài)了。
谷歌的RISC-V戰(zhàn)略
自己設計芯片的服務器廠商之一,谷歌,似乎也開始打算用上RISC-V。在今年9月美國的AI硬件峰會上,SiFive首席架構師和谷歌的TPU芯片架構師展示了他們的合作方案。谷歌的TPU是谷歌設計專用于機器學習的加速器,用于在數(shù)據(jù)中心上運行TensorFlow、Pytorch和JAX等機器學習框架。
而TPU的主要計算單元就是矩陣乘法打算(MXU),由脈動陣列中的128x128乘法/累積器組成,在最小配置v4版TPU中包含4個TPU芯片,每個TPU芯片都有8個MXU,是TPU v3版的兩倍,而且每個MXU都能使用BF16執(zhí)行每周期16K的乘積累加運算。
然而,谷歌發(fā)現(xiàn)雖然TPU的機器學習算力雖然夠用,但客戶在利用這類大型AI加速器時,往往無法用它來完成其他的復雜計算負載,所以谷歌的做法是將SiFive的X280處理器核心,作為TPU的協(xié)處理器,用來提供維護和運行代碼,跑加速器沒法運行的內(nèi)核。
雖然SiFive的X280主打的是加速AI/ML計算,但主要是針對邊緣端,比如AR/VR、數(shù)碼相機等等,并非用于數(shù)據(jù)中心的大型AI加速器。但在與谷歌等廠商的合作下,SiFive推出了一個名為矢量定制協(xié)處理器接口(VCIX)的技術,可以讓大型AI加速器直接與X280的32x512位矢量寄存器文件高速通信。
這相比其他方案來說,矢量寄存器層級上的訪問不僅可以提供更大的帶寬、比PCIe更低延遲,還能簡化軟件棧、省下更多的硬件資源。X280和TPU核心分工合作,前者負責運行完整的Linux系統(tǒng)和虛擬機管理程序,后者負責密集的機器學習運算。
英特爾HorseCreek初見端倪
早在去年,英特爾就宣布將會用到SiFive的P550高性能RISC-V核心,以及自己的7nm工藝(即現(xiàn)在的Intel4工藝)來打造一款RISC-V SoC,代號名為HorseCreek。雖然到了2022年,SiFive最高性能的核心已經(jīng)成了P650。但作為一個十三級流水線、三發(fā)射、亂序的64位RISC-V核心,P550的性能仍然是相當能打的,SiFive給到的定位也是對標ARM的Cortex-A75,同時只需不到一半的面積。
不過消息公布后,英特爾雖然又開展了一系列與RISC-V相關的行動,比如加入RISC-V國際基金會、IFS支持RISC-V芯片代工和推出RISC-V的FPGA開發(fā)平臺等等,但HorseCreek卻始終不見蹤影。
根據(jù)展臺上公開的數(shù)據(jù),HorseCreek配備了三級緩存,包括私有二級緩存和通用三級緩存。DDR5這塊集成了英特爾的DDR PHY、DFI接口與Cadence的DDR內(nèi)存控制器,支持到5600頻率的DDR5內(nèi)存,PCIe5.0部分集成了英特爾的PCIePhy和新思的PCIeRootHub控制器。除了英特爾提供的PLL、內(nèi)存編譯器、標準單元等數(shù)模IP以外,HorseCreek還用到了其他的IP,比如西門子的DFT和新思的NOC Fabric。
又一個千核RISC-V芯片
在戴爾的HPC社區(qū)大會上,來自美國的初創(chuàng)半導體公司InspireSemiconductor公布了他們?yōu)閿?shù)據(jù)中心提供的RISC-V加速器方案,同時還給出了另一個有趣的說法,那就是現(xiàn)有的高性能計算方案已經(jīng)“不夠好”了。
在他們看來,目前的主流數(shù)據(jù)中心CPU都太慢了,無論有無加速器的輔助都是如此,而在有了加速器以后,90%的高性能計算都是由加速器負責了。再者就是GPU和FPGA的方案,InspireSemiconductor指出這兩者的編程太復雜了,不僅鎖定了軟件棧,而且需要特定的技能才能獲得足夠好的計算結(jié)果。而ASIC和AI加速器的風險又太高了,從成本、時間上看都是如此。
為此,InspireSemiconductor推出了他們的RISC-V加速器方案,Thunderbird。Thunderbird在單芯片上集成了2560個64位的CPU核心,單個PCIe加速卡上的核心數(shù)量更是超過5000個。InspireSemiconductor稱他們用到了創(chuàng)新的高速互聯(lián)方案,在高效利用這么多核心的同時,最高可以組成256個芯片的陣列。
InspireSemiconductor同時承諾了一個對開發(fā)者友好的軟件生態(tài)系統(tǒng),但他們并沒有給出自己的軟件方案,而是指出Thunderbird將充分利用RISC-V已有的豐富軟件生態(tài)系統(tǒng),比如OneAPI等,所以不必像競品芯片那樣去開發(fā)一次性的軟件棧。如此一來更適合那些喜歡標準CPU編程模型的開發(fā)者,無需像GPU那樣去學習CUDA、OpenCL,而是可以用Pragma和MPI這樣的標準編譯器方案。
AI編程上也是如此,InspireSemiconductor指出流行的AI框架,諸如TensorFlow、Pytorch和Glow等都已有了對RISC-V的支持,Linux也在操作系統(tǒng)支持的行列中。如此看來,InspireSemiconductor目前應該只提供了純硬件方案,而這樣的產(chǎn)品是否能在市面上取得成功,目前看來完全取決于英特爾Codeplay那邊的OneAPI軟件生態(tài)了。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
英特爾
+關注
關注
61文章
9983瀏覽量
171947 -
谷歌
+關注
關注
27文章
6172瀏覽量
105625 -
數(shù)據(jù)中心
+關注
關注
16文章
4807瀏覽量
72209 -
RISC-V
+關注
關注
45文章
2292瀏覽量
46248
發(fā)布評論請先 登錄
相關推薦
第17屆英特爾互聯(lián)網(wǎng)數(shù)據(jù)中心大會順利舉行
第17屆英特爾互聯(lián)網(wǎng)數(shù)據(jù)中心大會在成都順利舉行。業(yè)界領先的云服務商、互聯(lián)網(wǎng)廠商、行業(yè)客戶、OEM/ODM等生態(tài)合作伙伴齊聚一堂,就當下云計算與AI技術的發(fā)展趨勢,以及加速產(chǎn)業(yè)智能化轉(zhuǎn)型等話題展開
RISC-V發(fā)展及FPGA廠商為什么選擇RISC-V
Microsemi 于 2017 年開始在其 FPGA 中提供 RISC-V 軟核,Lattice 于 2020 年開始提供,英特爾 (Altera) 于 2021 年
AMD數(shù)據(jù)中心營收首超英特爾
在這一領域的地位開始受到挑戰(zhàn),也預示著數(shù)據(jù)中心市場競爭格局的轉(zhuǎn)變。 具體數(shù)據(jù)顯示,AMD 在2024年第三季度的數(shù)據(jù)中心業(yè)務收入達到了35.49億美元(按照當前匯率計算,約合人民幣25
AMD數(shù)據(jù)中心業(yè)務首超英特爾,Nvidia異軍突起
長期以來,英特爾在數(shù)據(jù)中心CPU市場占據(jù)主導地位,其Xeon處理器為絕大多數(shù)服務器提供動力。大約七、八年前,AMD的處理器在市場份額中還只是個位數(shù)。然而,這一局面已經(jīng)發(fā)生了翻天覆地的變化。盡管
RISC-V,即將進入應用的爆發(fā)期
自己增加指令和自己的功能。RISC-V架構可以用于數(shù)據(jù)中心、車用、移動設備等任何AI需求產(chǎn)品。
展望RISC-V前景,此前硅谷芯片傳奇Jim Keller曾指出,“RISC-V的潛力是
發(fā)表于 10-31 16:06
RISC-V擁有巨大市場潛力的原因
敏感的市場尤其有吸引力。
5、行業(yè)支持:越來越多的行業(yè)巨頭和初創(chuàng)公司開始支持RISC-V,這不僅包括芯片制造商,還包括軟件開發(fā)商和系統(tǒng)設計公司。2023年,包括谷歌、英特爾、英偉達、高
發(fā)表于 09-30 14:20
英特爾發(fā)布至強6性能核處理器,攜手生態(tài)加速數(shù)據(jù)中心算力升級
英特爾至強6處理器在云計算、數(shù)據(jù)中心架構創(chuàng)新、綠色可持續(xù)發(fā)展等諸多領域的應用實踐,并攜手多家產(chǎn)業(yè)伙伴進行了聯(lián)合發(fā)布。
英特爾數(shù)據(jù)中心XPU產(chǎn)品最新進展:預計2027年發(fā)布
據(jù)匈牙利媒體PROHARDVER!的最新報道,英特爾正緊鑼密鼓地在其內(nèi)部開發(fā)新一代數(shù)據(jù)中心XPU產(chǎn)品,并有望于2027年正式發(fā)布。這一消息標志著英特爾在數(shù)據(jù)中心計算領域的又一重要布局,
risc-v的發(fā)展歷史
Foundation),旨在促進RISC-V架構的發(fā)展和推廣。該基金會由大量的企業(yè)和機構支持,包括英特爾、Nvidia、谷歌、華為、IBM、紅帽、西部數(shù)據(jù)等。
2015年:
發(fā)表于 07-29 17:20
RISC-V適合什么樣的應用場景
研發(fā)成本,不受任何專利或版權制約,這對于汽車電子等成本敏感型領域尤為重要。
5. 數(shù)據(jù)中心和云計算
高性能和能效比:RISC-V處理器在性能和能效比方面表現(xiàn)出色,適用于數(shù)據(jù)中心和云計算領域?qū)Ω咝阅苡嬎?/div>
發(fā)表于 07-29 17:16
RISC-V在中國的發(fā)展機遇有哪些場景?
的理想選擇。
生態(tài)系統(tǒng)建設:多家頭部芯片公司和生態(tài)廠商正在積極推進RISC-V在車規(guī)級產(chǎn)品的布局,這將有助于RISC-V在汽車領域的快速發(fā)展。
4. 數(shù)據(jù)中心和高性能計算(HPC)
性能與能效比
發(fā)表于 07-29 17:14
risc-v多核芯片在AI方面的應用
應用中的成本。
最后,RISC-V多核芯片不僅可以應用于AI邊緣計算領域,還可以擴展到其他領域,如數(shù)據(jù)中心、云計算、自動駕駛、機器人等,為這些領域提供高效、靈活和安全的解決方案。
總的來說,R
發(fā)表于 04-28 09:20
賽昉科技與超聚變達成戰(zhàn)略合作,RISC-V在數(shù)據(jù)中心迎來歷史性跨越
;賽昉科技聯(lián)合創(chuàng)新中心,賽昉科技為數(shù)據(jù)中心場景打造的首款研發(fā)代號為“獅子山”的RISC-V芯片將應用在超聚變的智算產(chǎn)品中。貫徹發(fā)展新質(zhì)生產(chǎn)力的時代要求,賽昉科技將持續(xù)打造具
RISC-V 基礎學習:RISC-V 基礎介紹
同一個存儲器的不同物理位置,因此程序指令和數(shù)據(jù)的寬度相同,如英特爾公司的8086中央處理器的程序指令和數(shù)據(jù)都是16位寬。
數(shù)學家馮·諾依曼提出了計算機制造的三個基本原則,即采用二進制邏輯、程序存儲執(zhí)行
發(fā)表于 03-12 10:25
【RISC-V開放架構設計之道|閱讀體驗】 RISC-V設計必備之案頭小冊
。在書中,特別提到了匯編器對于RISC-V中的作用,包括當講寄存器硬連線為0時,可以使用偽指令來簡化常規(guī)操作,如跳轉(zhuǎn)、返回和等于零時分支等。
浮點運算和壓縮指令數(shù)據(jù)集的知識則是放在下一次的帖子中說。
發(fā)表于 01-22 16:24
評論