電子發燒友網報道(文/周凱揚)今年開年以來,相信大家已經接受了一波各種國產GPU新品的消息轟炸了,尤其是GPGPU(通用圖形處理單元),比如天數智芯的天垓、壁仞科技的BR100系列等等,這也意味著在通用計算上,國內GPU的硬件生態終于走上了快車道。
然而去年9月份,RISC-V向量擴展(RVV)1.0的正式推出讓RISC-V開始在通用計算和AI領域有了更大發揮空間,比如GCC和LLVM這兩大著名編譯器都已經支持RVV匯編等。RISC-V的GPU也開始因此冒頭,甚至不少都是開源的,比如去年的Vortex等。
清華“承影”GPU今年的RISC-V中國峰會上,清華大學集成電路學院何虎副教授團隊發布了采用Chisel語言基于RISC-V 的開源GPGPU實現方案,名為“承影”(Ventus),同時還給出了映射方案、指令集和微架構的實現。
作為開始嶄露頭角的敏捷硬件設計語言,Chisel在RISC-V處理器的設計中變得愈發常見,另一開源RISC-V處理器,中科院的香山同樣采用了這一語言。這是因為其開發效率高過傳統的Verilog,承影開發團隊表示,利用Chisel高效參數化的特點可以生成不同規模的硬件單元,且應用無需更改代碼仍能運行。
承影選擇了將RISC-V向量擴展與SIMT架構結合的方式,RISC-V向量擴展可以適應不同規模而硬件,而無需進行重新編譯。而單指令多線程的SIMT作為當下幾乎所有GPU都選擇的架構,在編程靈活性上要更高一些。
承影開發團隊的設想是,讓RVV GPGPU與RISC-V CPU充分結合,完成統一ISA下的SoC系統,能讓編譯器在任務劃分和協同上探索更多可能。與此同時,他們也想借助開源RISC-V、開源硬件來打造自主可控的SoC系統。
承影已經在Xilinx VCU128 FPGA上完成了驗證,他們開發了AXI驅動程序,并用MicroBlaze作為Host進行任務發射,用PL搭建“承影”GPGPU進行計算,通過DDR共享內存。按照4 warp 8 thread的配置可部署160個核心,核心頻率為100MHz,理論峰值算力為32Gflops,可同時駐留1280個線程。承影開發團隊預計中芯國際40nm工藝下,頻率至少也能做到350MHz。
承影GPU不僅本身開源,也同樣受益于開源。在承影的Github界面可以看到,其CTA調度器是基于另一大開源GPU項目,MIAOW的超線程調度器,L2緩存設計和香山處理器一樣,參考了SiFive的Block InclusiveCache,乘法器和FPU也參考啟發自香山的設計。這也就是RISC-V的開源魅力,在設計過程中不僅可以汲取來自其他ISA過去的設計經驗,也能讓整個開源社區參與到后續的開發完善工作中來。
根據承影開發團隊的介紹,他們的后續工作包括工具鏈的開發,比如調試和UVM驗證工具、RVV自動向量化工具,至于CUDA支持,他們打算走CUDA-LLVM-RVV這條路線。后續他們也計劃引入一些架構上的改進,比如借鑒向量處理器的思路,以及現有GPGPU的架構。內存方面會考慮RVWMO與GPGPU的結合。他們也考慮加入圖形功能,Tensor core以及transformer等單元。當然了,以上所說到的工作量都不少,還是需要開源社區的積極參與才能完成。
對RISC-V GPGPU未來的展望盡管GPGPU作為通用計算的一種硬件形式,目前已經在AI、HPC中開始普及,但要說GPU的各種角色定位中,效率最高、計算量最大、內存占用最多的應用之一還是圖形渲染。鑒于目前圖形渲染技術壁壘其實更高,RISC-V在這塊還有很長的一段路要走。
天數智芯產品副總裁鄒翾也在會上指出,當下AI與圖形在云端融合已經成為必然的趨勢,非GPU的架構很難響應兩者在云端融合的挑戰,而通用GPU不是像英偉達一樣已經具備圖形功能,就是可以追加圖形功能。
具體實現方式也各有不同,就拿佐治亞理工學院的開源RISC-V GPGPU Vortex為例,今年的Hot Chips 34上,他們就展示了如何將GPGPU上的一部分圖形硬件區塊在軟件上實現,從而節省處理器面積。雖然他們在各種3D Demo上驗證出的平均幀數只有10fps左右,但對于在Intel Arria 10 FPGA上實現的一個8核128線程的GPGPU來說,已經是不錯的成績了。
至于軟件生態支持,建立一個像CUDA一樣流行的生態目前看來明顯不現實,所以相關的移植工作依然被列為重心,比如上面提到的Vortex,就在開展相關的移植工作,將CUDA轉換成OpenCL。除了他們以外,還有不少公司也在開展相關的工作,比如被英特爾收購的Codeplal,就在為RISC-V處理器開發對OpenCL與SYCL的支持,而他們也在開展CUDA移植SYCL相關開發工作。
賽昉科技也基于LLVM開發了RISC-V GPGPU編譯器,實現了CUDA程序到RISC-V GPGPU指令的生成,他們還開發了相應的runtime庫,實現了設備管理、內核下發、數據傳輸等一系列功能。賽昉科技算法高級經理夏品正在本屆RISC-V中國峰會上表示,基于這一套編譯器和runtime,一部分CUDA工程已經可以運行在RISC-V GPGPU上,并能通過功能測試。
RISC-V GPU真正落地到產品上的還是太少了,就拿本屆中國峰會上發布的賽昉科技VisionFive 2單板計算機來說,相較于上一代昉·星光來說雖然增加了GPU,但依然還是用的Imagination的方案,同樣的還有RIOS Lab的PicoRio、YADRO的EL Construct T等。這樣的異構設計并沒有問題,可RISC-V還在GPU上的投入還是不夠,要想繞過巨頭們積累的GPU專利,離真正打造一個完全基于該架構下的SoC產品還有一定的距離。
-
gpu
+關注
關注
28文章
4754瀏覽量
129077 -
SoC系統
+關注
關注
0文章
52瀏覽量
10700 -
RISC-V
+關注
關注
45文章
2300瀏覽量
46261
原文標題:清華承影,又一RISC-V開源GPU面世
文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論