電子發燒友網報道(文/周凱揚)要說跟上AI時代的進程,RISC-V相對其他架構來說也一點不慢。從各個初創公司的產品或者路線圖也可以看出,AI計算是他們最為重視的一環,甚至重要性要超過通用計算。畢竟這是RISC-V可以后發制人的一大領域,甚至不會有太多架構設計上的歷史桎梏。為此,不少廠商也都從AI出發,設計出了定位不一的RISC-V產品。
高性能AI計算
Esperanto作為為數不多的幾家沖擊高性能AI計算的公司,如今也開始察覺到了AI市場的風向變動,于是決定將重心從過去的推薦加速改為大語言模型和HPC。Esperanto走進大眾視野的方式相當特別,他們的第一款產品就是千核RISC-V芯片ET-SOC-1。
ET-SOC-1基于臺積電7nm工藝打造,集成了1088個64位ET-Minion RISC-V核心和4個ET-Maxion核心,提供了超高的單線程性能。雖說ET-SOC-1對ML進行了優化,是一個理想的推理芯片選擇,但Esperanto為其打造的軟件棧主要還是以推薦場景打造。直到他們近期推出了新的AI軟件開發工具包,并專門針對LLM進行了優化,并展示了運行300億參數的OPT模型。
據Esperanto表示,目前他們的生成式AI應用已經可以運行最新的LLM和圖片生成模型,比如LLaMA2、Vicuma和Stable Diffusion等等。不過在千變萬化的AI市場下,單個模型往往難以維持長時間的熱度,所以Esperanto的計劃是持續跟進最流行的開源模型。
IP廠商也不例外,除了SiFive、平頭哥、Tenstorrent等已經推出高性能AI IP或對現有產品線進行AI升級的公司外,Semidynamics也發布了最新完全可定制的矢量單元,用于配合其Atrevido CPU核心。該矢量單元有多個矢量內核構成,每個內核都有算數單元,可以執行加減、乘加等數字與邏輯運算。
這個矢量單元的最大特色在于全定制性,與其他廠商只有部分配置選項不同,為了應對未來各種AI模型的精度要求,Semidynamics的矢量單元在定制化后,可以支持FP64、FP32、FP16、BF16、INT64、INT32、INT16或INT8的數據類型。
盡管ASIC、GPU和FPGA常被視為最合適進行AI計算的三大硬件,但在如今的市場環境下,無論是服務器還是消費終端,CPU也都需要一些可觀的AI計算特性。所以開源社區推出了LLaMA.cpp這一模型,該模型是基于Meta的LLaMA模型打造而成,無需PyTorch等庫的外部依賴,僅靠C/C++編譯即可生成執行文件,且無需GPU,只靠CPU就可以運行。
曠視科技參考并借鑒了LLaMA.cpp項目,推出了InferLLM這一輕量級的LLM模型推理管家,且除了常見的Arm、x86和CUDA外,他們也針對RISCV-Vector做了專門的優化,目前已經可以部署在群芯閃耀科技發布的Milk-V Pioneer RISC-V主板上,而該主板用到的64位CPU正是算能科技的算豐SG2042。
算豐SG2042采用了單芯片64個RISC-V內核的設計,支持雙路CPU互聯、4通道DDR4和32通道PCIe 4.0,典型功耗為120W,可以說是典型的服務器芯片設計。但很明顯,即便是高性能CPU,在一些非重型AI負載下,也能有可觀的表現。
低功耗的邊緣端
盡管云端的生成式AI已經變得越來越普及,企業在花了大成本購置硬件資源后也能在本地運行更多的AI計算負載降低效率提高安全性。但對于消費者而言,似乎真正部署在端側的生成式AI才更加值得關注,在實用性上也剛強一些,而且不只是手機這種使用高端芯片的產品,不少IoT產品也在規劃著如何接入生成式AI,因此大算力的邊緣AI芯片就成了首選。
云天勵飛作為國內首批闖入AI賽道的廠商,此前一直在主攻AI算法領域,但單靠算法的泛化能力相對較弱,于是云天勵飛也就開始加入芯片設計賽道,比如2018年推出的DeepEye 1000等。
而在今年舉辦的第三屆滴水湖中國RISC-V論壇上,云天勵飛展示了去年成功流片,如今已經接近量產的邊緣AP級SoC Deep Edge10V。從芯片結構上看,Edge10V采用了Chiplet設計,滿足國產Chiplet UCIE標準。CPU部分采用了1.2GHz的雙核C920,還集成了一個500MHz的NNP400T NPU,算力高達12TOPS@INT8。在視頻處理能力上,Edge10V也配備了支持H265/H264視頻編解碼的多媒體子系統。
另外值得一提的是,Edge10V僅僅是Edge10系列中的一環,由于Chiplet設計支持多die擴展,所以也可以在Edge10Max這一產品上實現高達64Tops的算力。云天勵飛芯片BD總監張福林表示,Edge10V主要應用于邊緣計算,而Edge10Max則應用于邊緣CV大模型,比如Pytorch、Caffe、Tensorflow等框架下的模型。從應用上來看,Edge10V的主要應用場景還是云天勵飛擅長的機器視覺領域,比如機器人、智能安防之類的邊緣端。
本屆滴水湖論壇上,普林芯馳也展示了他們的智能離線語音交互MCU SPV20系列芯片。該系列的特色在于,除了基于SiFive E21RISC-V核心打造的CPU外,還有基于CEVA TL420核心的DSP與集成普林芯馳自有算法的NPU。該NPU支持CNN、DS-CNN等深度壓縮語音識別模型,可用于家電的智能語音控制。
嘉楠科技的第二代AI推理芯片,勘智K510,同樣是針對邊緣側AI開發的產品。這一芯片采用了雙核RISC-V 64位CPU,主頻最高達到800MHz。勘智K510支持INT8和BF16雙數據類型,且具備2.5TFLOPS的算力,還支持Tensorflow、Pytorch和ONNX等多種框架的算子庫。
用生成式AI設計RISC-V芯片
隨著生成式AI在代碼生成上日益精進的表現,如今利用生成式AI來設計芯片也成了可能。近日,開源硬件平臺Efabless就舉辦了一屆生成式開源芯片設計挑戰賽,其中清華RIOS Lab團隊的RISC-V芯片,CyberRio獲得了亞軍。
據其Github頁面所示,該芯片的大部分Verilog代碼都是使用GPT-4生成的,從而基于一個經典的5級流水線設計出了CyberRio。CyberRio也在Skywater提供的130nm的工藝平臺上得到了流片驗證,這也意味著全球第一個由LLM完成主要涉及的CPU被成功制造出來。
不過開放團隊也表示,GPT-4對硬件語言的理解并不算完整,無論是對設計語言本身的理解,還是對握手或并行處理等設計概念。這很可能是GPT-4訓練過程本身的缺陷,不過開發團隊也提出了Langchain之類的替代方案或許可以解決GPT-4信息缺失造成的問題。
寫在最后
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
機器人
+關注
關注
211文章
28632瀏覽量
208005 -
控制
+關注
關注
4文章
1014瀏覽量
122725 -
AI
+關注
關注
87文章
31490瀏覽量
269915
發布評論請先 登錄
相關推薦
新的一年 RISC-V前景如何呢?
1 月 7 日消息,RISC-V 領軍企業 SiFive 成立中國分公司,中文名稱定為“芯伍科技”。
1 月 14 日消息,專注傳統與 AI 業務,Imagination 放棄 RISC-V CPU 開發。
新的
發表于 01-24 16:19
Rivos全新產品采用Andes晶心科技NX45 RISC-V處理器
專注于加速數據分析和生成式AI工作負載的RISC-V主要會員公司Rivos與32/64位RISC-V處理器內核的領先供貨商、
關于RISC-V學習路線圖推薦
向量指令集、密碼指令集等)進行硬件加速和優化。
嵌入式系統開發 :
掌握RISC-V在嵌入式系統中的應用,如物聯網設備、智能家居等。目前AI、大模型
發表于 11-30 15:21
RISC-V,即將進入應用的爆發期
RISC-V是一種開放標準指令集架構 (ISA),最初由加州大學伯克利分校的研究人員于2010年開發。業界稱,這種開源特性為芯片設計者提供了極大的靈活性,可以根據具體需求定制AI加速器。
而A
發表于 10-31 16:06
芯原聯合主辦RISC-V和生成式AI論壇
隨著生成式AI技術的快速演進,相關應用已開始向各行業滲透,AI模型在云側進行訓練、端側進行推理和微調時,產生了巨大的算力需求。
risc-v的發展歷史
領域中得到廣泛應用,包括嵌入式設備、個人電腦、服務器等。
國際合作:RISC-V基金會將繼續加強與國際企業和機構的合作,共同推動RISC-V架構的發展和應用。
綜上所述,RISC-V的
發表于 07-29 17:20
RISC-V適合什么樣的應用場景
設計使得開發者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統的各種性能要求。
3. 人工智能(AI)和機器學習(ML)
高性能計算:RISC-V結合AI加速器或協處理器,可以提供高效
發表于 07-29 17:16
RISC-V在中國的發展機遇有哪些場景?
聯網市場的重要參與者,擁有龐大的用戶基數和豐富的應用場景。RISC-V在中國的發展將受益于這一市場需求的增長。
2. 人工智能(AI)
AI算力需求:隨著人工智能技術的廣泛應用,對算力
發表于 07-29 17:14
芯原股份RISC-V和生成式AI論壇成功舉辦
海世博中心舉辦。此次論壇邀請了烏鎮智庫、RISC-V國際基金會、Tenstorrent、MIPS、知合計算、芯來科技和華東政法大學等國內外產學研界的專家,與芯原一同深入探討RISC-V與生成
risc-v多核芯片在AI方面的應用
在極低的能耗下實現高效的AI元器件的運行。這對于需要長時間運行和依賴電池供電的AI設備來說尤為重要。
其次,RISC-V的模塊化架構允許其不同部分以模塊化的方式串在一起,從而滿足各種不
發表于 04-28 09:20
RISC-V有哪些優點和缺點
新的、尚未被廣泛驗證的技術。
需要注意的是,隨著RISC-V技術的不斷發展和生態系統的逐步完善,其缺點可能會逐漸被克服。同時,RISC-V的優點也使其在多個領域具有廣闊的應用前景,包括服務器、物聯網、嵌入
發表于 04-28 09:03
RISC-V有哪些優缺點?是堅持ARM方向還是投入risc-V的懷抱?
是一個優勢。同時,這種設計也降低了制造成本,使得RISC-V在成本敏感的應用場景中更具競爭力。
缺點 :
性能問題 :雖然RISC-V設計簡潔,但相對于某些專用ISA(如ARM),其性
發表于 04-28 08:51
解鎖RISC-V技術力量丨曹英杰:RISC-V與大模型探索
4月12日,第二期“大家來談芯|解鎖RISC-V技術力量”在上海臨港新片區頂科永久會址舉辦,本期沙龍聚焦RISC-V技術,圍繞AI時代的RISC-V市場機會、
評論