電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)2021年一月,上海天數(shù)智芯半導(dǎo)體有限公司(以下簡(jiǎn)稱:天數(shù)智芯)宣布,公司旗艦7nm工藝GPGPU云端訓(xùn)練芯片BI成功點(diǎn)亮,這是國(guó)內(nèi)第一款全自研、真正基于GPU架構(gòu)下的7nm工藝GPGPU訓(xùn)練芯片。
緊接著,2021年3月31日,天數(shù)智芯正式對(duì)外發(fā)布全自研高性能云端7nm芯片BI及產(chǎn)品卡,實(shí)現(xiàn)國(guó)產(chǎn)云端高性能GPGPU芯片從0到1的突破。在算力方面,天數(shù)智芯BI產(chǎn)品單芯每秒可進(jìn)行147萬億次FP16計(jì)算(147TFLOPS@FP16)。
天數(shù)智芯在BI產(chǎn)品“點(diǎn)亮”時(shí)提到,BI產(chǎn)品的理論峰值性能達(dá)市場(chǎng)主流產(chǎn)品的2倍。一時(shí)間,國(guó)產(chǎn)GPGPU似乎已經(jīng)站在世界之巔。但天數(shù)智芯產(chǎn)品副總裁鄒翾在接受電子發(fā)燒友采訪時(shí)表示:“實(shí)測(cè)性能對(duì)用戶才是關(guān)鍵,目前國(guó)內(nèi)的軟件生態(tài)是短板,幾乎90%的AI應(yīng)用都基于國(guó)外的基礎(chǔ)軟件棧,如何在現(xiàn)有軟件生態(tài)上充分發(fā)揮芯片的計(jì)算力,提供優(yōu)秀的實(shí)測(cè)性能,這是國(guó)產(chǎn)GPGPU 發(fā)展的關(guān)鍵。”
減少客戶遷移的成本
軟件的重要性是毋庸置疑的,是發(fā)揮GPGPU硬件潛力的必要一環(huán),讓抽象的算力資源能夠和具體應(yīng)用深度結(jié)合。目前,在GPGPU領(lǐng)域,無論是CUDA/OpenCL/TensorRT這些硬件加速平臺(tái),還是TensorFlow/PyTorch等主流深度學(xué)習(xí)開發(fā)框架,主導(dǎo)者都是國(guó)際廠商或機(jī)構(gòu)。鄒翾認(rèn)為:“自己的軟件平臺(tái)一定是需要的,但目前來說,我們與國(guó)外主流廠商還有比較大的差距。而且不能單從某一顆芯片上去對(duì)比,還包括產(chǎn)品的覆蓋范圍、生態(tài)等方面。尤其是生態(tài)建設(shè),這是國(guó)內(nèi)廠商必須要面對(duì)的問題。”
他還說到,國(guó)內(nèi)企業(yè)一定要敢于承認(rèn)這種差距,在解決這些問題以后,國(guó)內(nèi)的運(yùn)算平臺(tái)才會(huì)有真正的用武之地。我們企業(yè)還是要圍繞怎么解決用戶需求去發(fā)展,在這個(gè)過程中不斷追趕并縮小這種差距。。
在天數(shù)智芯的系統(tǒng)軟件方案中有標(biāo)注,該公司除了提供高效的全棧式解決方案和全套SDK,也強(qiáng)調(diào)API兼容業(yè)界主流生態(tài)以及無痛遷移。“提供高效率的軟件結(jié)構(gòu),最大限度降低已有客戶的開發(fā)遷移成本,極大地影響著整個(gè)產(chǎn)業(yè)的發(fā)展。” 鄒翾指出,“天數(shù)智芯在產(chǎn)品的設(shè)計(jì)之初就關(guān)注到,客戶需要最大限度降低跨平臺(tái)的開發(fā)成本。我們考慮到GPGPU產(chǎn)品架構(gòu)的通用兼容性,本著以客戶需求為出發(fā)點(diǎn)的原則,從實(shí)際角度為客戶實(shí)現(xiàn)跨平臺(tái)轉(zhuǎn)換的無痛遷移。”
從云端走向更廣闊的場(chǎng)景
在天數(shù)智芯BI產(chǎn)品的介紹中我們看到,這款全自研通用計(jì)算GPGPU芯片聚焦于云端訓(xùn)練市場(chǎng)。長(zhǎng)期以來,云端訓(xùn)練市場(chǎng)被國(guó)際巨頭壟斷,不僅加速卡產(chǎn)品成本高,且生態(tài)較為封閉,制約了AI產(chǎn)品多元化發(fā)展和升級(jí)迭代。
鄒翾介紹說,BI產(chǎn)品是國(guó)內(nèi)第一款全自研、真正基于通用GPU架構(gòu)的GPGPU云端高端訓(xùn)練芯片,以比同類產(chǎn)品更小的芯片面積 、更低的功耗,提供主流廠商實(shí)測(cè)接近的性能。總結(jié)而言,BI產(chǎn)品有以下幾個(gè)優(yōu)勢(shì):
全自研IP核心;
GPGPU架構(gòu),更具有通用性及靈活性;
采用先進(jìn)的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
軟件對(duì)主流生態(tài)兼容,客戶的跨平臺(tái)開發(fā)成本更低。
作為一種通用計(jì)算芯片,云端訓(xùn)練只是GPGPU典型的應(yīng)用場(chǎng)景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業(yè)中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運(yùn)行圖形渲染之外的通用計(jì)算任務(wù)。”
在采訪的過程中,我們談到了端側(cè)AI的應(yīng)用。鄒翾表示,GPU在端到端AI部署中,屬于一個(gè)已經(jīng)被驗(yàn)證的芯片架構(gòu)。AI端側(cè)發(fā)展會(huì)驅(qū)動(dòng)應(yīng)用背后更多新型函數(shù)和新型算子的出現(xiàn),這些需求將被融合到GPU未來的軟硬件開發(fā)中。
下面這段引述是他對(duì)于GPGPU在與各類型AI芯片相比特點(diǎn)的總結(jié):GPGPU的設(shè)計(jì)特點(diǎn)在于其通用可編程性,對(duì)于層出不窮的新的算法和應(yīng)用,能做到性能和開發(fā)成本間較好的平衡。同時(shí),基于GPGPU的通用性,客戶可以在類似軟硬件架構(gòu)間的產(chǎn)品間進(jìn)行應(yīng)用的無痛遷移。
在GPGPU領(lǐng)域,NVIDIA無疑是行業(yè)的標(biāo)桿,不僅擁有百萬開發(fā)者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領(lǐng)先優(yōu)勢(shì),再考慮到產(chǎn)業(yè)生態(tài),國(guó)產(chǎn)GPGPU替代還有很長(zhǎng)的路要走。在NVIDIA官網(wǎng)有提到,AI應(yīng)用不僅需要大的內(nèi)存池,也需要CPU和GPU緊密耦合。
對(duì)于這一點(diǎn),鄒翾認(rèn)為,GPU注重的是同類型的數(shù)據(jù)按照同樣的處理流程進(jìn)行高效并行處理,CPU的優(yōu)勢(shì)是處理復(fù)雜邏輯流程。CPU和GPU在一個(gè)芯片上是可以實(shí)現(xiàn)的,而且以前也存在這種整合性的產(chǎn)品,但是對(duì)于高端的、云端的CPU加上GPU同時(shí)實(shí)現(xiàn),需要非常大的尺寸規(guī)模,而且會(huì)限制芯片在各自領(lǐng)域的性價(jià)比。
天數(shù)智芯的下一步
艾瑞咨詢此前在相關(guān)報(bào)告中指出,2020年中國(guó)人工智能基礎(chǔ)層市場(chǎng)規(guī)模為497億元,為AI產(chǎn)業(yè)總規(guī)模的33%,AI芯片的高增長(zhǎng)是產(chǎn)業(yè)規(guī)模增長(zhǎng)的主要推動(dòng)力。未來,算力模塊的智能服務(wù)器國(guó)產(chǎn)化率將逐步提升。
毫無疑問,云端訓(xùn)練在未來很長(zhǎng)一段時(shí)間內(nèi)仍將是AI芯片的主要市場(chǎng),市場(chǎng)占比會(huì)一直處于前列。但正如鄒翾所言,隨著AI、5G技術(shù)的持續(xù)發(fā)展與應(yīng)用落地,端側(cè)及邊緣側(cè)未來對(duì)算力性能的要求會(huì)越來越大。其中,數(shù)據(jù)中心以及金融、電信等方面將會(huì)是很大的市場(chǎng)。
他表示:“目前天數(shù)智芯的產(chǎn)品是云端7nm通用計(jì)算芯片BI及加速卡,未來公司將聚焦GPGPU領(lǐng)域的高通用性及更廣闊的應(yīng)用領(lǐng)域。天數(shù)智芯始終以市場(chǎng)需求為導(dǎo)向,結(jié)合公司技術(shù)優(yōu)勢(shì),關(guān)注客戶需求痛點(diǎn)并推出適合的GPGPU產(chǎn)品。隨著城市數(shù)字化轉(zhuǎn)型,傳統(tǒng)行業(yè)智能化轉(zhuǎn)型升級(jí)需求逐漸擴(kuò)大,5G、大數(shù)據(jù)中心、人工智能、工業(yè)物聯(lián)網(wǎng)、無人駕駛、智慧城市等眾多智能應(yīng)用領(lǐng)域?qū)Ω叨薌PGPU芯片產(chǎn)品的需求量都在急劇增加。”
2021年3月1日,天數(shù)智芯對(duì)外宣布完成12億元人民幣的C輪融資。在企業(yè)高速發(fā)展的過程中,除了資金要到位,人才是重中之重。“天數(shù)智芯目前已經(jīng)擁有了一支全球頂尖的數(shù)字集成電路設(shè)計(jì)與基礎(chǔ)軟件設(shè)計(jì)科學(xué)家團(tuán)隊(duì),為實(shí)現(xiàn)公司‘做算力引擎,創(chuàng)世界一流’的愿景而砥礪前行。
這支完整的GPGPU研發(fā)團(tuán)隊(duì),由公司聯(lián)合創(chuàng)始人、高級(jí)副總裁及首席科學(xué)家鄭金山先生帶領(lǐng),占比公司總?cè)藬?shù)85%以上,這其中既有一批行業(yè)經(jīng)驗(yàn)超過20年的世界級(jí)技術(shù)專家,也有一大批擁有5-15年業(yè)界經(jīng)驗(yàn)的高執(zhí)行力技術(shù)菁英,亦不乏來自于全球頂級(jí)院校的博士。”
鄒翾對(duì)此講到,“按照公司的業(yè)務(wù)發(fā)展,我們將會(huì)持續(xù)不斷地吸納優(yōu)秀人才深耕國(guó)產(chǎn)GPGPU芯片設(shè)計(jì)。隨著新產(chǎn)品的推出,團(tuán)隊(duì)也將進(jìn)一步擴(kuò)大。另外,根據(jù)我們產(chǎn)品規(guī)劃和市場(chǎng)發(fā)展需要,天數(shù)智芯也會(huì)進(jìn)一步通過融資支持公司的長(zhǎng)遠(yuǎn)發(fā)展。”
聲明:本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請(qǐng)注明以上來源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請(qǐng)發(fā)郵箱huangjingjing@elecfans.com。
編輯:jq
-
芯片
+關(guān)注
關(guān)注
456文章
51155瀏覽量
426355 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5075瀏覽量
103543 -
gpu
+關(guān)注
關(guān)注
28文章
4768瀏覽量
129228 -
AI
+關(guān)注
關(guān)注
87文章
31490瀏覽量
269923 -
SDK
+關(guān)注
關(guān)注
3文章
1045瀏覽量
46154
原文標(biāo)題:正視差距,國(guó)產(chǎn)GPGPU的進(jìn)階之路
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論