(文章來(lái)源:雷鋒網(wǎng))
Arm推出了一系列全新的IP,包括NPU、GPU以及DPU。NPU尤為值得關(guān)注,不僅因?yàn)镹PU系列同時(shí)發(fā)布了N57和N37兩款新品,還因?yàn)锳rm的ML處理器(Machine Learning Processor)系列名稱Ethos也正式公布。全新AI系列產(chǎn)品的亮相,意味著Arm的AI策略更加明晰。
實(shí)際上,Arm原計(jì)劃在2019年第一季度發(fā)布首款ML處理器。之所以選擇這個(gè)時(shí)間點(diǎn),Arm ML事業(yè)群商業(yè)與營(yíng)銷副總裁Dennis Laudick去年11月接受雷鋒網(wǎng)專訪時(shí)表示:“最近我們已經(jīng)看到機(jī)器學(xué)習(xí)技術(shù)正在穩(wěn)定和成熟,市場(chǎng)需求也正在不斷增加,我們認(rèn)為現(xiàn)在是進(jìn)入市場(chǎng)的最佳時(shí)機(jī)。”
不過(guò),Arm首款ML處理器的發(fā)布時(shí)間是在今年5月,比計(jì)劃略晚一些。Dennis上周再次接受雷鋒網(wǎng)專訪時(shí)表示,發(fā)布推遲有很多原因,產(chǎn)品開(kāi)發(fā)是主要的問(wèn)題。ML處理器開(kāi)發(fā)的過(guò)程中面臨很多挑戰(zhàn),其中一個(gè)很大的挑戰(zhàn)就是數(shù)據(jù)移動(dòng)處理不好就會(huì)消耗大量的電,另一個(gè)大的挑戰(zhàn)就是如何權(quán)衡效率和靈活性。
雖然產(chǎn)品的開(kāi)發(fā)影響了首款ML處理器發(fā)布的時(shí)間,但Arm并沒(méi)有在首款ML產(chǎn)品發(fā)布時(shí)就公布其系列名稱和型號(hào)。而是直到面向主流市場(chǎng),提供性能、成本以及功耗均衡的N57和對(duì)成本極端敏感的N37發(fā)布,Arm才正式公布ML系列處理器的的名稱——Ethos(中文可翻譯為精神)。此時(shí),外界也才清楚5月發(fā)布的首款ML處理器型號(hào)為Ethos-N77,定位高端,面向高性能需求的市場(chǎng)。
這是為什么?Dennis解釋稱,其實(shí)有很多原因,Arm內(nèi)部也在重新思考命名系統(tǒng),如果推出第一款機(jī)器學(xué)習(xí)產(chǎn)品就立刻發(fā)布新的產(chǎn)品系列名稱,可能大家會(huì)把對(duì)這個(gè)系列品牌的印象和認(rèn)知捆綁在這一款產(chǎn)品身上,我們不希望造成這樣的效果。我們希望大家看到Ethos這個(gè)產(chǎn)品名下面的產(chǎn)品系列是廣泛而豐富的,這就是為什么要等到有針對(duì)三個(gè)不同市場(chǎng),三個(gè)不同檔次的產(chǎn)品都出來(lái)了,才正式的對(duì)外公布產(chǎn)品系列的名稱的主要原因。
但更為關(guān)鍵的是,市場(chǎng)上已經(jīng)有眾多競(jìng)爭(zhēng)者,此時(shí)推出Ethos還有競(jìng)爭(zhēng)力嗎?Dennis表示,Arm的成功一直以來(lái)都得益于生態(tài)系統(tǒng),對(duì)于NPU來(lái)說(shuō)挑戰(zhàn)并不是能夠做出自己的NPU,而是NPU在市場(chǎng)上是不是真的好用。我們已經(jīng)聽(tīng)到合作伙伴反饋說(shuō),希望在硬件上能夠標(biāo)準(zhǔn)化,他們不想支持15種不同的硬件,所以,他們期待有一個(gè)標(biāo)準(zhǔn)化的軟件平臺(tái)能夠支持。
以具體的產(chǎn)品看,Ethos-N57與Ethos-N37的設(shè)計(jì)理念包括一些基本原則,例如:針對(duì)Int8與Int16數(shù)據(jù)類型的支持性進(jìn)行優(yōu)化;先進(jìn)的數(shù)據(jù)管理技術(shù),以減少數(shù)據(jù)的移動(dòng)與相關(guān)的耗電;通過(guò)Winograd技術(shù)的落地,使性能比其他NPU提升超過(guò)200%。
AI處理器支持的數(shù)據(jù)類型非常關(guān)鍵,隨著算法和模型的逐步成熟,邊緣端的AI芯片很多都只支持Int8的數(shù)據(jù)類型,但Arm還選擇支持Int16。對(duì)此,Dennis表示,機(jī)器學(xué)習(xí)支持Int8數(shù)據(jù)類型基本就足夠了,我們之所以選擇也支持INT16是為了更好的應(yīng)對(duì)涉及到圖像處理的工作,因?yàn)橥ǔ?lái)說(shuō)像素是10到12位,牽扯到顏色,支持INT16就省略了很多的數(shù)據(jù)轉(zhuǎn)換的工作,非常適合圖像處理。
但為何又沒(méi)有支持更高精度的FP16?“因?yàn)镕P16對(duì)帶寬的需求相當(dāng)高,這就意味著處理器的整個(gè)處理量和功耗就會(huì)提升。但消耗這么多的功耗和帶寬,準(zhǔn)確率與INT8比較卻沒(méi)有多少提升。” Dennis如此解釋。
雖然機(jī)器學(xué)習(xí)讓處理器的設(shè)計(jì)面臨著新的挑戰(zhàn),不過(guò)Dennis認(rèn)為機(jī)器學(xué)習(xí)本身并沒(méi)有改變最為根本的處理器的設(shè)計(jì)原則,只不過(guò)針對(duì)機(jī)器學(xué)習(xí)的處理器設(shè)計(jì)的重點(diǎn)可能和通用處理器有所不同。Arm一直強(qiáng)調(diào)的數(shù)據(jù)管理是我們的重點(diǎn),還有并行計(jì)算、矩陣乘法都是我們關(guān)注的重點(diǎn)。
硬件的獨(dú)特性之外,軟件也同樣重要,特別是在AI時(shí)代,軟硬一體化的重要性更加突顯。要實(shí)現(xiàn)理想的軟硬結(jié)合,Dennis認(rèn)為有兩大挑戰(zhàn),一個(gè)還是權(quán)衡的問(wèn)題,也就是多少工作讓硬件完成以及多少工作給軟件完成。另一個(gè)是ML框架的支持,因?yàn)檫@個(gè)領(lǐng)域還很新,還會(huì)出現(xiàn)不同的框架。
除了軟硬一體化提升AI性能,在先進(jìn)半導(dǎo)體制程越來(lái)越昂貴的背景下,通過(guò)異構(gòu)系統(tǒng)提升處理器性能也受到了很大的關(guān)注。但異構(gòu)的系統(tǒng)給軟件帶來(lái)的更大的挑戰(zhàn),此時(shí),到底是用統(tǒng)一的軟件API去分配硬件資源實(shí)現(xiàn)易用性,還是對(duì)每個(gè)硬件單獨(dú)編程讓系統(tǒng)更加高效?
Arm采用的在硬件之上有特別優(yōu)化的Compute Library,它會(huì)把底層的硬件和驅(qū)動(dòng)進(jìn)行充分優(yōu)化,根據(jù)算子的不同需求驅(qū)動(dòng)硬件,可以提升幾倍到十幾倍的效率。再上一層是Arm nn,可以將TensorFlow、Caffe等神經(jīng)網(wǎng)絡(luò)框架轉(zhuǎn)換成Compute Library可以執(zhí)行的任務(wù),讓開(kāi)發(fā)者不用關(guān)心底層的硬件,只需要使用標(biāo)準(zhǔn)架構(gòu)進(jìn)行開(kāi)發(fā)就可以。
因此,Dennis表示Arm采用的方式是更加底層的方式,軟件直接與CPU、GPU或NPU進(jìn)行溝通,做最佳匹配。這其中最大的挑戰(zhàn)還是平衡的問(wèn)題,軟件的架構(gòu)要做到根據(jù)具體的應(yīng)用,分配專用和通用的處理器,這個(gè)百分比還可以不斷調(diào)整,這是最難做的。
在框架的支持上,Arm是希望其硬件可以讓開(kāi)發(fā)者不需要去特別選擇需要用哪一個(gè)框架。NPU軟硬件的獨(dú)特性和優(yōu)勢(shì)只有獲得市場(chǎng)的認(rèn)可才能成功,那么首先得滿足不同場(chǎng)景的算力需求。Ethos系列現(xiàn)有的三款ML處理器性能從1-4 TOP/s不等,但是即便是在邊緣端,也會(huì)有更高的性能需求,更不用說(shuō)高性能計(jì)算的場(chǎng)景。
但是,隨著系統(tǒng)的復(fù)雜性增加,計(jì)算單元的增加并不意味著一直能夠帶來(lái)線性的性能提升。Arm如何應(yīng)對(duì)?Dennis表示,這種組裝確實(shí)有其局限性,到達(dá)某個(gè)性能后可能性能的提升就消失了,但Arm在GPU和CPU多處理器架構(gòu)上有很好的架構(gòu)設(shè)計(jì),能夠盡量實(shí)現(xiàn)比較長(zhǎng)的線性性能提升。
為應(yīng)對(duì)AIoT時(shí)代更激烈的競(jìng)爭(zhēng),特別是RISC-V的競(jìng)爭(zhēng),我們也看到Arm在本月初宣布推出全新的功能 Arm Custom instructions,允許客戶在特定的 CPU 內(nèi)核中加入自定義指令功能,能夠加速特定的用例、嵌入式和物聯(lián)網(wǎng)應(yīng)用程序。
Dennis表示,我們會(huì)認(rèn)真的看待RISC-V在市場(chǎng)上的進(jìn)展和動(dòng)作,就像我們認(rèn)真看待其他架構(gòu)一樣。Arm的優(yōu)勢(shì)在于我們能夠提供最全面的、擁有靈活性、普遍性的解決方案和產(chǎn)品,與此同時(shí),我們還擁有強(qiáng)大豐富的生態(tài),能夠更好的滿足市場(chǎng)的需求。
(責(zé)任編輯:fqj)
-
處理器
+關(guān)注
關(guān)注
68文章
19404瀏覽量
230762 -
ARM
+關(guān)注
關(guān)注
134文章
9164瀏覽量
368576
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論