后摩智能點(diǎn)亮首款基于SRAM的「存算一體」大算力AI芯片,迎戰(zhàn)自動(dòng)駕駛芯片算力焦慮。
自動(dòng)駕駛芯片,越來越「熱鬧」了。
近年來,自動(dòng)駕駛的普及以肉眼可見的速度加快,根據(jù)1月12日工信部數(shù)據(jù),2021年新能源汽車銷售352.1萬輛,其中搭載組合輔助駕駛系統(tǒng)的乘用車新車市場占比達(dá)到20%。而兩年前,L2級(jí)輔助駕駛的滲透率僅為3.3%。
相伴而生的,是汽車「大腦」自動(dòng)駕駛AI芯片的競爭加劇。
英偉達(dá)、英特爾等老牌芯片企業(yè)早就瞄準(zhǔn)了這一賽道,特斯拉、蔚來、小鵬等車企,黑芝麻、地平線、芯馳科技、寒武紀(jì)、后摩智能等國內(nèi)芯片廠商也都紛紛入局。
比如,蔚來汽車有自研芯片的計(jì)劃;高通去年宣布和寶馬合作,2025年使用高通驍龍Ride自動(dòng)駕駛平臺(tái);初創(chuàng)公司有的直接聚焦在自動(dòng)駕駛上,也有的業(yè)務(wù)范圍更廣,覆蓋自動(dòng)駕駛、智能座艙、中央網(wǎng)關(guān)、高可靠MCU等;收購、合作等關(guān)系網(wǎng)也在不斷變動(dòng),這一戰(zhàn)場的發(fā)令槍已經(jīng)拉響了。
然而,與常見的數(shù)據(jù)中心AI芯片不同,應(yīng)用于汽車場景的AI芯片,在算力、功耗、性能方面都提出了更極端的要求。
在摩爾定律逐漸失效、“存儲(chǔ)墻”問題日益凸顯的當(dāng)下,汽車AI芯片到底需要提供多大算力?何種路徑才是突破摩爾定律的存儲(chǔ)墻壁壘的最接近落地方法?面對(duì)山頭林立、秩序井然的芯片市場,初創(chuàng)公司的市場機(jī)遇和差異化優(yōu)勢又是什么?
「存算一體」也許是個(gè)值得研究的答案。
一筆取舍賬,自動(dòng)駕駛需要多少算力
過去幾年中,用于衡量一款自動(dòng)駕駛芯片最直接的標(biāo)準(zhǔn)之一,就是算力高低。
自動(dòng)駕駛級(jí)別越高時(shí),產(chǎn)生的數(shù)據(jù)越多,對(duì)芯片的算力要求也就越高。
2014年時(shí),最早應(yīng)用Mobileye的第一代EyeQ芯片,算力只有0.256TOPS;2015年,就已有專門面向自動(dòng)駕駛的平臺(tái),每年要迭代1-2次;英偉達(dá)也預(yù)告將在2025年上市1000T算力的Atlan芯片。
算力的不斷提升,是否意味著自動(dòng)駕駛的需求已經(jīng)得到了滿足,自動(dòng)駕駛玩家們可以跑出算力焦慮了?
遠(yuǎn)還沒有。
一方面,大算力也意味著更高的成本。實(shí)際上在現(xiàn)有的自動(dòng)駕駛芯片中,單片算力很難滿足高級(jí)別自動(dòng)駕駛的需求,車企或自動(dòng)駕駛企業(yè)多會(huì)采取“堆料”的方式,用芯片數(shù)量的增加來實(shí)現(xiàn)大算力。成本的增加不可避免,難以推動(dòng)自動(dòng)駕駛技術(shù)的規(guī)模化應(yīng)用,車企也很難實(shí)現(xiàn)技術(shù)和商業(yè)的平衡。
另一方面,除了對(duì)算力需求高,智能駕駛場景也對(duì)芯片的功耗和散熱有很高的要求。服務(wù)于豐田的創(chuàng)業(yè)者Amnon Shashua曾在多個(gè)場合表示過,效率比算力更重要。具體解釋,算力、功耗、成本就像是一個(gè)三角架構(gòu),一角的增減要用另一角來填補(bǔ)才行。
除此之外,「算力」并不真正代表著「性能」。
1000Tops的芯片參數(shù),并不意味著這塊芯片在實(shí)際應(yīng)用中能夠發(fā)揮出1000Tops的真實(shí)性能。
在當(dāng)前的馮·諾伊曼架構(gòu)當(dāng)中,內(nèi)存系統(tǒng)的性能提升速度大幅落后于處理器的性能提升速度,有限的內(nèi)存帶寬無法保證數(shù)據(jù)高速傳輸,形成了一道“存儲(chǔ)墻”。
一方面,大量的計(jì)算單元受限于帶寬的限制,無法發(fā)揮作用,造成算力利用率很低;另一方面,數(shù)據(jù)來回傳輸又會(huì)產(chǎn)生巨大功耗,進(jìn)一步加大汽車電動(dòng)化大潮下的里程焦慮。
因此,僅僅簡單用算力高低來評(píng)估,遠(yuǎn)遠(yuǎn)達(dá)不到自動(dòng)駕駛的需求。
汽車AI芯片不僅需要大算力,更要有實(shí)際利用率的大算力,而且能夠保障低功耗、低延遲以及可承受的成本。
存算一體,金字塔從頭建起
為了解決“存儲(chǔ)墻”問題,當(dāng)前業(yè)內(nèi)主要有三種方案:
用GDDR 或HBM來解決存儲(chǔ)墻問題的馮·諾依曼架構(gòu)策略;算法和芯片高度綁定在一起的DSA方案;以及存算一體的方案。
HBM是目前業(yè)內(nèi)超大算力芯片常用的方案之一,其優(yōu)勢在于能夠暫時(shí)緩解“存儲(chǔ)墻”的困擾,但其性能天花板明顯,并且成本較高。
DSA方案以犧牲靈活性換取效率提升,算法和硬件高度耦合,適用于已經(jīng)成熟的AI算法,但并不適用于正處于快速迭代的自動(dòng)駕駛AI算法中。
最后是存算一體方案,這是一項(xiàng)誕生于實(shí)驗(yàn)室的新興技術(shù),其創(chuàng)新性在于打破了傳統(tǒng)·馮諾伊曼架構(gòu)局限性,實(shí)現(xiàn)了計(jì)算與存儲(chǔ)模塊一體化的整合創(chuàng)新,解決了傳統(tǒng)芯片架構(gòu)中計(jì)算與存儲(chǔ)模塊間巨大的數(shù)據(jù)傳輸延遲、能量損耗痛點(diǎn),既增加了數(shù)據(jù)處理速度,又大大降低了數(shù)據(jù)傳輸?shù)墓模瑥亩剐酒苄П龋疵客吣芴峁┑乃懔Γ┑玫?-3個(gè)數(shù)量級(jí)(》100倍)的提升。
達(dá)摩院計(jì)算技術(shù)實(shí)驗(yàn)室科學(xué)家鄭宏忠曾講過:“存算一體是顛覆性的芯片技術(shù),它天然擁有高性能、高帶寬和高能效的優(yōu)勢,可以從底層架構(gòu)上解決后摩爾定律時(shí)代芯片的性能和能耗問題。”
因此,存算一體架構(gòu)可以把算力做的更大,其芯片算力天花板比傳統(tǒng)馮·諾依曼架構(gòu)更高;同時(shí),大幅降低了數(shù)據(jù)傳輸?shù)哪芰繐p耗,提升了能效比;另外,還能得到更低的延時(shí),存儲(chǔ)和計(jì)算單元之間數(shù)據(jù)搬運(yùn)的減少,大幅縮短了系統(tǒng)響應(yīng)時(shí)間。
更重要的是,用存算一體架構(gòu)做大算力AI芯片另一大優(yōu)勢在于成本控制。不依賴于GDDR 或HBM,存算一體芯片的成本能夠相應(yīng)的降低50%~70%。
換句話說,真正創(chuàng)新架構(gòu)的AI芯片是將上文中提到的算力、功耗、成本三角形結(jié)構(gòu)從原來的位置往上挪了三個(gè)檔位。不僅可以提高算力,還可以達(dá)到降低功耗、控制成本的效果。
摘取「高掛的果實(shí)」
最近幾年,在缺芯的時(shí)代背景下,隨著政策支持的不斷加碼,我們看到國內(nèi)半導(dǎo)體產(chǎn)業(yè)迎來了發(fā)展的良機(jī)。芯片的“國產(chǎn)替代”已經(jīng)在很多細(xì)分領(lǐng)域取得了進(jìn)展,深受資本市場青睞。
但是資本市場也有越來越多的人意識(shí)到,熱門芯片賽道的“國產(chǎn)替代”創(chuàng)業(yè)項(xiàng)目已經(jīng)日趨飽和。一部分嗅覺敏銳的投資人開始關(guān)注后摩爾時(shí)代的“創(chuàng)新架構(gòu)”,認(rèn)為要想在純市場化競爭中挑戰(zhàn)英偉達(dá)等國際芯片巨頭,必須另辟蹊徑。于是差異化的技術(shù)創(chuàng)新成為芯片投資中的重要策略。
HBM、DSA、存算一體都屬于芯片行業(yè)當(dāng)前的技術(shù)創(chuàng)新路徑,三者對(duì)比來看,存算一體可以算作是一條難度最大、顛覆性最強(qiáng)、風(fēng)險(xiǎn)最高,但差異化和創(chuàng)新性也最顯著的路徑。
近年來,國內(nèi)外涌現(xiàn)出不少專注于存算一體芯片的新興創(chuàng)企,巨頭們紛紛加快了產(chǎn)業(yè)布局,資本也對(duì)其青睞有加。國內(nèi)最近一筆相關(guān)融資來自今年4月,國內(nèi)存算一體明星創(chuàng)企「后摩智能」宣布獲得數(shù)億人民幣Pre-A+輪融資。
不過,一直以來,傳統(tǒng)的存算一體研究大多集中在低功耗、低算力的「小」芯片場景中,比如語音、AIoT、安防等邊緣領(lǐng)域。
能夠應(yīng)用在車載AI的存算一體「大」算力芯片,即便在學(xué)術(shù)界也是一大難題,產(chǎn)業(yè)界敢于迎戰(zhàn)者更是屈指可數(shù)。
想要將二者融合,既需要存儲(chǔ)單元陣列、AI core、工具鏈等各個(gè)方面都需要有深厚積累的團(tuán)隊(duì),又需要進(jìn)行整體的協(xié)同優(yōu)化設(shè)計(jì),才能最終實(shí)現(xiàn)一款高效的基于存算一體的大算力AI芯片。
所幸,這一創(chuàng)新性技術(shù)已經(jīng)讓市場看到了落地可能性。
5月23日,后摩智能首款基于SRAM的存算一體大算力AI芯片已成功點(diǎn)亮,并跑通智能駕駛算法模型。首次在存內(nèi)計(jì)算架構(gòu)上跑通了智能駕駛場景下多場景、多任務(wù)算法模型,為高級(jí)別智能駕駛提供了一條全新的技術(shù)路徑。
存算一體很難,存算一體大芯片更難。但在產(chǎn)業(yè)巨頭林立,市場秩序森嚴(yán)的芯片產(chǎn)業(yè),新興創(chuàng)企若是只愿意選擇容易走的路、采摘「低垂的果實(shí)」,是難以取得成功的。
在保證存算一體帶來的高能效比、高性價(jià)比的前提下,又能將其成功擴(kuò)展到滿足自動(dòng)駕駛「大」算力需求的級(jí)別,屬于產(chǎn)業(yè)中「高掛的果實(shí)」。
從成立之初就聚焦于存算一體大算力芯片的后摩智能,正是瞄準(zhǔn)了這一道路。
以團(tuán)隊(duì)組成來說,后摩智能的核心創(chuàng)始團(tuán)隊(duì)既有來自美國普林斯頓大學(xué)、UCSB, Penn State大學(xué)等海內(nèi)外知名高校的學(xué)術(shù)人才,又有在AMD、Nvidia、華為海思、地平線等一線芯片企業(yè)中擁有豐富大芯片設(shè)計(jì)與實(shí)戰(zhàn)經(jīng)驗(yàn)的產(chǎn)業(yè)專家。
今年5月大算力存算一體芯片宣布點(diǎn)亮,對(duì)于后摩智能來說,離摘取「高掛的果實(shí)」已經(jīng)越來越近了。
傳統(tǒng)高算力芯片山頭林立,后來者想要在現(xiàn)有賽道上實(shí)現(xiàn)超越,確實(shí)是充滿挑戰(zhàn)的。
但隨著HBM等昂貴方案的不斷的提出,馮·諾伊曼架構(gòu)的最后一絲紅利已經(jīng)被榨干,市場迫切地需要新架構(gòu)、新出路。
在AI算法快速迭代,摩爾定律逐漸失效的當(dāng)下,我們期待看到越來越多像后摩智能這樣愿意投身于基礎(chǔ)創(chuàng)新的芯片創(chuàng)企,不斷推進(jìn)產(chǎn)業(yè)走向下一個(gè)時(shí)代。
審核編輯 :李倩
-
摩爾定律
+關(guān)注
關(guān)注
4文章
636瀏覽量
79176 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13923瀏覽量
166800 -
AI芯片
+關(guān)注
關(guān)注
17文章
1903瀏覽量
35159
原文標(biāo)題:自動(dòng)駕駛芯片的算力焦慮,「存算一體」能解決嗎?
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論