新一輪的AI熱潮對芯片提出了更高要求,不過,AI芯片的定義還沒有嚴格和公認的標準。因此,可以運行深度學習算法的CPU、GPU以及FPGA和ASIC都可以被稱為AI芯片。雖然都稱為AI芯片,但在2019年AI落地的大背景下,AI芯片的效率更值得關注。
那么,在邊緣端,FPGA能與專為邊緣AI設計的ASIC共同推動AI的普及嗎?
三大FPGA公司整體向上
歷經并購和整合,目前全球排名前三的FPGA供應商分別是賽靈思、英特爾、萊迪思。有意思的是,前兩大供應商在今年相繼推出“最大”FPGA。8月,賽靈思宣布推出全球最大容量的FPGA Virtex UltraScale+ VU19P,這款FPGA基于臺積電16nm工藝,集成350億個晶體管、900萬個系統邏輯單元,有每秒達1.5 Terabit的DDR4存儲器帶寬、每秒達f 4.5 Terabit的收發器帶寬和超過2000個用戶I/O。
三個月后的11月,英特爾宣布推出全球容量最大的FPGA Stratix 10 GX 10M,采用14nm工藝制造,集成了443億個晶體管,核心面積約1400平方毫米,在70×74毫米的封裝面積內擁有1020萬個邏輯單元,還有25920個數據接口總線(EMIB),是此前記錄的兩倍多,每個接口吞吐量2Gbps,內部總帶寬6.5TB/s,另有308Mb存儲、6912個DSP(18×19排列)、2304個用戶I/O針腳、48個收發器(0.84Tb/s帶寬)。
顯然,賽靈思和英特爾推出更大容量的FPGA為的是滿足大數據以及云端AI的需求,將FPGA的應用從工業和汽車更多地拓展到數據中心。在半導體行業,頭部效應尤為明顯,即便市場份額排名第三,如果萊迪思也推出大容量FPGA,境遇可能會非常艱辛。
賽靈思和英特爾在FPGA市場的調整也給了萊迪思市場拓展的機遇。過去幾年,萊迪思都專注于消費類市場,但消費類市場迭代速度非常快,需要根據不同的市場需求推出相應的產品。
萊迪思亞太區產品市場部總監陳英仁表示:“在市場需求不明確且快速變化的時候,技術很難復用。我們現在采用平臺化的新模式,這樣能夠最大化設計復用,降低開發成本及加速產品迭代。”
萊迪思亞太區產品市場部總監陳英仁
FPGA適合邊緣AI嗎?
由此看來,萊迪思在市場的變化中找到了合適的定位和產品路線。不過FPGA要在邊緣AI計算中應用,高成本和開發難度大是兩個問題。對此,陳英仁表示,很多客戶都用我們的FPGA進行量產,所以我們的FPGA價格非常友好。并且過去四年,萊迪思出貨的FPGA數量在10億片的量級,這也證明我們的產品非常可靠。
至于設計門檻,陳英仁指出,由于FPGA的生態環境不像C語言那樣方便,所以大家覺得FPGA的設計門檻比較高。這又可以分成兩部分,一部分是工具,萊迪思全新推出的平臺CrossLink-NX會使用Radiant 2.0,調試工具做了很大改善,也支持業界標準的SDC,還加了ECO編譯器,還有信號完整的分析,并且將持續保持更新,讓懂FPGA的工程師能夠更方便的使用。
另一部分是參考設計,對于那些不太懂FPGA的工程師,他們不知道這些工具的差異,需要一些參考設計才更容易上手,這也是萊迪思的強項。另外我們推出的sensAI,包含了評估、開發和部署基于FPGA的機器學習和人工智能解決方案所需的模塊化硬件平臺、演示示例、參考設計、神經網絡IP核、軟件開發工具和定制設計服務。這些都能夠降低FPGA的設計門檻。
還有一點,FPGA本身就是并行處理,深度學習算法很多都需要并行處理,通過sensAI把AI模型轉換之后,FPGA執行AI推理非常適合。
價格友好且設計門檻在降低,但FPGA想在邊緣端應用,還需要有相對ASIC明顯的優勢才具備吸引力。對此,陳英仁對雷鋒網表示:“我們專注于把FPGA的優勢發揮出來,比如低延遲。另一個是FPGA能夠快速導入市場。還有就是FPGA的彈性,因為FPGA本身就有可編程性的優勢,I/O、配置都非常靈活。I/O接口的靈活性非常適合邊緣端,可以接入各種傳感器。”
他進一步解釋靈活性在邊緣端的重要性,如果從性能和功耗比的角度衡量, FPGA相比ASIC會顯得沒有優勢。但FPGA可以提供不同的接口,這樣就可以接不同的傳感器,并且能夠滿足產品智能化升級的需求。特別是AI技術還在不斷地演進,要對現有產品做升級的時候,由于ASIC的拓撲結構已經固化,如果一個電子廣告牌想要增加一個傳感器更好滿足需求時,ASIC就很難,而用FPGA無論是用SPI還是USB接口都能輕松接入。
什么樣的FPGA更適合邊緣AI?
既然FPGA從成本、性能、開發門檻方面都在改變滿足邊緣AI的需求,那到底什么樣的FPGA可以更好滿足邊緣AI需求?萊迪思給出的答案就是前面提到的CrossLink-NX。CrossLink-NX基于萊迪思NEXUS平臺,有功耗降低75%、可靠性提升100倍、最小尺寸以及高性能網絡邊緣計算能力的特性。
具體而言,CrossLink-NX有192個可編程I/O,D-PHY速度達到2.5Gbps,邏輯單元達到40K,主要應用于視頻橋接處理。
低功耗的實現是因為萊迪思在CrossLink-NX中使用了三星28nm FD-SOI的工藝,陳英仁介紹,我們選用的工藝中有一個很薄的Buried Oxide,可以把失效率降低100倍,也就是可靠性增加了100倍,并且靜態功耗最高可以比競爭對手降低75%。
在性能方面,CrossLink-NX提供了17K-40K的邏輯單元,可以提供低功耗以及高性能模式,并且增加了很多嵌入式存儲RAM,再加上DSP模塊,讓CrossLink-NX嵌入式存儲器/邏輯比達到170bit,比競爭對手的產品高幾倍,可以更有效地處理圖形和AI推理。
高存儲器/邏輯比的同時還實現了小尺寸,CrossLink-NX采用的是優化4輸入查找表,使其產品能夠實現小尺寸,在6x6mm的面積上就具備40K的邏輯單元。陳英仁認為,4輸入的查找表到目前為止,甚至以后的產品都綽綽有余,因為我們追求的不是最高性能,而是低功耗以及由此帶來的成本以及方便性。
當然,讓CrossLink-NX更適合邊緣AI的還有超快的I/O啟動以及快速地I/O傳輸。在傳輸速度上,萊迪思使用的是硬核的I/O提升速率,通過MIPI D-PHY,速度從之前的1.5Gbps提升到了2.5Gbps。陳英仁表示,現在大部分的SoC的速度都是2.5Gbps,所以我們的FPGA可以更容易與SoC配合滿足嵌入式視覺和邊緣AI的需求。
啟動速度方面,CrossLink-NX的I/O配置速度小于3ms,器件配置小于8ms,這個速度不僅相比mcu或SoC時間段很多,并且通過先把I/O配置好,電壓已經固定,系統也就比較穩定。
雷鋒網了解到,CrossLink-NX一開始會先支持工業級的溫度,然后會進行車規認證。目前,CrossLink-NX已經有30多個客戶開始試用,供貨時間也比預期更加提前。
陳英仁還表示,軟件和IP也準備就緒,未來sensAI也將支持CrossLink-NX。針對AI應用,我們還可能與第三方合作提供一站式方案,通過硬件成品在搭配上參考設計,讓不懂FPGA以及AI算法的客戶能夠更加方便的應用。
雷鋒網小結
邊緣AI以及AI市場潛力巨大,在AI對芯片算力提出更高要求的時候,所有的芯片提供商都不想錯過AI帶來的機會。FPGA公司也不例外,只是FPGA本身更加擅長信號處理和網絡加速等,但為了能夠在大數據的AI的時代發揮更大的價值,排名第一和第二的FPGA公司都推出更大規模的FPGA,更好地滿足云端AI市場。這給萊迪思一個很好的機會,通過計算平臺化的方式,最大化復用技術的同時,還能向上一步進入工業和汽車市場。
為了更好地把握好這個機會,萊迪思的新品通過性能、穩定性、I/O各方面的優化,發揮FPGA在邊緣AI中低延遲、高靈活性的特性,盡可能滿足邊緣AI計算的需求。對于市場而言,增加一種有競爭力的選擇當然一件好事,至于市場的接受度如何,我們將保持關注。
-
FPGA
+關注
關注
1629文章
21744瀏覽量
603600 -
AI
+關注
關注
87文章
30946瀏覽量
269187 -
邊緣計算
+關注
關注
22文章
3093瀏覽量
49006
發布評論請先 登錄
相關推薦
評論