從配角到主角的逆襲
FPGA,屬于數字集成電路中一種邏輯芯片,同類芯片包括廣為人知的CPU(中央處理器)、GPU(圖形處理器)以及ASIC(專用集成電路)。
FPGA是基于通用邏輯電路陣列的集成電路芯片,主要由邏輯陣列塊(LAB)、輸入輸出單元(I/O)和內部連接線(Interconnect)三部分構成。
FPGA內部組成部分,圖源丨尚普咨詢
FPGA屬于數字集成電路中邏輯芯片,圖源丨尚普咨詢
數據計算包括兩種方式:
一種是利用CPU或GPU基于指令的架構編寫計算所需的軟件,另一種則是針對特定計算需求設計、制造出一套專用的電路,即ASIC。
FPGA是ASIC領域的一類半定制電路芯片,是在PAL、GAL等可編程器件基礎上進一步發展的產物,它解決了定制電路的不足,又克服了原有可編程器件門電路數有限的缺點。
上世紀80年代,Ross Freeman和同事從Zilog 買下FPGA技術,并共同創立賽靈思,推出第一顆真正意義上的FPGA芯片XC2064。
該芯片采用2μm工藝,包含64個邏輯模塊和85000個晶體管,門數量不超過1000個。因為發明FPGA,Ross Freeman于2009年被列入了美國發明家名人堂。
與現在動輒千萬邏輯單元的產品相比,XC2064怎么看都像是一只“丑小鴨”[2],但它開啟了可編程邏輯芯片的歷史。
最初,FPGA只是充當連接各個專用芯片的膠合邏輯(Glue Logic)的角色。直到SoC-FPGA(可編程片上系統芯片)發布,單個FPGA芯片中實現一個完整電子系統成為現實的方案,FPGA才算真正走到舞臺中央[3]。
此后,便是FPGA從配角逐漸逆襲成主角的故事。
FPGA的發展歷史,制表丨果殼硬科技
既能設計又能計算的芯片
歷史之路曲折,但FPGA應用之路是光明的。
它既能用于芯片設計,又能在計算上獨當一面。自身擁有硬件可編程、集成度高、并行計算能力強、延遲低等特點,并在性能、功耗、成本之間有較好的平衡。因此,工業、通信、醫療、消費電子、人工智能、視覺等領域都需要FPGA。
2.1 設計:可重構的萬能芯片
FPGA最大特點是芯片內部硬件結構可重構,即硬件可編程,因此極具靈活性,號稱“萬能芯片”。
理論上,FPGA提供的門電路規模足夠大,通過編程可以實現任意邏輯功能的電路。并且,FPGA開發流程中無需布線、掩模和定制流片等,編程后即可直接使用。
打個比方,集成電路就像一幢高樓大廈,建成后就無法改變主體結構了;FPGA就像是建房子所需的材料,想要建什么樣的房子都可以自由組合,建得不好還可以拆掉重建,同樣一種芯片可以滿足各個領域[4]。
在芯片設計上,FPGA功不可沒:
比如實現ASIC的前期的設計驗證、實現CPU的原型驗證(流片前確定芯片功能正確性的一種驗證方式)、實現DSP(數字信號處理器)的原型驗證、實現MCU(單片機)的原型驗證等。
2.2 計算:執行效率極高
FPGA內部設計可簡單理解為電路的設計,無論是時序邏輯電路還是組合邏輯電路,都能在電路板上電的那一刻開始工作。[5]
因此,在代碼執行上更類似“電路直給”的內部原理,賦予FPGA自身延遲低和實時性強的特點,比CPU/GPU的軟件指令架構執行效率更高。
另外,FPGA內部可按數據包的多少,搭建相應數量的流水線,實現數據并行和流水線并行兩種并行計算方式,大幅度降低I/O及計算消耗。相對于一次只能處理一個指令集的串行計算,并行計算可以一次執行多個指令的算法。
值得一提的是,一些需要重復構建的功能模塊,被編寫成IP核,嵌入FPGA,包括片上處理器、收發器I/O、RAM塊和DSP引擎等,大大增強了FPGA的計算性能。
FPGA的主要應用領域,制表丨果殼硬科技
FPGA vs. CPU/GPU/ASIC
有市場的地方,就會有競爭。各大廠商經常在發布會上拿FPGA與同屬邏輯芯片的CPU/GPU/ASIC對比算力。
在數十年的大戰中,還誕生了eFPGA和eASIC這種新生代芯片。
不過,在制程節點越來越逼近1nm極限以及摩爾定律逐步放緩的情況下,異構計算(多種不同計算芯片的組合,如“CPU+GPU”“CPU+FPGA”)成為不同邏輯芯片協同協作的契機。
CPU、GPU、FPGA、eFPGA、eASIC、ASIC各種指標對比,制表丨果殼硬科技
3.1 FPGA相較于CPU和GPU
CPU和GPU都為馮·諾依曼結構的通用處理器,與結構完全不同的FPGA沒什么關系,但二者計算用途與FPGA有一定重合,因此常被人們拿來對比。
CPU適宜進行標量運算,可處理來自多個設備的計算請求,可隨時終止當前運算,轉向其它運算,FPGA相對CPU偏重計算效率;GPU適宜進行矢量運算,既可以圖形渲染,又可以并行計算,FPGA相對GPU偏重能效比。
另外,與CPU和GPU相比,FPGA有更低的延遲:CPU和GPU均使用SIMD(單指令流多數據流)執行存儲器、譯碼器、運算器、分支跳轉處理邏輯等,FPGA則是在燒寫時已確定每個邏輯單元功能和通信要求,不需要額外指令。
由于FPGA浮點計算能力出眾,因此英偉達GPU的浮點計算能力是其主要對標對象。研究學者認為,架構有差別,單純對比性能未免偏頗,實際二者擅長領域是不同的:GPU更適合深度學習算法的訓練階段,FPGA更適合深度學習算法的推理階段和深度神經網絡[6]。
3.2 FPGA相較于ASIC
ASIC在定制算法上擁有比FPGA更高的運算性能和更低的功耗,但生產后硬件算法無法被修改,且在定制化上要求非常高,因此流片量過小會導致成本升高[7]。FPGA則不需要更改硬件電路,直接更改代碼,相當于擁有“無限次的后悔藥”。
因此FPGA作為ASIC領域的半定制電路的一種發明,仿真ASIC再進行掩碼處理和批量制造使用是FPGA的重要使命之一。傳統的ASIC設計周期平均是14到24個月,如果用FPGA,開發時間平均可降低 55%[8]。
在FPGA芯片成本逐步下降后,與ASIC之間總擁有成本(TCO)差距越來越小,一些廠商也開始直接使用FPGA取代ASIC,避免ASIC前期高昂的一次性工程費用,消除最低訂單數量和多芯片迭代風險和損失。
FPGA方案與ASIC方案的對比,圖源丨頭豹研究院
3.3 FPGA衍生出的eFPGA和eASIC
eFPGA是指將一個或多個FPGA以IP的形式嵌入ASIC、ASSP(專用標準產品)或SoC(系統級芯片)等芯片中的發展模式,擁有極強的易用性,能夠降低客戶集成FPGA加速器的門檻。
目前eFPGA已有大量應用,但一直沒有成為市場主流,接受度有望在云計算和人工智能發展下進一步提升[9]。
eASIC與ASIC類似,都是定制類型的芯片,是將FPGA可重復編程的功能去掉,獲得更小的晶片尺寸,來實現低功耗和更低的成本。
eASIC比FPGA的單位成本和功耗更低,比標準單元ASIC的上市速度更快、一次性工程 (NRE) 費用更低。
eASIC源于名字同為eASIC的公司,目前已被英特爾收購,英特爾將eASIC定位為從FPGA向ASIC過渡的中間選擇,并將FPGA、eASIC、ASIC的連續生命周期的產品組合命名為“定制邏輯連續體”:FPGA擁有最快的上市速度和最高的靈活性;eASIC擁有出色的性價比,優化上市時間;ASIC擁有最高的性能和最低的功耗和成本。
英特爾的“定制邏輯連續體”,圖源丨英特爾
3.4 走向異構計算
FPGA的確擁有絕佳的性能和時延優勢,但芯片單價高、峰值計算能力較低、上手難度高是未能解決的問題。
邏輯芯片發展至今,單一計算體系結構已無法滿足當今最流行的應用所需性能和功耗要求,FPGA正朝向異構計算的方向發展[10]。異構計算,是將不同架構處理芯片整合到一個系統內工作的方式。
具體實施的方向包括兩種:其一為芯片級集成,即將CPU IP、GPU IP、DSP IP等集成到單一SoC內;其二為板級集成,將CPU、GPU、FPGA、ASIC等放在一個板上組合。
將這些不同邏輯器件整合起來,用不同架構去處理不同類型數據,根據處理速度或帶寬要求進行優化,發揮CPU、GPU、FPGA、ASIC各自的專長,就能各取所需,打好組合拳。
從巨頭近幾年收購的動作就可看出,行業早已認識到未來計算不可能憑借單獨的CPU、GPU、FPGA器件獨領市場:x86架構的英特爾收購Altera FPGA,x86架構的AMD計劃收購賽靈思FPGA,GPU“大王”NVIDIA瞄準Arm架構(旗下擁有CPU IP)。
FPGA正在邁向異構系統的時代。
FPGA設計發展階段,圖源丨尚普咨詢
資料來源丨電子工業出版社《集成電路產業全書》 2018年9月第1版
四大巨頭支配的全球市場
據知名咨詢機構Frost&Sullivan預計,全球FPGA市場將從2021年的68.6億美元增至2025年的125.8億美元,年均復合增長率約16.4%。
經過幾十年的寡頭壟斷和行業整合,目前全球形成以賽靈思和英特爾占據70%~80%的市場份額,萊迪思(Lattice)、微芯科技(Microchip)瓜分低功耗或細分子市場份額的局面[11]。
反觀國產FPGA,目前在中國市場份額僅約4%。
國外FPGA主要公司基本情況,制表丨果殼硬科技 信息來源丨各公司官網
FPGA的比拼分為硬件和軟件兩個舞臺,四大廠商的策略也各不相同。
4.1 硬件:“兩大兩小公司”的革命
FPGA的硬件技術指標包括LUT數量、DSP數量、RAM容量、User I/O數量、制造工藝、DSP工作頻率、動態功耗、SerDes速率、DDR速率等。
國外廠商主要在制程、LUT(基于查找表的邏輯單元)數、SerDes(串行收發器)速率三大硬件性能指標上角逐:制程決定了芯片的晶體管密度,單位面積內晶體管越多性能越強;LUT數是FPGA基本容量單位,同樣芯片大小LUT數量越多越強;SerDes速率決定著芯片與光模塊間、芯片與芯片間、以太網的速度。
FPGA產品關鍵技術指標,圖源丨安路科技招股書[12]
在硬件性能比拼上,賽靈思和英特爾一直是宿敵。雖然兩家交鋒的火藥味兒十足,但競爭的產物也成為FPGA行業的標桿。
先是爭奪全球最大FPGA:2019年8月,賽靈思宣布擁有900萬個系統邏輯單元和超過2000個用戶I/O的Virtex UltraScale+ VU19P FPGA。相隔僅三個月,英特爾就宣布推出擁有1020萬個邏輯單元和2304個用戶I/O的Stratix 10 GX 10M FPGA。
繼而競爭最先進FPGA:賽靈思先于2020年3月發布Versal Premium ACAP平臺,采用臺積電(TSMC)7nm FinFET制程工藝、112 Gbps PAM4收發器,在邏輯密度上相當于22個16nm的FPGA;相隔一年,英特爾就宣布Agilex系列大規模量產出貨,采用10nm SuperFin制程工藝,116Gps PAM4收發器(最高可達224Gbps),邏輯結構性能、功耗比相比7nm的FPGA高約2倍。
反觀萊迪思和微芯科技則是坐看兩巨頭龍爭虎斗,不與世爭,不做最強,但做精巨頭“看不起”的28nm制程中低端市場。FPGA專家曾向筆者表示,實際上28nm制程就能滿足大部分需求,16/14/10/7nm雖然性能參數強,但成本和功耗并不劃算。
相比傳統bulk CMOS,萊迪思選擇采用FD-SOI(耗盡型絕緣層上硅)這種工藝平衡FPGA的性能和功耗。目前萊迪思已基于三星28nm FD-SOI的Lattice Nexus技術平臺,推出Certus-NX、CrossLink-NX等產品。
微芯科技主要聚焦在低功耗、低成本的28nm FPGA,并提供非易失閃存和SRAM(靜態隨機存取存儲器)兩種選擇。
國外廠商代表產品部分參數對比,制表丨果殼硬科技
信息來源丨各公司官網、公司新聞
4.2 軟件:輕量化編程才能繼續占領市場
硬件是FPGA的基礎,軟件工具鏈是產品立足的根本,脫離軟件工具鏈的FPGA芯片,只能看不能用。
EDA(電子設計自動化,集成電路設計的一種平臺)和IP核(知識產權核,設計中可直接使用的功能模塊)是兩個重要工具。如果把芯片比作電腦,EDA就相當于Windows/Linux,IP核就相當于應用軟件。未來EDA工具和IP核的全面性將會是FPGA廠商競爭的關鍵所在。
除此之外,FPGA還需要降低開發難度,來開拓市場。一直以來,設計是FPGA廣被詬病的缺點。FPGA所使用的Verilog、VHDL或SystemVerilog等硬件描述語言非常難上手,相關領域的人才更是寥寥無幾。
英特爾和賽靈思的思路一致,均推出一體化平臺,不僅整合了旗下產品,還對不同層次的開發者提供更多簡單開發選擇:
傳統硬件工程師繼續使用硬件編程語言;
軟件工程師可調用預先定義的硬件庫,使用自身熟悉的C/C++/Python語言開發;AI科學家可直接使用高層次框架訓練模型,使用自身熟悉的Tenserflow、Caffe開發。
萊迪思和微芯科技也正在嘗試利用多種手段降低FPGA開發難度。
國外廠商軟件部分內容對比,制表丨果殼硬科技
信息來源丨各公司官網、公司新聞
國產企業的追趕之路
據創道咨詢統計,目前國內與FPGA相關研發企業數量在27家以上,其中已在A股上市的企業包括復旦微電子、安路科技、航錦科技,成都華微電子擬在科創板上市[13]。2021年,至少有3家企業成為FPGA市場新玩家。
國內FPGA主要公司基本情況,制表丨果殼硬科技
信息來源丨各公司官網、公司新聞、招股書
國內FPGA設計始于20世紀90年代,真正技術發展于2000年以后,起步比國外晚十多年。通過對比國際尖端產品,核心參數差距依然較大。
國內外代表廠商部分FPGA產品對比,制表丨果殼硬科技
信息來源丨各公司官網、公司新聞、招股書
芯片自主研發之路上難啃的“硬骨頭”很多,特別是FPGA這種高端復雜芯片,而國內企業也正在追趕巨頭。
“氪金”才能變強
研發設計FPGA有許多難點:
第一,內核架構設計、邏輯單元設計、異構單元設計、互連結構設計的難點;
第二,異構單元的芯片結構定義與設計問題;
第三,綜合映射、布局布線等軟件的設計難點;第四,在面積、速度、功耗上實現最優的難點[14]。
這么難怎么辦?砸錢,砸錢,砸錢。
縱觀安路科技、紫光同創、復旦微的關鍵業務數據,由于研發費用占比一度超100%,導致它們有一段時期凈利為負。
事實上,國外企業長期占據大部分市場份額,通過規模效應分攤研發成本。國內企業的相關抗風險就會較為薄弱。不過,得益于政策傾斜和科研項目經費補貼,這種窘境一定程度上得以緩解。
安路科技、紫光同創、復旦微三家關鍵業務數據,圖源丨安陸科技招股書
生態建設的坑
FPGA想要有所突破,不但需要在芯片上創新,相應的生態也要跟得上。
事實上,復旦微就曾吃過生態的虧。復旦微創始人施雷曾表示,2007年的他們的第一代FPGA性能很高,但由于沒有配套軟件工具鏈支持,很難在應用中使用。這種情況下,性能反而恰恰是最不重要的參數,對一顆FPGA芯片而言,更重要的是能與軟件很好地配合。復旦微推出的第二代FPGA,重新考慮了在軟硬結合上的實施,最終才得以被成功規模應用。
縱觀國內知名的FPGA廠商,基本也都擁有自家的EDA軟件和工具鏈。比如復旦微的自主研發EDA軟件Procise、中科億海微的全新軟件架構和高性能算法的EDA軟件eLinx1.0。
另外,國內EDA軟件廠商也開始涉足自主知識產權FPGA工具。比如芯華章推出的樺捷(HuaPro-P1) 高性能FPGA原型驗證系統、穹景(GalaxPSS)新一代智能驗證系統等。EDA軟件公司這一有利外援,能夠有效增強國產FPGA的可用性和易用性。
切入市場的契機
目前國產的民用FPGA起步于消費市場,主打10K~100K邏輯單元的中低端芯片產品,逐漸涉足通信和汽車領域,并向500~1000K邏輯單元的下一目標進發。
與萊迪思和微芯科技思路類似,國產FPGA也主要集中在28nm制程節點上。現階段賽靈思和英特爾太過強勢,先進制程并不是一個好的切入點。
另外,易靈思對此解釋,一顆最小的16nm FPGA NRE(一次性工程費用)就已超過一千萬美元,10nm/7nm這種工藝反而會導致NRE急速上升;高性能工藝芯片功耗遲遲沒有降下來,芯片尺寸也越來越大[15]。
市場進化過程中,國產FPGA廠商將提升產品的性能列為首要目標,縮小與國外廠商的差距。
根據器件發展歷程以及市場應用需求發展趨勢,國產自研FPGA的目標還包括:高密度、高速度、寬頻帶、高保密、低電壓、低功耗、低成本、低價格、IP核復用、系統集成、動態可重構及單片集群。
市場總會有人唱衰國產,認為國產芯片不夠高級。
對此,一位國產FPGA的代表認為:“沒有競爭力的芯片都無法銷售,只要有客戶購買,就值得被尊重[16]。”
References:
[1] Barbara Jorgensen:Xilinx Envisions its Future Without Huawei
.EEtimes.2019.10.24.https://www.eetimes.com/xilinx-envisions-its-future-without-huawei/
[2] 孫俊杰。高云半導體:FPGA市場的攪局者[J]。中國工業評論,2017,(Z1):98-105.
[3] 王薇,楊靜文,林海濤,華松逸.FPGA設計專利最新進展[J]。電子元器件與信息技術,2021,5(08):69-73+78.
[4] 劉明。 國產FPGA的創新之路[J]。 科協論壇, 2015(6):10-11.
[5] 王瑩瑩,牟軍,周鵬.FPGA技術優勢及編程實踐經驗總結[J]。信息記錄材料,2020,21(09):83-84.
[6] 吳艷霞,梁楷,劉穎,崔慧敏。深度學習FPGA加速器的進展與趨勢[J]。計算機學報,2019,42(11):2461-2480.
[7] 王俊博。 FPGA器件設計技術發展綜述[J]。 科技傳播, 2013(18):2.
[8] 奧利薇婭:FPGA 市場格局及國產機會.AI電堂.2021.12.07.https://mp.weixin.qq.com/s/SZ5e23xltNEVPMbAlhv3tQ
[9] 許子皓。瑞薩入場 FPGA市場格局或迎來變數[N]。中國電子報,2021-11-23(008)
[10] 異構化、平臺化、IP化人工智能時代FPGA展現新趨勢[J]。電子技術與軟件工程,2019,(12):12-13.
[11] 易靈思官微:易靈思總經理:本土FPGA易靈思看本土發展與芯片短缺.2021.12.10.https://mp.weixin.qq.com/s/0zyrsaAGVIhJGRAZ46JCzA
[12] 上海安路信息科技股份有限公司:首次公開發行股票并在科創板上市招股說明書.2021.11.09.http://www.cninfo.com.cn/new/disclosure/detail?orgId=9900048391&announcementId=1211530537&announcementTime=2021-11-09
[13] 沐遙:風口上的FPGA:國內廠商現狀及未來趨勢。創道硬科技.2021.11.10.https://mp.weixin.qq.com/s/6c88HnfAyL2Sod8gJ3Pdig
[14] 王海力。 淺談國產FPGA芯片的產業化之路[J]。 中國電子商情(基礎電子), 2013, 000(005):60-65.
[15] 易靈思張永慧:如何孕育中國FPGA的生態.2022.1.24.https://mp.weixin.qq.com/s/6PfeJ6a4_fjhPQGZc1PAhA
[16] 包永剛:從進口替代到全球一流!中國第一家上市的芯片設計公司,成立僅用“5分鐘”。雷峰網.2021.11.23.https://mp.weixin.qq.com/s/q9rj3Xyj6zV5X3cWBdmrUA
-
FPGA
+關注
關注
1630文章
21759瀏覽量
604369 -
cpu
+關注
關注
68文章
10882瀏覽量
212231 -
eda
+關注
關注
71文章
2769瀏覽量
173440
發布評論請先 登錄
相關推薦
評論