菲數科技使用Stratix 10 FPGA和開源的開放式FPGA堆棧(OFS)基礎設施開發高性能FPGA加速卡。
概 述
基于FA728Q FPGA的加速卡現已出貨,它是一種基于PCIe*、搭載Stratix10 FPGA的高性能加速卡
菲數科技使用OFS基礎設施加速其自定義FPGA接口管理器 (FIM) 的開發,該管理器包括一個集成的TCP/IP卸載引擎
在運行LLT等時間關鍵型應用時,FA728Q加速卡的TCP傳輸時延不到100納秒
要 點 綜 述
LLT和其他時間敏感型應用是FPGA加速的理想使用場景。為了滿足這一市場需求,菲數科技開發了基于FA728Q FPGA的加速卡。FA728Q加速平臺為最終用戶提供了強大的FPGA資源、充足的存儲容量和易于使用的界面。菲數科技使用OFS基礎設施來加速、簡化、標準化其加速主板的開發。OFS基礎設施提供了一種強大的方法,支持以“量身定制”的方式加速FPGA解決方案的開發。借助OFS基礎設施,菲數科技將其TCP/IP卸載引擎集成至開源的基礎FIM中,它通常被稱作FPGA“shell”。
背 景 信 息 和 挑 戰
LLT以電子方式執行金融證券交易,盡可能地減少訂單輸入與訂單之間的時延。如今,大型投資銀行、對沖基金和其他金融機構普遍使用該方法。過去,交易是手動執行的,而不是以電子方式執行,交易的時間長則數分鐘,短則數秒。然而,隨著硬件和相應軟件技術的進步,人們可以對系統進行編程,根據特定的市場信號和動態自動做出買入或賣出決策,從而將交易執行時間縮短到毫秒級。近年來,隨著基于FPGA的加速產品的大規模出貨,交易時間進一步縮短至數微秒,甚至不到1微秒。
同時,LLT系統越來越多地使用復雜的交易算法模型來進行訂單薄交互。這些算法模型是根據每家交易公司的特定交易策略而專門定制的。解決方案需要借助通用處理器和專用協處理器的算力,以滿足交易公司在異構計算等方面的功率和性能要求。FPGA非常適合實施定制的交易算法,但是這款硬件加速設備的編程非常耗時,并且隨著FPGA家族的優化升級,也很難遷移。
菲數科技是一家總部位于中國的公司,致力于滿足數據中心異構計算和高性能計算(包括LLT細分領域)領域的需求。他們向市場交付了基于FPGA的硬件加速器平臺、FPGA加速知識產權(IP)功能和基于FPGA的平臺設計服務。
解 決 方 案
為滿足LLT應用的低時延、標準化和可移植性要求,菲數科技開發了FA728Q加速卡,用于對集成式TCP/IP卸載引擎進行實例化。為此,菲數科技修改了開源版OFS中提供的基礎FIM。得益于可組合的架構和“量身定制”的方法,該公司使用OFS,將其算法輕松地移植到FA728Q加速卡,同時,該公司利用OFS提供的其它基礎設施,包括OFS軟件驅動程序和庫,從而盡可能地減少應用的修改。
運行在主機上的軟件
PCIe* 加速卡
圖 1. FA728Q上實施的采用TCP/IP卸載引擎 (TOE) 解決方案的OFS
OFS是一種開源硬件和軟件基礎設施,提供了所有必要的關鍵設計、軟件和基礎設施組件,支持快速開發基于FPGA的自定義主板或工作負載。OFS基礎設施由 FIM(通常被稱作“shell”)和加速器功能單元 (AFU) 區域(一種用于工作負載開發的指定區域)組成。借助OFS、FPGA主板或FIM,開發者可以利用開源基礎設施或基礎FIM,根據目標應用或行業,快速開發量身定制的主板FIM。OFS還附帶了oneAPI加速器支持包 (ASP),開發者可以利用它對FPGA硬件和設計流程進行抽象化。OFS節省了開發者的時間,提高了不同FPGA代際間的可移植性,其采用行業標準接口,并且使用oneAPI提供可選的高層次設計流程。
FA728Q加速卡現已出貨,它是一款基于PCIe的高端FPGA加速主板,可提供 32GB板載DDR4內存和3個QSFP28插槽,每個接口支持高達100GbE。FA728Q加速卡還可以通過OFS基礎設施啟用oneAPI,以支持客戶在RTL中實施內核,或者將算法從CPU/GPU遷移到C/C++等高級設計語言。oneAPI基礎工具套件也可以助力客戶在內核中采用FPGA資源,從而進一步縮短上市時間。
表 1. FA728Q規格
菲數科技還開始開發基于AgilexFPGA的主板,包括使用Agilex7 FPGA I系列的FA927S卡和使用Agilex7 FPGA F系列的FA925E卡。
FA927S卡可提供高達116Gbps的收發器速率,并且支持PCIe 5.0 x16和 Compute Express Link (CXL)。它面向帶寬密集型應用,現在已用于基于RTL 的開發中。FA927S卡已于2024年第一季度支持OFS。
另一方面,FA925E卡提供了4個8GB內存條和4個4GB DDR4內存條,板載內存總計高達48GB。FA925E卡專為對外部內存容量和帶寬要求較高的應用而設計。它全面支持OFS。2023年底已量產。
這兩款加速卡的規格如下表所示。
表 2. FA927S規格
表 3. FA925E規格
成 效
菲數科技在FA728Q卡上實施的卸載引擎IP功能針對時延和性能進行了優化,以滿足LLT要求。在加速模式下,TCP的傳輸時延低于100納秒,可為時間關鍵型網絡應用建立穩定的低時延連接。下表顯示了各種連接所測量的時延。
表 4. TOE的規格
注:
1) 一個時鐘周期為6.4納秒;
2) TX時延計算的是從數據包EOP的下降邊緣到XGMII TXC中的有效數據的時間;
3) RX時延計算的是從數據包SOP到XGMII RXC中的有效數據的時間
FA728Q卡還提供了高帶寬PCIe 3.0 x16和DDR4接口。
表 5. 每個接口提供的帶寬
板級支持包
圖 2. OFS平臺中的高帶寬數據路徑
如何使用OFS和菲數科技解決方案 開始進行FPGA加速
FPGA開發者可以利用FA728Q加速卡和基于OFS的主板,借助開源文檔和源代碼來構建自己的自定義工作負載。
下表概述了開發者應如何使用菲數科技加速主板,開始開發基于FPGA的工作負載。
您可以訪問https://github.com/OFS,獲取開放式FPGA堆棧的基礎源代碼和文檔。請注意,您可以在OFS主板目錄中瀏覽所有基于OFS的第三方主板。
客戶評價
“OFS幫助我們更輕松、更快速地構建客戶所需的加速平臺,為客戶提供從軟件、API 、驅動程序到底層硬件的一整套方案。”
—— 菲數科技有限公司
Cheng Ailian
-
FPGA
+關注
關注
1630文章
21783瀏覽量
605023 -
英特爾
+關注
關注
61文章
10002瀏覽量
172115 -
加速卡
+關注
關注
1文章
61瀏覽量
10981 -
LLT
+關注
關注
0文章
2瀏覽量
5614
原文標題:菲數科技使用FA728Q加速卡加速低時延交易(LLT)應用
文章出處:【微信號:英特爾FPGA,微信公眾號:英特爾FPGA】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論