概 述
程序化交易、量化交易的快速發展凸顯了交易系統運行效率的重要性,通過運用先進的軟硬件技術,最大限度地提升交易通道的速度,有助于幫助用戶捕捉轉瞬即逝的交易機會,在證券市場中獲得更高的收益。但同時,證券業務的復雜性意味著,交易系統不僅需要考慮硬件選型與軟件優化,以獲得更高的性能,同時也需要統籌考慮總體擁有成本 (TCO)、服務質量 (QoS) 等因素,從而幫助客戶提升在證券市場的投資收益。
為了實現上述目標,深圳市金證科技股份有限公司(以下簡稱:金證)與英特爾在過去幾年中進行了密切合作,推出了基于英特爾 架構的金證極速交易系統,采用了英特爾 至強 可擴展處理器以及英特爾 oneAPI 等軟件工具,顯著提升了業務效率、降低了業 務時延。在雙方新一輪的合作中,金證極速交易系統搭載了最新推出的第五代英特爾 至強 可擴展處理器,在 5000 TPS 場景下實現了低至 2.02 微秒的上行性能和 1.55 微秒的下行性能1 。同時,系統還采用了英特爾 Speed Select 技術(英特爾 SST),將系統的 P90 時延降低 32%,P99 時延降低 83%。
挑戰:金證極速交易系統
旨在進一步提升性能與穩定性
在開展策略交易的高端客戶中,以機構投資者為主,其中私募基金占了重要的比重。近年來,伴隨著金融市場的活躍,私募基金迎來了爆發式的增長。中國證券投資基金業協會發布的私募基金管理人登記及產品備案月報顯示,截至 2024 年 2 月,私募基金管理總規模為 20.33 萬億元,管理基金數量 153756 只2 。
同時,隨著投資工具的豐富,私募基金的投資策略多樣化起來,阿爾法策略、套利策略、相對價值策略、管理期貨策略等借助于金融衍生品的策略受到歡迎,并且在當今市場環境下取得了不錯的收益。要捕捉轉瞬即逝的交易機遇,就需要通過證券交易系統,執行程序化、量化交易。因此,證券交易系統的交易速度在很大程度上影響了套利策略的實現能力。
作為證券行業核心交易 IT 供應商,金證自 2012 年起開始投身于新一代極速交易系統研發中。金證推出的極速交易系統是針對需要做高頻率、極速交易的機構投資者而開發的一套極速交易系統。該系統基于交易與清算分離原則,采用全內存、低延時等核心技術,實現業務微秒級交易處理及交易查詢,提供訂單委托、委托撤單、成交回轉、實時委托查詢、實時成交查詢等高實時性的交易相關功能。該系統能夠支持程序化交易、算法交易、高頻交易等新型、專業化投資交易手段的便利接入。
圖 1. 金證極速交易系統架構
金證極速交易系統整體基于金證微架構技術平臺開發,采用多活架構與組件化理念設計,可實現業務功能的靈活擴展;系統支持主備、多活等多種部署模式,基于 Raft 一致性算法,可實現主備、容災之間的自動切換,實現業務連續和系統多活。系統在原有技術架構基礎上,新增獨立的新極速模塊,新極速模塊僅完成委托申報和成交回轉功能,減少線程切換,性能實現突破性飛躍。
在金證與英特爾的既往合作中,雙方成功通過版本迭代、硬件升級與軟件調優,降低了委托業務的時延,并通過英特爾 oneAPI 庫大幅提升了風控計算的效率。著眼于當前及未來的證券交易需求,雙方開展了新一輪的優化工作,以達成如下目標:
進一步提升交易效率、降低交易時延
從金證極速交易系統的極速訂單流程來看,其包含了接入、業務、報盤、內存庫等主要進程,這些進程對于 CPU 的峰值性能非常敏感,因此,通過采用更高性能的 CPU,將有助于提升交易效率、降低時延。
提升交易系統的時延穩定性,提高服務質量
時延穩定性對于證券交易有著至關重要的影響,特別是在業務高峰期,CPU 利用率提升、資源競爭等會帶來交易時延波動,時序圖上出現 “毛刺”,可能導致交易效率降低,這就需要通過進一步的優化,來提升穩定性。
解決方案:采用第五代英特爾 至強 可擴展處理器與英特爾 SST 進行方案升級
在之前合作成果的基礎上,金證將極速交易系統的 CPU 升級為第五代英特爾 至強 可擴展處理器。第五代英特爾 至強 可擴展處理器擁有更可靠的性能,更出色的能效。它在運行各種工作負載時均可實現顯著的每瓦性能增益,在 AI、數據中心、網絡和科學計算的性能和總體擁有成本 (TCO) 方面亦有更出色的表現。相較上一代產品,第五代英特爾 至強 可擴展處理器可在相同功耗范圍內提供更高的算力和更快的內存。由于 CPU 內部架構設計的優化,即使與相同規格參數(如核數、頻率、緩存、 TDP 等)的上一代產品比較,CPU 性能也有可觀的提升。此外,它與上一代產品的軟件和平臺兼容,因此部署新系統時可大大減少測試和驗證工作。
圖 2. 第五代英特爾 至強 可擴展處理器具備強大性能
在性能驗證中,金證極速交易系統采用了英特爾 至強 金牌 6544Y 處理器。該處理器提供了多達 16 個核心、32 個線程,使其將部分核心與交易服務綁定之外,還能夠有充足的核心分配給風控服務,保證性能的釋放。
測試數據如圖 3 所示,在 5000 TPS 的測試場景中,第五代英特爾 至強 可擴展處理器的訂單提交時間(上行性能)中位數為 2.02 微秒,相較于第四代處理器的 2.54 微秒,交易時間降低約 20.5%;下發訂單時間(下行性能)中位數為 1.55 微秒,相較于第四代處理器的 1.84 微秒降低約 15.8%;同時,上行性能相比第二代處理器的 2.98 微秒降低約 32.2%8 。
圖 3. 金證極速交易系統在不同代英特爾 至強 可擴展處理器上的上行性能對比
針對委托交易時延不穩定的問題,金證嘗試采用英特爾 SST 技術進行優化。金證采用了英特爾 SST 的 SST-Turbo Frequency (SST-TF)、SST-Core Powe (SST-CP) 兩種模式。其中,英特爾 SST-TF 允許增加一定數量內核(高優先級內核)的最大 Turbo 頻率,以降低 CPU 其余內核(低優先級內核)上的最大 Turbo 頻率。在某些工作負載中,有少數內核會成為系統整體性能的瓶頸,通過使用英特爾 SST-TF 為這些核心分配更高的頻率,可以在不改變軟件的情況下實現顯著的性能優化。
SST-CP 通過為每個 CPU 核分配優先級來提供 CPU 核功率/性能的動態優先級,從而按優先級順序滿足每個核的功率要求。這允許用戶指定頻率層以滿足其工作負載的需要。SST-CP 可以與 P 狀態、Turbo Boost 和其他速度選擇技術等功能相結合,使平臺能夠在最關鍵的時間為最關鍵的工作負載通電并排定頻率優先級。
圖 4. 英特爾 SST-TF 功能示例
圖 5. SST-CP 功能示例
由于英特爾 至強 金牌 6544Y 處理器可以支持全核運行最大 Turbo 頻率,因此金證極速交易系統在 CPU 全核開啟 SST,并測試了委托時延性能的變化。測試數據如圖 6 所示,當開啟 SST 之后,P90 時延(90% 的調用時延都在特定值以下)降低 32%,P99 時延(99% 的調用時延都在特定值以下)降低 83%,有效優化了低時延委托毛刺問題9 。
圖 6. 關閉/開啟 SST 委托時延性能對比(越低越好)
收 益
在升級為第五代英特爾 至強 可擴展處理器,并開啟英特爾 SST 之后,金證極速交易系統的委托交易性能與時延穩定性有了顯著的提升,這能夠為用戶帶來以下收益:
提升了全鏈路的交易速度,在瞬息萬變的證券市場環境中,幫助客戶敏銳抓住轉瞬即逝的市場機遇,推動獲利的最大化。
提升了委托業務時延的穩定性,降低了低時延委托的毛刺問題,從而能夠為客戶提供“始終如一”的服務質量與體驗。
釋放了第五代英特爾 至強 可擴展處理器的硬件潛力,提升了性能密度,有助于控制服務器節點規模,實現更高的成本效益。
展 望
在如今的證券交易市場中,機構投資者要求更快的交易系統,支撐制定高頻交易策略、實現高收益的投資目標。近年來,各大券商也紛紛加大 IT 投入,積極布局極速交易系統建設,全面賦能業務增長。在此背景下,金證緊抓機遇,持續夯實金融科技能力建設,不斷實現極速交易技術迭代,并推出了金證極速交易系統 KFOS 3.7,進一步提升產品性能。
通過采用第五代英特爾 至強 可擴展處理器、英特爾 SST,金證極速交易系統在性能、時延穩定性等方面獲得了進一步提升。在此基礎上,雙方將在未來進行深度合作,探索如何進一步利用第五代英特爾 至強 可擴展處理器搭載的創新技術,釋放硬件潛能,助力打造更加卓越的極速交易系統,幫助用戶獲得更高收益。
審核編輯:劉清
-
處理器
+關注
關注
68文章
19349瀏覽量
230278 -
英特爾
+關注
關注
61文章
9985瀏覽量
171957 -
SST
+關注
關注
0文章
69瀏覽量
35264
原文標題:金證采用第五代英特爾? 至強? 可擴展處理器 進一步提升交易速度及穩定性
文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論