菲數(shù)科技使用Stratix 10 FPGA和開源的開放式FPGA堆棧(OFS)基礎(chǔ)設(shè)施開發(fā)高性能FPGA加速卡。
概 述
基于FA728Q FPGA的加速卡現(xiàn)已出貨,它是一種基于PCIe*、搭載Stratix10 FPGA的高性能加速卡
菲數(shù)科技使用OFS基礎(chǔ)設(shè)施加速其自定義FPGA接口管理器 (FIM) 的開發(fā),該管理器包括一個(gè)集成的TCP/IP卸載引擎
在運(yùn)行LLT等時(shí)間關(guān)鍵型應(yīng)用時(shí),F(xiàn)A728Q加速卡的TCP傳輸時(shí)延不到100納秒
要 點(diǎn) 綜 述
LLT和其他時(shí)間敏感型應(yīng)用是FPGA加速的理想使用場(chǎng)景。為了滿足這一市場(chǎng)需求,菲數(shù)科技開發(fā)了基于FA728Q FPGA的加速卡。FA728Q加速平臺(tái)為最終用戶提供了強(qiáng)大的FPGA資源、充足的存儲(chǔ)容量和易于使用的界面。菲數(shù)科技使用OFS基礎(chǔ)設(shè)施來(lái)加速、簡(jiǎn)化、標(biāo)準(zhǔn)化其加速主板的開發(fā)。OFS基礎(chǔ)設(shè)施提供了一種強(qiáng)大的方法,支持以“量身定制”的方式加速FPGA解決方案的開發(fā)。借助OFS基礎(chǔ)設(shè)施,菲數(shù)科技將其TCP/IP卸載引擎集成至開源的基礎(chǔ)FIM中,它通常被稱作FPGA“shell”。
背 景 信 息 和 挑 戰(zhàn)
LLT以電子方式執(zhí)行金融證券交易,盡可能地減少訂單輸入與訂單之間的時(shí)延。如今,大型投資銀行、對(duì)沖基金和其他金融機(jī)構(gòu)普遍使用該方法。過(guò)去,交易是手動(dòng)執(zhí)行的,而不是以電子方式執(zhí)行,交易的時(shí)間長(zhǎng)則數(shù)分鐘,短則數(shù)秒。然而,隨著硬件和相應(yīng)軟件技術(shù)的進(jìn)步,人們可以對(duì)系統(tǒng)進(jìn)行編程,根據(jù)特定的市場(chǎng)信號(hào)和動(dòng)態(tài)自動(dòng)做出買入或賣出決策,從而將交易執(zhí)行時(shí)間縮短到毫秒級(jí)。近年來(lái),隨著基于FPGA的加速產(chǎn)品的大規(guī)模出貨,交易時(shí)間進(jìn)一步縮短至數(shù)微秒,甚至不到1微秒。
同時(shí),LLT系統(tǒng)越來(lái)越多地使用復(fù)雜的交易算法模型來(lái)進(jìn)行訂單薄交互。這些算法模型是根據(jù)每家交易公司的特定交易策略而專門定制的。解決方案需要借助通用處理器和專用協(xié)處理器的算力,以滿足交易公司在異構(gòu)計(jì)算等方面的功率和性能要求。FPGA非常適合實(shí)施定制的交易算法,但是這款硬件加速設(shè)備的編程非常耗時(shí),并且隨著FPGA家族的優(yōu)化升級(jí),也很難遷移。
菲數(shù)科技是一家總部位于中國(guó)的公司,致力于滿足數(shù)據(jù)中心異構(gòu)計(jì)算和高性能計(jì)算(包括LLT細(xì)分領(lǐng)域)領(lǐng)域的需求。他們向市場(chǎng)交付了基于FPGA的硬件加速器平臺(tái)、FPGA加速知識(shí)產(chǎn)權(quán)(IP)功能和基于FPGA的平臺(tái)設(shè)計(jì)服務(wù)。
解 決 方 案
為滿足LLT應(yīng)用的低時(shí)延、標(biāo)準(zhǔn)化和可移植性要求,菲數(shù)科技開發(fā)了FA728Q加速卡,用于對(duì)集成式TCP/IP卸載引擎進(jìn)行實(shí)例化。為此,菲數(shù)科技修改了開源版OFS中提供的基礎(chǔ)FIM。得益于可組合的架構(gòu)和“量身定制”的方法,該公司使用OFS,將其算法輕松地移植到FA728Q加速卡,同時(shí),該公司利用OFS提供的其它基礎(chǔ)設(shè)施,包括OFS軟件驅(qū)動(dòng)程序和庫(kù),從而盡可能地減少應(yīng)用的修改。
運(yùn)行在主機(jī)上的軟件
PCIe* 加速卡
圖 1. FA728Q上實(shí)施的采用TCP/IP卸載引擎 (TOE) 解決方案的OFS
OFS是一種開源硬件和軟件基礎(chǔ)設(shè)施,提供了所有必要的關(guān)鍵設(shè)計(jì)、軟件和基礎(chǔ)設(shè)施組件,支持快速開發(fā)基于FPGA的自定義主板或工作負(fù)載。OFS基礎(chǔ)設(shè)施由 FIM(通常被稱作“shell”)和加速器功能單元 (AFU) 區(qū)域(一種用于工作負(fù)載開發(fā)的指定區(qū)域)組成。借助OFS、FPGA主板或FIM,開發(fā)者可以利用開源基礎(chǔ)設(shè)施或基礎(chǔ)FIM,根據(jù)目標(biāo)應(yīng)用或行業(yè),快速開發(fā)量身定制的主板FIM。OFS還附帶了oneAPI加速器支持包 (ASP),開發(fā)者可以利用它對(duì)FPGA硬件和設(shè)計(jì)流程進(jìn)行抽象化。OFS節(jié)省了開發(fā)者的時(shí)間,提高了不同F(xiàn)PGA代際間的可移植性,其采用行業(yè)標(biāo)準(zhǔn)接口,并且使用oneAPI提供可選的高層次設(shè)計(jì)流程。
FA728Q加速卡現(xiàn)已出貨,它是一款基于PCIe的高端FPGA加速主板,可提供 32GB板載DDR4內(nèi)存和3個(gè)QSFP28插槽,每個(gè)接口支持高達(dá)100GbE。FA728Q加速卡還可以通過(guò)OFS基礎(chǔ)設(shè)施啟用oneAPI,以支持客戶在RTL中實(shí)施內(nèi)核,或者將算法從CPU/GPU遷移到C/C++等高級(jí)設(shè)計(jì)語(yǔ)言。oneAPI基礎(chǔ)工具套件也可以助力客戶在內(nèi)核中采用FPGA資源,從而進(jìn)一步縮短上市時(shí)間。
表 1. FA728Q規(guī)格
菲數(shù)科技還開始開發(fā)基于AgilexFPGA的主板,包括使用Agilex7 FPGA I系列的FA927S卡和使用Agilex7 FPGA F系列的FA925E卡。
FA927S卡可提供高達(dá)116Gbps的收發(fā)器速率,并且支持PCIe 5.0 x16和 Compute Express Link (CXL)。它面向帶寬密集型應(yīng)用,現(xiàn)在已用于基于RTL 的開發(fā)中。FA927S卡已于2024年第一季度支持OFS。
另一方面,F(xiàn)A925E卡提供了4個(gè)8GB內(nèi)存條和4個(gè)4GB DDR4內(nèi)存條,板載內(nèi)存總計(jì)高達(dá)48GB。FA925E卡專為對(duì)外部?jī)?nèi)存容量和帶寬要求較高的應(yīng)用而設(shè)計(jì)。它全面支持OFS。2023年底已量產(chǎn)。
這兩款加速卡的規(guī)格如下表所示。
表 2. FA927S規(guī)格
表 3. FA925E規(guī)格
成 效
菲數(shù)科技在FA728Q卡上實(shí)施的卸載引擎IP功能針對(duì)時(shí)延和性能進(jìn)行了優(yōu)化,以滿足LLT要求。在加速模式下,TCP的傳輸時(shí)延低于100納秒,可為時(shí)間關(guān)鍵型網(wǎng)絡(luò)應(yīng)用建立穩(wěn)定的低時(shí)延連接。下表顯示了各種連接所測(cè)量的時(shí)延。
表 4. TOE的規(guī)格
注:
1) 一個(gè)時(shí)鐘周期為6.4納秒;
2) TX時(shí)延計(jì)算的是從數(shù)據(jù)包EOP的下降邊緣到XGMII TXC中的有效數(shù)據(jù)的時(shí)間;
3) RX時(shí)延計(jì)算的是從數(shù)據(jù)包SOP到XGMII RXC中的有效數(shù)據(jù)的時(shí)間
FA728Q卡還提供了高帶寬PCIe 3.0 x16和DDR4接口。
表 5. 每個(gè)接口提供的帶寬
板級(jí)支持包
圖 2. OFS平臺(tái)中的高帶寬數(shù)據(jù)路徑
如何使用OFS和菲數(shù)科技解決方案 開始進(jìn)行FPGA加速
FPGA開發(fā)者可以利用FA728Q加速卡和基于OFS的主板,借助開源文檔和源代碼來(lái)構(gòu)建自己的自定義工作負(fù)載。
下表概述了開發(fā)者應(yīng)如何使用菲數(shù)科技加速主板,開始開發(fā)基于FPGA的工作負(fù)載。
您可以訪問(wèn)https://github.com/OFS,獲取開放式FPGA堆棧的基礎(chǔ)源代碼和文檔。請(qǐng)注意,您可以在OFS主板目錄中瀏覽所有基于OFS的第三方主板。
客戶評(píng)價(jià)
“OFS幫助我們更輕松、更快速地構(gòu)建客戶所需的加速平臺(tái),為客戶提供從軟件、API 、驅(qū)動(dòng)程序到底層硬件的一整套方案。”
—— 菲數(shù)科技有限公司
Cheng Ailian
-
FPGA
+關(guān)注
關(guān)注
1630文章
21796瀏覽量
605996 -
英特爾
+關(guān)注
關(guān)注
61文章
10007瀏覽量
172327 -
加速卡
+關(guān)注
關(guān)注
1文章
61瀏覽量
10990 -
LLT
+關(guān)注
關(guān)注
0文章
2瀏覽量
5615
原文標(biāo)題:菲數(shù)科技使用FA728Q加速卡加速低時(shí)延交易(LLT)應(yīng)用
文章出處:【微信號(hào):英特爾FPGA,微信公眾號(hào):英特爾FPGA】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論