AI軟件初創公司Mipsology正在與Xilinx合作,以使FPGA能夠僅使用一個附加命令即可替換AI加速器應用程序中的GPU。Mipsology的“零努力”軟件Zebra將GPU代碼轉換為可在FPGA上的Mipsology的AI計算引擎上運行,而無需進行任何代碼更改或重新培訓。
賽靈思今天宣布,將為數據中心向Zebra交付最新版本的Alveo U50卡。Zebra已經在其他Xilinx板上支持推理加速,包括Alveo U200和Alveo U250。
Xilinx營銷副總裁Ramine Roane表示:“ Zebra帶給我們的Alveo卡的加速水平使CPU和GPU加速器感到羞愧。”“與Zebra結合使用,Alveo U50滿足了AI工作負載的靈活性和性能需求,并為任何部署提供了高吞吐量和低延遲性能優勢。”
過去,即插即用的FPGA對于非專業人士來說很難編程,但是Mipsology希望將FPGA變成即插即用的解決方案,就像CPU或GPU一樣容易使用。這樣做的想法是使從其他類型的加速切換到FPGA盡可能容易。
Mipsology首席執行官Ludovic Larzul說:“最好的方式是[Mipsology],我們使用FPGA之上的軟件來使它們透明化,就像Nvidia用Cuda CuDNN來使GPU對AI用戶完全透明一樣。“在接受EE Times采訪時。
至關重要的是,這可以由非專家完成,而無需具備深厚的AI專業知識或FPGA技能,因為無需進行模型再培訓即可過渡。
“易用性非常重要,因為當您查看人們的AI項目時,他們通常無法訪問設計神經網絡的AI團隊,” Larzul說。“通常,如果有人安裝了一個機器人系統或一個視頻監視系統……他們會讓其他團隊或其他團體開發神經網絡并對其進行培訓。一旦獲得了[訓練有素的模型],他們就不會更改它,因為他們沒有專業知識。”
與Xilinx對比當Xilinx
已經擁有自己的神經網絡加速器引擎(XDNN)時,為什么會支持第三方軟件?
“一句話的重點是:我們做得更好,”拉爾祖爾說。“另一句話是:我們的作品。”
Mipsology在Zebra中擁有自己的計算引擎,該引擎支持客戶現有的卷積神經網絡(CNN)模型,與XDNN不同,Larzul表示XDNN支持大量演示,但不太適合定制神經網絡。他說,這使使用XDNN建立和運行自定義網絡“痛苦”。盡管XDNN可以在不受GPU威脅的應用程序中競爭,但Zebra旨在使FPGA根據性能,成本和易用性直接采用GPU。
Larzul說,大多數客戶改變GPU解決方案的動機是成本。
他說:“他們想降低硬件成本,但又不想重新設計神經網絡。”“(避免了)一筆非經常性的費用,因為我們能夠透明地替換GPU,并且無需重新訓練或修改神經網絡。”
FPGA還具有可靠性,部分原因是因為它們在芯片領域不那么積極,并且通常比包括GPU在內的其他加速器類型運行溫度更低。這在需要長期維護成本的數據中心中尤其重要。
拉爾祖爾說:“總擁有成本不僅僅是董事會的價格。”“確保系統正常運行還需要付出代價。”
Zebra還旨在使FPGA在性能上競爭。Larzul說,盡管FPGA通常提供比其他加速器更少的TOPS(每秒Tera操作),但由于Zebra精心設計的計算引擎,它們能夠更有效地使用TOPS。
“這是大多數加速AI的ASIC初創企業都忘記了的-他們在做很大的一塊硅片,試圖包裝更多的TOPS,但是他們沒有考慮如何在網絡上映射它以提高效率”,他說,并指出Zebra的基于FPGA的引擎比TOPS量為6倍的GPU每秒能夠處理更多圖像。
如何實現的?盡管Larzul沒有提供確切的細節,但他確實表示它們不依賴修剪,因為精度降低太大,以至于不進行重新培訓就無法接受。由于相同的原因,它們不使用極限量化(低于8位)。
Zebra的引擎加快了CNN的速度,而CNN如今已廣泛用于圖像和視頻處理應用程序,但Zebra也可以應用于使用類似數學概念的BERT(Google的自然語言處理模型)。Zebra的未來迭代可能會覆蓋其他類型的神經網絡,包括LSTM(長期短期記憶)和RNN(遞歸神經網絡),但這很難實現,因為RNN在數學上更加多樣化。
EVE
Mipsology的團隊成立于2015年,在法國約有30人從事研發工作,在加利福尼亞有一個小團隊,主要負責業務發展。該公司已獲得總計700萬美元的資金,其中200萬美元是2019年法國政府創新競賽的獎金。
Mipsology的核心團隊來自EVE,這是一家ASIC仿真器公司,于2012年被Synopsys收購,用于其ZeBu(零錯誤)硬件輔助驗證產品,當時是Cadence鈀金驗證平臺的競爭對手。Larzul認為,幾乎所有主要的ASIC公司都使用EVE技術在設計周期內驗證ASIC。該技術依賴于連接在一起的數千個FPGA來重現ASIC行為。
Mipsology擁有12項正在申請的專利,并且與Xilinx密切合作,并且與第三方加速器卡兼容,例如Western Digital小型(SFF U.2)卡和Vega-4001等研華卡。
-
FPGA
+關注
關注
1630文章
21798瀏覽量
606041 -
gpu
+關注
關注
28文章
4777瀏覽量
129360 -
AI
+關注
關注
87文章
31536瀏覽量
270346
發布評論請先 登錄
相關推薦
GPU加速云服務器怎么用的
英偉達AI加速器新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內存
![英偉達<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內存](https://file1.elecfans.com//web3/M00/02/33/wKgZO2dbq-SAaMLYAABIRLt0R1E505.jpg)
![](https://file1.elecfans.com/web2/M00/0D/4B/wKgaomdFX46AbOHfAAWTPwQ3Wl0193.jpg)
《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變
英特爾發布Gaudi3 AI加速器,押注低成本優勢挑戰市場
下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理
![下一代高功能新一代<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>(DRP-<b class='flag-5'>AI</b>3):10x在高級<b class='flag-5'>AI</b>系統高級<b class='flag-5'>AI</b><b class='flag-5'>中</b>更快的嵌入處理](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
美國限制向中東AI加速器出口,審查國家安全
Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構,性能提升四倍
![Arm推動生成式<b class='flag-5'>AI</b>落地邊緣!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>支持Transformer 架構,性能提升四倍](https://file1.elecfans.com/web2/M00/C8/7D/wKgZomYclwuAXCUGAAKIwINsqQs457.png)
Hitek Systems開發基于PCIe的高性能加速器以滿足行業需求
![Hitek Systems開發基于PCIe的高性能<b class='flag-5'>加速器</b>以滿足行業需求](https://file1.elecfans.com/web2/M00/C5/69/wKgZomX9H7qAU9yvAAA_z697ZsE499.png)
評論