在計算架構和負載變得愈發復雜和多樣的情況下,處理器廠商紛紛開始了自己的造詞之路。要想體現產品定位,又要讓大家對其縮寫印象深刻,所以PU成了最常見的后綴。現在的處理器家族中已經有了不少成員,除了常見的CPU、GPU、APU之外,按照處理對象的不同,在人工智能和深度學習的崛起下,NPU和TPU也紛紛出現。
DPU模糊的定義
不過這些已經定義明確的處理單元并不是我們今天的主角,而是找到了全新定義的xPU。什么是xPU,其實很難定義,這其中有DPU(數據處理單元)、IPU(基礎設施處理單元)和FAC(功能加速卡),這些剛冒頭的產品就是xPU,它們代表了從SmartNIC演化過來并超越其定位的新時代加速器硬件。除了SmartNIC以外,這些xPU雖然命名不同,但其實很多時候,它們是完全重合的,現在為了方便,很多時候也以DPU統稱。
![](https://file.elecfans.com/web2/M00/4D/B9/pYYBAGK1oJ6AGFPZABRDaOz-o9M995.png)
BlueField-3 DPU / 英偉達
這樣說DPU的定義還是很模糊,我們就從其特點來看。SmartNIC往往需要主CPU來完成管理工作,DPU雖然往往也屬于一個主系統中的部件,但卻可以做到完全獨立,可以部署到邊緣、JBOF存儲和網關上,并為它們提供網絡接口和虛擬功能。它的另一項職責就是幫CPU減輕負擔,節省服務器上有限的處理器核心。
因此,盡管DPU看起來和一些PCIe智能網卡或GPU差不多,但它本質上就是一個為數據流和數據包處理提供加速、卸載和本地服務的微型服務器,在服務器中提供一個獨立單元的同時,又不乏協助其他單元的處理能力。
什么樣的任務需要DPU?
至于為什么要用到DPU,這就不得不談到日益增加的數據密集型任務了,短視頻、實時金融交易的興起,高帶寬的數據流要求數據中心對網絡、存儲、安全和AI/ML進行高效的處理。比如谷歌在數年前就提到,在他們的數據中心里,有三分之一的任務都是數據密集型的,這些都是交由底層基礎設施完成的,而且這類任務的占比是在逐步增加的。因為CPU和GPU這樣的通用計算單元并不擅長,所以專門針對這類任務優化的DPU就得出來擔此大任了。其次就是企業數據中心和公共數據中心也想獲得超大規模巨頭廠商那樣的效率,做到這一點就必須解聚那些昂貴的硬件資源,比如SSD、GPU等,DPU為數據中心的解聚提供了極高的效率,優化了擁有成本、占用面積和安全性。
DPU可以完成各個方面的卸載與加速,尤其是在網絡、安全和存儲這三大塊。在網絡端,DPU可以有效實現虛擬路由器,輔助數據包交換、定義交換規則等工作,減少延遲的同時還能夠提高吞吐量;在安全上,DPU可以用于下一代防火墻(NGFW)的加速,完成數據包過濾、內容檢測和報頭檢測與重寫,將性能提高數倍以上;在存儲上,DPU可以卸載高速NVMe/TCP,進一步提升存儲性能。最關鍵的是,這三者都能有效地接管CPU控制面的負載,節省CPU本身的計算核心。
![](https://file.elecfans.com/web2/M00/4D/B9/pYYBAGK1oNKAAHUKAAc-DsxY5fM575.png)
基于DPU的服務器存儲方案 / Fungible
以上是DPU為服務器提供的加強,主要以PCIe加速卡的形式來提供,此外,還有單獨的DPU存儲產品。傳統的CPU存儲方案中,整個系統由DRAM、x86 CPU、SmartNIC、加速器和PCIe接口組成,而在未來的存儲方案,比如高性能存儲、計算型存儲和軟件定義網絡應用的存儲中,單片集成的方案更能滿足要求,這就是與DRAM結合的DPU存儲產品。這種方案不僅可以提升IOPS,也能進一步降低能耗。
正因如此,數據中心會用DPU來完成數據密集型任務,從而減少功耗、擁有成本和占用空間。此外,他們也會用到基于DPU的存儲、GPU/TPU資源池和主機卡,來高效地完成高成本硬件資源的解聚。
DPU市場混戰
在不少廠商對DPU的宣傳中,往往都會提到這將是除了CPU和GPU之外的第三大硬件。大家可能覺得類似的承諾,好像一些AI處理器也有提到,但市面上還是GPU占據主導地位,DPU又會有何不同呢?事實證明,市場對DPU的信心很足,這我們從入局DPU的廠商就能看出。
![](https://file.elecfans.com/web2/M00/4D/1D/poYBAGK1oQaABYcCAAE8wpLh1Ak460.jpg)
云霄DPU / 云豹智能
如今制造DPU的企業分為三種,一是初創公司,比如:云豹智能、星云智聯、中科馭數、云脈芯聯、芯啟源、大禹智芯、Fungible等;二是市面上一些已有的服務器巨頭,比如AMD/Xilinx、英特爾、Marvel、英偉達;三是CSP(云服務供應商)廠商,比如亞馬遜AWS、微軟Azure、阿里云等等。后者更多是負責設計或者聯合設計這些xPU,好專用于自己的云服務器。最終售賣這些DPU的除了DPU廠商外,還有基礎設施的OEM和ODM,增值分銷商和集成方案廠商,CSP廠商在售賣服務器的時候,自然也會以間接的方式來體現DPU的價值。
隨著Mellanox被英偉達收購,Pensando被AMD收購,而Fungible的DPU主要針對存儲加速和卸載,雖然沒有被收購,但也收獲了軟銀的主導的融資。國內的DPU廠商同樣備受青睞,比如騰訊屢次投資的云豹智能,字節跳動投資的云脈芯聯,美團和百度投資的星云智聯等,這些投資方要么是CSP,要么擁有超大規模的數據中心,他們不像其他CSP大廠,硬件設計能力缺乏或有限,卻也看到了DPU的前景。
DPU并不完美
即便大廠看好,但從現狀來看,部署DPU對某些中小企業來說依然是雙刃劍。固然,DPU可以卸載基礎設施的任務,減輕其負擔,讓服務器的CPU空出來專注在應用本身,更高的效率、更低的擁有成本和更高的安全性也都隨之而來,這些優點是幾乎每個服務器都能享受到的。
但在部分服務器中,引入DPU不免增加了服務器的資本投入,而且相較于CPU、GPU這類硬件來說,它只能卸載和加速特定的負載,并不是一個通用加速單元。此外,部分服務器在增加DPU的情況下還是會導致功耗提升,在服務器、數據中心紛紛開始節能減排的當下,如何權衡各個組件的功耗無疑會是一個大問題。還有就是相關的開發,DPU的靈活性體現在可編程上,但這需要進行一定的編程能力,加上目前每家廠商都在單干,也沒有一個標準的接口,所以在適配上絕對不輕松,這也是不少DPU選擇Arm作為核心架構的原因,就是為了減少其編程的難度。
也正是因為以上這些理由,從市場滲透率上來看,DPU主要是還是大規模的CSP廠商用的更多一點,加上托管應用的增加,這一塊未來也會驅動DPU產品的銷售。對于自研DPU的CSP來說,他們肯定會繼續加大這方面的投入,進一步降低成本,而對于第三方廠商來說,英偉達、AMD和英特爾這些服務器CPU、GPU廠商無疑會更有優勢,因為他們提供競爭力更強的集成方案。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
服務器
+關注
關注
12文章
9308瀏覽量
86073 -
DPU
+關注
關注
0文章
368瀏覽量
24260 -
英偉達
+關注
關注
22文章
3848瀏覽量
91995
發布評論請先 登錄
相關推薦
利用NVIDIA DPF引領DPU加速云計算的未來
DPU 的強大功能,并優化 GPU 加速計算平臺。作為一種編排框架和實施藍圖,DPF 使開發者、服務提供商和企業能夠無縫構建 BlueField 加速的云原生軟件平臺。
![利用NVIDIA DPF引領<b class='flag-5'>DPU</b><b class='flag-5'>加速</b>云計算的未來](https://file1.elecfans.com/web3/M00/07/0B/wKgZPGeS7aKAGUIAAAAbxIpaJKw881.png)
![](https://file1.elecfans.com/web2/M00/0D/4B/wKgaomdFX46AbOHfAAWTPwQ3Wl0193.jpg)
IBM將在云平臺部署AMD加速器
IBM與AMD近期宣布了一項重要合作協議,根據協議,IBM將在其云平臺上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業客戶在生成式AI模型方面的性能和能效,進一步推動AI技術的創新與應用。
磁調制式電流傳感器在粒子加速器中的應用
粒子加速器是一種利用電磁場加速帶電粒子(如質子、電子、離子等)至極高速度的裝置。其工作原理基于洛倫茲力定律,即當帶電粒子在電磁場中運動時,會受到垂直于其速度方向的力作用,從而改變其運動狀態。粒子
具有邊沿速率加速器的TXB和TXS電壓電平轉換器的注意事項
電子發燒友網站提供《具有邊沿速率加速器的TXB和TXS電壓電平轉換器的注意事項.pdf》資料免費下載
發表于 09-04 09:52
?0次下載
![具有邊沿速率<b class='flag-5'>加速器</b>的TXB和TXS電壓電平轉換<b class='flag-5'>器</b>的注意事項](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書
數據中心的第三顆“主力芯片”,主要通過其專用處理器優化數據中心的網絡、存儲、安全等處理性能,助力服務器運行效率顯著提升,有效降低成本。因此,在新型數據中心建設時,圍繞 DPU 構建數據中心網絡的基礎設施
發表于 07-24 15:32
什么是神經網絡加速器?它有哪些特點?
神經網絡加速器是一種專門設計用于提高神經網絡計算效率的硬件設備。隨著深度學習技術的快速發展和廣泛應用,神經網絡模型的復雜度和計算量急劇增加,對計算性能的要求也越來越高。傳統的通用處理器(CPU
西門子推出Catapult AI NN軟件,賦能神經網絡加速器設計
西門子數字化工業軟件近日發布了Catapult AI NN軟件,這款軟件在神經網絡加速器設計領域邁出了重要一步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級系統(SoC)上實現神經網絡的高層次綜合(HLS),為機器學習應用提供了硬件
Hitek Systems開發基于PCIe的高性能加速器以滿足行業需求
Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開發基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網絡、計算和高容量存儲應用的需求。
![Hitek Systems開發基于PCIe的高性能<b class='flag-5'>加速器</b>以滿足行業需求](https://file1.elecfans.com/web2/M00/C5/69/wKgZomX9H7qAU9yvAAA_z697ZsE499.png)
瑞薩發布下一代動態可重構人工智能處理器加速器
瑞薩最新發布的動態可重構人工智能處理器(DRP-AI)加速器,在業界引起了廣泛關注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統技術,效率提升了驚人的10倍。其獨特之處在于,它能在低功耗的傳統嵌入式處理
家居智能化,推動AI加速器的發展
電子發燒友網報道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執行機器學習和深度學習任務而設計的ASIC或定制化處理器。在智能家居中,AI加速
評論