一家成功的大算力芯片公司,其核心壁壘必須是軟硬兼備的,既要有芯片架構的強大技術壁壘,更要有持久投入的、生態兼容完備的軟件護城河。HADOS,就是中科馭數的軟件護城河。
——中科馭數高級副總裁 張宇
近日,在DPU基礎軟件開發上,中科馭數迎來了一項重要的突破成果——HADOS 正式來到3.0版本。
HADOS 3.0是國內DPU軟件研發平臺的一個里程碑版本,集結了中科馭數6年全部軟件研發投入與DPU在各行業廣泛落地經驗的整合和沉淀,體現了中科馭數全面擁抱敏捷開發的理念和方法,以及對高效、靈活、安全、易用的極致追求。
目前,HADOS 3.0核心代碼量已經超過126萬行,包含網絡、計算、存儲、安全等多層次API數量高達2765個,并且提供大量的開箱即用的組件和服務。相較于英特爾的IPDK和英偉達的DOCA,起步更早的HADOS在不少方面都有獨特的沉淀和優勢,包括云原生網絡、微服務治理、全卸載能力、DPU全仿真技術、生態兼容性、運營管控、國內安全加解密,以及最重要的人工智能場景下國產AI芯片和GPU芯片網絡方案等等方面。可以這么說,HADOS 3.0已經站在了業界最前沿,成為與國際巨頭英偉達和英特爾并駕齊驅的本土解決方案。
![](https://file1.elecfans.com//web2/M00/FB/29/wKgaomaM2BGAOCTqAAuWfiuKHdM776.png)
HADOS 3.0 沿用馭數經典軟件棧架構
為用戶提供全方位、多層次的開發體驗
從架構來看,HADOS3.0延續了此前兩個大版本的三個邏輯功能分區架構,分別是超高性能的設備驅動層(DDL),兼容性完備的應用驅動層(ADL),以及功能強大且好用的應用開發平臺層(ADP)。這也是中科馭數的經典軟件棧架構模型設計,旨在為用戶提供全方位、多層次的開發體驗。
![](https://file1.elecfans.com//web2/M00/FA/3D/wKgZomaM2BGAKn33AAWDnbQMBe0016.png)
設備驅動層(DDL),作為性能與靈活性兼備的“不二之選”,集成了DPU開發所需的全套驅動模塊與豐富的API接口,涵蓋超低延遲LDMA、RDMA、虛擬化、存儲加密等功能模塊,并且支持NP的網絡可編程,特別適用于追求極致性能與定制化的用戶。
應用驅動層(ADL),聚焦于“三U一體”高性能算力中心,通過優化的DPDK、SPDK、OVS、OVN,以及云原生和服務網格等技術組件,為網絡、計算、存儲提供全面加速服務,助力用戶輕松構建高性能算力底座,開箱即用,即刻享受DPU帶來的性能飛躍。
而應用開發平臺層(ADP),是HADOS的“敏捷”核心,配備了編譯、仿真、調試、部署的全棧工具包,其中HADEP——業界首款DPU Emulator,更是歷經三年精心打磨,實現了中科馭數DPU的全功能仿真,支持云化部署,讓客戶能夠在云端一鍵部署DPU設備集群,大幅縮短開發周期,加速項目落地。此外,HADEP還支持與真實DPU的混合部署,進一步提升研發效率。
在內部,中科馭數本身就是HADEP的“重度用戶”,基于云化部署的HADEP,搭建了自動化研發測試平臺,大大節省了硬件資源協調和占用開銷,提升了開發效率。這一舉措不僅是HADOS敏捷異構開發理念的生動實踐,也體現了馭數對研發效率與質量的不懈追求。
![](https://file1.elecfans.com//web2/M00/FB/29/wKgaomaM2BKAfXXjAAN4_QdsDqA655.png)
面對DPU開發平臺的復雜性,中科馭數構建了ADIP——一套多流水線自動化DevOps與自動化測試平臺,支持敏捷開發、持續集成、部署、安裝、測試、迭代,確保HADOS的構建與自動化測試,成為推動HADOS成功的“幕后英雄”。
![](https://file1.elecfans.com//web2/M00/FA/3D/wKgZomaM2BOAd8CLAAYRWwNWGLE394.png)
HADOS 3.0四大架構革新
全面擁抱敏捷開發,引領DPU應用生態
架構革新之一:為云原生而“原生”
云原生技術,既承載了當前通用數據中心中主流方式,更是在當下以AIGC和大模型為代表的人工智能浪潮中,承擔核心算力操作系統角色,海量數據訓練以及大模型訓練、大模型推理都離不開云原生技術。
HADOS 3.0全面深度支持和擁抱原生網絡集群,提供云原生網絡加速、服務網格全卸載、裸金屬共池管理和網絡安全增強,為用戶打造了一個高效率、低成本、安全可靠的開發與運行平臺,提供了全面、高效的云原生解決方案。
![](https://file1.elecfans.com//web2/M00/FB/29/wKgaomaM2BSARs--AAMMwXe1TDA401.png)
架構革新之二:簡約而不簡單
深知客戶在運維過程中面臨的挑戰與需求,HADOS 3.0通過一系列智能化的管理工具與服務,提供強大的智能化運維支撐。HADOS 3.0引入了完善的運維管控遙測接口,與服務組件無縫集成,確保了對DPU集群的全面監控與高效管理。更值得一提的是,HADOS靈活地提供了普羅米修斯等系統服務,滿足客戶多樣化的運維需求。在此基礎上,HADOS傾力打造的DPU UMS統一管理系統,不僅能實時監測DPU設備的狀態,還能進行精細化的配置管理,確保集群的穩定運行與資源的高效利用。
通過這一平臺,用戶可以輕松實現設備的遠程控制、故障預警、性能優化等功能,極大降低了運維的復雜度與成本,釋放了更多精力專注于核心業務的創新與發展。
![](https://file1.elecfans.com//web2/M00/FB/29/wKgaomaM2BSAeodiAAOI6JJGOAU678.png)
架構革新之三:層次化服務API,支持不同層次的二次開發
針對客戶對于DPU開發使用門檻高的痛點,HADOS 3.0提供從基礎到高級各個層次的服務API,更以直觀清晰的文檔,如全量、豐富的說明文檔、用戶手冊、最佳編程實踐與調優實踐指導,助力開發者快速打開DPU應用的大門,大幅縮短項目啟動周期,有效控制開發成本。
![](https://file1.elecfans.com//web2/M00/FA/3D/wKgZomaM2BWABq2qAAfrx2h53Z4928.png)
架構革新之四:一云多芯
“一云多芯”是當前業界整個高性能數據中心繞不過去的主流趨勢。為了順應這一多元化需求,HADOS 3.0支持“一云多芯”策略,讓DPU能夠與不同CPU、操作系統、GPU及IAAS層軟件系統無縫對接,做到全適配、全兼容承諾,讓客戶輕松構建“三U一體”高性能算力底座,一鍵部署,即刻體驗敏捷異構的效益。HADOS 3.0目前已成為業內唯一一款生態全兼容的DPU應用開發平臺,兼容了8款主流國產CPU平臺和10大國產操作系統。
![](https://file1.elecfans.com//web2/M00/FA/3D/wKgZomaM2BaAH69CAAPQH2hnhD0908.png)
六年磨一劍,HADOS已經成為業內適配最完全、競爭力最強、國內實際落地部署最多的DPU軟件開發平臺,累計部署量已經超過了萬卡級別。
HADOS 3.0每一行代碼,每一個功能模塊,都是基于中科馭數對用戶需求的深刻理解,為用戶提供了從底層硬件到上層應用的全方位加速,有效解決DPU開發與部署過程中的復雜性與挑戰,是對高性能計算與DPU規模化應用落地挑戰的有力回應。中科馭數將一如既往地站在DPU軟硬件技術探索前沿,與廣大用戶一道,共筑高性能計算的堅實基石。所有的這些努力,也都代表著一個信念——把敏捷易用送給客戶,把復雜挑戰留給馭數。
審核編輯 黃宇
-
數據中心
+關注
關注
16文章
4858瀏覽量
72380 -
DPU
+關注
關注
0文章
368瀏覽量
24257
發布評論請先 登錄
相關推薦
中科馭數憑借在DPU芯片領域的積累被認定為北京市知識產權優勢單位
![<b class='flag-5'>中科</b><b class='flag-5'>馭</b><b class='flag-5'>數</b>憑借在<b class='flag-5'>DPU</b>芯片領域的積累被認定為北京市知識產權優勢單位](https://file1.elecfans.com//web3/M00/04/7D/wKgZO2dzzEWAGJluAD1VagR9ePM548.jpg)
中科馭數分析DPU在云原生網絡與智算網絡中的實際應用
中科馭數受邀出席2024武漢RDI生態創新論壇
中科馭數加入中國聯通智算聯盟
中科馭數:DPU是構建高效智算中心基礎設施的必選項
中科馭數發布第三代DPU芯片K2 Pro,較上一代能耗降低30%
中科馭數發布高性能DPU芯片K2-Pro
重新定義DPU——中科馭數2024產品發布會,6月19日誠邀蒞臨!
深度踐行“IaaS on DPU”理念,中科馭數正式發布“馭云”高性能云異構算力解決方案!
![深度踐行“IaaS on <b class='flag-5'>DPU</b>”<b class='flag-5'>理念</b>,<b class='flag-5'>中科</b><b class='flag-5'>馭</b><b class='flag-5'>數</b>正式發布“<b class='flag-5'>馭</b>云”高性能云異構算力解決方案!](https://file1.elecfans.com//web2/M00/E6/59/wKgaomZDKS2AKvo9AApNpnyalo8922.jpg)
評論