在最新發布的全球最強超級計算機排名 Top500 的榜單中,InfiniBand 網絡再次以絕對的數量和性能優勢蟬聯超級計算機互連設備數量榜首,比上次排行榜的數量又有了大幅度的增長。縱觀這次的榜單,可以歸納出以下三個趨勢。
基于 InfiniBand 網絡的超級計算機以 197 臺的數量大幅領先于其它網絡技術。特別在 Top100 的系統中,基于 InfiniBand 網絡的超級計算機更是遙遙領先,InfiniBand 網絡已經成為了追求性能的超級計算機的標配。
NVIDIA 網絡產品成為 Top500 系統中的主流互連設備,其中超過三分之二的超級計算機在使用 NVIDIA 網絡互連,NVIDIA 網絡的性能和技術領先性已經得到了廣泛認可。
還值得一提的是,InfiniBand 網絡不僅在傳統的 HPC 業務,在企業級數據中心和公有云上也已被廣泛使用。目前性能第一的企業級超級計算機 NVIDIA Selene 和微軟公司的 Azure 公有云都在利用 InfiniBand 網絡來發揮其超高的業務性能。
網絡計算技術成就性能優勢
為什么 InfiniBand 網絡在 Top500 中受到了如此的重視?
其性能優勢起到了決定性的作用。
InfiniBand 網絡率先實現了通信和計算在網絡中的融合,是業界第一款會計算的網絡,其先進的網絡計算技術,不僅大幅提升了計算性能,還通過計算的手段解決了困擾通信領域數十年的問題,如 Reduce 、Allreduce 、Barrier 等通信操作帶來的網絡擁塞問題。
這些操作會在網絡中產生瞬間的網絡流量突發,對于無損網絡來說,會通過擁塞控制技術來強迫網絡降速以緩解擁塞問題;對于有損網絡來說,就會造成網絡中的大量丟包,從而導致網絡重傳數據,這兩種情形都會造成業務的性能下降。
由于這些通信操作是很多業務中頻繁使用的通信方式,在過去幾十年的時間里,眾多的科研人員都在致力于優化擁塞控制的算法和優化通信法則來解決這個問題,但是一直沒能有突破性的進展。
InfiniBand 網絡的 SHARP 網絡計算技術(In-Network Computing)的出現,為業界提供了新的思路,利用計算的手段從根本上可以解決這些通信模型造成的擁塞問題,讓您的網絡不必再降速或者丟包,在全線速的狀態下完成數據的傳輸。
這項技術已經被廣泛用到 Top500 的眾多的機器當中。
性能隔離技術解決企業級數據中心
和云市場難題
為什么 InfiniBand 網絡進入了企業級數據中心和云的市場?
InfiniBand 網絡帶來的性能隔離技術為其叩開了這些市場的大門。
對于業務來進行性能隔離也是困擾網絡界和計算界很久的問題,現在我們已經實現了租戶之間的安全隔離,租戶業務和業務之間的隔離,但是當很多的租戶在同時運行多個應用的時候,卻無法實現應用之間的性能隔離。
即使我們通過一些先進的 QoS 技術來將計算資源和通信資源隔離開來,但卻無法實現業務運行在 Bare Metal 系統上的性能。
InfiniBand 網絡極先進的性能隔離技術,除了實現業務的隔離之外,更是保障了業務在云上多租戶、多任務的狀態下,實現和在 Bare Metal 環境下一樣的性能。
這項技術已經在微軟的 Azure 公有云上開始向用戶提供服務。
在當前的算力成為服務,數據中心成為計算單元的新型計算平臺下,網絡成為決定算力性能的關鍵因素。
單機的性能已無法滿足算力的需求,數據中心的性能以及多數據中心的綜合性能才是算力保障的基礎。
作為連接數據中心內的計算單元、存儲單元以及各個數據中心之間的網絡,成為算力保障的核心。
InfiniBand 網絡憑借其極致的性能,不斷創新的技術架構,在更低功耗、更少硬件設備的前提下幫助用戶實現了業務性能的最大化,其進入越來越多的使用場景自是大勢所趨。
原文標題:算力時代,網絡決定性能
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關注
關注
14文章
5076瀏覽量
103716 -
數據中心
+關注
關注
16文章
4858瀏覽量
72380 -
InfiniBand
+關注
關注
1文章
29瀏覽量
9200 -
公有云
+關注
關注
1文章
95瀏覽量
17460
原文標題:算力時代,網絡決定性能
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論