沒有先進的制程,再頂尖的科學家也無法用少量的晶體管完成復雜計算;沒有更高的頻率和更大的緩存,再高效結構也無法轉化為強大的計算能力;但對于實際的算力來說,這些都只是表象。真正的算力,是云數據中心里能跑多少應用,是超算中心里的科學家能夠多快獲得結果,是用戶能夠把經歷集中在業務和應用之上。
有人說這是智能時代,有人說這是數據的時代,有人說這是云時代……但無論我們如何定義當下與未來,算力卻總是一個繞不開的話題。但當我們在討論算力的時候,我們究竟在談什么?是幾nm的制程?是多少GHz、多少L3緩存?是多少核心、多少線程?這些都對,但也都不對。
沒有先進的制程,再頂尖的科學家也無法用少量的晶體管完成復雜計算;沒有更高的頻率和更大的緩存,再高效結構也無法轉化為強大的計算能力;但對于實際的算力來說,這些都只是表象。真正的算力,是云數據中心里能跑多少應用,是超算中心里的科學家能夠多快獲得結果,是用戶能夠把經歷集中在業務和應用之上。
還有哪些核心競爭力?
眾所周知,英特爾在挑戰新制程的道路上遇到了一些困難。這使得英特爾很難在兼顧功耗、良率及芯片面積的情況下,在晶片之上集成更多的晶體管。相應的,也就無法構建更多核心、更多線程。這的確給英特爾繼續挑戰更高的處理器性能帶來了麻煩,但實際的情況卻遠非如此簡單。
硬件的性能需要依靠軟件來體現,而軟件層面的優化則直接關系到硬件的性能。舉個例子,2000年,索尼推出的PS2主機使用的Emotion Engine處理器使用180nm制程,包含1050萬個晶體管,每秒能夠生成6600萬個多邊形(概括系統3D能力的核心指標之一);同年英偉達發布的GeForce 2 Ultra使用同樣的工藝制程,包含2500萬個晶體管,理論上每秒卻只能生成3100萬個多邊形。前者運行著定制的操作系統,并且軟件都由專門的開發機進行開發;而后者則面向PC市場,運行在Windows環境中。
當然,如此簡單粗暴的對比索尼EE處理器和英偉達顯卡的每秒多邊形生成率并沒有太大的實際意義,但這也足以說明軟件優化的意義。
誠然,我們無法要求今日的商用系統全部運行經過深度定制開發的操作系統和應用軟件,但細致且廣泛的調優仍舊關系到硬件最終性能及用戶價值的體現。
回到今日的主題,當我們在看到英特爾遇到的種種問題時,我們也應當注意到,英特爾始終在投入更多的人力和資源于軟件及系統的優化之上。而通過這些優化,英特爾所獲得不僅是一個個用戶的認可,更是海量用戶價值的體現。
開放的云服務提供商
開放的選擇
在處理器廠商的各類客戶群中,CSP絕對是一個十分特殊的存在。CSP的價值在于向外界提供高性價比的基礎設施類服務;換句話說,如何以更低的價格對外提供更多服務是CSP的核心盈利模式。這意味著,CSP對于性能是十分敏感的。當兩款處理器價格持平,那么CSP會毫不猶豫的選擇算力更高的那一款。
青云QingCloud是國內一家特色十分鮮明的CSP,堅持中立可靠的為客戶提供云計算服務。但是相對于財大氣粗的BAT,青云QingCloud更在乎基礎設施的性價比。同時,青云QingCloud對于基礎架構中計算平臺的選擇也始終保持開放態度,任何能夠提供優勢性價比的產品都會成為青云QingCloud未來基礎架構的選項。所以,對于不同的計算平臺,青云QingCloud不僅始終保持關注,更會通過不斷的對比測試來決定下一次升級的對象。
顯然,對于此時的英特爾,想要拿下青云QingCloud,難度自然不小。但就在大家都以為青云QingCloud會選擇目前外界呼聲更高的對手產品時,英特爾卻再次成為其采購對象。在這一結果的背后,則是英特爾戰略客戶支持部門的大力支持。
2020年1月,青云QingCloud在測試后認為對手產品在一些場景中的性能表現要優于英特爾。但在英特爾戰略客戶支持部門的努力下,英特爾軟件工程團隊對青云QingCloud的軟件測試環境進行了細致的調優,而經過調優后的測試結果則完全逆轉。最終,開放的青云QingCloud在對自身軟件環境進行調整后仍舊選擇了英特爾的產品。
另一方面,在英特爾團隊的協助下,青云QingCloud還上線了基于英特爾至強處理器的AI推理業務,直接擴展了青云QingCloud的服務目錄,讓青云QingCloud能夠更快的加入普惠AI的大潮,在競爭中不落人后。同時,青云QingCloud也是首個將傲騰產品應用在企業級存儲的緩存層中的CSP,在成本平衡的前提下實現了更好的性能。
對于英特爾平臺所帶來的一系列應用新體驗和新業務,青云QingCloud供應鏈總監廖洋直言不諱:作為CSP,青云QingCloud不僅關注硬件的采購成本,更關注硬件在使用和對外服務過程中的成本。而英特爾對于青云QingCloud的關注、溝通及服務不僅讓彼此之間形成了深度的默契,更幫助青云QingCloud解決了業務層面的諸多實際問題。
而對于青云QingCloud,英特爾也通過自身真金白銀的服務付出換來了客戶選擇與信賴。
超級算力背后的超強服務
如果說云計算是讓大量的資源去服務更大量的用戶,那么與之相對的便是HPC領域的用大量資源去滿足幾個應用的需求。在算力應用的道路上,云和超算,一個向左,一個向右。但在對用戶的支持方面,英特爾的支持卻是一以貫之的。
與前面的CSP不同,HPC的用戶多為高校和科研機構。如果說以CSP為代表的企業用戶對算力的追求是全生命周期的極致性價比,那么以高校和科研單位為主的HPC用戶群則更關注算力的絕對性能和在專業領域的支持。因為在云之中,算力是以各種高度模板化的服務列表來呈現的;而在科研類應用之中,HPC很可能昨天還在處理氣象問題,今天就需要轉戰重金屬污染的防治。不確定的應用方向,不確定的計算規模……唯一確定的是,HPC的用戶需要更多支持與幫助。
清華大學、中南大學,前者是如雷貫耳的中國頂級學府,后者則是擁有6個國家一級重點學科、12個二級重點學科的知名高校。而為了方便科研,兩所高校同樣也是HPC的老用戶。
在傳統的商業領域,很多成熟的應用都有龐大的開發支持和用戶基礎,軟硬件的適配能夠獲得很好的保障。但在超算領域,應用的開發者和使用者都是小眾用戶,能夠理解業務和軟件邏輯的人少之又少,針對硬件變化的軟件優化也就更少。因此,無論使用這些軟件的是本科生、研究生還是博士生,軟件的優化都需要有專業人員的支持。
另一方面,從硬件的構成方面,不同的高校和科研機構也有不同的傾向。以清華大學為例,在其擁有的包含近2000個節點的超算系統中包含800多個Westmere-EX架構節點(2010年興建)、200多個Broadwell架構節點(2016年興建)和900多個Cascade Lake架構節點。顯然,清華大學的超算建設思路屬于“常用常新”的滾動建設型。而中南大學則直接使用了新的Cascade Lake架構至強Gold 6248R構建了1000多個節點。顯然,中南大學屬于“一步到位”型。
而無論采用哪種建設思路,從最開始的架構設計到處理器具體型號選擇,到供應商設備再到最后的應用移植與調整優化;英特爾都全程參與。
對此,清華大學高性能計算中心張武生老師舉了一個生動的例子:在超算的使用過程中,清華發現在某一個應用上英特爾處理器的計算結果與其他平臺不一致。在得知這一消息后英特爾第一時間調集全球研發力量進行響應,并最終找到了原因、對硬件進行了修正。而在另外一個要求實時性、高帶寬、高IO的金融類研究項目中,由于計算模式不一樣,清華在實際的研究過程中遇到了很大困難。英特爾得知之后更第一時間為清華提供了全新的測試平臺,保證了實驗的進度;整個過程只用了兩三周時間。響應及時,支持到位。
對于英特爾的支持,中南大學鄒有老師則表示:英特爾平臺有著完整的編譯器和文檔支持,軟件的開發和移植都能夠比較方便的展開。同時,英特爾對客戶實際應用中的真實需求有著很深的理解,并提供了眾多的培訓項目,幫助學校的老師和同學提升了深度學習方面的能力。而這些軟硬件和技術層面的開放性使得英特爾成為了一個更方便使用的平臺。
當超算遇到云
作為一種高精尖的IT應用,對超算有需求的也絕不止清華、中南大學這樣的頂尖學府,更有廣泛的其他企業、高效和研究機構。如果每個單位在遇到HPC需求時都以自建的形式來滿足,那么無論從經濟成本還是時間成本來看,很多研究都是無法繼續的。因此,更合理的解決方案就是讓超算具備對外提供服務的能力,換句話說就是“超算云”。
并行科技是一家專注于高性能軟件開發、服務的公司;而超算云則是并行科技近幾年的戰略發展重點。相較于自建超算的高校或其他研究機構,作為一家商業公司,并行科技在超算建設方面更注重系統的性價比——讓硬件以更高的效率為高性能應用服務。
在底層硬件領域,并行科技一方面在基于英特爾Cascade Lake-AP架構處理器構建自營硬件平臺,另一方面也在積極聯系擁有超算系統的高校和科研機構,使之能夠將閑時的計算資源貢獻出來,為其他用戶服務,獲得更多資金以支持教學科研發展。
而在軟件平臺層,并行科技則基于英特爾系列處理器的硬件特點開發了高效且靈活的超算云OS,在實現用戶管理和計費功能的同時,也讓平臺能夠充分調動底層硬件資源實現更具效率的計算。當然,并行科技的超算云還將常用的、經過細致優化的超算應用以服務目錄的形式提供給用戶,免去用戶軟件部署和調優的麻煩。
與此同時,并行科技還聯手英特爾每年舉辦并行編程大賽,在高校中普及高性能計算編程技巧和方法,為超算領域的持續發展培養更多的跨界編程人才。
當我們在聊算力時
我們到底在討論什么?
伴隨社會與商業的數字化,算力已經成為支持社會、科研和商業的不可或缺的基礎設要素。而這一要素更要在軟件應用當中體現其具體價值。再強大的算力也需要配套的應用和優化,才能充分發揮效能。
因此,當我們在聊算力時,我們所說的不僅僅是制程、核數、頻率,更是算力之上的軟件以及算力背后的優化、服務與長期的支持。
在這些方面,英特爾對用戶的重視與支持毋庸置疑;以“客戶至上”作為公司的價值觀,英特爾一直在深入各行各業,緊密聆聽客戶的心聲,從推動應用落地的角度有針對性地對產品和解決方案策略進行調整。而在此之外,英特爾還提供了軟件、內存與存儲、網絡、安全等多種配套技術。加之架構、制程與封裝,英特爾圍繞數據價值所構建的六大支柱正在成為各行各業用戶實現價值方便捷徑。
而隨著算力需求和以英特爾為代表的ICT企業的技術發展,在聊算力時,我們討論的話題還可以更多。
-
芯片
+關注
關注
456文章
51170瀏覽量
427244 -
英特爾
+關注
關注
61文章
10007瀏覽量
172327 -
云數據
+關注
關注
0文章
117瀏覽量
16655
發布評論請先 登錄
相關推薦
評論