在過(guò)去的幾年里,英特爾一直專注于其消費(fèi)者酷睿臺(tái)式機(jī)CPU,如果你認(rèn)為英特爾已經(jīng)忘記了他們的至強(qiáng)高端工作站處理器陣容,這是可以理解的。在英特爾臺(tái)式機(jī)級(jí)至強(qiáng)W-1x00系列產(chǎn)品實(shí)際上已經(jīng)退役,而Intel當(dāng)前一代用于服務(wù)器的大型芯片(基于Sapphire Rapids的第四代Xeon Scalable系列)也一再推遲,過(guò)去幾年英特爾在工作站領(lǐng)域并沒(méi)有太多的聲音。但是現(xiàn)在針對(duì)服務(wù)器的Sapphire Rapids終于推出了,英特爾產(chǎn)品路線圖中的僵局終于被打破了,英特爾終于可以繼續(xù)將他們最新的芯片集成到新的工作站中。近期,英特爾宣布了他們的第一個(gè)從上到下更新的工作站處理器,至強(qiáng)W-3400和至強(qiáng)W-2400系列。針對(duì)英特爾大致劃分為專家工作站和主流工作站的市場(chǎng),這些芯片系列旨在用于高性能工作站的設(shè)置,特別是那些需要更多CPU內(nèi)核、更多PCle通道、更多內(nèi)存帶寬或三者結(jié)合的設(shè)置?;谂c英特爾最近推出的服務(wù)器相同的Sapphire Rapids芯片,新的至強(qiáng)W SKU將降低許多(但不是所有)定義Intel領(lǐng)先服務(wù)器芯片的功能,以及更適合在高性能工作站中使用的新芯片組(W790)和主板。與新的至強(qiáng)可擴(kuò)展部件一樣,這里的三大新增功能是轉(zhuǎn)向英特爾的Golden Cove CPU架構(gòu)——具有所有的IPC和時(shí)鐘速度優(yōu)勢(shì)——以及對(duì)DDR5內(nèi)存和用于I/O連接的PCle 5的支持。所有這些都是對(duì)構(gòu)成英特爾之前產(chǎn)品堆棧的Cascade Lake和Ice Lake部件組合的重大升級(jí)。與此同時(shí),與英特爾現(xiàn)有的臺(tái)式機(jī)處理器陣容相比,這些都是2021年底在Alder Lake(第12代酷睿)上率先推出的功能,專注于工作站的Xeon W部件將在更大程度上進(jìn)行構(gòu)建。
至強(qiáng)W-3400系列(Sapphire Rapids-112L)將從12核到56核不等,且都包括112個(gè)PCle 5.0通道,支持8個(gè)內(nèi)存通道最多4 TB的DDR5-4800內(nèi)存、ECC內(nèi)存(僅RDIMM)、Intel vPro和Intel標(biāo)準(zhǔn)可管理性(ISM)。7個(gè)W-3400 SKU(X系列)中的4個(gè)得益于解鎖成熟,因此正式支持超頻。與此同時(shí),Xeon W-2400系列(Sapphire Rapids-64L)將提供6到24個(gè)CPU內(nèi)核,搭配減少的64通道PCle 5.0連接,支持多達(dá)2TB的DDR5-4800內(nèi)存跨四個(gè)內(nèi)存通道,以及所有其余的Xeon W配件,如ECC內(nèi)存。
新的至強(qiáng)W系列將取代英特爾之前的至強(qiáng)產(chǎn)品。雖然英特爾確實(shí)在2021年推出了一些基于Ice lake的至強(qiáng)產(chǎn)品—至強(qiáng)W-3300系列—這些是對(duì)英特爾至強(qiáng)陣容的補(bǔ)充更新,針對(duì)需要額外CPU內(nèi)核或PCIe帶寬的特定客戶。對(duì)于其他人來(lái)說(shuō),即將推出的至強(qiáng)W系列產(chǎn)品,即大約2019年的W-3200和W-2200系列,都是基于英特爾的Cascade Lake芯片的,這本身是對(duì)英特爾Skylake部件的適度更新。因此,推出至強(qiáng)W-3400/2400系列對(duì)英特爾工作站陣容的重要性不言而喻:這是英特爾至強(qiáng)系列的一次重大升級(jí)。
新的至強(qiáng)W系列將與AMD的Threadripper Pro 5000 WX競(jìng)爭(zhēng),后者基于AMD的Zen 3架構(gòu)。最近的Threadripper Pro于去年春天推出,從那時(shí)起,AMD在CPU性能方面基本上占據(jù)了市場(chǎng)的主導(dǎo)地位,這要?dú)w功于內(nèi)核數(shù)量和IPC方面的顯著優(yōu)勢(shì)。即使有了他們的新部件,英特爾在技術(shù)上仍然沒(méi)有完全縮小內(nèi)核數(shù)量的差距,但I(xiàn)PC、內(nèi)核數(shù)量和時(shí)鐘速度的提升應(yīng)該有助于在整體CPU性能方面達(dá)到公平的競(jìng)爭(zhēng)環(huán)境,但具體程度還有待觀察。
英特爾至強(qiáng)W-3400系列:“專家”平臺(tái),最多56核,112個(gè)PCIe 5.0通道,8通道內(nèi)存
英特爾至強(qiáng)的W-3400和W-2400系列工作站處理器基于英特爾的Golden Cove CPU架構(gòu),與英特爾的Alder Lake(第12代)臺(tái)式機(jī)處理器相同。W-3400系列代表了英特爾第4代至強(qiáng)Scalable Sapphire Rapids高級(jí)工作站產(chǎn)品的首要產(chǎn)品線,總共有7個(gè)SKU。至強(qiáng)W-3400的范圍從普通的12核/24線程部件(w5-3425)到備受期待的56核/112線程部件,旗艦w9-3495X。
特別是至強(qiáng)W-3400系列,基于英特爾Sapphire Rapids Extreme Core Count (XCC)芯片,該芯片目前用于英特爾高端至強(qiáng)服務(wù)器部件。XCC芯片依賴于4個(gè)計(jì)算模塊,使用英特爾最新的EMIB互連連接在一起,這是至強(qiáng)工作站處理器的第一個(gè)互連。
Sapphire Rapids XCC芯片的各個(gè)區(qū)塊都是相同或?qū)ΨQ的,因此每個(gè)磁片提供整個(gè)芯片四分之一的CPU內(nèi)核、I/O和內(nèi)存通道。因此,每個(gè)tile最多可以提供32個(gè)PCle 5.0通道(w9-3495X上總共有112個(gè)),而每個(gè)tile還包括兩個(gè)內(nèi)存控制器,在W-3400系列上提供8通道內(nèi)存。
專注于至強(qiáng)W-3400系列的高端SKU Intel Xeon w9-3495X,它與英特爾上一代巨無(wú)霸至強(qiáng)W-3175X有著類似的共鳴,后者于2019年發(fā)布,并提供了超頻的官方支持。與基于skylake的至強(qiáng)W-3175X一樣,最新的至強(qiáng)w9-3495X也有用于超頻的解鎖乘法器。
英特爾至強(qiáng)w9-3495X有56個(gè)核,112個(gè)線程,不像英特爾的臺(tái)式機(jī)處理器,每一個(gè)都是性能(P)內(nèi)核。此外,還提供了總計(jì)105 MB的英特爾智能L3緩存,官方支持8通道DDR5-4800 ECC RDIMM內(nèi)存,最大容量高達(dá)4 TB。
w9-3495X的TDP額定值相當(dāng)高,為350瓦。在實(shí)際操作中,啟用英特爾Turbo Boost和Turbo Boost Max 3.0技術(shù)的情況下,滿載時(shí)的峰值功耗可能會(huì)高得多,特別是在56-unlocked內(nèi)核上。雖然它的56個(gè)Golden Cove內(nèi)核的基本頻率為1.9 GHz,但它的turbo頻率高達(dá)4.6 GHz,而且由于turbo Boost Max 3.0(英特爾最青睞的核心技術(shù)),少數(shù)內(nèi)核可以進(jìn)一步提高到4.8 GHz。
至強(qiáng)W-3400系列的其他SKU從36核到12核不等,如w9-3475X (36C/72T)和w5-3425 (12C/24T)。最終,所有至強(qiáng)W-3400系列都提供相同數(shù)量的DDR5內(nèi)存通道和PCIe通道,因此區(qū)分不同SKU的是CPU核心數(shù)、最大內(nèi)存時(shí)鐘速度、L3緩存,當(dāng)然還有價(jià)格。
與此同時(shí),如前所述,四款至強(qiáng)W-3400 SKU——w9-3495X、w9-3475X、w7-3465X和w5-3435X——都是“unlocked”處理器。這是英特爾幾年來(lái)在至強(qiáng)W系列上沒(méi)有提供的功能,并帶來(lái)了一些有趣的現(xiàn)象。除了最基本的改變CPU時(shí)鐘速度乘法器的能力外,“unlocked”處理器還可以調(diào)整其AVX和AMX偏移量,以防止處理器在沉重的SIMD負(fù)載下下降太多。最后,它們還為網(wǎng)狀互連提供了一些調(diào)優(yōu)選項(xiàng),盡管英特爾沒(méi)有說(shuō)具體可以在這里進(jìn)行調(diào)整。
英特爾至強(qiáng)W-3400系列的起售價(jià)為1189美元,Intel提供每單位1K的定價(jià)(托盤(pán)),而不是單獨(dú)購(gòu)買(mǎi)的零售SKU。至強(qiáng)w9-3495X的1KPU價(jià)格為5889美元,這使得頂級(jí)SKU和后續(xù)的每個(gè)W-3400 SKU比上一代的至強(qiáng)W-3300芯片更貴,但它們確實(shí)具有更多的內(nèi)核,更快的頻率,更多的L3緩存,并支持DDR5-4800。
值得指出的是,英特爾所有的W-3400 SKU都支持高達(dá)4TB的八通道DDR54800 ECC內(nèi)存,即使是最底層的SKU,即w5-3425 (12C/24T)。因此,對(duì)于那些需要大量DRAM,但不一定需要大量CPU內(nèi)核的系統(tǒng),可以在至強(qiáng)的產(chǎn)品系列中找到合適的選擇。但是,請(qǐng)注意,實(shí)際達(dá)到4TB需要每個(gè)通道使用2個(gè)DIMM(DPC),這需要回退到DDR5-4400內(nèi)存速度。
由于CPU提供112個(gè)PCle 5通道(芯片組提供更多通道),至強(qiáng)W-3400芯片可以支持大量的I/O設(shè)備。這相當(dāng)于7個(gè)獨(dú)立的x16顯卡,或高達(dá)28個(gè)x4高速存儲(chǔ)設(shè)備。這一點(diǎn),以及內(nèi)核數(shù)和內(nèi)存通道,是與較低級(jí)別的至強(qiáng)W-2400系列的主要區(qū)別之一,對(duì)于那些被英特爾早期至強(qiáng)W部件的一小部分I/O帶寬所困擾的英特爾平臺(tái)用戶來(lái)說(shuō),應(yīng)該是一個(gè)受歡迎的特點(diǎn)。
有趣的是,112個(gè)PCle 5通道實(shí)際上比英特爾Sapphire Rapids服務(wù)器部件提供的要多。至強(qiáng)可擴(kuò)展陣容最多只有80個(gè)通道。造成這種差異的原因是英特爾僅為其服務(wù)器部件啟用了7個(gè)根端口中的5個(gè),還有2個(gè)端口(32個(gè)通道)未使用。然而,由于工作站Sapphire Rapids部件不需要分配任何引腳來(lái)支持英特爾的多插槽UPI鏈路,因此Intel似乎已將這些引腳分配給為工作站部件提供額外的PCIe通道。值得注意的是,英特爾在這里為服務(wù)器和工作站芯片使用了相同的插槽——LGA 4677——但隨著引腳的變化,它們可能不兼容。
同時(shí),在英特爾的另一個(gè)首次發(fā)布活動(dòng)中,該公司表示,他們將支持RDIMM的DDR5 XMP 3.0內(nèi)存超頻配置文件。關(guān)于這個(gè)公告的細(xì)節(jié)非常少,但從高層次上講,這將為運(yùn)行在W790上的未鎖定處理器用戶提供嘗試從內(nèi)存中擠出更多空間的選項(xiàng)。一般來(lái)說(shuō),內(nèi)存超頻和RDIMM堅(jiān)如磐石的穩(wěn)定性是截然相反的目標(biāo),因此,看看這在市場(chǎng)上的表現(xiàn)會(huì)很有趣。DRAM的時(shí)鐘速度可能高于DDR5-4800,但注冊(cè)的時(shí)鐘驅(qū)動(dòng)器(RCD)可以嗎?
此外,所有這些關(guān)于RDIMM的討論都是有意的:與以前的Xeon W平臺(tái)相比,Sapphire Rapids Xeon工作站平臺(tái)將不支持UDIMM。這是DDR5規(guī)范的一個(gè)限制,它要求UDIMM和RDIMM使用不同的電壓。UDIMM為5伏,RDIMM為12伏,因此不兼容。如果您曾經(jīng)有機(jī)會(huì)親眼看到DDR5 RDIMM,您可能會(huì)注意到它們的鍵控與UDIMM不同,因此它們?cè)谖锢砗?a target="_blank">電氣上都不兼容。
這意味著用戶將不得不將這些處理器和W790主板與更昂貴、但質(zhì)量更高的ECC支持DDR5 RDIMM配對(duì)。對(duì)于羊毛染色工作站用戶來(lái)說(shuō),這不太可能是一個(gè)問(wèn)題,甚至不是一個(gè)能引起注意的差異,但任何希望以低廉的價(jià)格構(gòu)建HEDT風(fēng)格的系統(tǒng)或低端工作站的人都會(huì)發(fā)現(xiàn),Xeon W系統(tǒng)的最終價(jià)格將高于W-3200/2200系列的價(jià)格。
加速計(jì)算:AMX和CXL占據(jù)優(yōu)勢(shì),但大多數(shù)領(lǐng)域特定加速器無(wú)法做到
對(duì)于Sapphire Rapids Xeon芯片和相應(yīng)的服務(wù)器部件,英特爾推出了一系列不同的加速塊和其他加速器相關(guān)功能。在矩陣擴(kuò)展(AMX)、各種特定領(lǐng)域的硬件加速塊以及對(duì)外部加速器的Compute eXpress Link(CXL)的支持之間,英特爾最終將大量的精力投入到了非CPU任務(wù)中。這意味著,特別是針對(duì)其Xeon Scalable服務(wù)器部件,Intel選擇依靠這些加速器功能,在所有芯片中啟用一個(gè)DSA引擎。仍然不支持QAT、DLB和IAA。這取代了原始的x86 CPU性能,以使硬件與其前身及其競(jìng)爭(zhēng)對(duì)手區(qū)別開(kāi)來(lái)。
但對(duì)于他們的工作站部分,事情就簡(jiǎn)單多了,不管是好是壞。簡(jiǎn)而言之,并非所有英特爾的加速計(jì)算功能都在至強(qiáng)W-3400/2400系列中提供。那么,讓我們來(lái)快速瀏覽一下哪些Sapphire Rapids功能適合Xeon W。
也許最關(guān)鍵的是,英特爾的高級(jí)矩陣擴(kuò)展(AMX)確實(shí)做到了這一點(diǎn),至強(qiáng)W-3400/2400系列完全支持它們。AMX是英特爾的矩陣數(shù)學(xué)執(zhí)行塊,類似于張量核和其他類型的矩陣加速器,這些都是用于有效執(zhí)行矩陣數(shù)學(xué)的超高密度塊。AMX不是一個(gè)專用的加速器,而是CPU核心的一部分,每個(gè)核心都有一個(gè)塊,這允許AMX代碼與x86(和AVX)代碼混合,這也是Sapphire Rapids使用超密集代碼時(shí)時(shí)鐘速度偏移為負(fù)的原因。
AMX是英特爾在深度學(xué)習(xí)市場(chǎng)上的重頭戲,通過(guò)使用更密集的數(shù)據(jù)結(jié)構(gòu),超越了他們目前使用AVX-512所能實(shí)現(xiàn)的吞吐量。雖然英特爾有AMX支持的GPU(英特爾數(shù)據(jù)中心Max GPU系列),甚至超越了這一點(diǎn),但對(duì)于Sapphire Rapids,英特爾正在尋求解決需要AI推理的客戶群體,這些推理發(fā)生在非常接近CPU內(nèi)核的地方,而不是在一個(gè)不太靈活,更專用的加速器中。新的AMX單元還支持Bfloat16,確保英特爾的每一層加速計(jì)算塊(AVX和AMX)都支持這種用于深度學(xué)習(xí)的常見(jiàn)中等精度浮點(diǎn)格式。
Sapphire Rapids的一個(gè)新的特定于領(lǐng)域的硬件加速器塊,數(shù)據(jù)流加速器(DSA)也獲得了成功。此塊用于卸載/加速某些操作,如數(shù)據(jù)復(fù)制和簡(jiǎn)單計(jì)算,如計(jì)算CRC32。DSA塊可用于所有至強(qiáng)W SKU。
然而,你不會(huì)發(fā)現(xiàn)提到其他的英特爾加速器模塊,如英特爾動(dòng)態(tài)負(fù)載均衡器(DLB),英特爾內(nèi)存分析加速器(IAA)和英特爾快速輔助技術(shù)(QAT)。盡管事實(shí)上,這些加速器都是藍(lán)寶石激流硅片上相同功能塊的一部分。這些加速器塊主要都是針對(duì)服務(wù)器的,所以沒(méi)有看到它們也就不足為奇了,但這確實(shí)意味著任何為服務(wù)器創(chuàng)建原型代碼的人,如果要使用它們的功能,都需要在實(shí)際的至強(qiáng)可擴(kuò)展服務(wù)器上進(jìn)行測(cè)試。
最后,雖然Intel的Xeon W規(guī)格表中沒(méi)有CXL支持,但I(xiàn)ntel已向我們證實(shí),事實(shí)上這兩個(gè)系列都支持CXL。用于主機(jī)到設(shè)備連接的基于PCIe標(biāo)準(zhǔn)的內(nèi)置技術(shù)已經(jīng)出現(xiàn)了幾年,Sapphire Rapids是第一個(gè)支持該技術(shù)的Intel CPU平臺(tái)。與其他一些功能一樣,它主要用于服務(wù)器,因此將其引入工作站的動(dòng)力較小。盡管如此,英特爾還是為希望利用其功能的用戶提供了支持。
英特爾至強(qiáng)W-2400系列:最多24核,64個(gè)PCIe 5.0通道,適用于主流工作站
再往下看,我們有Xeon W-2400系列(Sapphire Rapids-64L),它被設(shè)計(jì)為“主流”工作站平臺(tái)。Xeon W-2400提供的PCIe通道數(shù)量比W-3400 SKU的一半多一點(diǎn),有64個(gè)PCIe 5.0通道可用,內(nèi)存通道數(shù)量減少了一半,達(dá)到四個(gè)通道。因此,這意味著W-2400系列的價(jià)格低于其更強(qiáng)大的W-3400系列,入門(mén)級(jí)Xeon w3-2423的價(jià)格低至359美元。
總體而言,至強(qiáng)W-2400系列將從6核到24核年不等。英特爾在這里使用了他們的Sapphire Rapids Medium Core Count (MCC)芯片,與XCC芯片不同,它是傳統(tǒng)的單片芯片。這意味著不需要花哨的EMIB封裝來(lái)構(gòu)建芯片,相反,英特爾只需要制造一個(gè)相當(dāng)大的芯片。
至強(qiáng)W-2400系列的高端產(chǎn)品是w7-2495X,它具有24核/48線程,45 MB的Intel Smart L3緩存和225瓦的TDP。英特爾還有三個(gè)w5系列SKU,最后是三個(gè)w3 SKU。
與專家級(jí)同類產(chǎn)品一樣,至強(qiáng)W-2400系列在整個(gè)系列中提供一致的內(nèi)存和I/O配置。這是因?yàn)閬?lái)自CPU的64通道PCIe 5和四通道DDR5內(nèi)存,允許總內(nèi)存最大為2 TB。此外,只有w5和w7 SKU提供完整的DDR-4800內(nèi)存速度;w3部件都以DDR4-4400為上限。在2個(gè)DPC配置中,所有SKU都下降到這個(gè)速度,因此出于任何原因構(gòu)建2 TB系統(tǒng)都可以實(shí)現(xiàn)。
像至強(qiáng)W-3400系列一樣,W-2400系列中也有一些unlocked X SKU,包括頂級(jí)的w7-2495X。其他unlocked乘數(shù)的SKU包括具有20個(gè)內(nèi)核和37.5 MB L3緩存的w7-2475X,以及兩個(gè)w5 SKU(w5-2465X 16C/32T和w5-2455X 12C/24T)。然而,我們不會(huì)發(fā)現(xiàn)任何unlocked w3部件,因?yàn)樗腥齻€(gè)入門(mén)級(jí)w3 SKU都已完全鎖定。
Intel W790芯片組:支持Xeon W-3400和W-2400平臺(tái)
英特爾所有至強(qiáng)W-3400和W-2400系列SKU均受益于英特爾vPro和英特爾的標(biāo)準(zhǔn)可管理性(ISM)技術(shù)。Xeon W-2400和W-3400系列都由相關(guān)的W790芯片組支持,但CPU特定的功能(如可用的內(nèi)存通道和PCIe通道的數(shù)量)取決于處理器本身。
W790芯片組的一些主要功能包括處理器和芯片組之間的直接媒體接口(DMI) 4.0 x8鏈路,以及多達(dá)16個(gè)PCIe 4.0通道和支持多達(dá)8個(gè)SATA 3.0端口。W790還支持5個(gè)USB 3.2 Gen2x2 (20Gbps)端口,包括一個(gè)Intel Wi-Fi 6E PHY,并可支持2.5 GbE控制器。
雖然沒(méi)有提及新的主板,但預(yù)計(jì)將有來(lái)自華碩、GIGABYTE、超微和ASRock等供應(yīng)商的英特爾W790主板。戴爾、聯(lián)想和超微等系統(tǒng)集成商預(yù)計(jì)將在DIY構(gòu)建商獲得解決方案和系統(tǒng)之前優(yōu)先提供解決方案和系統(tǒng)。
ASRock在發(fā)布前大概介紹了其W790 WS模型,該模型具有20+2相供電,雙10 GbE控制器,并支持8個(gè)插槽中多達(dá)2 TB的DDR5-4800 ECC RDIMM。雖然該板同時(shí)支持至強(qiáng)W-3400和W-2400處理器,但該板僅支持四通道內(nèi)存。
關(guān)于最新一代主板,值得一提的是W790主板的成本可能高于用于支持至強(qiáng)W-3300系列(Ice Lake)的基于c621的主板。因?yàn)閃790單板有4個(gè)DDR5內(nèi)存通道和48個(gè)PCIe 5通道。雖然我們預(yù)計(jì)會(huì)看到不同級(jí)別的主板設(shè)計(jì),具有不同的插槽和I/O配置,但英特爾還沒(méi)有具體說(shuō)明這些主板是否支持這兩個(gè)系列,或者供應(yīng)商是否會(huì)圍繞Xeon W-3400和W-2400系列設(shè)計(jì)特定的主板。
英特爾的至強(qiáng)W-3400和W-2400處理器已經(jīng)開(kāi)始接受行業(yè)合作伙伴的預(yù)定,系統(tǒng)預(yù)計(jì)將在3月初部署。英特爾對(duì)Xeon w3-2423的預(yù)期和建議定價(jià)為359美元起,Xeon w9-3495X的預(yù)期和建議價(jià)格為5889美元。
編輯:黃飛
?
評(píng)論
查看更多