電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在亞馬遜、英偉達(dá)和阿里巴巴等廠商紛紛圍繞Arm Neoverse架構(gòu)打造服務(wù)器處理器之際,Ampere Computing選擇了一條與眾不同的路線,自研核心。近日,Ampere宣布推出全新的AmpereOne系列處理器,可配置多達(dá)192個(gè)核心,且這些都是基于Ampere自有IP打造的自研核心。
Ampere Altra到AmpereOne,Ampere的自研之路
憑借前兩代Ampere Altra系列產(chǎn)品80核Ampere Altra和128核Ampere Altra Max,Ampere成了在Arm服務(wù)器CPU領(lǐng)域的先行者之一。主流的大型云服務(wù)廠商(CSP)都已經(jīng)推出了基于這兩款CPU的服務(wù)器,如京東云就在近日推出了其首款基于Arm架構(gòu)的云主機(jī),搭載的正是Ampere Altra Max CPU。
CSP廠商紛紛擁抱Arm的原因很簡單,高并發(fā)、高算力和更低的價(jià)格,為上云提供了極具性價(jià)比的選擇。但如何做好差異化,是每個(gè)Arm服務(wù)器CPU廠商都需要思考的問題,比如英偉達(dá)選擇了與自己的GPU結(jié)合打造Grace Hopper這樣的SuperChip。
而擁有Arm ISA架構(gòu)授權(quán)的Ampere選擇了從微架構(gòu)上進(jìn)一步創(chuàng)新,打造自研的Arm云原生核,從絕對性能和可擴(kuò)展性上超越同類產(chǎn)品。單個(gè)AmpereOne CPU的可配置核心已經(jīng)達(dá)到192個(gè),比上一代的Ampere Altra Max多出了50%,內(nèi)核數(shù)為業(yè)界最高。
這意味著基于AmpereOne CPU的單機(jī)架性能將再創(chuàng)新高,為了匹配新CPU強(qiáng)大計(jì)算能力,AmpereOne還采用了8通道DDR5、128通道PCIe 5.0和更大私有緩存的設(shè)計(jì),斷絕了內(nèi)存帶寬和I/O性能上出現(xiàn)瓶頸的可能。針對高速增長的云原生應(yīng)用,AmpereOne還集成了一系列新特性,包括網(wǎng)格擁塞管理、細(xì)粒度電源管理和內(nèi)存標(biāo)簽等。Ampere表示,AmpereOne將幫助該公司進(jìn)一步擴(kuò)大在每機(jī)架性能方面的優(yōu)勢。
Ampere首席產(chǎn)品官Jeff Wittich:“192 核是一個(gè)非常大的數(shù)字,比英特爾和 AMD 要多很多。用一個(gè)具體的場景來說明,在云環(huán)境中運(yùn)行虛擬機(jī)時(shí),用192核的AmpereOne對比96核的AMD Genoa,或者60核的英特爾Sapphire Rapids,AmpereOne每機(jī)架運(yùn)行的虛擬機(jī)數(shù)量是AMD Genoa的2.9倍,是英特爾Sapphire Rapids的4.3倍。”
AmpereOne發(fā)力Chiplet與AI推理
得益于工藝的進(jìn)步和架構(gòu)的創(chuàng)新,AmpereOne能做到如此規(guī)格似乎并不意外,但能在Ampere Altra Max面世后的短時(shí)間內(nèi)推出這樣一個(gè)“性能怪獸”,其實(shí)也離不開在設(shè)計(jì)方法上的轉(zhuǎn)變。從AmpereOne的架構(gòu)可以看出,與此前Ampere Altra系列不同的是,新的處理器轉(zhuǎn)為采用Chiplet設(shè)計(jì)。近來不少先進(jìn)芯片設(shè)計(jì)中都采用了這一技術(shù),電子發(fā)燒友網(wǎng)也就這一轉(zhuǎn)變詢問了Ampere,Chiplet究竟有何助力,是否加快了芯片設(shè)計(jì)周期?
Jeff Wittich指出:“綜合而言,我們在Ampere中轉(zhuǎn)為大量采用小芯片帶來了許多的優(yōu)勢,其中第一點(diǎn)就是能夠有更高的靈活度,第二點(diǎn)就是如問題中提到的,幫助我們加快了整個(gè)芯片設(shè)計(jì)周期。在采用了Chiplet架構(gòu)之后,產(chǎn)品的TTM也會(huì)隨之縮短,還可以提供更高的可擴(kuò)展性,從而提供現(xiàn)代云原生CPU的最佳性能。第三,Chiplet拓?fù)涞脑O(shè)計(jì)也可以使AmpereOne更輕易地實(shí)現(xiàn)內(nèi)存到內(nèi)核的訪問,而不需要為處理器引入額外的HOPs。”
另外值得注意的一點(diǎn)是,在早前的Ampere Altra系列CPU中,雖然也可以用于AI推理,但從CSP已發(fā)布服務(wù)器的定位來看,其主要還是用于Web服務(wù)、視頻編解碼以及云游戲等非AI應(yīng)用上。而此次發(fā)布的AmpereOne,則在AI計(jì)算上加大了力度。
?
AI推理性能對比 / Ampere
從性能對比上,我們可以看出AmpereOne在AI推理負(fù)載上的領(lǐng)先,比如在生成式AI和推薦算法上,AmpereOne的單機(jī)架性能是AMD EYPC 9654 Genoa的兩倍或以上,但兩者卻有著近乎相同的系統(tǒng)功耗,AmpereOne的優(yōu)勢在此展現(xiàn)得一覽無余。
這與Ampere自身的發(fā)展以及行業(yè)趨勢也緊密相關(guān),AI負(fù)載已經(jīng)成為云端最大的算力需求之一。而Ampere除了解決了AI硬件的問題外,也在布局AI軟件生態(tài)。比如2020年,Ampere收購了專注于打造AI軟件的OnSpecta,通過軟硬件協(xié)同優(yōu)化,為AmpereOne提供卓越的AI性能,比如對BF16精度的支持等等。
解決性能與能效的矛盾
在Ampere公布今年的路線圖時(shí),創(chuàng)始人/董事長兼首席執(zhí)行官Renée J. James表示:“Ampere已經(jīng)向行業(yè)證明,擊破單核性能與能耗之間的矛盾正是行業(yè)所有人都在尋找的新象限。在能耗與性能的坐標(biāo)軸之中,朝坐標(biāo)軸的右下方移動(dòng)是行業(yè)發(fā)展的新常態(tài),目的是實(shí)現(xiàn)更低的能耗和更高的性能。”
針對云計(jì)算的需求,在設(shè)計(jì)產(chǎn)品的過程中,Ampere借助Arm架構(gòu)的優(yōu)勢,綜合考量從核、SoC到等其他方面的因素,致力于實(shí)現(xiàn)每瓦性能、每機(jī)架性能的提升。對比x86架構(gòu)的CPU,Ampere Altra系列的的云原生處理器可以實(shí)現(xiàn)每機(jī)架2.5倍的性能提升,降低能耗2.8倍,并僅占用1/3的空間。而新發(fā)布的AmpereOne將幫助Ampere進(jìn)一步擴(kuò)大領(lǐng)先優(yōu)勢。
Jeff Wittich表示:“其實(shí)我們Ampere Altra系列處理器已經(jīng)提供了行業(yè)領(lǐng)先的單機(jī)架性能,在能效方面已經(jīng)是行業(yè)標(biāo)桿性的產(chǎn)品。不僅是在性能方面,在能效方面我們也是領(lǐng)先AMD和英特爾所有的產(chǎn)品,即使是他們近期發(fā)布的低功耗產(chǎn)品。”
寫在最后
誠然,對于大部分服務(wù)器CPU而言,面向的客戶都是CSP和服務(wù)器OEM廠商,而他們提高競爭力的方式之一即提供差異化的高質(zhì)量方案。不少Arm服務(wù)器CPU,雖然都在設(shè)計(jì)上做了差異化,但計(jì)算核心的性能并未拉開太大差距。Ampere選擇了自研云原生核的方式,既滿足了更高性能的需求,也解決了他們的另一大痛點(diǎn),可擴(kuò)展性與規(guī)模化。
成立5年多來,Ampere,已經(jīng)在x86壟斷的服務(wù)器市場占領(lǐng)了一席之地。在一切背后,是Ampere 認(rèn)為云需要一種從本質(zhì)上而言完全不同的方法。隨著所有的計(jì)算轉(zhuǎn)移到云端,整個(gè)平臺的云原生化趨勢不可避免,而Ampere正在做的就是為云原生進(jìn)行徹底的CPU創(chuàng)新。
Ampere Altra到AmpereOne,Ampere的自研之路
![](https://file1.elecfans.com/web2/M00/89/34/wKgaomR9j32AUTf4Aqp1noqjfco113.png)
CSP廠商紛紛擁抱Arm的原因很簡單,高并發(fā)、高算力和更低的價(jià)格,為上云提供了極具性價(jià)比的選擇。但如何做好差異化,是每個(gè)Arm服務(wù)器CPU廠商都需要思考的問題,比如英偉達(dá)選擇了與自己的GPU結(jié)合打造Grace Hopper這樣的SuperChip。
而擁有Arm ISA架構(gòu)授權(quán)的Ampere選擇了從微架構(gòu)上進(jìn)一步創(chuàng)新,打造自研的Arm云原生核,從絕對性能和可擴(kuò)展性上超越同類產(chǎn)品。單個(gè)AmpereOne CPU的可配置核心已經(jīng)達(dá)到192個(gè),比上一代的Ampere Altra Max多出了50%,內(nèi)核數(shù)為業(yè)界最高。
這意味著基于AmpereOne CPU的單機(jī)架性能將再創(chuàng)新高,為了匹配新CPU強(qiáng)大計(jì)算能力,AmpereOne還采用了8通道DDR5、128通道PCIe 5.0和更大私有緩存的設(shè)計(jì),斷絕了內(nèi)存帶寬和I/O性能上出現(xiàn)瓶頸的可能。針對高速增長的云原生應(yīng)用,AmpereOne還集成了一系列新特性,包括網(wǎng)格擁塞管理、細(xì)粒度電源管理和內(nèi)存標(biāo)簽等。Ampere表示,AmpereOne將幫助該公司進(jìn)一步擴(kuò)大在每機(jī)架性能方面的優(yōu)勢。
Ampere首席產(chǎn)品官Jeff Wittich:“192 核是一個(gè)非常大的數(shù)字,比英特爾和 AMD 要多很多。用一個(gè)具體的場景來說明,在云環(huán)境中運(yùn)行虛擬機(jī)時(shí),用192核的AmpereOne對比96核的AMD Genoa,或者60核的英特爾Sapphire Rapids,AmpereOne每機(jī)架運(yùn)行的虛擬機(jī)數(shù)量是AMD Genoa的2.9倍,是英特爾Sapphire Rapids的4.3倍。”
AmpereOne發(fā)力Chiplet與AI推理
得益于工藝的進(jìn)步和架構(gòu)的創(chuàng)新,AmpereOne能做到如此規(guī)格似乎并不意外,但能在Ampere Altra Max面世后的短時(shí)間內(nèi)推出這樣一個(gè)“性能怪獸”,其實(shí)也離不開在設(shè)計(jì)方法上的轉(zhuǎn)變。從AmpereOne的架構(gòu)可以看出,與此前Ampere Altra系列不同的是,新的處理器轉(zhuǎn)為采用Chiplet設(shè)計(jì)。近來不少先進(jìn)芯片設(shè)計(jì)中都采用了這一技術(shù),電子發(fā)燒友網(wǎng)也就這一轉(zhuǎn)變詢問了Ampere,Chiplet究竟有何助力,是否加快了芯片設(shè)計(jì)周期?
Jeff Wittich指出:“綜合而言,我們在Ampere中轉(zhuǎn)為大量采用小芯片帶來了許多的優(yōu)勢,其中第一點(diǎn)就是能夠有更高的靈活度,第二點(diǎn)就是如問題中提到的,幫助我們加快了整個(gè)芯片設(shè)計(jì)周期。在采用了Chiplet架構(gòu)之后,產(chǎn)品的TTM也會(huì)隨之縮短,還可以提供更高的可擴(kuò)展性,從而提供現(xiàn)代云原生CPU的最佳性能。第三,Chiplet拓?fù)涞脑O(shè)計(jì)也可以使AmpereOne更輕易地實(shí)現(xiàn)內(nèi)存到內(nèi)核的訪問,而不需要為處理器引入額外的HOPs。”
另外值得注意的一點(diǎn)是,在早前的Ampere Altra系列CPU中,雖然也可以用于AI推理,但從CSP已發(fā)布服務(wù)器的定位來看,其主要還是用于Web服務(wù)、視頻編解碼以及云游戲等非AI應(yīng)用上。而此次發(fā)布的AmpereOne,則在AI計(jì)算上加大了力度。
![](https://file1.elecfans.com/web2/M00/89/34/wKgaomR9j5uAXMRJAAGm3Bkx2RU410.png)
AI推理性能對比 / Ampere
從性能對比上,我們可以看出AmpereOne在AI推理負(fù)載上的領(lǐng)先,比如在生成式AI和推薦算法上,AmpereOne的單機(jī)架性能是AMD EYPC 9654 Genoa的兩倍或以上,但兩者卻有著近乎相同的系統(tǒng)功耗,AmpereOne的優(yōu)勢在此展現(xiàn)得一覽無余。
這與Ampere自身的發(fā)展以及行業(yè)趨勢也緊密相關(guān),AI負(fù)載已經(jīng)成為云端最大的算力需求之一。而Ampere除了解決了AI硬件的問題外,也在布局AI軟件生態(tài)。比如2020年,Ampere收購了專注于打造AI軟件的OnSpecta,通過軟硬件協(xié)同優(yōu)化,為AmpereOne提供卓越的AI性能,比如對BF16精度的支持等等。
解決性能與能效的矛盾
![](https://file1.elecfans.com/web2/M00/89/35/wKgZomR9j6-Aa4QaAAPMK4xveD4181.png)
針對云計(jì)算的需求,在設(shè)計(jì)產(chǎn)品的過程中,Ampere借助Arm架構(gòu)的優(yōu)勢,綜合考量從核、SoC到等其他方面的因素,致力于實(shí)現(xiàn)每瓦性能、每機(jī)架性能的提升。對比x86架構(gòu)的CPU,Ampere Altra系列的的云原生處理器可以實(shí)現(xiàn)每機(jī)架2.5倍的性能提升,降低能耗2.8倍,并僅占用1/3的空間。而新發(fā)布的AmpereOne將幫助Ampere進(jìn)一步擴(kuò)大領(lǐng)先優(yōu)勢。
Jeff Wittich表示:“其實(shí)我們Ampere Altra系列處理器已經(jīng)提供了行業(yè)領(lǐng)先的單機(jī)架性能,在能效方面已經(jīng)是行業(yè)標(biāo)桿性的產(chǎn)品。不僅是在性能方面,在能效方面我們也是領(lǐng)先AMD和英特爾所有的產(chǎn)品,即使是他們近期發(fā)布的低功耗產(chǎn)品。”
寫在最后
誠然,對于大部分服務(wù)器CPU而言,面向的客戶都是CSP和服務(wù)器OEM廠商,而他們提高競爭力的方式之一即提供差異化的高質(zhì)量方案。不少Arm服務(wù)器CPU,雖然都在設(shè)計(jì)上做了差異化,但計(jì)算核心的性能并未拉開太大差距。Ampere選擇了自研云原生核的方式,既滿足了更高性能的需求,也解決了他們的另一大痛點(diǎn),可擴(kuò)展性與規(guī)模化。
成立5年多來,Ampere,已經(jīng)在x86壟斷的服務(wù)器市場占領(lǐng)了一席之地。在一切背后,是Ampere 認(rèn)為云需要一種從本質(zhì)上而言完全不同的方法。隨著所有的計(jì)算轉(zhuǎn)移到云端,整個(gè)平臺的云原生化趨勢不可避免,而Ampere正在做的就是為云原生進(jìn)行徹底的CPU創(chuàng)新。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
-
ARM
+關(guān)注
關(guān)注
134文章
9169瀏覽量
369231 -
cpu
+關(guān)注
關(guān)注
68文章
10905瀏覽量
213030 -
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270344 -
Ampere
+關(guān)注
關(guān)注
1文章
70瀏覽量
4566
發(fā)布評論請先 登錄
相關(guān)推薦
Ampere?發(fā)布新版AmpereOne?處理器,強(qiáng)化AI與云計(jì)算性能
Ampere?公司近期推出了其旗艦產(chǎn)品AmpereOne?處理器的新版本,這一新版本處理器配備了12個(gè)內(nèi)存通道,進(jìn)一步提升了性能。這一舉動(dòng)與Ampere在去年5月份公布的年度戰(zhàn)略和產(chǎn)品路線圖更新中
Ampere發(fā)布最新192核12內(nèi)存通道AmpereOne M處理器
AmpereOne 產(chǎn)品路線圖,并圍繞云和 AI 的可持續(xù)以及節(jié)能計(jì)算提供持續(xù)創(chuàng)新。最新 192 核 12 內(nèi)存通道的AmpereOne M通過提供更高的內(nèi)存帶寬來擴(kuò)展產(chǎn)品系列,許多應(yīng)用都將從中獲益,尤其是 AI。這也為 AI
東風(fēng)四款自研新能源動(dòng)力上榜年度“十佳”
強(qiáng)勁“中國心”,創(chuàng)新“加速度”。東風(fēng)汽車實(shí)現(xiàn)關(guān)鍵核心技術(shù)自主掌控,自研動(dòng)力成為轉(zhuǎn)型發(fā)展“新動(dòng)力”,提升高質(zhì)量發(fā)展“含金量”。
蘋果計(jì)劃2025年起采用自研藍(lán)牙Wi-Fi芯片
近日,據(jù)最新報(bào)道,蘋果公司為了減少對博通(Broadcom)的依賴,并進(jìn)一步提升其設(shè)備的性能和能效,已經(jīng)制定了一項(xiàng)重要的芯片自研計(jì)劃。據(jù)悉,從2025年開始,蘋果將正式啟用自
龍芯自研顯卡來了!性能看齊AMD熱銷顯卡
在信息技術(shù)領(lǐng)域,顯卡作為計(jì)算機(jī)圖形處理的核心組件,其自主研發(fā)能力一直被視為衡量一個(gè)國家技術(shù)實(shí)力的重要標(biāo)準(zhǔn)。近日,龍芯科技宣布正在研發(fā)自家顯卡——龍芯9A1000,這一消息在國產(chǎn)硬件領(lǐng)域引起了廣泛關(guān)注
![龍芯<b class='flag-5'>自</b><b class='flag-5'>研</b>顯卡來了!<b class='flag-5'>性能</b>看齊AMD熱銷顯卡](https://file1.elecfans.com/web2/M00/E5/D3/wKgaomZBeIyADEqiAACsZ19UYWk044.png)
Arm成功將Arm KleidiAI軟件庫集成到騰訊自研的Angel 機(jī)器學(xué)習(xí)框架
Arm 與騰訊攜手合作,成功將 Arm KleidiAI 軟件庫集成到騰訊自研的 Angel 機(jī)器學(xué)習(xí)框架。 ? 借助 KleidiAI 解鎖卓越性能、能效和可移植性,騰訊混元大模型能夠?qū)崿F(xiàn)更快
蘋果自研5G芯片或于明年亮相
蘋果公司正加速推進(jìn)其自研5G芯片的研發(fā)進(jìn)程,有望最快在明年推出首款自研5G調(diào)制解調(diào)器。這一舉措對高通而言,無疑構(gòu)成了巨大的挑戰(zhàn)。
比亞迪最快于11月實(shí)現(xiàn)自研算法量產(chǎn),推進(jìn)智駕芯片自研進(jìn)程
10月21日市場傳出消息,比亞迪正計(jì)劃整合其新技術(shù)院下的自研智能駕駛團(tuán)隊(duì),目標(biāo)是在今年11月實(shí)現(xiàn)自研智能駕駛算法的量產(chǎn),并持續(xù)推進(jìn)智能駕駛芯片的自
國產(chǎn)DSP,自研指令集內(nèi)核C2000,F(xiàn)28335、F280049、F28377
國產(chǎn)DSP,自研指令集內(nèi)核架構(gòu),自研工具鏈,完美替代TI的 C2000系列產(chǎn)品,F(xiàn)280049、F28335、F28377
性能、主頻、外設(shè)
發(fā)表于 09-26 13:56
蘋果自研Wi-Fi芯片或明年商用,用于部分iPad
9月20日最新資訊顯示,蘋果公司在自研芯片領(lǐng)域的成就斐然,其標(biāo)志性的A系列芯片在iPhone和iPad上持續(xù)多年引領(lǐng)性能巔峰,而自2020年起推出的M系列芯片更是成功助力Mac產(chǎn)品線完
消息稱小鵬汽車自研智駕芯片流片成功
小鵬汽車近期傳來振奮人心的消息,其自主研發(fā)的智能駕駛芯片已成功完成流片,標(biāo)志著小鵬在核心技術(shù)自研領(lǐng)域邁出了堅(jiān)實(shí)的一步。據(jù)知情人士透露,這款小鵬智駕芯片專為滿足高度智能化的駕駛需求而生,采用先進(jìn)的端到端大模型設(shè)計(jì)理念,構(gòu)建了一套艙
國產(chǎn)車企自研智駕芯片加速落地,蔚來小鵬等領(lǐng)跑賽道
在智能汽車產(chǎn)業(yè)加速變革的浪潮中,中國車企正以前所未有的決心和速度推進(jìn)核心技術(shù)自研,特別是在智能駕駛芯片這一關(guān)鍵領(lǐng)域,蔚來、小鵬等頭部企業(yè)已邁出堅(jiān)實(shí)步伐,自
Ampere下一代AmpereOne系列處理器將擁有256個(gè)核心
雖然訓(xùn)練 AI 需要超強(qiáng)大的 GPU 算力,但 AI 算法的執(zhí)行首先需要超高效的芯片。就像 AmpereCPU,未來的 AmpereOne 將擁有不少于256個(gè)內(nèi)核,其功率僅為350W。(原文轉(zhuǎn)自 Adrian Branco 發(fā)
理想汽車自研大模型Mind GPT通過國家備案
理想汽車近日宣布,其全自研的多模態(tài)認(rèn)知大模型Mind GPT已正式通過國家《生成式人工智能服務(wù)管理暫行辦法》備案,成為汽車行業(yè)中首個(gè)成功通過該備案的自研大模型。這一里程碑式的成就,彰顯
微軟正在研發(fā)新型網(wǎng)卡,旨在提升自研AI芯片性能
微軟近日被曝正在秘密研發(fā)一款高性能的新型網(wǎng)卡,這一創(chuàng)新旨在增強(qiáng)其自研的Maia AI服務(wù)器芯片的功能,并可能大幅度降低對外部芯片設(shè)計(jì)廠商如英偉達(dá)的依賴。據(jù)知情人士透露,這款網(wǎng)卡的設(shè)計(jì)思路與英偉達(dá)熱銷的ConnectX-7網(wǎng)卡有著
評論