衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大家都在爭相超過A100,無人對標的Grace Hopper性能幾何?

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2023-09-06 01:10 ? 次閱讀

電子發(fā)燒友網(wǎng)報道(文/周凱揚)作為英偉達CPUGPU技術(shù)開發(fā)上的集大成之作,Grace Hopper很大程度上象征著復(fù)雜計算領(lǐng)軍產(chǎn)品。盡管英偉達竭盡所能地去堆這一“超級芯片”的性能,但英偉達還是選擇將Grace Hopper(GH200)描述成了世界上最萬能的計算平臺,這也得益于它同時在AI計算和HPC計算領(lǐng)域展現(xiàn)的可怕性能。

AI計算性能

相信絕大多數(shù)人已經(jīng)從市場瘋搶A100、H100的現(xiàn)狀,對Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作為一個異構(gòu)計算平臺,在與傳統(tǒng)的x86 CPU與H100對比上,也有著不小的性能差距。

首要區(qū)別自然就是連接Grace CPU和Hopper GPU的NVLink-C2C,這一高帶寬低延遲的互聯(lián)技術(shù)可謂是目前唯一能發(fā)揮H100近乎全部實力的方案。支持最高144TB內(nèi)存的同時,提供900GB/s的帶寬。

英偉達官方也對部分AI計算負載進行了測試,在終端應(yīng)用上對比x86+Hopper與Grace Hopper的一體化方案有何異同。其性能差距可以說是巨大的,就拿最常見的大語言模型推理來說,GH200可以做到x86平臺的4.5倍性能表現(xiàn),而DLRM(深度學習推薦模型)訓練與圖神經(jīng)網(wǎng)絡(luò)(GNN)訓練的性能也可以分別達到3.5倍和1.9倍。

其實這里的差異還是體現(xiàn)在互聯(lián)方案的帶寬上,例如x86+Hopper的方案還是在使用PCIe方案,該方案在batch size較小時性能落后還不算明顯,一旦到了更大的batch size,PCIe的帶寬就成了瓶頸,而不斷以高帶寬輸送數(shù)據(jù)給H100的NVLink-C2C則可以實現(xiàn)比PCIe高出數(shù)倍的性能。

HPC計算性能

Grace Hopper的另一大應(yīng)用領(lǐng)域自然就是HPC了。HPC主要集中在一些科學、工程的復(fù)雜計算上,比如天氣預(yù)測、生命科學、流體力學等。然而與此同時,不少商業(yè)相關(guān)的HPC計算也在進一步推動HPC的發(fā)展,甚至更早用上最新芯片技術(shù),比如油藏模擬等。

著名油藏模擬軟件ECHELON的開發(fā)商Stone Ridge,在最近獲得了早期訪問權(quán),對英偉達的H100-PCIe、H100-NVL和Grace-Hopper來了場性能測試。早在Volta和Ampere架構(gòu)時,Stone Ridge就對不同架構(gòu)的GPU進行了測試,而如今的H100相較這些舊GPU已經(jīng)在CUDA核心、內(nèi)存容量和內(nèi)存帶寬上有了數(shù)倍的提升。

這些還只是表面上的變化,英偉達還引入了諸多架構(gòu)改進,提高了ML和HPC應(yīng)用程序的性能。而Grace Hopper相較傳統(tǒng)的x86+GPU方案就更具優(yōu)勢了,首先Grace本身就是一個強大的CPU,每個內(nèi)核都有四個128位適量單元,超高的內(nèi)存帶寬以及超大的L2+L3緩存。其次,NVLink的存在大大減少了CPU和GPU之間的通信時間。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架構(gòu)不同版本的英偉達GPU在ECHELON模型上的性能對比 / Stone Ridge


Stone Ridge選擇了不同細胞規(guī)模的模型,從83000個細胞到670萬個細胞,其中Grace Hopper都展現(xiàn)出了不俗的性能,最高可達Volta架構(gòu)的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架構(gòu),所以ECHELON必須重新編譯才能在系統(tǒng)上運行,不過對于ECHELON來說,重新編譯并不要花太多力氣,他們在不修改代碼的情況就成功重編譯在GH200上正常運行。如果對代碼進行進一步優(yōu)化的話,還有機會獲得更高的性能表現(xiàn)。如此高的性能提升,意味著油藏勘探模擬的時間可以被大幅縮短,從而加快油藏評估的速度。

結(jié)語

可以說無論是A100還是H100,都只是英偉達在AI與HPC戰(zhàn)線擴大戰(zhàn)果的第一步棋,明年Q2交付到各大系統(tǒng)中的GH200才是最大的殺手锏,也很可能會成為更搶手的數(shù)據(jù)中心與超算中心硬件產(chǎn)品。這也恰好證明了英偉達給它的定位,世界上最萬能的計算平臺。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    小軸距高性能!時代星光發(fā)布蜂鷹F1超高性價比單兵無人

    隨著無人機產(chǎn)業(yè)的發(fā)展,無人機在各個行業(yè)、各個領(lǐng)域的應(yīng)用都在不斷深化。近日,時代星光科技發(fā)布了全新自研的高性能單兵無人機蜂鷹F1,以輕巧便攜、
    的頭像 發(fā)表于 12-24 15:01 ?222次閱讀
    小軸距高<b class='flag-5'>性能</b>!時代星光發(fā)布蜂鷹F1超高性價比單兵<b class='flag-5'>無人</b>機

    英偉達CEO確認:液冷Grace Blackwell服務(wù)器無過熱問題

    問題”。 這一表態(tài)無疑為市場注入了一劑強心針。隨著數(shù)據(jù)中心運算需求的不斷增長,服務(wù)器的散熱問題日益凸顯,成為制約其性能發(fā)揮的關(guān)鍵因素之一。而英偉達作為全球領(lǐng)先的圖形處理器(GPU)制造商,其服務(wù)器產(chǎn)品的散熱性能自然備受矚目。 據(jù)悉,Gr
    的頭像 發(fā)表于 11-21 11:45 ?319次閱讀

    本期為大家帶來的是100W氮化鎵充電器詳細介紹拆解。

    本期為大家帶來的是100W氮化鎵充電器詳細介紹拆解。 這款充電器配備折疊插腳以及2C1A接口,兩個USB-C口均支持100W PD快充和PPS快充,USB-
    的頭像 發(fā)表于 11-11 14:59 ?1000次閱讀
    本期為<b class='flag-5'>大家</b>帶來的是<b class='flag-5'>100</b>W氮化鎵充電器詳細介紹拆解。

    軟銀升級人工智能計算平臺,安裝4000顆英偉達Hopper GPU

    達Ampere GPU。通過新增的4000顆Hopper GPU,該平臺的總計算性能已躍升至每秒約4.7百億億次。
    的頭像 發(fā)表于 11-04 16:18 ?492次閱讀

    英偉達或取消B100轉(zhuǎn)用B200A代替

    今年3月份,英偉達在美國加利福尼亞州圣何塞會議中心召開的GTC 2024大會上推出了Blackwell架構(gòu)GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現(xiàn)行H100/H200,并有與Grace CPU協(xié)作的GB2
    的頭像 發(fā)表于 08-08 17:19 ?594次閱讀

    NVIDIA AI Enterprise榮獲金獎

    NVIDIA AI Enterprise、GH200 Grace Hopper 超級芯片和 Spectrum-X 在 COMPUTEX 2024 獲得認可。
    的頭像 發(fā)表于 05-29 09:27 ?498次閱讀
    NVIDIA AI Enterprise榮獲金獎

    亞馬遜AWS暫緩訂購英偉達Grace Hopper,等待新品Grace Blackwel

    今年 3 月,英偉達宣布了新款人工智能處理器Blackwell,比上一代Hopper提前不到一年面世。CEO黃仁勛表示,新產(chǎn)品在訓練大規(guī)模語言模型方面的性能將提升一倍。
    的頭像 發(fā)表于 05-22 12:03 ?691次閱讀

    亞馬遜未中斷英偉達訂單,等待Grace Blackwell更強性能

    英國《金融時報》昨日報道稱,亞馬遜AWS已暫停訂購英偉達最新款“超級芯片”Grace Hopper,等待性能更強的新品Grace Blackwell(GH200)。此舉引發(fā)市場擔憂,認
    的頭像 發(fā)表于 05-22 11:00 ?528次閱讀

    英偉達靜候新品來臨,亞馬遜暫緩購買Grace Hopper

    今年3月,英偉達發(fā)布了全新的Blackwell處理器,距離前任產(chǎn)品Hopper的發(fā)布不過短短一年。英偉達首席執(zhí)行官黃仁勛表示,新款產(chǎn)品在訓練大規(guī)模語言模型上的效率將提升至原來的兩倍。
    的頭像 發(fā)表于 05-22 09:07 ?343次閱讀

    NVIDIA Grace Hopper點亮AI超級計算新時代

    瑞士 Alps、法國 EXA1-HE 等超級計算機將使用高能效的、基于 Grace 的系統(tǒng)為氣候和天氣、科學探索等領(lǐng)域提供 200 EFLOPS AI 算力,以支持突破性研究。
    的頭像 發(fā)表于 05-15 09:46 ?421次閱讀

    NVIDIA通過CUDA-Q平臺為全球各地的量子計算中心提供加速

    德國、日本和波蘭的超級計算機利用 Grace-Hopper 和量子-經(jīng)典加速超算平臺推進量子計算研究。
    的頭像 發(fā)表于 05-14 09:15 ?406次閱讀

    美國首個Grace Hopper架構(gòu)超算Venado落地:達10 exaFLOPS

    該超級計算機是由惠普企業(yè)集團(Hewlett Packard Enterprise)打造,其運算能力高達 10 exaFLOPS,它是美國第一款采用英偉達Grace Hopper芯片架構(gòu)的超級計算機系統(tǒng)。
    的頭像 發(fā)表于 04-18 14:37 ?474次閱讀

    英偉達H200和A100的區(qū)別

    英偉達H200和A100兩款芯片在性能、架構(gòu)、內(nèi)存以及應(yīng)用場景等多個方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-07 16:23 ?3947次閱讀

    英偉達H200和A100的差異

    英偉達H200和A100在多個方面存在差異。
    的頭像 發(fā)表于 03-07 16:18 ?2822次閱讀

    Arm架構(gòu)與Neoverse技術(shù)在基礎(chǔ)設(shè)施領(lǐng)域的應(yīng)用與發(fā)展

    Arm的Neoverse系列已有穩(wěn)定的立足點。例如,英偉達的超級芯片Grace-Hopper就是由兩片獨立的芯片組成,其中 Hopper負責處理所有AI任務(wù),如張量運算,Grace則扮演 CPU角色,利用I/O與內(nèi)存管理功能與常
    的頭像 發(fā)表于 02-22 15:36 ?652次閱讀
    百家乐官网ag厅投注限额| 澳门永利| 石屏县| 百家乐官网园百利宫娱乐城信誉好...| 皇室百家乐官网的玩法技巧和规则 | 百家乐官网百家乐官网技巧| 百家乐皇室百家乐的玩法技巧和规则| 宝胜娱乐场| 足球百家乐官网投注计算| 百家乐庄闲和概率| 大发888注册步骤| 百家乐官网怎样做弊| 百家乐怎么看门路| 大发8888游戏平台| 真人百家乐官网免费开户送钱| 百家乐官网老千| 百家乐是多少个庄闲| 威尼斯人娱乐城赌场| 百家乐官网娱乐皇冠世界杯| 百家乐双面数字筹码| 362娱乐城开户| 番禺百家乐官网电器店| 百家乐网上真钱娱乐场开户注册 | 百家乐官网压分规律| 24山方位吉凶| 大发888下载客户端| 百家乐官网平注常赢打法| 如何玩百家乐的玩法技巧和规则| 安徽省| 百家乐手机软件| 利好线上娱乐| LV百家乐官网娱乐城| bet365合法吗| 自贡百家乐官网赌| 大发888总结经验| 金百家乐官网的玩法技巧和规则 | 永利百家乐娱乐平台| 百家乐官网捡揽方法| 百家乐专打单跳投注法| 云顶国际平台| 24楼风水化解|