AMD在本周的SC20虛擬會議上,推出了基于他們CDNA架構(gòu)的AMD Instinct MI100加速器。另外值得注意的是,與MI100發(fā)布同時進行的還有Radeon Open eCosystem 4.0(ROCm 4.0)Linux版本。AMD認為MI100是世界上最快的HPC GPU加速器,提供超過10TFLOPS的FP64計算能力。MI100額定峰值FP64性能為11.5 TFLOPS,F(xiàn)P32矩陣性能高達46.1 TFLOPS。與上一代AMD加速器相比,搭配AMD矩陣核心技術(shù)的MI100在人工智能訓(xùn)練方面的FP16峰值性能提升近7倍。
AMD Instinct MI100內(nèi)建32GB HBM2內(nèi)存,工作頻率1.2GHz,內(nèi)存帶寬為1.23TB/s。MI100支持PCI Express 4.0連接,內(nèi)建120個計算單元和7680個流處理器。CDNA是Vega架構(gòu)演化版本,而不是針對游戲優(yōu)化的RDNA/Navi架構(gòu),考慮到HPC的重點和我們看到Arcturus Linux補丁成熟的時間,AMD Instinct MI100支持的Linux支持應(yīng)該是很好的推出狀態(tài),盡管我們還沒能測試加速器以確認其Linux支持狀態(tài)。
AMD Instinct MI100使用32GB HBM2內(nèi)存,時鐘速率為1.2GHz,內(nèi)存帶寬為1.23TB/s。MI100支持PCI Express 4.0連接,可打包120個計算單元和7680個流處理器。CDNA是織女星結(jié)構(gòu)的進化,而不是游戲優(yōu)化而不是計算的RDNA/Navi。考慮到AMD對HPC的關(guān)注以及Arcturus Linux補丁準備在即,AMD Instinct MI100應(yīng)該很好的支持到Linux。
這次推出的ROCm 4.0讓它比以往更容易更高效地將NVIDIA CUDA代碼庫移植到它上面。ROCm 4.0被宣傳為 “Exascale時代 ”的開源平臺,同時支持OpenMP 5.0行業(yè)標準及其HIP接口,以及PyTorch和Tensorflow框架等。ROCm進化目的是讓開發(fā)者更容易部署和移植他們的軟件,使其運行在這個開源計算棧上,而不是NVIDIA專有的 CUDA平臺。
AMD還在SC20虛擬會議上表示,EPYC “Zen 3 ”處理器本季度將批量提供給部分HPC和云計算客戶。AMD EPYC Zen 3 CPU將在2021年第一季度正式發(fā)布和上市。
責(zé)任編輯:haq
-
amd
+關(guān)注
關(guān)注
25文章
5500瀏覽量
134646 -
加速器
+關(guān)注
關(guān)注
2文章
807瀏覽量
38093 -
內(nèi)存
+關(guān)注
關(guān)注
8文章
3055瀏覽量
74336
發(fā)布評論請先 登錄
相關(guān)推薦
AMD將DeepSeek-V3模型集成至Instinct MI300X GPU
消息稱AMD Instinct MI400 AI加速器將配備8個計算芯片
AMD集成DeepSeek-V3模型至Instinct MI300X GPU
IBM與AMD攜手部署MI300X加速器,強化AI與HPC能力
IBM與AMD攜手將在IBM云上部署AMD Instinct MI300X加速器
AMD發(fā)布新版Instinct MI325X
AMD發(fā)布新一代AI芯片MI325X
三星首度引入AMD MI300X,緩解AI GPU短缺
AMD Radeon Anti-Lag 2技術(shù)的功能特性
AMD發(fā)布全新AI芯片Instinct MI325X
AMD發(fā)布AI芯片MI325X 預(yù)計2024年第四季度上市
人工智能市場風(fēng)向轉(zhuǎn)變,AMD Instinct MI300X GPU更受歡迎
AMD ROCm 6.1升級MIPOpen 3.1,引入AI參數(shù)預(yù)測模型
AMD Instinct MI300新版將采用HBM3e內(nèi)存,競爭英偉達B100
英偉達繁榮背后的挑戰(zhàn) 仍面臨著各種內(nèi)憂外患
![英偉達繁榮背后的挑戰(zhàn) 仍面臨著各種內(nèi)憂外患](https://file1.elecfans.com/web2/M00/C1/5D/wKgaomXVlcCAVPE4AAAPCeQ-rMI605.jpg)
評論