國內芯片未來能否實現替代?
10 月 17 日,美國商務部放出最嚴對華出口管制規定,H800 等 AI 加速器成為制裁的焦點。因為制裁涉及顯卡功率和算力的限制,繼 H100 之后,英偉達專為符合要求設計的定制芯片也因此受限。
新的禁令已在 10 月 23 日生效。有經銷商表示,在 A800 和 H800 GPU 無法進口后,英偉達為國內市場專門開發了一款新服務器芯片和兩款新 GPU,英偉達將在未來幾天內向國內制造商交付三款新芯片。
繼 A800 和 H800 GPU 之后,英偉達開發了 HGX H20 以及 GPU L20 和 L2,它們分別對應人工智能的訓練、推理和端側應用場景,將于今年底發布并量產。
本周四,一些媒體首次報道了英偉達特供芯片的消息。報道稱,這三款新產品是在 H100 GPU 的基礎版本基礎上進行修改的,采用的是最新架構,但性能大幅度縮減。H100 GPU 是一種用于人工智能訓練的高端 GPU,已于 2022 年 8 月被禁止在國內銷售。
其中,HGX L20 是基于 Hopper 架構的 HGX 形式加速卡。該型號提供高規格 HBM3 內存,容量為 96 GB,帶寬達到 4Tb/s。在計算性能方面,該型號的 INT8 算力為 296 TFLOPS,通過 Tensor Core 在 BF16 中可達到 148 TFLOPS,在 FP32 中為 44 TFLOPS,在 FP64 中為 1 TFLOP。最后,它具有 PCIe 5.0 接口以及 900 GB/s NVLINK 鏈路。
L20 和 L2 是分別配備 48 GB 和 24 GB GDDR6 的 PCIe 卡,內存帶寬分別為 864 GB/s 和 300 GB/s。它們的 GPU 核心型號是 AD102,公布的性能數據如下:
L20:239 TFLOPS (FP8) – BF16 中為 119.5 TFLOPS – FP32 中為 59.8 TFLOP
L2:193 TFLOPS (FP8) – BF16 中為 96.5 TFLOPS – FP32 中為 24.1 TFLOP
與目前業內標桿 H100 相比,這些顯卡在內存和帶寬方面相近,功耗更低,但算力數字非常有限,特別是在 TFLOPS 方面:H20 的紙面算力不及 H100 的 20%。
顯然,目前的規格完全是按照新的出口限制設計的。
它們比之前以 H800 和 A800 形式提供的性能也要差得多,但如果英偉達用于 AI 和 HPC 的軟件堆棧對于一些客戶來說無法放棄,為了獲得最新的 Hopper 架構,人們或許仍然愿意采用降低規格后的產品。
分銷商表示,其已于本周早些時候聽取了有關進展情況的簡報,并表示符合美國最新出口規則的新芯片將作為 A800 和 H800 的替代品提供給國內客戶。
在業務受阻的情況下,英偉達仍然努力尋求遵守限制,提供產品,這表明了中國市場對于芯片公司的重要性。英偉達數據中心業務面向中國的收入占整體的 20% 至 25%,而該業務是英偉達目前營收最大的部門。
上月底曾有報道稱,英偉達可能因為新的禁令被迫取消了價值 50 億美元的先進芯片訂單。
另一方面,近日也有消息稱,國內科技公司正在采購國產 910B 芯片作為英偉達芯片的替代,其能力已經基本做到可對標英偉達 A100。
-
芯片
+關注
關注
456文章
51188瀏覽量
427289 -
AI
+關注
關注
87文章
31534瀏覽量
270342 -
英偉達
+關注
關注
22文章
3848瀏覽量
91982
原文標題:英偉達特供版芯片將上市:性能最高不到H100的20%
文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論