近日,DIGITIMES 報道,在新冠疫情大流行期間,數(shù)據(jù)中心對高性能計算 HPC、AI 應用需求旺盛,英偉達、AMD 服務器芯片銷量正在增加。
實際上,以服務器芯片為代表的英偉達數(shù)據(jù)中心業(yè)務,已經(jīng)連續(xù)多個季度獲得快速增長。從 2019 年財年的 25%,增長到 2020 年財年(截至 2020 年 1 月 26 日)的 27.4%,再到 2021 財年第一季度(截至 4 月 26 日)的 37%。數(shù)據(jù)中心業(yè)務對英偉達整體營收的貢獻越來越重要,和英偉達「傳統(tǒng)」優(yōu)勢領(lǐng)域游戲板塊業(yè)務旗鼓相當。
而就在一個多月以前的 2020 年 GTC 線上發(fā)布會上,英偉達切合時宜地順應了云市場需求激增這一市場趨勢。發(fā)布會沒有出現(xiàn)傳聞中的 Ampere GeForce RTX 3080 游戲顯卡,數(shù)據(jù)中心產(chǎn)品卻成為了「絕對主角」,賺足了閃光燈。英偉達推出了第八代 GPU 架構(gòu) Ampere 安培,新一代 A100 計算卡,不但在工藝制程上跨越至 7nm,更在多個關(guān)鍵性能參數(shù)指標上呈數(shù)倍、乃至數(shù)十倍增長。
這是英偉達時隔三年,再度向市場扔出的重磅「核彈」,英偉達的目標很明確,就是 AI 訓練兼推理芯片、高性能計算 HPC 領(lǐng)域。當然,英偉達占領(lǐng)的也不僅僅是服務器芯片為代表的硬件市場,其最大的「殺手锏」在于軟硬一體的生態(tài)布局。
「最大的對手是自己」
英偉達 CEO 黃仁勛評價 A100 GPU,「這是英偉達有史以來最好的數(shù)據(jù)中心 GPU 芯片,幾乎是當今半導體的理論極限,它是英偉達數(shù)十年以來數(shù)據(jù)中心經(jīng)驗的結(jié)晶。」
的確,A100 GPU 引起了包括亞馬遜 AWS、谷歌云、微軟 Azure、阿里云、百度云、騰訊云等云巨頭,以及戴爾、浪潮、HPE、新華三、思科等系統(tǒng)制造商極大的采購熱情。并且,在 A100 GPU 發(fā)布之前,就已經(jīng)投產(chǎn),開始逐步向云廠商們交付。
用黃仁勛的話來描述就是「前所未有」。
八年以前,黃仁勛絕對想不到,英偉達能夠 C 端、B 端通吃,踩準了 AI 時代的每個關(guān)鍵節(jié)點,為深度學習提供強大算力,推動圖片、語音、自動駕駛、機器人、乃至數(shù)據(jù)中心的飛速發(fā)展。如今,相比于 21 年前剛上市時,英偉達市值已翻了千余倍。
2012 年,ImageNet 大賽上,參賽者因使用英偉達 GPU+CUDA,將深度卷積神經(jīng)網(wǎng)絡 AlexNet 準確率提高 10% 以上,獲得冠軍,也讓英偉達名聲大噪。此后,英偉達 GPU 和 CUDA 軟件一直主導深度學習市場,幾乎所有深度學習開發(fā)者離不開英偉達 GPU+CUDA 組合。
包括 2016 年,直接引爆 AI 第三次浪潮的關(guān)鍵事件,AlphaGo 大戰(zhàn)李世石,以及亞馬遜 AWS、微軟,國內(nèi)的互聯(lián)網(wǎng)廠商 BAT、美團等 AI 最新進展均有英偉達 GPU 的底層支持。多個第三方研究報告顯示,在云端 AI 芯片市場,尤其是云端訓練方面,英偉達占據(jù)絕對主導地位。
云端、企業(yè)級數(shù)據(jù)中心芯片市場,排名前四位的公有云廠商亞馬遜 AWS、微軟 Azure、谷歌云、阿里云的上萬余個實例類型中,只有很小一部分不基于英偉達 GPU 加速。
不過,這不意味著,英偉達完全沒有潛在威脅。英偉達競爭對手大致分為三種:英特爾、AMD 為代表的「老對手」;亞馬遜 AWS、谷歌、阿里巴巴、華為為代表的云巨頭,以及寒武紀、燧原科技為代表的創(chuàng)業(yè)型 AI 芯片公司在內(nèi)的新對手。
實際上,與其說是新老之爭,不如說是 CPU、GPU、ASIC、FPGA 之間的紛爭。盡管,英特爾 Xeon CPU 已經(jīng)安裝于全球 99% 的數(shù)據(jù)中心中,但深度學習、AR/VR、IoT、海量數(shù)據(jù)處理,推動著數(shù)據(jù)中心從 CPU 轉(zhuǎn)向 GPU,并成為常態(tài)化。
比如,廣告位展示、流媒體、電商平臺推薦引擎系統(tǒng)、智能語音現(xiàn)在均已采用 GPU 驅(qū)動。再如,相同時間周期內(nèi)芯片性能提高的難易程度不同。2017 年,英偉達推出基于新架構(gòu) Volta 的 Tesla V100 芯片,是上一代基于 Pascal 架構(gòu)的 Tesla P100 訓練速度的 12 倍。英偉達在三年之內(nèi)將 AI 性能提高了 60多倍,而相同時間內(nèi),CPU 只能提高一倍。
難怪,黃仁勛自 2017 年以來,多次公開宣布摩爾定律已失效。
在云巨頭方面,無論是 AWS Inferentia、谷歌 TPU、阿里巴巴含光 800 均屬于 ASIC 芯片,側(cè)重 AI 推理。云巨頭自研云端 AI 芯片背后的邏輯有兩點,一方面,降低購置芯片的成本,更好服務于自身業(yè)務,另一方面,逐步減少對英偉達、英特爾芯片的依賴,提高自己對云生態(tài)系統(tǒng)的掌控能力。
一般來說,ASIC 只針對單一場景,速度很快,GPU 的性能以面積和功耗為代價,理論上 ASIC 性能優(yōu)于 GPU。但 ASIC 研發(fā)較慢,有時候趕不上深度學習的發(fā)展速度。在價格方面甚至更昂貴,谷歌官網(wǎng)顯示,使用 TPU 價格為 8 美元/時,英偉達芯片則為 2.48 美元/小時。
「AI 訓練芯片的研發(fā)難度更高,目前還是 GPU 占據(jù)了很大的優(yōu)勢。主要是英偉達圍繞自己的 GPU 已經(jīng)構(gòu)建了豐富的軟件生態(tài)。其他 ASIC 或 FPGA 在硬件指標上可能占據(jù)優(yōu)勢,但在生態(tài)上比英偉達還落后很多,這也是為什么英偉達一家獨大的原因。 」芯謀研究徐可告訴極客公園。
黃仁勛曾說過,英偉達是一家 AI 公司,更強調(diào)英偉達是一家軟件公司,和蘋果類似,通過售賣硬件盈利的軟件公司。
2006 年,英偉達面向開發(fā)者推出 CUDA 通用并行計算平臺,通過 CUDA 平臺,開發(fā)者可以使用 C 或 C++語言編程,來加速計算應用程序,極大地簡化了軟件開發(fā)過程。英偉達投入大量資金構(gòu)筑 CUDA 生態(tài),通過開設課程、培訓,吸引開發(fā)者,滲透至各個關(guān)鍵行業(yè)用戶,這是競爭對手 AMD 所不具備的能力。
近三四年,英偉達開發(fā)者數(shù)量增長迅猛,僅 2019 年一年,CUDA 平臺的下載量就超過了 500 萬次。不僅如此,在 CUDA 平臺之上,英偉達還提供 CUDA-X 軟件加速庫集合,其中,CUDA-X AI 囊括了加速深度學習的 cuDNN、加速機器學習算法的 cuML、優(yōu)化訓練模型以進行推理的 TensorRT 等 15 個庫,此外,英偉達還推出 RAPIDS 開源軟件平臺,加速企業(yè)數(shù)據(jù)分析、機器學習。
去年年底,黃仁勛在接受 GamesBeat 采訪時談到,英偉達基于 GPU 芯片構(gòu)建出了非常復雜的軟件堆棧,而軟件堆棧是競爭對手不具備的「賽道」。
可見,CUDA 平臺在內(nèi)的軟件能力,已經(jīng)成為英偉達的「護城河」。比如,2017 年,英偉達推出面向 AI 訓練和高性能計算的 Tesla V100 芯片后,長達兩年多的時間里,沒有新的后續(xù)產(chǎn)品推出。軟件成為提高 AI 性能的關(guān)鍵,ResNet-50 神經(jīng)網(wǎng)絡在軟件的幫助下,AI 訓練能力提高了 100%。
在 GPU 硬件方面,英偉達也在鞏固、增強固有優(yōu)勢。2019 年,英偉達收購 Mellanox,彌補了英偉達在數(shù)據(jù)中心低延遲互連及網(wǎng)絡方面的欠缺,顯著增強 NVLink(GPU 與 GPU 互聯(lián))和 NVSwitch(整合多個 NVLink)互聯(lián)的速度與可擴展性。
2016 年,英偉達面向 AI 創(chuàng)業(yè)公司,推出初創(chuàng)加速計劃,幫助 AI 創(chuàng)業(yè)公司加速孵化、商業(yè)落地。巨頭競爭的本質(zhì)是生態(tài)上的競爭。
「生態(tài)和軟件非常關(guān)鍵。AI 芯片只是底層的工具,AI 開發(fā)者對 AI 芯片相關(guān)生態(tài)和軟件的選擇,決定了芯片的前途。」徐可說。
在經(jīng)歷游戲顯卡業(yè)務想象力登頂,比特幣挖礦機行業(yè)「過山車」式的起伏后,英偉達正憑借數(shù)據(jù)中心業(yè)務進階 B 端。現(xiàn)在看來,英偉達押寶數(shù)據(jù)中心前景與錢景巨大,數(shù)據(jù)中心業(yè)務與英偉達強大的軟件、生態(tài)能力產(chǎn)生的化學反應,正驅(qū)動英偉達在芯片市場講出一個新的增長故事。
-
amd
+關(guān)注
關(guān)注
25文章
5500瀏覽量
134655 -
英偉達
+關(guān)注
關(guān)注
22文章
3848瀏覽量
91994
發(fā)布評論請先 登錄
相關(guān)推薦
評論