衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

“算力”的分層定義-初級算力

澎峰科技PerfXLab ? 來源:澎峰科技PerfXLab ? 作者:澎峰科技PerfXLab ? 2023-07-27 14:02 ? 次閱讀

“算力”(Computility,也被稱為計算能力或計算力)通常而言是指計算機、服務器、GPU或其他硬件設備執行計算任務的速度和能力。算力的英文名是computility。其中的compu-是計算的詞根,表達“算”的含義,-utility是效用、實用的意思。computility用來表達計算的能力,即算力。近年來,“算力”被全社會高度關注,同時對于算力的準確量化描述也非常混亂,例如:

“每秒算力可達116億億次”

問題:執行的啥計算任務呀?也沒有講數據類型(整型?浮點數?),也不提精度(整型多少位?雙精浮點?單精度浮點?),也不講是AI算力還是通用算力,等等。

由此,也出現了“已有算力不夠用,新建算力用不了”的怪事。本系列文章試圖澄清算力的各種信息,并提出算力分層定義的觀點,總共分為三層:

初級算力:即硬件spec.描述的算力,應該采用FLOPS、TOPS加“計算類型和精度”,加“算力類型”(CPU通用算力,GPU算力,DSA算力)準確描述。該層最重要的是計算芯片架構的設計能力和半導體制造工藝,當下,多數情況描述的算力多么強大都只是指初級算力。(注釋:DSA(Domain Specific Architecture,特定領域架構)在本文泛指市面上講得NPU、TPU、XPU等等專用加速卡。)

中級算力:即計算硬件通過基礎計算軟件層,向算法和應用層提供的實際計算的能力,在實踐中初級算力要轉換為中級算力面臨兩個問題:一是是否可行,二是轉換效率。基本上,通用算力可以用Linpack等測試基準進行衡量(求解線性方程),AI算力的衡量可以使用AIPerf、MLPerf等衡量。該層最重要的是計算基礎軟件棧的軟件能力,具體指高性能計算庫、異構計算框架、領域編譯器等。用戶只會為有效算力而付費。

高級算力:各種算法和應用被封裝成領域服務,用戶可以直接獲得跨領域的具體能力,也許可以叫FAAS,用戶為具體服務而付費。該層最重要的是對于領域和應用場景核心算法的大規模并行化算法的構建能力。

對算力分層描述的重要意義在于:

更為準確描述一個計算中心執行計算任務的能力。

急需提升我國對于計算基礎軟件層的重視程度。

使“算力”從低層次商品向高層次商品發展,促進實現算力商業化。

“初級算力”如何準確描述

關于“算力”的量詞介紹

浮點數運算能力通常使用以下單位描述:

FLOPS(Floating-Point Operations Per Second) - 這是衡量計算機或其他設備執行浮點運算速度的基本單位,表示每秒鐘可以執行多少次浮點運算(加、減、乘和除等運算)。FLOPS 以前通常用于衡量大規模科學計算和數值模擬等需要雙精度浮點數計算的應用程序,現在也被用于描述AI高精度訓練算力。

1 GFLOPS(Giga-FLOPS),表示每秒鐘執行十億次浮點運算(10^9)。

1 TFLOPS(Tera-FLOPS),表示每秒鐘執行1萬億次浮點運算(10^12)。

1 PFLOPS(Peta-FLOPS),表示每秒鐘執行1千萬億次浮點運算(10^15)。

1 EFLOPS(Exa-FLOPS),表示每秒鐘執行1百億億次浮點運算(10^18)。

1 ZFLOPS(Zetta-FLOPS),表示每秒鐘執行十億億億次浮點運算(10^21)。

1 YFLOPS(Yotta-FLOPS),表示每秒鐘執行1萬億億億次浮點運算(10^24)。

整型數據運算能力通常使用TOPS(Tera Operations Per Second)來描述,即每秒多少萬億次(10^12)。對于64位CPU處理器,指的就是64位整型數據的處理能力。但在GPU和DSA的領域,描述多少TOPS,可能是INT32,也有可能是INT8,還有可能是INT4。(備注:對于CPU性能的強弱,還有DMIPS(Dhrystone Million Instructions executed Per Second)來描述,即每秒執行多少百萬條指令)。

關于“算力”的計算精度

在科學計算領域,?FLOPS以前通常指雙精度浮點數(FP64)。現在也被用于人工智能領域,但通常指的是其他精度(FP32/FP16/BF16/INT8等類型),同時還引入了一些新的浮點數格式。下面是一些常見的計算中使用的浮點數格式:

FP64:雙精度浮點數,占用64位存儲空間,通常用于大規模科學計算、工程計算等需要高精度計算的算法。

FP32:單精度浮點數,占用32位存儲空間。與雙精度浮點數相比,存儲空間較小但精度較低,部分科學計算和工程計算也可以使用FP32,但通常也用于神經網絡的前向推理和反向傳播計算。

FP16:半精度浮點數,占用16位存儲空間。存儲空間更小但精度進一步降低,通常用于模型訓練過程中參數和梯度的計算。

BF16: 用于半精度矩陣乘法計算(GEMM)的浮點數格式,占用16位存儲空間。相對于FP16,在保持存儲空間相同的情況下能夠提高運算精度和效率。

TF32:TensorFLoat-32,是NVIDIA定義的使用TensorCore的中間計算格式。

INT8:8位整數,用于量化神經網絡的計算,由于存儲和計算都相對于浮點數更加高效,在低功耗、嵌入式系統和邊緣設備等領域有著廣泛的應用。用TOPS(Tera Operations Per Second,每秒處理的萬億級別的操作數)作為計算性能的單位。

INT4:4位整數,只能表示-8到7的16個整數。因為新的量化技術出現,追求更低的存儲空間,減少計算量和更高的算力密度,而產生的新格式。

其他標準的整數類型,16位整型INT16,32位整型INT32,deng64位整型等。

wKgZomTCBl-Aa5wmAAIsDpUYFJU676.png

9. 現在你看到這個計算中心,每秒可以計算多多多少次。就需要留意”計算格式/計算精度”了。另外,引入了POPS這個名詞,POPS是神經網絡處理器(NNP)性能的單位,全稱為“Per Second Operations Per Second”,即每秒鐘的計算數量,這個單位似乎使用頻率不高。

wKgZomTCBoqAJ0VmAAEVBw9kT-U516.png

A800的初級算力規格(圖1)

A100的卡有7項算力規格描述。

這里面的計算格式描述就有6種。

wKgZomTCBrWABf0QAAOXFMpxG2I180.png

intel CPU的初級算力規格(圖2)

另外,神經網絡處理器(NNP)性能描述雖然引入了POPS作為單位,全稱為“Per Second Operations Per Second”,即每秒鐘的計算數量。也同樣存在類似的問題,也少人使用。

關于通用算力和專用算力有差異!

(圖1)NVIDIA A100,硬件算力是9.7TFLOPS

(圖2)Intel的i9-12900K,硬件算力才0.8192TFLOPS

硬件算力為啥差一個數量級呀,是intel不要臉了嗎?

當然不是,這是因為GPU和CPU的設計目標不同,算力分為通用算里和專用算力(GPU算力、AI算力)。GPU在設計時專注于進行大量并行計算,因此它們采用了更多的小計算單元(即ALU)和更多的流處理器,這使得它們能夠在單位時間內完成更多的計算。而CPU則更加注重單線程處理能力和數據緩存,具有更多指令集條數、更高效的緩存和更快的時鐘速度,每個計算單元大,但數量相對較少。這就是為什么GPU的算力可以達到數以TFLOPS級別,而CPU通常只能達到數百GFLOPS的原因。這也是通用算力和AI算力的根本性差異。

CPU堆核心數和GPU堆核心數也不是一個概念。

wKgZomTCBvGAHCvJAAtA2XIGaww544.png

A100有了6912個FP32 CUDA Core

wKgaomTCBw-AdY4PAACtwxEh_5I984.png

i9-12900K有8個性能核加8個能效核

展開一點點,GPU和CPU的核心雖然都是進行運算的單元(ALU)。CPU的設計目標是滿足各種可能的應用,強調通用性,例如各種辦公軟件,網絡服務,用戶交互軟件等等。GPU和DSA強調某一些領域和算法的大規模并行計算,例如圖像渲染,深度學習等;

關于超算、智算、超腦等

超級計算機的TOP500排名的性能指標,包括Rmax(最大性能)和Rpeak(理論性能)。Rmax是指超級計算機在實際運行中所能達到的最大計算性能,即每秒鐘所能計算的浮點數的數量(FLOPS)。而Rpeak是指超級計算機按照其設計時理論上所能達到的最大計算性能,實際上Rmax值往往會低于Rpeak值。排名靠前的超級計算機通常具備更高的計算性能、更強的可擴展性和更高的能效比。盡管TOP500排行榜的排名主要依據性能指標,但也會考慮其他因素,如超級計算機應用領域、處理器類型、計算節點數量等。相對比較嚴謹。

世界第一臺E級超算是美國橡樹嶺國家實驗室(ORNL)的Frontier,在2022 年 6 月高性能計算的TOP500 榜單中,Frontier 位列第一名,速度為 1.685 EFLOPS。(題外話:有新聞說該超算出現大量故障,機器甚至于無法完整運行一整天。不知現在怎樣了?)

wKgaomTCB4qAGGMIAADur5344UQ065.png

世界TOP 500超級計算機排行榜 Frontier超算 國內某算力中心

現在,您應該知道“每秒算力可達116億億次”的算力中心,通常只是混淆描述算力規模,根本無法和TOP500的超算1.685 EFLOPS類比了吧!這些算力中心基本無法進行科學計算,甚至于在運行類似ChatGPT這種AI大模型實際能效比也不高。

所以,對于描述算力中心的描述,我國還出現的“智算”、“超級大腦”等名詞。如果基礎軟件不行,也就徒剩“初級算力”的spec參數和猛力造詞,比氣勢!

智算出處:《后漢書·荀彧傳論》:“常以為中賢以下,道無求備,智筭有所研疎,原始未必要末,斯理之不可全詰者也。”

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7540

    瀏覽量

    88646
  • 算力
    +關注

    關注

    1

    文章

    1016

    瀏覽量

    14959
收藏 人收藏

    評論

    相關推薦

    力系列基礎篇——101:從零開始了解

    相信大家已經感受到,我們正處在一個人工智能時代。如果要問在人工智能時代最重要的是什么?那必須是:
    的頭像 發表于 04-24 08:05 ?1002次閱讀
    <b class='flag-5'>算</b>力系列基礎篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:從零開始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    智能規模超通用,大模型對智能提出高要求

    電子發燒友網報道(文/李彎彎)是設備通過處理數據,實現特定結果輸出的計算能力,常用FLOPS作為計量單位。FLOPS是Floating-point Operations Per Second
    的頭像 發表于 02-06 00:08 ?6539次閱讀

    大茉莉X16-P,5800M大稱王稱霸

    Rykj365
    發布于 :2024年01月25日 14:54:52

    rx580,rx580顯卡,rx588,rx588顯卡 精選資料分享

    已下是rx580顯卡9-11 Mh 沒有開啟計算模式,挖幾分種重啟自動開啟,計算模式只支持WIN1022-28 Mh 原版BIOS,開啟時序,并設置超頻29-32 Mh 正常
    發表于 07-23 06:59

    何為

    由基于CPU芯片的服務器所提供的,主要用于基礎通用計算。日常提到的云計算、邊緣計算等都屬于基礎,它為移動計算、物聯網等提供計算支持。基礎
    的頭像 發表于 05-13 14:36 ?8313次閱讀

    如何創建網絡

    網大腦作為網絡的中樞核心,主要實現感知、網統一調度、
    的頭像 發表于 06-20 16:05 ?2619次閱讀

    網絡的架構

    網絡的核心特征,是它通過,實現了對資源、網絡資源的全面接管,可以讓網絡實時感知用戶的
    的頭像 發表于 08-17 09:32 ?5578次閱讀

    如何定義AI中心新實踐

    9月3日上午, “盡其用·AI中心建設新實踐”云端AI產業論壇在2022世界人工智能大會上隆重召開,來自人工智能
    發表于 09-05 10:48 ?1243次閱讀

    網絡:和網絡的關系

    網絡的核心特征,是它通過,實現了對資源、網絡資源的全面接管,可以讓網絡實時感知用戶的
    的頭像 發表于 12-14 16:09 ?4628次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>網絡:<b class='flag-5'>算</b><b class='flag-5'>力</b>和網絡的關系

    網絡是什么意思

    網絡是什么意思 東數西想必大家都知道,很長一段時間內“東數西”都是熱議焦點,要知道在數字經濟時代,
    的頭像 發表于 12-14 17:55 ?5115次閱讀

    到底什么是的作用?

    的字面意思,大家都懂,就是計算能力(Computing Power)。
    的頭像 發表于 11-20 09:26 ?2140次閱讀
    到底什么是<b class='flag-5'>算</b><b class='flag-5'>力</b>?<b class='flag-5'>算</b><b class='flag-5'>力</b>的作用?

    一文讀懂:什么是“”?

    定義即計算能力(ComputingPower)。《中國
    的頭像 發表于 12-22 08:27 ?7568次閱讀
    一文讀懂:什么是“<b class='flag-5'>算</b><b class='flag-5'>力</b>”?

    科技云報到:要更要“利”,“精裝”觸發大模型產業新變局?

    科技云報到:要更要“利”,“精裝”觸發大模型產業新變局?
    的頭像 發表于 01-16 10:24 ?114次閱讀

    中心的如何衡量?

    作為當下科技發展的重要基礎設施,其的衡量關乎其能否高效支撐人工智能、大數據分析等智能應用的運行。以下是對智中心算衡量的詳細闡述:一、
    的頭像 發表于 01-16 14:03 ?479次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?
    天天乐娱乐城官网| 武乡县| 百家乐官网视频下栽| 真人百家乐官网游戏网址| 洪江市| 百家乐官网网上真钱娱乐场| 百家乐怎么玩了| 威尼斯人娱乐城真实网址| 百家乐官网出千大全| 网上百家乐官网信誉度| 海王星百家乐官网的玩法技巧和规则 | 百家乐官网投注程式| 百家乐积分| 10BET娱乐城| 百家乐赢利策略| 百利宫娱乐城官方网| 百家乐官网游戏唯一官网站| 百家乐用品| 澳门百家乐官网破解| 怎样赢百家乐的玩法技巧和规则 | 成安县| 百家乐1个人| 宝龙百家乐官网娱乐城| 百家乐机器图片| 百家乐官网电子作弊器| 华侨人百家乐的玩法技巧和规则 | 百家乐官网3带厂家地址| 沙巴百家乐现金网| 宝马会在线娱乐城| 百家乐赌博代理荐| 百家乐官网玩法及技巧| 如何玩百家乐的玩法技巧和规则 | 战神百家乐官网的玩法技巧和规则 | 新时代百家乐官网娱乐城| 威尼斯人娱乐城现金开户| 百家乐官网薯片| 大发888设置| 属狗与属鸡做生意| 中方县| 国际娱百家乐的玩法技巧和规则| 现场百家乐官网牌路分析|