衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI引擎機器學習陣列指南

Xilinx賽靈思官微 ? 來源:Xilinx賽靈思官微 ? 2024-09-18 09:16 ? 次閱讀

AMD Versal AI Core 系列和 Versal AI Edge 系列旨在憑借 AI 引擎機器學習 ( ML ) 架構來提供突破性的 AI 推斷加速。這些器件的設計應用范圍廣泛,包括用于云端動態工作負載以及超高帶寬網絡,同時還可提供高級安全性功能。AI 和數據科學家以及軟硬件開發者均可充分利用高計算密度的優勢來加速提升任何應用的性能。AI 引擎機器學習擁有先進的張量計算能力,非常適合用于高度優化的 AI 和 ML 應用。

AI 引擎機器學習器件包含二維陣列,由帶有單指令流多數據流 ( SIMD ) 矢量單元的超長指令字 ( VLIW ) 處理器構成,專為計算密集型應用而高度優化,特別適用于機器學習 ( ML ) 等 AI 技術。

AI 引擎機器學習陣列支持三種級別并行度:

指令級并行度 ( ILP ):通過 VLIW 架構,允許在單個時鐘周期內執行多次運算。
SIMD:通過矢量寄存器,允許并行執行多項計算。
多核:通過 AI 引擎機器學習陣列,支持并行執行多個 AI 引擎機器學習核。

指令級并行度包括 1 次標量操作、1 次移動、2 次矢量讀取(加載)、1 次矢量寫入(存儲)和 1 條可執行的矢量指令,總計每個時鐘周期達 6 路 VLIW 指令。數據級并行度是通過矢量級操作來實現的,其中每個時鐘周期可執行多組數據操作。

每個 AI 引擎機器學習都包含矢量處理器和標量處理器、專用程序存儲器、本地 64 KB 數據存儲器、支持訪問其本身和三個相鄰 AI 引擎機器學習內的本地存儲器。它還可訪問 DMA 引擎和 AXI4 互連開關,以通過串流來與其他 AI 引擎機器學習進行通信或者與可編程邏輯 ( PL ) 或 DMA 進行通信。請參閱《Versal 自適應 SoC AIE ML 架構手冊》 ( AM020 ) 以獲取有關 AI 引擎機器學習陣列和接口的具體詳細信息

b5d29b6992f9e799189185986d306675.png

雖然對于 AI 引擎機器學習而言,大部分標準 C 語言代碼均可編譯,但代碼可能需要重構才能充分利用硬件所提供的并行度。AI 引擎機器學習的優勢在于,它能夠在每個時鐘周期內使用 2 個矢量執行乘積累加 ( MAC ) 運算、為下一項運算加載 2 個矢量、存儲來自上一項運算的單個矢量,并遞增一個指針或執行另一次標量運算。稱為本征函數的專用函數允許您以 AI 引擎機器學習矢量處理器和標量處理器為目標,并提供多個常用矢量函數和標量函數的實現,使您能夠專注于處理目標算法。AI 引擎機器學習不僅包含其矢量單元,還包含一個標量單元用于所有標準 C 語言代碼程序。

AI 引擎機器學習程序使用以 C++ 編寫的數據流計算圖(自適應數據流計算圖)規格。此規范可使用 AI 引擎編譯器進行編譯并執行。自適應數據流 ( ADF ) 計算圖應用由多個節點和邊緣組成,其中節點表示計算內核函數,邊緣則表示數據連接。應用中的內核可編譯為在 AI 引擎機器學習上運行,這些內核構成了 ADF 計算圖規范的基礎構建塊。ADF 計算圖屬于 Kahn 進程網絡,其中包含并行運行的 AI 引擎內核。AI 引擎內核在數據串流和緩沖器上執行運算。這些內核會耗用輸入數據塊并生成輸出數據塊。內核還可包含靜態數據或運行時參數 ( RTP ) 實參,包括異步實參或同步實參。

下圖顯示

ADF 計算圖的概念視圖及其與處理器系統 ( PS )、可編程邏輯 ( PL ) 和 DDR 存儲器的對接接口。它包括:

AI 引擎機器學習:每個 AI 引擎機器學習都是一個 VLIW 處理器,其中包含一個標量單元、一個矢量單元、兩個加載單元和一個存儲單元。

AI 引擎內核:內核是以 AI 引擎機器學習中運行的 C/C++ 編寫的。

ADF 計算圖:ADF 計算圖是具有單個或多個 AI 引擎內核(以數據串流和/或緩沖器連接)的 Kahn 進程網絡。它憑借如下特定構造來與 PL、全局存儲器和 PS 進行交互,此類構造有:PLIO(計算圖中的端口屬性,用于建立往來可編程邏輯的串流連接)、GMIO(計算圖中的端口屬性,用于建立往來全局存儲器的外部存儲器映射連接)和 RTP。

如需了解有關 AI 引擎機器學習存儲器拼塊訪問的信息,請參閱 AI 引擎機器學習存儲器拼塊訪問。如需了解有關 AI 引擎機器學習外部存儲器訪問的信息,請參閱 AI 引擎機器學習外部存儲器訪問。

本文檔第 2 章到第 5 章聚焦 AI 引擎內核編程,不僅涉及單內核編程,還涵蓋了多方面的內容,如內核之間的數據通信,這些內容都是將應用分區為多個內核以達成所需的吞吐量所必不可少的概念。

本文檔第 6 到 14 章焦點包括 AI 引擎計算圖編程構造、內核之間的數據通信類型、通過主機應用來控制 AI 引擎計算圖以及高級計算圖編程構造。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19406

    瀏覽量

    231160
  • AI
    AI
    +關注

    關注

    87

    文章

    31504

    瀏覽量

    270302
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133074

原文標題:AI 引擎機器學習內核與計算圖編程指南

文章出處:【微信號:賽靈思,微信公眾號:Xilinx賽靈思官微】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    RISC-V如何支持不同的AI機器學習框架和庫?

    RISC-V如何支持不同的AI機器學習框架和庫?還請壇友們多多指教一下。
    發表于 10-10 22:24

    機器學習實踐指南——案例應用解析

    機器學習實踐指南——案例應用解析
    發表于 04-13 16:40

    Firefly支持AI引擎Tengine,性能提升,輕松搭建AI計算框架

    `Tengine 是OPEN AI LAB 為嵌入式設備開發的一個輕量級、高性能并且模塊化的引擎。基于ARM平臺高效的計算庫實現,針對特定硬件平臺的性能優化,吸取已有AI計算框架的優點,設計全新
    發表于 08-13 15:58

    AI學習AI概論:(Part-A)與AI智慧交流

    人機界面---基于Excel+Python任務三:觀察事物,提取特征任務四:如何把特征傳遞給AI---邁入機器學習任務五:傳遞你觀察到的新特征任務六:觀察特征的更多(新的組合)任務七:觀察更多食物和特征任務八:創作你自己的
    發表于 10-30 14:04

    AI學習AI概論:(Part-B)AI頭腦+機器人行為

    任務九:讓AI自動提取特征目標: ? 在前面各任務里,已經引導AI自我學習,能夠基于人們所給予的特征值而進行分類了。? 其中,是由人們去觀察而萃取特征的,然后才遞交給AI去分類,這通稱
    發表于 10-30 14:17

    AI概論: <TensorFlow + Excel>可操作教案(Part-C:AI(機器)是如何學習呢?)

    任務十四:從您孰悉的出發任務十五:認識AI術語-- 權重(Weight)任務十六:簡單的權重運算-- 兩兩相乘&求和任務十七:訓練(機器學習)-- AI開始任務十八:創作您的
    發表于 12-02 14:12

    最值得學習機器學習編程語言

    如果你對人工智能和機器學習感興趣,而且正在積極地規劃著自己的程序員職業生涯,那么你肯定面臨著一個問題:你應該學習哪些編程語言,才能真正了解并掌握 AI
    發表于 03-02 06:22

    AI+機器學習:推動AI應用產業化,加快機器學習步伐

    毫不客氣地說,人工智能(AI)和機器學習(ML)已然“滲透”到了各行各業,企業們期待通過機器學習基礎架構平臺,以推動人工智能在業務中的利用。
    的頭像 發表于 07-03 11:45 ?2873次閱讀

    賽靈思AI引擎簡介

    在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內存、數據流和級聯接口相連的二維AI
    的頭像 發表于 09-03 09:35 ?3460次閱讀

    華為智慧終端背后的黑科技--超輕量AI引擎MindSpore Lite,性能評測結果領先

    MindSpore Lite是MindSpore全場景AI框架的端側引擎,目前MindSpore Lite作為華為HMS Core機器學習服務的推理
    發表于 01-25 19:37 ?3次下載
    華為智慧終端背后的黑科技--超輕量<b class='flag-5'>AI</b><b class='flag-5'>引擎</b>MindSpore Lite,性能評測結果領先

    火山引擎機器學習平臺與NVIDIA加深合作

    隨著 AI 在醫療健康和生命科學領域應用的不斷增加,GPU 算力的需求迅猛增長。火山引擎機器學習平臺在 NVIDIA A100 Tensor Core GPU 的硬件基礎架構之上,基于
    的頭像 發表于 07-05 08:59 ?1047次閱讀

    AI引擎架構和陣列編程要求

    Versal AI Core 系列可借助 AI 引擎提供突破性的 AI 推斷加速。此系列應用范圍廣泛,包括用于云端動態工作負載以及超高帶寬網絡,同時還可提供高級安全性功能。
    的頭像 發表于 12-08 09:18 ?1046次閱讀

    Versal ACAP AI引擎編程環境用戶指南

    電子發燒友網站提供《Versal ACAP AI引擎編程環境用戶指南.pdf》資料免費下載
    發表于 09-14 10:10 ?0次下載
    Versal ACAP <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>編程環境用戶<b class='flag-5'>指南</b>

    AI引擎內核編碼最佳實踐指南

    電子發燒友網站提供《AI引擎內核編碼最佳實踐指南.pdf》資料免費下載
    發表于 09-14 14:58 ?0次下載
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>內核編碼最佳實踐<b class='flag-5'>指南</b>

    AI引擎內核與計算圖編程指南

    電子發燒友網站提供《AI引擎內核與計算圖編程指南.pdf》資料免費下載
    發表于 01-03 10:50 ?0次下載
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>內核與計算圖編程<b class='flag-5'>指南</b>
    大发888娱乐场下载com| 大发888娱乐城电话| 棋牌游戏源码| 百家乐官网视频象棋| 神人百家乐官网赌博| 七胜百家乐官网娱乐场| 澳门百家乐怎么| 大发888游戏平台dafa 888 gw| 百家乐官网闲庄概率| 雅加达百家乐官网的玩法技巧和规则 | 百家乐傻瓜式投注法| 全讯网hg9388.com| 呼伦贝尔市| 澳门百家乐官网官方网站| 新锦江百家乐官网赌场娱乐网规则| 百家乐开户导航| k7线上娱乐| 利博百家乐官网的玩法技巧和规则| 百家乐怎么玩请指教| 缅甸百家乐官网网站| 开心8| 打百家乐官网的介绍| 属鸡与属羊做生意| 大发888 娱乐平台| 百家乐官网技巧头头娱乐| 百家乐平注法攻略| 百乐门线上娱乐城| 爱拼百家乐官网的玩法技巧和规则| 大发888体育和娱乐| 网络赌博| 百家乐天天赢钱| 爱拼| 属鼠跟属虎做生意| 波音现金网投注| 网上赌百家乐官网的玩法技巧和规则 | 大发888存款| 百家乐官网自动下注| 路单百家乐的玩法技巧和规则| 百家乐官网管理启发书| 破解百家乐游戏机| 百家乐官网游戏机压法|