太阳城娱乐城立即博,百乐坊娱乐场官网备用网,英超足球宝苏菲丽德(中国)·官方网站

阿里云震旦異構計算加速平臺基于NVIDIA Tensor Core GPU，通過機器學習模型的自動優化技術，大幅提升了算子的執行效率，刷新了NVIDIA A100、A10、T4的GPU單卡性能。并基于8張NVIDIA A100 GPU和開放規則，以離線場景下每秒處理107.8萬張圖片的成績，打破MLPerf 1.0推理性能測試紀錄。

阿里云自研震旦異構計算加速平臺，適配GPU、ASIC等多種異構AI 芯片，優化編譯代碼，深挖和釋放異構芯片算力，支持TensorFlow、Caffe、PAI等多種深度學習框架，可實現AI框架及算法的無縫遷移適配，支持云變端多場景快速部署，大幅提升AI應用開發效率。

在MLPerf推理性能測試結果1.0版中，震旦異構計算加速平臺，基于8卡NVIDIA A100 GPU配置上性能奪魁，在開放規則的離線場景下取得每秒處理107.8萬張圖片的成績。

首先在頂層算法模型上，使用基于自動機器學習（AutoML）的模型設計方式，這種方式可以獲得比人工設計更高效的模型。震旦基于MIT的先進的神經網絡架構搜索算法Once-For-All。

使用了基于強化學習的自研搜索算法獲得了高性能子網絡；之后通過INT8量化獲得硬件加速繼續提高性能，并在量化前進行深度重訓練，以保證量化后的精度能夠達到測試的精度要求。

IRB即反轉殘差塊（Inverted Residual Block），是用于網絡架構搜索的基本模塊。每個反轉殘差塊包括三層卷積算子，圖上反轉殘差塊的長度代表了該塊的輸出channel數量。

一般機器學習框架的算子實現專注于優化主流的神經網絡架構，而對于NAS的反轉殘差塊則效率不佳，震旦使用了基于自動調優的大規模算子融合技術，大幅提高了推理時算子對GPU的利用率，并且可根據不同的架構自動調優到最佳算子實現。

因此能快速發掘全新GPU架構的潛力，例如對于A100上通過MIG（多實例GPU）技術產生的具有不同計算資源的GPU實例，震旦算子優化技術可以通過自動調優來進一步提升計算資源利用率。

打破紀錄的背后，在硬件平臺上也得益于NVIDIA A100 GPU 強大的算力支持，近5倍于上一代的INT8性能使得超越百萬級性能成為可能。另外，NVIDIA GPU的通用性，即通過CUDA直接對硬件編程，使得用戶可以針對其特有的神經網絡模型進行定制優化，這讓震旦基于GPU的自動算子調優技術成為了現實。

最終獲得的調優算子可以更高效地利用A100最新的Tensor Core硬件指令以及更大的共享內存，從而交出了軟硬件協同優化的滿意答卷。

在MLPerf推理性能測試結果1.0版本圖像分類性能測試中，阿里云震旦異構計算加速平臺，基于NVIDIA A100 GPU平臺和開放規則，在離線場景下以每秒處理107.8萬張圖片的成績，打破了此前谷歌保持的絕對性能榜單的世界紀錄。這也是阿里在通用GPU平臺第一次取得100萬+這樣的成績。

此次阿里云震旦異構計算加速平臺基于NVIDIA通用GPU硬件，通過機器學習模型的自動優化技術，大幅提升了算子的執行效率，刷新了NVIDIA GPU單卡性能。無論是新推出的A100和A10，還是已面市3年的T4，都帶來了單卡性能的大幅提升。

編輯：jq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

asic

asic

+關注

關注
34

文章
1206

瀏覽量
120761
gpu

gpu

+關注

關注
28

文章
4775

瀏覽量
129357
AI芯片

AI芯片

+關注

關注
17

文章
1906

瀏覽量
35216

原文標題：NVIDIA A100 GPU助力阿里云打破MLPerf推理性能測試紀錄

文章出處：【微信號：murata-eetrend，微信公眾號：murata-eetrend】歡迎添加關注！文章轉載請注明出處。

利用NVIDIA DPF引領DPU加速云計算的未來

越來越多的企業開始采用加速計算，從而滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 推出了 DOCA 平臺框架（DPF)，該框架提

發表于 01-24 09:29 ?211次閱讀

利用<b class='flag-5'>NVIDIA</b> DPF引領DPU<b class='flag-5'>加速</b><b class='flag-5'>云</b><b class='flag-5'>計算</b>的未來

異構計算的概念、核心、優勢、挑戰及考慮因素

異構計算就像是一支由“多才多藝”處理器組成的團隊，每個成員都有自己的強項和責任。 ? 什么是異構計算????? “異構計算”指的是在同一個計算平臺

發表于 01-13 11:43 ?353次閱讀

GPU加速云服務器怎么用的

GPU加速云服務器是將GPU硬件與云計算服務相結合，通過云

發表于 12-26 11:58 ?129次閱讀

《CST Studio Suite 2024 GPU加速計算指南》

的各個方面，包括硬件支持、操作系統支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細信息以及相關的使用指南和故障排除等內容。 1. 硬件支持 -

發表于 12-16 14:25

【一文看懂】什么是異構計算？

隨著人工智能、深度學習、大數據處理等技術的快速發展，計算需求的復雜性不斷提升。傳統的單一計算架構已難以滿足高效處理復雜任務的要求，異構計算因此應運而生，成為現代計算領域的一個重要方向。

發表于 12-04 01:06 ?1744次閱讀

詳解Arm計算平臺的優勢

對于人工智能 (AI) 而言，任何單一硬件或計算組件都無法成為適合各類工作負載的萬能解決方案。AI 貫穿從云端到邊緣側的整個現代計算領域，為了滿足不同的 AI 用例和需求，一個可以靈活使用 CPU、GPU 和 NPU 等不同

發表于 12-03 16:53 ?396次閱讀

《算力芯片高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

對卷積核優化的思考。 GPU的存儲體系采用了獨特的倒金字塔結構，在我看來這是其計算性能的關鍵。大容量寄存器設計破解了傳統馮諾依曼架構的內存瓶頸，合并訪存機制巧妙解決了內存帶寬限制。NVIDIA

發表于 11-24 17:12

NVIDIA加速計算如何推動醫療健康

近日，NVIDIA 企業平臺副總裁 Bob Pette 在 AI Summit 一場演講中重點談論了 NVIDIA 加速計算如何推動醫療健康

發表于 11-20 09:10 ?354次閱讀

GPU加速計算平臺是什么

GPU加速計算平臺，簡而言之，是利用圖形處理器（GPU）的強大并行計算能力來

發表于 10-25 09:23 ?294次閱讀

打造異構計算新標桿！國數集聯發布首款CXL混合資源池參考設計

參考設計是首個支持異構計算架構的CXL硬件設備，標志著CXL技術在數據中心領域迎來異構計算新階段。 ? 國數集聯基于FPGA與自主研發的CXL協議IP的先進特性，可實現CPU、GPU、DDR、SSD

發表于 08-06 14:19 ?380次閱讀

AvaotaA1全志T527開發板AMP異構計算簡介

Avaota SBC 的部分平臺內具有小核心 CPU，與大核心一起組成了異構計算的功能。在異構多處理系統中，主核心和輔助核心的存在旨在共同協作，以實現更高效的任務處理。這種協作需要系統采取一系列

發表于 07-24 09:54

異構計算：解鎖算力潛能的新途徑

范式，智慧地解鎖了計算潛能的新境界。異構計算：多元并蓄的智慧之選首先，讓我們揭開異構計算的神秘面紗。簡單來說，異構計算是指將不同類型的計算單

發表于 07-18 08:28 ?9909次閱讀

NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

德國、日本和波蘭的超級計算機利用 Grace-Hopper 和量子-經典加速超算平臺推進量子計算研究 ? ? 德國漢堡 —— 國際超算大會（ISC）—— 2024 年 5 月 13 日

發表于 05-13 15:21 ?226次閱讀

基于NVIDIA Megatron Core的MOE LLM實現和訓練優化

本文將分享阿里云人工智能平臺 PAI 團隊與 NVIDIA Megatron-Core 團隊在 MoE (Mixture of Expert

發表于 03-22 09:50 ?878次閱讀

高通NPU和異構計算提升生成式AI性能?

異構計算的重要性不可忽視。根據生成式AI的獨特需求和計算負擔，需要配備不同的處理器，如專注于AI工作負載的定制設計的NPU、CPU和GPU。

發表于 03-06 14:15 ?894次閱讀

衡阳派盒市场营销有限公司

搜索歷史

阿里云震旦異構計算加速平臺基于NVIDIA Tensor Core GPU

評論

利用NVIDIA DPF引領DPU加速云計算的未來

異構計算的概念、核心、優勢、挑戰及考慮因素

GPU加速云服務器怎么用的

《CST Studio Suite 2024 GPU加速計算指南》

【一文看懂】什么是異構計算？

詳解Arm計算平臺的優勢

《算力芯片高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得：GPU革命：從圖形引擎到AI加速器的蛻變

NVIDIA加速計算如何推動醫療健康

GPU加速計算平臺是什么

打造異構計算新標桿！國數集聯發布首款CXL混合資源池參考設計

AvaotaA1全志T527開發板AMP異構計算簡介

異構計算：解鎖算力潛能的新途徑

NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

基于NVIDIA Megatron Core的MOE LLM實現和訓練優化

高通NPU和異構計算提升生成式AI性能?