作者:Arm 基礎設施事業部服務器生態系統開發總監
Bhumik Patel
隨著人工智能 (AI) 技術的迅猛發展,云計算領域正在經歷顯著變革。愈發復雜的 AI 應用對計算解決方案的性能、效率和成本效益提出了更高要求。在云端部署工作負載的客戶正在重新評估其所需的基礎設施,以滿足現代工作負載需求,其中不僅包括提高性能和降低成本,還涵蓋了需符合監管要求或可持續發展目標的新能效基準。
Arm 與亞馬遜云科技 (AWS) 長期合作,為實現性能更強勁、更高效和可持續的云計算提供專用芯片和計算技術。在近期舉行的 AWS re:Invent 2024 大會上,AWS 進一步展示了 AWS Graviton4 所取得的顯著進展,使開發者和企業能夠充分發揮其云工作負載的性能潛力。
卓越的性能表現
相較于上一代 Graviton3 處理器,基于 Arm Neoverse V2 平臺的 AWS Graviton4 處理器在計算性能上提升了 30%,核心數增加了 50%,內存帶寬提高了 75%。憑借這些技術優勢,AWS Graviton 處理器在生態系統和客戶群體中得到了廣泛應用。
Arm Neoverse V2 平臺涵蓋 Armv9 架構的新特性,包括高性能浮點和向量指令支持,以及 SVE/SVE2、Bfloat16 和 INT8 MatMul 等特性。這些特性為 AI/機器學習 (ML) 以及高性能計算 (HPC) 工作負載提供了卓越性能。
AI/ML 工作負載
今年早些時候,Arm 與主流的 AI 框架和軟件生態系統合作,推出了 Arm Kleidi 軟件,以確保 Arm 平臺上開機即用的推理性能優化能惠及整個 ML 棧,開發者無需掌握額外的 Arm 專業知識即可構建其工作負載,從而進一步推動 AI 工作負載的廣泛應用。此前,我們已展示了 PyTorch 中的這些優化如何賦能 AWS Graviton4 上運行大語言模型 (LLM),如 Llama 3 70B 和 Llama 3.1 8B,并顯著改善了每秒生成詞元 (token) 數和詞元首次響應時間的表現指標。
歡迎閱讀《Arm KleidiAI 助力提升 PyTorch 上 LLM 推理性能》一文,詳細了解性能指標的提升細節。
HPC 和 EDA 工作負載
對于 HPC 工作負載,Graviton4 相較于 Graviton3E 在功能上實現了顯著提升。每個核心的主內存帶寬增加了16%,每個 vCPU 的 L2 緩存容量翻倍。這些改進對于 HPC 應用的性能至關重要,因為 HPC 應用通常受限于內存帶寬。AWS 已經在這些領域取得了顯著優勢,如下所示。
根據 Arm 工程團隊實際運行 EDA 工作負載所得出的結果,Graviton4 提供的 RTL 仿真工作負載性能比 Graviton3 高出 37%。
生態系統廣泛采用
近年來,隨著云計算用戶將各種云工作負載部署在 AWS Graviton 處理器上,其軟件生態系統持續擴展。如此一來,客戶不僅節省了費用,收獲了性能的提升,還能優化其碳足跡和可持續發展足跡。以下是部分示例:
著手利用 Graviton 的強大性能
我們堅信 Arm 將在云計算的未來中發揮關鍵作用,同時我們也非常自豪能夠支持 AWS Graviton 立于技術創新的前沿。Arm 將繼續投入,進一步強化我們的軟件生態系統,從而使開發者能夠更加輕松地在 Arm 平臺上構建其應用,并充分利用 Arm 計算平臺所提供的卓越性能和效率優勢。
-
處理器
+關注
關注
68文章
19407瀏覽量
231169 -
ARM
+關注
關注
134文章
9165瀏覽量
369167 -
云計算
+關注
關注
39文章
7859瀏覽量
137856 -
AI
+關注
關注
87文章
31513瀏覽量
270314
原文標題:Arm Neoverse 賦能 AWS Graviton4 處理器,加速云計算創新
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
Arm Neoverse 驅動 AWS Graviton4,加速云計算新時代
強悍的AWS Graviton4處理器及其背后的Arm Neoverse
Arm與AWS合作深化,AWS Graviton4展現顯著進展
Arm Neoverse如何加速實現AI數據中心
亞馬遜云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g實例正式可用
亞馬遜網絡服務即將推出第四代Graviton處理器
ARM進軍汽車芯片市場,推出Neoverse設計
Arm新Arm Neoverse計算子系統(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器
Arm Neoverse CSS V3 助力云計算實現 TCO 優化的機密計算

Arm Neoverse S3 系統 IP 為打造機密計算和多芯粒基礎設施 SoC 夯實根基

Neoverse CSS V3助力云計算實現TCO優化的機密計算

Arm發布Neoverse V3和N3 CPU內核

評論