衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于Arm Neoverse平臺的處理器革新生成式AI體驗

Arm社區 ? 來源:Arm社區 ? 2025-01-03 15:31 ? 次閱讀

作者:Arm 基礎設施事業部 AI 解決方案架構師 Na Li

(Arm 工程部技術總監 Milos Puzovic 和 Arm 基礎設施事業部軟件工程師 Nobel Chowdary Mandepudi 參與了本文撰寫)

Llama 是一個專為開發者、研究人員和企業打造的開源大語言模型 (LLM) 庫,旨在推動生成式 AI 的創新、實驗及可靠地擴展。Llama 3.1 405B 是 Llama 系列中性能領先的模型之一,然而部署和使用如此大型的模型對缺乏足夠計算資源的個人或企業機構來說具有相當大的挑戰。為了解決上述挑戰,Meta 推出了 Llama 3.3 70B 模型。該模型在保持 Llama 3.1 70B 模型架構的同時,應用了最新的后訓練技術以提升模型評估性能。同時,在推理、數學計算、常識理解、指令遵循和工具使用方面都有顯著改進。盡管 Llama 3.3 70B 模型的體量顯著減小,其性能卻與 Llama 3.1 405B 模型相當。

Arm 工程團隊與 Meta 緊密協作,在 Google Axion 上對 Llama 3.3 70B 模型進行了推理性能評估。Google Axion 是基于 Arm Neoverse V2 平臺構建的定制 AArch64 處理器系列,通過 Google Cloud 提供。與傳統的現成處理器相比,Google Axion 具備更高的性能、更低的能耗以及更強的可擴展性,充分滿足了數據中心在 AI 時代的需求。

基準測試結果顯示,在運行 Llama 3.3 70B 模型時,基于 Axion 處理器的 C4A 虛擬機 (VM) 可提供順暢的 AI 體驗,并在不同的用戶批次大小下均達到了人類可讀性水平,即人們閱讀文本的平均速度,從而使開發者在基于文本的應用中,在獲得與使用 Llama 3.1 405B 模型結果相當的高質量輸出的同時,顯著降低了對大量算力資源的需求。

Google Axion 處理器上運行

Llama 3.3 70B 的 CPU 推理性能

Google Cloud 提供的基于 Axion 的 C4A 虛擬機,最多可配備 72 個虛擬 CPU (vCPU) 和 576 GB RAM。在這些測試中,我們使用了中檔高性價比的 c4a-standard-32 機器類型來部署 4 位量化的 Llama 3.3 70B 模型。為了運行我們的性能測試,我們使用了流行的 Llama.cpp 框架,該框架從 b4265 版本開始,已通過 Arm Kleidi 進行了優化。Kleidi 集成提供了優化的內核,以確保 AI 框架可以充分發揮 Arm CPU 的 AI 功能和性能。下面,我們來看看具體結果。

提示詞編碼速度是指語言模型處理和解釋用戶輸入的速度。如圖 1 所示,由于提示詞編碼利用了多核并行處理技術,因此在不同批次大小的測試中,其性能始終穩定在每秒約 50 個詞元左右。此外,不同提示詞規模測得的速度也相當。

b977af7c-c988-11ef-9310-92fbcf53809c.png

圖 1:運行 Llama 3.3 70B 模型時的提示詞編碼速度

詞元生成速度衡量的是運行 Llama 3.3 70B 模型時模型生成響應的速度。Arm Neoverse CPU 利用先進的 SIMD 指令(如 Neon 和 SVE)優化機器學習 (ML) 工作流,可加速通用矩陣乘法 (GEMM)。為了進一步提高吞吐量,尤其是在處理更大批次時,Arm 引入了專門的優化指令,如有符號點積 (SDOT) 和矩陣乘法累加 (MMLA)。

如圖 2 所示,隨著用戶批次大小的增加,詞元生成的速度相應提升,而在不同詞元生成規模下測得的速度保持相對一致。這種在更大批次下實現更高吞吐量的能力,對于構建高效服務多用戶的可擴展系統至關重要。

b99a8f24-c988-11ef-9310-92fbcf53809c.png

圖 2:運行 Llama 3.3 70B 模型時的詞元生成速度

為了評估多用戶同時與模型交互時每個用戶所感受到的性能,我們測量了每批次詞元的生成速度。每批次詞元的生成速度至關重要,因為這直接影響用戶與模型交互時的實時體驗。

如圖 3 所示,當批次大小最多 4 時,詞元生成速度可實現人類可讀性的平均水平。這表明,隨著系統擴展以滿足多用戶需求,其性能仍然保持穩定。為應對更多并發用戶的需求,可以采用 vLLM 等服務框架。這些框架通過優化 KV 緩存管理顯著提高了系統的可擴展性。

b9b1b3c0-c988-11ef-9310-92fbcf53809c.png

圖 3:不同批次大小下,以批次模式運行 Llama 3.3 70B 模型時每個用戶的提示詞生成速度與人類可讀性的平均水平的對比

革新生成式 AI 體驗

Llama 3.3 70B 模型能夠高效地發揮大規模 AI 的優勢,預示著潛在的變革。由于 Llama 3.3 70B 模型使用較小的參數規模,不僅使生成式 AI 處理技術更容易被生態系統采用,同時也減少了所需的計算資源。此外,Llama 3.3 70B 模型有助于提高 AI 的處理效率,這對于數據中心和云計算工作負載至關重要。在模型評估基準方面,Llama 3.3 70B 的性能也與 Llama 3.1 405B 模型相當。

通過基準測試工作,我們展示了基于 Arm Neoverse 平臺的 Google Axion 處理器在運行 Llama 3.3 70B 模型時可提供流暢高效的體驗,并在多個用戶批次大小測試中實現了與人類可讀性水平相當的文本生成性能。

我們很榮幸能繼續與 Meta 保持密切的合作關系,在 Arm 計算平臺上實現開源 AI 創新,從而確保 Llama LLM 跨硬件平臺順暢、高效地運行。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19406

    瀏覽量

    231159
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9165

    瀏覽量

    369163
  • Neoverse
    +關注

    關注

    0

    文章

    9

    瀏覽量

    4622
  • 生成式AI
    +關注

    關注

    0

    文章

    514

    瀏覽量

    547

原文標題:在基于 Arm Neoverse 平臺的處理器上實現更高效的生成式 AI

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    向Intel發起重型計算挑戰 ARM發布Neoverse 處理器

    ARM 基礎設施事業部總經理 Drew Henry 表示:該公司將處理器技術授權給許多企業,通常會用于智能手機等對功耗較敏感的設備。不過 Neoverse 主要面向計算類基礎設施,包括服務
    發表于 10-17 10:10 ?860次閱讀

    基于NXP iMX6Q ARM處理器的Apalis iMX6Q ARM嵌入平臺

    Parallel Camera Interface,MIPI/CSI-2 串行攝像頭接口,USB接口,網絡接口等。本文所演示的ARM平臺來自于Toradex 基于NXP iMX6Q ARM處理
    發表于 12-29 07:02

    Arm Neoverse N1軟件優化指南

    本文檔提供了有關Neoverse N1管道、指令性能特征和特殊性能注意事項的高級信息。此信息旨在幫助優化Neoverse N1軟件和編譯的人員。有關Neoverse N1
    發表于 08-11 06:56

    Arm Neoverse V2參考設計版本C技術概述

    內存。 支持雙通道內存的接口·基于ARM?Cortex?-M7處理器的系統控制處理器和可管理性控制處理器·ARM?酷睿?調試和跟蹤支持·面向
    發表于 08-11 07:54

    ARM,ARM處理器是什么意思

    ARM,ARM處理器是什么意思 ARM處理器簡介 ARM(Advanced RISC Mach
    發表于 03-26 10:53 ?5304次閱讀

    ARM嵌入處理器結構與應用基礎

    ARM嵌入處理器結構與應用基礎,針對ARM7處理器系列。
    發表于 05-06 16:09 ?9次下載

    ARM推出了一個名叫Neoverse處理器家族,叫板Intel

    ARM 基礎設施事業部總經理 Drew Henry 表示:該公司將處理器技術授權給許多企業,通常會用于智能手機等對功耗較敏感的設備。不過 Neoverse 主要面向計算類基礎設施,包括服務
    的頭像 發表于 10-19 10:07 ?4795次閱讀

    淺談arm處理器的優勢

    目前,世界正在向物聯網、人工智能的潮流邁進,也隨著物理網、人工智能技術上的發展與推進,微處理器技術也在不斷革新,各種新型微處理器的應用也在不斷深入。對于現階段大量32位嵌入應用的出現
    發表于 10-26 10:27 ?1.3w次閱讀

    Arm推出Neoverse處理器家族 大有對標Intel之勢

    從PC時代到移動時代,Arm憑借對ASIC架構的深耕占據了全球90%以上的市場,成為人工智能芯片市場中最被忌憚的巨頭之一。最近,Arm推出了一個名叫Neoverse處理器家族,將為每
    發表于 11-02 17:35 ?1268次閱讀

    ARM推出新一代Neoverse處理器平臺,面向5nm及3nm工藝性能提升30%以上

    作為移動處理器中的霸主,ARM想要搶數據中心處理器市場的野心也不是一天兩天了,為此他們專門推出了Neoverse處理器
    的頭像 發表于 09-23 16:08 ?2092次閱讀
    <b class='flag-5'>ARM</b>推出新一代<b class='flag-5'>Neoverse</b><b class='flag-5'>處理器</b><b class='flag-5'>平臺</b>,面向5nm及3nm工藝性能提升30%以上

    Arm推出新一代平臺 Neoverse V2 平臺

    目前,Arm Neoverse家族包括:V系列、N系列以及E系列。就在今年9月,Arm Neoverse迎來新的進展,推出新一代平臺
    的頭像 發表于 09-26 09:22 ?1489次閱讀

    基于ARM的嵌入電機控制處理器構建的模型設計平臺

    電子發燒友網站提供《基于ARM的嵌入電機控制處理器構建的模型設計平臺.pdf》資料免費下載
    發表于 11-24 14:39 ?0次下載
    基于<b class='flag-5'>ARM</b>的嵌入<b class='flag-5'>式</b>電機控制<b class='flag-5'>處理器</b>構建的模型設計<b class='flag-5'>平臺</b>

    Arm發布新一代Neoverse數據中心計算平臺AI負載性能顯著提升

    據公開信息顯示,Arm去年推出的Neoverse CSS運算子系統提供了包含處理器設計的預驗證平臺,加快了定制SoC上市進程,首發型號為Neover
    的頭像 發表于 02-22 14:48 ?765次閱讀

    Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器

    Arm Neoverse 平臺已成為云服務提供商優化其從芯片到軟件全棧的心儀之選。近日,Google Cloud 推出了基于 Arm Neovers
    的頭像 發表于 04-16 14:30 ?720次閱讀

    ArmArm Neoverse計算子系統(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    Arm宣布了兩款新的Arm Neoverse計算子系統(CSS),它們基于“迄今為止最好的一代Neoverse技術”。是什么讓這些新產品在擁擠的計算技術領域脫穎而出?
    的頭像 發表于 04-24 17:53 ?1186次閱讀
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>計算子系統(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS V3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3
    百家乐官网的嬴钱法| 澳门百家乐官网心德| 澳门百家乐官网网上直赌| 九宫飞星2024年的财位| 百家乐小路是怎么画的| 一起pk棋牌游戏大厅| 大家旺百家乐官网娱乐城| 多台百家乐官网的玩法技巧和规则 | 百家乐官网交流群号| E世博百家乐官网的玩法技巧和规则 | 百家乐俄罗斯轮盘转盘套装| 88真人娱乐城| 十三张百家乐官网的玩法技巧和规则| 免费百家乐官网过滤| ea百家乐系统| 赌博投注| 天堂鸟百家乐官网的玩法技巧和规则 | 澳门百家乐官网官方网站| 威尼斯人娱乐网注册送38元彩金 | 百家乐怎样概率大| 六合彩150期开奖结果| 戒掉百家乐官网的玩法技巧和规则 | 百家乐官网高手论坮| 百家乐怎么推算| 爱玩棋牌官方下载| 百家乐官网游戏卡通| 威尼斯人娱乐城信誉最好| 蓝盾百家乐官网赌场| 金海岸百家乐的玩法技巧和规则| 百家乐官网注册赠分| 百家乐沙| 广宗县| 超级百家乐2龙虎斗| 百家乐官网实时路单| 百家乐棋牌交| 博彩论坛| 百家乐技巧论坛| 乐亭县| 百家乐信息| 玩百家乐官网凤凰娱乐城| 威尼斯人娱乐城官方网|