衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力騰訊AI LAB打造一體AI生態

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 10:50 ? 次閱讀

案例簡介

? 本案例中通過使用NVIDIA T4 GPUTensorRT,OpenGL,CUDA, CUDA/OpenGL interoperability等GPU軟件技術棧,助力騰訊AI LAB虛擬人項目在人臉生成階段達到了超過3倍的加速。

? 本案例主要應用到 NVIDIA T4 GPU,TensorRT, OpenGL,CUDA, CUDA/OpenGL interoperability等AI加速平臺。

客戶簡介及應用背景

騰訊AI LAB致力于打造產學研用一體的 AI 生態,主要的研究方向包括計算機視覺語音識別、自然語言處理和機器學習,結合騰訊場景與業務優勢,在社交AI,游戲AI,內容AI及平臺AI等領域取得了顯著的成果,技術被應用于微信、QQ、天天快報和QQ音樂等上百個騰訊產品。其中圍棋AI “絕藝” 多次獲得世界人工智能圍棋大賽的冠軍。

騰訊AI LAB打造的虛擬人,具有自然,生動且飽含情緒的表情,其背后由一套騰訊 AI Lab 自研的復雜系統支撐,系統首先要從文本中提取不同信息,包括表情、情感、重音位置、和激動程度等;之后,這些信息被輸入到模型中生成,再同步生成語音、口型和表情參數,最終才有了虛擬人自然生動的表現。

客戶挑戰

根據虛擬人物需要表達的語言和情感,生成自然生動的人臉,是打造虛擬人重要的一個階段。需要先渲染人臉的紋理圖和渲染圖,并將它們輸入到深度學習模型中,最終生成自然生動的人臉。在這個過程中,需要用到OpenGL、OpenCV、CUDA、TensorFlow等軟件技術,騰訊原有的方案有很多CPU與GPU的數據交互,且有很多計算型的操作通過CPU來實現,效率非常低下, 無論是吞吐還是延時都不滿足要求,具體體現在:

OpenGL在GPU上渲染好圖像繪制到framebuffer后,需要先用glReadPixels拷貝數據到CPU,再用cudaMemcpy將數據從CPU拷回到GPU以進行深度學習模型的推理,這里有兩次不必要的CPU與GPU之間的數據傳輸。

顏色空間轉換,深度學習推理的前后處理等操作在CPU上完成,效率非常低下。

應用方案

NVIDIA 技術在虛擬人項目的渲染和推理階段均提供了強大的支持。在渲染階段,NVIDIA 助力提升了顏色空間轉換效率,降低整體延時,主要體現在:

用NVIDIA CUDA/OpenGL interoperability 代替騰訊之前使用glReadPixels在CUDA和OpenGL之間拷貝數據的方案,大幅減少了CPU和GPU之間的數據拷貝,從而降低了整體的延時。

把原來在CPU上做的顏色空間轉換的操作,遷移到NVIDIA T4 GPU上用CUDA kernel實現,利用GPU的并行優勢,大大提高了顏色空間轉換的效率,進一步降低了整體的延時。

將多幀的mesh組成一個batch分別繪制到framebuffer的不同區域,在提高OpenGL并行度的同時,給下一階段的深度學習模型的推理提供了更大的輸入數據的batch size,充分發揮NVIDIA T4 GPU高并發計算的優勢,進一步提高GPU的利用率,從而提高整體的吞吐。

在推理階段,NVIDIA助力提高推理整體吞吐,降低推理延時,主要體現在以下幾點:用NVIDIA TensorRT替換TensorFlow對模型推理進行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性,在最終視覺效果幾乎不變的情況下,進一步提升推理的吞吐,降低推理延時。

用NVIDIA TensorRT替換TensorFlow對模型推理進行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性,在最終視覺效果幾乎不變的情況下,進一步提升推理的吞吐,降低推理延時。

在NVIDIA T4 GPU上利用CUDA kernel 替代原始流程中在CPU上使用OpenCV實現 Mat-to-Tensor 和 Tensor-to-Mat 等格式轉換操作,并使用OpenCV-CUDA版替換OpenCV-CPU版的部分操作(如Resize等),充分發揮GPU相對于CPU更高的并發優勢,在加速這些操作的同時減少GPU到CPU的數據傳輸通信量,提高格式轉換效率,降低端到端的推理延時。

通過Pipeline的方式,使GPU和CPU上的操作進行overlap,并結合NVIDIA的MPS技術提高單卡上多個進程同時處理多個數據流的同時提高整體的吞吐。

使用效果及影響

在虛擬人項目中,NVIDIA CUDA技術大幅提升了渲染速度,NVIDIA TensorRT 方便快速地加速深度學習模型的推理,結合MPS技術,實現了單卡多路推流,使整體推理效率達到了原來的三倍!性能的大幅提升,既提升了GPU的利用率,又降低了AI技術的使用成本。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103723
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4775

    瀏覽量

    129357
  • AI
    AI
    +關注

    關注

    87

    文章

    31520

    瀏覽量

    270335
收藏 人收藏

    評論

    相關推薦

    NVIDIA技術助力Pantheon Lab數字人實時交互解決方案

    NVIDIA Triton,Pantheon Lab 訓練速度提高 10 倍、推理延遲降低 50%,以及用戶參與度提升 30%。這些進步使對話式 AI 能夠提供實時且真實的互動,使 Pantheon
    的頭像 發表于 01-14 11:19 ?257次閱讀

    NVIDIA推出可分析視頻的AI智能藍圖

    由 Metropolis 驅動的全新 NVIDIA AI Blueprint 可助力企業和個人提高生產力、增強安全性,甚至還能幫助 NVIDIA 首席執行官提升快球投球水平。
    的頭像 發表于 01-09 11:10 ?283次閱讀

    NVIDIA推出多個生成式AI模型和藍圖

    NVIDIA 宣布推出多個生成式 AI 模型和藍圖,將 NVIDIA Omniverse 一體化進步擴展至物理
    的頭像 發表于 01-08 10:48 ?163次閱讀

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造
    的頭像 發表于 01-06 10:45 ?224次閱讀

    麗臺科技推出WS3008 AI一體

    隨著 AI 技術的不斷進步和商業應用的深入探索,AI 一體機作為企業智能化轉型的重要載體,正逐步展現出其獨特的價值和潛力。為適用于更多企業轉型需求以及更靈活的場景化要求,麗臺科技現推出 AI
    的頭像 發表于 11-27 11:11 ?354次閱讀

    賴耶科技通過NVIDIA AI Enterprise平臺打造超級AI工廠

    NVIDIA 技術團隊保持合作。賴耶科技通過NVIDIA AI Enterprise平臺打造的超級 AI 工廠,致力于加速大模型場景應用
    的頭像 發表于 11-19 14:55 ?490次閱讀

    NVIDIA助力Amdocs打造生成式AI智能

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發和交付基于商用大語言模型(LLM)和領域適配模型的解決方案。該公司還在使用NVIDIA
    的頭像 發表于 11-19 14:48 ?419次閱讀

    使用全新NVIDIA AI Blueprint開發視覺AI智能

    為提高生產力、優化流程和創造更加安全的空間,埃森哲、戴爾科技和聯想等公司正在使用全新 NVIDIA AI Blueprint 開發視覺 AI 智能
    的頭像 發表于 11-06 13:58 ?518次閱讀

    NVIDIA助力印度打造AI基礎設施

    在孟買舉辦的 NVIDIA AI Summit 上,黃仁勛和穆克什·安巴尼(Mukesh Ambani)探討了關于 AI 基礎設施的投資,這些投資有望為各行各業帶來變革。
    的頭像 發表于 10-27 09:44 ?318次閱讀

    存算一體架構創新助力國產大算力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發表了題為《存算一體架構創新助力國產大算力AI芯片騰飛》的演講。
    的頭像 發表于 10-23 14:48 ?418次閱讀

    如何選擇合適的邊緣ai分析一體機解決方案

    的解決方案,成為企業決策者亟需解決的問題。本文將從需求分析、技術考量、生態兼容及未來可擴展性四個方面,探討如何科學合理地選擇合適的邊緣AI分析一體機。、明確需求分析
    的頭像 發表于 08-08 15:25 ?295次閱讀
    如何選擇合適的邊緣<b class='flag-5'>ai</b>分析<b class='flag-5'>一體</b>機解決方案

    微鏈道愛加入元腦生態,將打造AI視覺標注訓練一體

    北京2024年7月8日?/美通社/ --?近日,北京微鏈道愛科技有限公司(簡稱"微鏈道愛")與浪潮信息簽署元腦生態戰略合作協議。雙方將共同打造AI視覺標注訓練一體機,支持高效的數據標注
    的頭像 發表于 07-08 15:31 ?444次閱讀

    賽輪思與NVIDIA合作,利用生成式AI打造代車內體驗

    AI 驅動的移動出行創新企業與 NVIDIA 合作,打造代車內體驗。
    的頭像 發表于 05-23 10:12 ?1300次閱讀

    高德將打造時空智能應用生態助力智慧城市向時空智能城市進化

    5月20日,在AI Day技術開放日活動上,高德地圖旗下高德云圖宣布將逐步開放云睿時空融合大模型和云境AI三維重建平臺,打造時空智能應用生態
    的頭像 發表于 05-21 14:27 ?700次閱讀
    高德將<b class='flag-5'>打造</b>時空智能<b class='flag-5'>體</b>應用<b class='flag-5'>生態</b>,<b class='flag-5'>助力</b>智慧城市向時空智能城市進化

    潤和軟件基于華為昇騰AI打造的IntelliCore AI解決方案一體

    江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)基于華為昇騰AI打造的IntelliCore AI解決方案一體機,提供全方位的AI與數據服
    的頭像 發表于 05-09 09:18 ?1142次閱讀
    潤和軟件基于華為昇騰<b class='flag-5'>AI</b>所<b class='flag-5'>打造</b>的IntelliCore <b class='flag-5'>AI</b>解決方案<b class='flag-5'>一體</b>機
    百家乐官网园是真的不| 莆田棋牌游戏| 百家乐官网怎么玩啊| 免费百家乐规律| 大发888游戏平台hg dafa888 gw| 百家乐官网推广| 新锦江百家乐官网娱乐网| 爱拼百家乐的玩法技巧和规则| 博彩乐百家乐官网平台| 澳门百家乐限红规则| 米易县| 百家乐盈利分析路单| 777博彩| 玩百家乐678娱乐城| 新泰市| 视频百家乐信誉| 冀州市| 百家乐娱乐平台真人娱乐平台| 平遥县| 百家乐赌局| 视频百家乐官网试玩| 百家乐是真人发牌吗| 百家乐官网送彩金网络| 新全讯网3344111| 金满堂百家乐官网的玩法技巧和规则| 大发888亚洲游戏平台| 克拉克百家乐官网的玩法技巧和规则| 赌球开户| 澳门百家乐有赢钱的吗| 百家乐官网有方法赚反水| 机械百家乐官网技巧| 太子百家乐的玩法技巧和规则 | 手机百家乐能兑换现金棋牌游戏| 百家乐官网高手心得| 德州扑克2| 澳门百家乐娱乐城注册| 百家乐官网最佳下注方法| 威尼斯人娱乐城好不好| 正规百家乐官网平注法口诀| 常州市| 威尼斯人娱乐网代理注|