衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用NVIDIA產品技術組合提升用戶體驗

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 2024-01-17 09:30 ? 次閱讀

案例簡介

本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型,并借助NVIDIA Triton推理服務器在NVIDIA V100 GPU上進行高效部署,幫助必優科技的文檔智能體 UTalk-Doc 將用戶指令識別服務吞吐量提升了 5 倍,單個請求響應時間縮減了三分之一,大幅提升服務運行效率,提升資源利用率。Triton 模型分析能力還協助必優科技,將尋找最佳推理配置所需的時間從數周減少到數小時。

智能體迭代和

用戶增長的并發壓力

必優科技旗下 UTalk-Doc 是新一代協助用戶進行表達的辦公產品。其中“用戶指令識別”能力是產品組成中十分重要的一環。目前該能力主要由底層指令識別深度學習模型提供服務支持。

深度學習模型在運行過程中需要較大的計算量,在用 Pytorch 進行模型的推理時,一方面時延特別大,導致用戶體驗受損;另一方面,顯存占用很大,導致推理請求的并發數上不去,請求失敗的概率太高,只能通過增加機器的方式來提高并發能力,業務部署成本較高;再次,使用的模型經常變化,而業務需要更換后的模型能夠快速地加速和上線部署。NVIDIA GPU 硬件和軟件框架的強大性能幫助企業解決了海量計算需求,滿足了必優科技多模態 office 智能體的迭代和用戶幾何倍增長的并發壓力。

利用 NVIDIA產品技術組合

提升用戶體驗

基于以上挑戰,必優科技選擇了采用 NVIDIA 的 TensorRT-LLM SDK 對模型進行推理加速,并利用 NVIDIA Triton推理服務器在 V100 GPU 上進行在線部署,在提升用戶體驗的同時,大幅降低了服務成本。

通過使用 TensorRT-LLM 對指令識別深度學習模型進行加速,在都使用 FP32 的情況下,與 Pytorch 相對,時延降低 50% 左右。

使用 TensorRT-LLM 結合 NVIDIA V100 GPU 的 FP16 Tensor Core,在保證精度的同時,模型推理的時延進一步降低了 40%。

Triton 的 dynamic batch 及多實例特性,在滿足時延要求的同時,提高了系統整體的并發能力。

TensorRT-LLM 可以對模型進行快速地加速,Triton 則可以對加速后的模型進行快速地部署,滿足了業務對修改后的模型進行快速部署的需求,同時也大大減少了工程人員的工作量。

NVIDIA 賦能文檔智能體

在 NVIDIA 技術和初創加速生態的加持中,必優科技旗下應用產品 ChatPPT(UTalk-Doc)在短短幾個月內自然注冊用戶破 100 萬,同時通過內容表達場景(如 PPT 演示),賦能了如金融、教育、醫療等垂直行業領域客戶,并且在硬件生態合作等方面也做了更多的探索,共同推進整個 AI 行業的快速發展。

“NVIDIA 提供的 GPU 解決方案,解決了深度學習和機器學習的技術難題,是我們公司人工智能道路上一路狂飆所不可或缺的一環。”必優科技創始人兼 CTO 陳潤天博士表示。

必優科技成立于 2020 年,是國內較早期就專注于人工智能領域的智能內容生成技術的科技型公司,公司目前主要圍繞智慧辦公場景做相關業務開發服務,如 2023 年 3 月上線的 Chatppt(AI 生成 PPT)6 個月用戶過百萬;全新下一代產品 UTalk-Doc——不拘泥于格式、自由切換文檔格式的產品,將徹底顛覆、改變和引領下一代 office 產品,幫助用戶更好地進行表達。

NVIDIA 初創加速計劃

必優科技是 NVIDIA 初創加速計劃 (NVIDIA Inception) 會員企業。NVIDIA 初創加速計劃為免費會員制,旨在培養顛覆行業格局的優秀創業公司。該計劃聯合國內外知名的風投機構,創業孵化器,創業加速器,行業合作伙伴以及科技創業媒體等,打造創業加速生態系統。能夠提供產品折扣,技術支持,市場宣傳,融資對接,業務推薦等一系列服務,加速創業公司的發展。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103728
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4777

    瀏覽量

    129360
  • 深度學習
    +關注

    關注

    73

    文章

    5516

    瀏覽量

    121553

原文標題:NVIDIA GPU 解決方案加速必優科技新一代文檔智能體

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA攜手行業巨頭,共促醫療健康產業變革

    近日,NVIDIA宣布了一系列新的合作伙伴關系,旨在通過前沿技術推動醫療健康與生命科學產業的變革。此次合作,NVIDIA將攜手行業內的領先機構,共同加速藥物發現、提升基因組研究水平,并
    的頭像 發表于 01-20 14:02 ?129次閱讀

    NVIDIA技術引領媒體行業AI革新

    近日,媒體行業正醞釀一場技術革命,計劃投入高達3萬億美元,采用NVIDIA的NIM微服務、AI Blueprint等先進技術,旨在簡化AI視頻管線并顯著提升受眾參與度。這一宏大計劃彰顯
    的頭像 發表于 01-16 16:28 ?141次閱讀

    NVIDIA技術助力Pantheon Lab數字人實時交互解決方案

    NVIDIA Triton,Pantheon Lab 訓練速度提高 10 倍、推理延遲降低 50%,以及用戶參與度提升 30%。這些進步使對話式 AI 能夠提供實時且真實的互動,使 Pantheon Lab 在數字人
    的頭像 發表于 01-14 11:19 ?259次閱讀

    戴爾科技集團推出全新PC產品組合,驅動行業創新

    戴爾科技集團,憑借數十年的PC創新經驗,近日推出了全新設計的PC產品組合,旨在大幅提升終端用戶的創造力和生產力。 此次推出的產品組合,采用了簡化的設計理念,搭載了前沿的設備端AI
    的頭像 發表于 01-10 14:41 ?190次閱讀

    借助NVIDIA GPU提升魯班系統CAE軟件計算效率

    本案例中魯班系統高性能 CAE 軟件利用 NVIDIA 高性能 GPU,實現復雜產品的快速仿真,加速產品開發和設計迭代,縮短開發周期,提升
    的頭像 發表于 12-27 16:24 ?233次閱讀

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開發了一個全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發表于 11-27 11:29 ?431次閱讀

    全球大型電子產品制造商利用 Omniverse 和 AI 制定計劃

    ikan 全球大型電子產品制造商利用基于 NVIDIA Omniverse 構建的數字孿生和工業 AI 使工廠快速虛擬化。 為了滿足目前已全面投產的 Blackwell 的需求,全球大型電子
    的頭像 發表于 11-23 14:57 ?649次閱讀

    Foxconn利用NVIDIA AI和Omniverse訓練機器人

    全球最大電子制造商 Foxconn 正準備制造 NVIDIA 最復雜的產品之一,并開始使用 NVIDIA Omniverse 和 Isaac 平臺驅動的數字孿生。
    的頭像 發表于 10-10 09:40 ?479次閱讀

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

    DolphinDB 是一家高性能數據庫研發企業,也是 NVIDIA 初創加速計劃成員,其開發的產品基于高性能分布式時序數據庫,是支持復雜計算和流數據分析的實時計算平臺,適用于金融、電力、物聯網和零售等行業。
    的頭像 發表于 09-09 09:57 ?530次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> RAPIDS加速DolphinDB Shark平臺<b class='flag-5'>提升</b>計算性能

    初創公司SEA.AI利用NVIDIA邊緣AI和計算機視覺技術變革航海安全系統

    總部位于奧地利林茨的初創公司正在利用 NVIDIA 邊緣 AI 和計算機視覺技術變革航海安全系統,讓每一次出海變得更安全。
    的頭像 發表于 09-09 09:32 ?595次閱讀

    NVIDIA賦能理想汽車共同推進智能駕駛和智能座艙技術創新

    智能化已成為汽車行業發展的新引擎,NVIDIA 正在賦能理想汽車共同推進智能駕駛和智能座艙技術創新。 ? 作為中國新能源汽車制造商和造車新勢力頭部企業之一,理想汽車深耕智能駕駛領域。通過利用
    的頭像 發表于 07-01 18:21 ?1808次閱讀

    NVIDIA 通過 Holoscan 為 NVIDIA IGX 提供企業軟件支持

    Enterprise-IGX軟件現已在NVIDIA IGX平臺上正式可用,以滿足工業邊緣對實時 AI 計算日益增長的需求。它們將共同幫助醫療、工業和科學計算領域的解決方案提供商利用企業級軟件和支持來加快開發
    的頭像 發表于 06-04 10:21 ?568次閱讀

    沃爾沃利用英偉達的SoC和AI來提升自動駕駛的安全性

    在2024年英偉達GPU技術大會(NVIDIA GTC 2024)上,沃爾沃介紹了如何利用人工智能和日益提升的算力來提升自動駕駛的安全性。
    的頭像 發表于 05-08 14:38 ?1285次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱 Embedding 全置于 GPU 上進行
    的頭像 發表于 04-20 09:39 ?823次閱讀

    SAP與NVIDIA攜手加速生成式AI在企業應用中的普及

    SAP SE 和 NVIDIA 宣布深化合作,致力于加速企業客戶在 SAP 云解決方案和應用組合利用數據和生成式 AI 的變革力量。
    的頭像 發表于 03-22 10:02 ?673次閱讀
    百家乐官网永利娱乐城| 95博彩通| 足球比分直播| 潮安县| 百家乐官网投注方法网| 百家乐官网怎么才能| 24山先天分房| 百家乐新庄| 大发888娱乐场下| 百家乐视频游戏网址| 如何赢百家乐的玩法技巧和规则| 大发888真人网站| 菲律宾太阳城官方网| 百家乐官网买闲打法| 网络百家乐的陷阱| 威尼斯人娱乐网反| 嘉峪关市| 百家乐官网智能投注系统| 凯时百家乐技巧| 百家乐三珠投注法| 大发888赌场网址| 百家乐官网娱乐城提款| 24山家坐向| 海南太阳城大酒店| 网上百家乐官网好玩吗| 百家乐官网技巧| 太阳城官方网| 百家乐官网娱乐城代理| 百家乐有没有攻略| 大发888官方指定下载| 百家乐官网输了好多钱| 百家乐网上投注网站| 丹东棋牌网| 澳门百家乐官网赌| 博必发百家乐的玩法技巧和规则 | 百家乐官网的桌子| 海威百家乐赌博机| 国际环球娱乐| 百家乐官网手机壳| 大发888开户注册首选| 乐天堂百家乐官网娱乐平台|