衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Triton的概念、特性及主要功能

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-18 10:11 ? 次閱讀

NVIDIA Triton 推理服務(wù)器是 NVIDIA AI 平臺(tái)的一部分,它是一款開(kāi)源推理服務(wù)軟件,可助力標(biāo)準(zhǔn)化模型的部署和執(zhí)行,并在生產(chǎn)環(huán)境中提供快速且可擴(kuò)展的 AI。

什么是 NVIDIA Triton?

NVIDIA Triton 推理服務(wù)器可助力團(tuán)隊(duì)在任意基于 GPUCPU 的基礎(chǔ)設(shè)施上部署、運(yùn)行和擴(kuò)展任意框架中經(jīng)過(guò)訓(xùn)練的 AI 模型,進(jìn)而精簡(jiǎn) AI 推理。同時(shí),AI 研究人員和數(shù)據(jù)科學(xué)家可在不影響生產(chǎn)部署的情況下,針對(duì)其項(xiàng)目自由選擇合適的框架。它還幫助開(kāi)發(fā)者跨云、本地、邊緣和嵌入式設(shè)備提供高性能推理。

NVIDIA Triton特性

支持多個(gè)框架

NVIDIA Triton 推理服務(wù)器支持所有主流框架,例如 TensorFlow、NVIDIA TensorRT、PyTorch、MXNet、Python、ONNX、RAPIDS FIL(用于XGBoost、scikit-learn 等)、OpenVINO、自定義 C++ 等。

高性能推理

NVIDIA Triton 支持所有基于 NVIDIA GPU、x86 和 ArmCPU 的推理。它具有動(dòng)態(tài)批處理、并發(fā)執(zhí)行、最優(yōu)模型配置、模型集成和串流輸入等功能,可更大限度地提高吞吐量和利用率。

專(zhuān)為 DevOps 和 MLOps 設(shè)計(jì)

Triton 與 Kubernetes 集成,可用于編排和擴(kuò)展,導(dǎo)出 Prometheus 指標(biāo)進(jìn)行監(jiān)控,支持實(shí)時(shí)模型更新,并可用于所有主流的公有云 AI 和 Kubernetes 平臺(tái)。它還與許多 MLOps 軟件解決方案集成。

各項(xiàng)應(yīng)用中快速且可擴(kuò)展的AI

高推理吞吐量

0f9e53ee-0431-11ed-ba43-dac502259ad0.jpg

NVIDIA Triton 可在單個(gè) GPU 或 CPU 上并行指定相同或不同框架下的多個(gè)模型。在多 GPU 服務(wù)器中,NVIDIA Triton 會(huì)自動(dòng)為基于每個(gè) GPU 的每個(gè)模型創(chuàng)建一個(gè)實(shí)例,以提高利用率。

它還可在嚴(yán)格的延遲限制條件下優(yōu)化實(shí)時(shí)推理服務(wù),通過(guò)支持批量推理來(lái)更大限度地提高 GPU 和 CPU 利用率,并內(nèi)置對(duì)音頻視頻流輸入的支持。對(duì)于需要使用多個(gè)模型來(lái)執(zhí)行端到端推理(例如對(duì)話(huà)式 AI)的用例,Triton 支持模型集成。

模型可在生產(chǎn)環(huán)境中實(shí)時(shí)更新,無(wú)需重啟 Triton 或應(yīng)用。Triton 支持對(duì)單個(gè) GPU 顯存無(wú)法容納的超大模型進(jìn)行多 GPU 以及多節(jié)點(diǎn)推理。

高度可擴(kuò)展的推理

0faecbe8-0431-11ed-ba43-dac502259ad0.jpg

作為一個(gè) Docker 容器,Triton 與 Kubernetes 集成,用于編排、指標(biāo)和自動(dòng)縮放。Triton 還與 Kubeflow 和 Kubeflow 工作流集成,實(shí)現(xiàn)端到端的 AI 工作流,并導(dǎo)出 Prometheus 指標(biāo),用于監(jiān)控 GPU 利用率、延遲、內(nèi)存使用率和推理吞吐量。它支持標(biāo)準(zhǔn)的 HTTP / gRPC 接口,可與 load balancer 等其他應(yīng)用連接,并可輕松擴(kuò)展到任意數(shù)量的服務(wù)器,以為任意模型處理日益增長(zhǎng)的推理負(fù)載。

Triton 可通過(guò)一個(gè)模型控制 API 來(lái)服務(wù)于數(shù)十或數(shù)百個(gè)模型。您可基于為適應(yīng) GPU 或 CPU 顯存而進(jìn)行的改動(dòng),將模型加載到推理服務(wù)器中或從推理服務(wù)器中卸載。支持兼具 GPU 和 CPU 的異構(gòu)集群有助于跨平臺(tái)實(shí)現(xiàn)推理標(biāo)準(zhǔn)化,并動(dòng)態(tài)擴(kuò)展到任意 CPU 或 GPU 以處理峰值負(fù)載。

NVIDIA Triton的主要功能

Triton Forest Inference Library (FIL) 后端

新的 Forest Inference Library (FIL) 后端支持在 CPU 和 GPU 上對(duì)基于樹(shù)的模型進(jìn)行具有可解釋性(Shapley 值)的高性能推理。它支持來(lái)自 XGBoost、LightGBM、scikit-learn RandomForest、RAPIDS cuML RandomForest 以及其他 Treelite 格式的模型。

Triton 模型分析器

Triton 模型分析器是一種自動(dòng)評(píng)估 Triton 部署配置(例如目標(biāo)處理器上的批量大小、精度和并發(fā)執(zhí)行實(shí)例)的工具。它有助于選擇優(yōu)化配置,以滿(mǎn)足應(yīng)用的服務(wù)質(zhì)量(QoS)限制(延遲、吞吐量和內(nèi)存要求),并且可以將找到優(yōu)化配置所需的時(shí)間從數(shù)周縮短到數(shù)小時(shí)。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103726
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9306

    瀏覽量

    86069
  • Triton
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    7060

原文標(biāo)題:DevZone | NVIDIA Triton推理服務(wù)器

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    變頻電源的主要功能及特點(diǎn)

    變頻電源的主要功能及特點(diǎn) 1. 引言 隨著現(xiàn)代工業(yè)自動(dòng)化和智能化的發(fā)展,對(duì)電力供應(yīng)的穩(wěn)定性和靈活性提出了更高的要求。變頻電源作為一種能夠提供可變頻率和電壓的電源設(shè)備,已經(jīng)成為工業(yè)自動(dòng)化領(lǐng)域不可或缺
    的頭像 發(fā)表于 12-04 10:06 ?295次閱讀

    負(fù)載管理器的主要功能

    負(fù)載管理器(Load Manager)是計(jì)算機(jī)系統(tǒng)中的一個(gè)關(guān)鍵組件,它負(fù)責(zé)分配和管理計(jì)算資源,以確保系統(tǒng)運(yùn)行的效率和穩(wěn)定性。負(fù)載管理器的主要功能包括任務(wù)調(diào)度、資源分配、性能監(jiān)控、故障恢復(fù)等。以下
    的頭像 發(fā)表于 10-10 11:26 ?424次閱讀

    數(shù)字化智能工廠的主要功能組成

    數(shù)字化智能工廠是一種基于數(shù)字化技術(shù)和智能化系統(tǒng)的現(xiàn)代制造工廠,主要功能包括自動(dòng)化生產(chǎn)設(shè)備、信息技術(shù)基礎(chǔ)設(shè)施、數(shù)據(jù)采集與分析系統(tǒng)、互聯(lián)互通技術(shù)、人工智能與機(jī)器學(xué)習(xí)、虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)、安全防護(hù)體系和綠色制造。
    的頭像 發(fā)表于 10-08 11:40 ?556次閱讀
    數(shù)字化智能工廠的<b class='flag-5'>主要功能</b>組成

    FPD link主要功能模塊

    電子發(fā)燒友網(wǎng)站提供《FPD link主要功能模塊.pdf》資料免費(fèi)下載
    發(fā)表于 09-27 11:38 ?0次下載
    FPD link<b class='flag-5'>主要功能</b>模塊

    漏洞掃描的主要功能是什么

    漏洞掃描是一種網(wǎng)絡(luò)安全技術(shù),用于識(shí)別計(jì)算機(jī)系統(tǒng)、網(wǎng)絡(luò)或應(yīng)用程序中的安全漏洞。這些漏洞可能被惡意用戶(hù)利用來(lái)獲取未授權(quán)訪(fǎng)問(wèn)、數(shù)據(jù)泄露或其他形式的攻擊。漏洞掃描的主要功能是幫助組織及時(shí)發(fā)現(xiàn)并修復(fù)這些安全
    的頭像 發(fā)表于 09-25 10:25 ?504次閱讀

    電子地圖的主要功能與應(yīng)用

    電子地圖,即數(shù)字地圖,是利用計(jì)算機(jī)技術(shù),以數(shù)字方式存儲(chǔ)和查閱的地圖。它不僅繼承了傳統(tǒng)紙質(zhì)地圖的基本功能,還通過(guò)現(xiàn)代科技手段實(shí)現(xiàn)了諸多創(chuàng)新應(yīng)用。以下是電子地圖的主要功能與應(yīng)用: 一、主要功能 快速存取
    的頭像 發(fā)表于 09-12 11:18 ?2525次閱讀
    電子地圖的<b class='flag-5'>主要功能</b>與應(yīng)用

    GUTOR不間斷電源的主要功能是什么?

    GUTOR不間斷電源的主要功能是什么?
    發(fā)表于 09-06 17:44

    微處理器的主要功能是什么

    微處理器(Microprocessor),作為計(jì)算機(jī)系統(tǒng)的核心部件,其主要功能對(duì)于整個(gè)計(jì)算機(jī)系統(tǒng)的運(yùn)行至關(guān)重要。
    的頭像 發(fā)表于 08-22 11:48 ?2303次閱讀

    RFID天線(xiàn)的工作原理和主要功能

    RFID(Radio Frequency Identification,無(wú)線(xiàn)射頻識(shí)別)天線(xiàn)作為RFID系統(tǒng)中的關(guān)鍵組件,其工作原理和主要功能對(duì)于整個(gè)系統(tǒng)的性能和穩(wěn)定性至關(guān)重要。以下是對(duì)RFID天線(xiàn)工作原理和主要功能的詳細(xì)闡述。
    的頭像 發(fā)表于 08-09 15:38 ?1544次閱讀

    高頻調(diào)諧器的主要功能有哪些

    高頻調(diào)諧器是一種廣泛應(yīng)用于電子通信領(lǐng)域的設(shè)備,其主要功能是對(duì)接收到的高頻信號(hào)進(jìn)行調(diào)諧、濾波、放大等處理,以滿(mǎn)足通信系統(tǒng)對(duì)信號(hào)質(zhì)量的要求。 一、調(diào)諧功能 調(diào)諧功能是高頻調(diào)諧器最基本的功能
    的頭像 發(fā)表于 07-16 16:35 ?919次閱讀

    opencv的主要功能有哪些

    OpenCV(Open Source Computer Vision Library)是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)庫(kù),提供了大量的計(jì)算機(jī)視覺(jué)算法和工具。以下是OpenCV的主要功能: 圖像處理
    的頭像 發(fā)表于 07-16 10:35 ?1763次閱讀

    連接器的主要功能是什么

    連接器的主要功能是實(shí)現(xiàn)電子設(shè)備之間的電氣連接和信號(hào)傳輸。連接器的種類(lèi)繁多,應(yīng)用領(lǐng)域廣泛,其主要功能可以歸納為以下幾點(diǎn): 電氣連接:連接器的主要功能是實(shí)現(xiàn)電子設(shè)備之間的電氣連接。連接器通過(guò)其金屬接觸件
    的頭像 發(fā)表于 06-20 09:22 ?1198次閱讀

    IoT網(wǎng)關(guān)的主要功能有哪些?

    IoT網(wǎng)關(guān)的主要功能,并探討其在實(shí)現(xiàn)物聯(lián)網(wǎng)系統(tǒng)中的關(guān)鍵作用。 一、數(shù)據(jù)聚合與預(yù)處理 IoT網(wǎng)關(guān)的首要功能之一是數(shù)據(jù)聚合。在物聯(lián)網(wǎng)系統(tǒng)中,各種傳感器和設(shè)備會(huì)產(chǎn)生海量的數(shù)據(jù),這些數(shù)據(jù)需要被有效地收集、整理并傳輸?shù)皆贫诉M(jìn)行分析。IoT網(wǎng)
    的頭像 發(fā)表于 06-11 15:55 ?516次閱讀
    IoT網(wǎng)關(guān)的<b class='flag-5'>主要功能</b>有哪些?

    變頻器的主要功能有哪些

    在當(dāng)今的工業(yè)自動(dòng)化領(lǐng)域,變頻器以其獨(dú)特的性能和廣泛的應(yīng)用領(lǐng)域,成為了電力控制設(shè)備中的關(guān)鍵一環(huán)。變頻器不僅具備傳統(tǒng)的電機(jī)調(diào)速功能,還通過(guò)其先進(jìn)的控制技術(shù)和多樣的保護(hù)功能,為現(xiàn)代工業(yè)生產(chǎn)帶來(lái)了諸多便利。本文將對(duì)變頻器的主要功能進(jìn)行詳
    的頭像 發(fā)表于 05-28 17:27 ?1456次閱讀

    接地電阻柜的主要功能是控制和限制接地電流

    中性點(diǎn)接地電阻柜的主要功能是控制和限制接地電流
    的頭像 發(fā)表于 05-09 15:16 ?486次閱讀
    接地電阻柜的<b class='flag-5'>主要功能</b>是控制和限制接地電流
    墓地附近做生意风水| 真钱百家乐官网送钱| 赌百家乐咋赢对方| 凤台县| 水浒传老虎机破解| 现金百家乐伟易博| 玩百家乐官网秘诀| 五张百家乐官网的玩法技巧和规则 | 威尼斯人娱乐网注册| 新宝百家乐网址| 百家乐官网园百利宫娱乐城怎么样百家乐官网园百利宫娱乐城如何 | 电子百家乐假在线哪| 丽都百家乐官网的玩法技巧和规则 | 波浪百家乐测试| 百家乐官网轮盘| 百家乐官网tt娱乐| 爱拼百家乐| 凱旋門百家乐娱乐城| 澳门百家乐游戏说明书| 百家乐官网最新分析仪| 大发888官方网址| 线上百家乐赌法| 百家乐注码调整| 马尼拉百家乐官网的玩法技巧和规则| 百家乐官网有破解的吗| 乐百家国际娱乐城| 威尼斯人娱乐城线上赌博| 百家乐游戏作弊| 澳门百家乐怎么赢钱| 广州百家乐娱乐场| 百家乐有无规律可循| 百家乐官网投资| 百家乐官网那里可以玩| BB百家乐官网大转轮| 365新网址| 大发888怎么能不卡| 免费百家乐统计| 百家乐和的打法| 威尼斯人娱乐平台最新地址| 太阳城俱乐部| 大发888老l|