足球经营类游戏,赌球澳盘,鼎兴棋牌游戏(中国)·官方网站

大部分要學(xué)習(xí) Triton 推理服務(wù)器的入門者，都會被搜索引擎或網(wǎng)上文章引導(dǎo)至官方的https://developer.nvidia.com/nvidia-triton-inference-server處（如下截圖），然后從 “Get Started” 直接安裝服務(wù)器與用戶端軟件、創(chuàng)建基礎(chǔ)的模型倉、執(zhí)行一些最基本的范例。

這條路徑雖然能在很短時(shí)間內(nèi)跑起 Triton 的應(yīng)用，但在未掌握整個(gè)應(yīng)用架構(gòu)之前便貿(mào)然執(zhí)行，反倒容易讓初學(xué)者陷入迷失的狀態(tài)，因此建議初學(xué)者最好先對 Triton 項(xiàng)目有比較更完整的了解之后，再執(zhí)行前面的 “Get Started” 就會更容易掌握項(xiàng)目的精髓。

要獲得比較完整的 Triton 技術(shù)資料，就得到項(xiàng)目開源倉里去尋找。與 NVIDIA 其他放在 https://github.com/NVIDIA或https://github.com/NVIDIA-AI-IOT的項(xiàng)目不同，Triton 項(xiàng)目有獨(dú)立的開源倉，位置在https://github.com/triton-inference-server，進(jìn)入開源倉后會看到如下截屏的內(nèi)容：

下面列出四大部分的技術(shù)資源：

1. Getting Start（新手上路）：

這里提供三個(gè)鏈接，比較重要的是 “Quick Start（快速啟動(dòng)）” 的部分，提供以下三個(gè)步驟就能輕松執(zhí)行 Triton 的基礎(chǔ)示范：

(1) Create a Model Repository（創(chuàng)建模型倉）

(2) Launch Triton（啟動(dòng)Triton服務(wù)器與用戶端）

(3) Send an Inference Request（提交推理要求）

2. Production Documentation（生產(chǎn)文件）：

這里最重要的是 “server documents on GitHub” 鏈接，點(diǎn)進(jìn)去后會進(jìn)入整個(gè) Triton 項(xiàng)目中最完整的技術(shù)文件中心（如下圖），除 Installation 與 Getting Started 屬于入門范疇，其余 User Guide、API Guide、Additional Resources 與 Customization Guide 等四個(gè)部分，都是 Triton 推理服務(wù)器非常重要的技術(shù)內(nèi)容。

因此這個(gè)部分可以算得上是學(xué)習(xí) Triton 服務(wù)器的最重要資源。

例如點(diǎn)擊 “User Guide” 之后，就會看到以下所條例的執(zhí)行步驟：

Creating a Model Repository

Writing a Model Configuration

Buillding a Model Pipeline

Managing Model Availablity

Collecting Server Metrics

Supporting Custom Ops/layers

Using the Client API

Analyzing Performance

Deploying on edge (Jetson)

3. Examples（范例）：

這里的范例，比較重要的是指向https://github.com/NVIDIA/DeepLearningExamples鏈接，列出針對 NVIDIA Tensor Core 計(jì)算單元的深度學(xué)習(xí)模型列表，包括計(jì)算機(jī)視覺、NLP 自然語言處理、推薦系統(tǒng)、語音轉(zhuǎn)文字 / 文字轉(zhuǎn)語音、圖形神經(jīng)網(wǎng)絡(luò)、時(shí)間序列等各種神經(jīng)網(wǎng)絡(luò)模型細(xì)節(jié)，包括網(wǎng)絡(luò)結(jié)構(gòu)與相關(guān)參數(shù)的內(nèi)容。

對于未來要在 Triton 服務(wù)器上，對于所使用的網(wǎng)絡(luò)后端進(jìn)行性能優(yōu)化或者創(chuàng)建新的后端，會有很大的助益，但是對于初學(xué)者來說是相對艱澀的，因此現(xiàn)階段先不做深入的說明與示范。

4. Feedback（反饋）：

這里會鏈接到https://github.com/triton-inference-server/server/issues問題中心，是 Triton 項(xiàng)目中最重要的技術(shù)問題解決資源之一，后面執(zhí)行過程中所遇到的問題，都可以先到這里來查看是否有人已經(jīng)提出？如果沒有的話，也可以在這里提交自己所遇到的問題，項(xiàng)目負(fù)責(zé)人會提供合適的回復(fù)。

以上第 2、4 兩項(xiàng)資源，對初學(xué)者來說會有最大的幫助。接著看一下項(xiàng)目里 “釘住（Pinned）” 的 6 個(gè)倉（如下圖），是比較重要的基礎(chǔ)部分，涵蓋了 Triton 架構(gòu)圖中的主要板塊。

主要內(nèi)容如下：

1. server 倉：

這里集成整個(gè)項(xiàng)目的主要內(nèi)容，包括幾部分：

(1)deploy（部署）：提供在阿里巴巴、亞馬遜等云資源的部署方式，以及基于 NVIDIA Fleet 指令集、GKE（Google kubernets Engine）、k8s、Helm 等應(yīng)用平臺的各種部署方法；

(2)docker（容器）：修正一些創(chuàng)建容器腳本的錯(cuò)誤；

(3)docs（使用說明）：就是前面 “生產(chǎn)文件（Production Documentation）” 的內(nèi)容，這里不重復(fù)贅述；

(4)qa（質(zhì)量優(yōu)化）：由于 Triton 推理服務(wù)器有非常多優(yōu)化的環(huán)節(jié)，在這個(gè)目錄下提供上百個(gè)不同狀況的優(yōu)化測試腳本；

(5)src（源代碼）：目錄下存放整個(gè) Triton 推理服務(wù)器的開源代碼（.cc）、頭文件（.h）與編譯腳本（CMakeLists.txt）；

(6)其他代碼與腳本

2. core 倉：

此存儲庫包含實(shí)現(xiàn) Triton 核心功能的庫的源代碼和標(biāo)頭。核心庫可以如下所述構(gòu)建，并通過其 CAPI 直接使用。為了有用，核心庫必須與一個(gè)或多個(gè)后端配對。您可以在后端回購中了解有關(guān)后端的更多信息。

3. backend 倉：

提供創(chuàng)建 Triton 服務(wù)器后端（backend）的源代碼、腳本與工具。“后端” 是用來執(zhí)行不同深度學(xué)習(xí)模型的管理模塊，以深度學(xué)習(xí)框架進(jìn)行封裝，例如 PyTorch、Tensorflow、ONNX Runtime 與 TensorRT 等等，用戶也可以為了性能目的，自行定義 C / C++ 封裝方式。

4. client 倉：

提供 Triton 用戶端的 C++ / Python / Java 開發(fā)接口、能生成適用于不同編程語言的 GRPC 開發(fā)接口的 protoc 編譯器，以及對應(yīng)的用戶端范例；

5. model_analyzer 倉：

深度學(xué)習(xí)模型（model）是 Triton 推理服務(wù)器的最基礎(chǔ)組成元件，因此對分析模型的計(jì)算與內(nèi)存需求是服務(wù)器性能的一項(xiàng)關(guān)鍵功能。這個(gè) model_analyzer 模型分析工具是一種 CLI 工具，這款新工具可以自動(dòng)化地從數(shù)百種組合中為 AI 模型選擇最佳配置，以實(shí)現(xiàn)最優(yōu)性能，同時(shí)確保應(yīng)用程序所需的服務(wù)質(zhì)量，能幫助開發(fā)人員更好地了解不同配置中的權(quán)衡，并選擇能夠最大化 Triton 的性能配置；

6. model_navigator 倉：

這個(gè) model_navigator 模型導(dǎo)航器是一種能夠自動(dòng)將模型從源移動(dòng)到最佳格式和配置的工具，支持將模型從源導(dǎo)出為所有可能的格式，并應(yīng)用 Triton 服務(wù)器的后端優(yōu)化。使用模型分析器能找到最佳的模型配置，匹配提供的約束條件并優(yōu)化性能。

以上是 Triton 開源項(xiàng)目里比較核心的 6 個(gè)倉，另外還有 20 多個(gè)代碼倉，其中大約 15 個(gè)是項(xiàng)目提供的后端（backend）擴(kuò)充應(yīng)用，例如 tensorrt_backend、fil_backend、square_backend 等等，以及一些額外的管理工具，并且不斷增加中。

本系列后面的內(nèi)容都會基于這個(gè) server 倉的 docs 目錄下的內(nèi)容為主，按部就班地帶著讀者循序漸進(jìn)創(chuàng)建與調(diào)試 Triton 推理服務(wù)器的運(yùn)作環(huán)境。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5076

瀏覽量
103718
服務(wù)器

服務(wù)器

+關(guān)注

關(guān)注
12

文章
9303

瀏覽量
86061

原文標(biāo)題：NVIDIA Triton 系列文章（3）：開發(fā)資源說明

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

Triton編譯器與GPU編程的結(jié)合應(yīng)用

Triton編譯器簡介 Triton編譯器是一種針對并行計(jì)算優(yōu)化的編譯器，它能夠自動(dòng)將高級語言代碼轉(zhuǎn)換為針對特定硬件優(yōu)化的低級代碼。Triton編譯器的核心優(yōu)勢在于其能夠識別并行模式，自動(dòng)進(jìn)行代碼

發(fā)表于 12-25 09:13 ?323次閱讀

Triton編譯器如何提升編程效率

在現(xiàn)代軟件開發(fā)中，編譯器扮演著至關(guān)重要的角色。它們不僅將高級語言代碼轉(zhuǎn)換為機(jī)器可執(zhí)行的代碼，還通過各種優(yōu)化技術(shù)提升程序的性能。Triton 編譯器作為一種先進(jìn)的編譯器，通過多種方式提升編程效率，使得

發(fā)表于 12-25 09:12 ?333次閱讀

Triton編譯器在高性能計(jì)算中的應(yīng)用

高性能計(jì)算（High-Performance Computing，HPC）是現(xiàn)代科學(xué)研究和工程計(jì)算中不可或缺的一部分。隨著計(jì)算需求的不斷增長，對計(jì)算資源的要求也越來越高。Triton編譯器作為一種

發(fā)表于 12-25 09:11 ?352次閱讀

Triton編譯器的優(yōu)化技巧

在現(xiàn)代計(jì)算環(huán)境中，編譯器的性能對于軟件的運(yùn)行效率至關(guān)重要。Triton 編譯器作為一個(gè)先進(jìn)的編譯器框架，提供了一系列的優(yōu)化技術(shù)，以確保生成的代碼既高效又適應(yīng)不同的硬件架構(gòu)。 1. 指令選擇

發(fā)表于 12-25 09:09 ?340次閱讀

Triton編譯器的優(yōu)勢與劣勢分析

Triton編譯器作為一種新興的深度學(xué)習(xí)編譯器，具有一系列顯著的優(yōu)勢，同時(shí)也存在一些潛在的劣勢。以下是對Triton編譯器優(yōu)勢與劣勢的分析：優(yōu)勢高效性能優(yōu)化： Triton編譯器

發(fā)表于 12-25 09:07 ?385次閱讀

Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

1. Triton編譯器概述 Triton編譯器是NVIDIA Triton推理服務(wù)平臺的一部分，它負(fù)責(zé)將深度學(xué)習(xí)模型轉(zhuǎn)換為優(yōu)化的格式，以便在NVI

發(fā)表于 12-24 18:13 ?518次閱讀

Triton編譯器支持的編程語言

編寫和優(yōu)化深度學(xué)習(xí)代碼。Python是一種廣泛使用的高級編程語言，具有簡潔易讀、易于上手、庫豐富等特點(diǎn)，非常適合用于深度學(xué)習(xí)應(yīng)用的開發(fā)。二、領(lǐng)域特定語言（DSL） Triton也提供了一種針對深度學(xué)習(xí)領(lǐng)域的特定編程語言（DSL），這種語言是基于C/C++或Python等

發(fā)表于 12-24 17:33 ?457次閱讀

Triton編譯器與其他編譯器的比較

Triton編譯器與其他編譯器的比較主要體現(xiàn)在以下幾個(gè)方面：一、定位與目標(biāo) Triton編譯器：定位：專注于深度學(xué)習(xí)中最核心、最耗時(shí)的張量運(yùn)算的優(yōu)化。目標(biāo)：提供一個(gè)高度抽象、靈活、高效

發(fā)表于 12-24 17:25 ?483次閱讀

Triton編譯器功能介紹 Triton編譯器使用教程

Triton 是一個(gè)開源的編譯器前端，它支持多種編程語言，包括 C、C++、Fortran 和 Ada。Triton 旨在提供一個(gè)可擴(kuò)展和可定制的編譯器框架，允許開發(fā)者添加新的編程語言特性和優(yōu)化技術(shù)

發(fā)表于 12-24 17:23 ?637次閱讀

NVIDIA與印度攜手計(jì)劃聯(lián)合開發(fā)定制AI芯片

　10月23日，有媒體報(bào)道稱，NVIDIA正計(jì)劃與印度攜手開發(fā)人工智能芯片，旨在充分利用印度豐富的半導(dǎo)體設(shè)計(jì)人才資源，并深入開拓印度這一快速增長的市場。　　此次合作不僅有助于NVIDI

發(fā)表于 10-23 11:50 ?474次閱讀

NVIDIA助力提供多樣、靈活的模型選擇

在本案例中，Dify 以模型中立以及開源生態(tài)的優(yōu)勢，為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務(wù)器產(chǎn)品，為

發(fā)表于 09-09 09:19 ?535次閱讀

新款Nvidia Titan GPU正在開發(fā)中？或?qū)魯∥窗l(fā)布的RTX 5090

ABSTRACT摘要最近有消息透露，NVIDIA正在開發(fā)一款名為TITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發(fā)布其RTX40系列

發(fā)表于 07-26 08:26 ?584次閱讀

機(jī)智云助力小程序開發(fā)：連接智能硬件與智能生活

捷、智能的生活體驗(yàn)。豐富的開發(fā)資源機(jī)智云提供了豐富的開發(fā)資源和文檔支持，為小程序開發(fā)者提供了詳盡的開發(fā)指南和示例代碼，幫助他們快速上手，實(shí)現(xiàn)智能硬件與小程序的連接。

發(fā)表于 06-15 08:10 ?498次閱讀

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

這家云計(jì)算巨頭的計(jì)算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。

發(fā)表于 02-29 14:04 ?634次閱讀

在AMD GPU上如何安裝和配置triton？

最近在整理python-based的benchmark代碼，反過來在NV的GPU上又把Triton裝了一遍，發(fā)現(xiàn)Triton的github repo已經(jīng)給出了對應(yīng)的llvm的commit id以及對應(yīng)的編譯細(xì)節(jié)，然后跟著走了一遍，也順利的安裝成功，只需要按照如下方式即可完

發(fā)表于 02-22 17:04 ?2588次閱讀

衡阳派盒市场营销有限公司

搜索歷史

NVIDIA Triton系列文章：開發(fā)資源說明

評論

Triton編譯器與GPU編程的結(jié)合應(yīng)用

Triton編譯器如何提升編程效率

Triton編譯器在高性能計(jì)算中的應(yīng)用

Triton編譯器的優(yōu)化技巧

Triton編譯器的優(yōu)勢與劣勢分析

Triton編譯器在機(jī)器學(xué)習(xí)中的應(yīng)用

Triton編譯器支持的編程語言

Triton編譯器與其他編譯器的比較

Triton編譯器功能介紹 Triton編譯器使用教程

NVIDIA與印度攜手計(jì)劃聯(lián)合開發(fā)定制AI芯片

NVIDIA助力提供多樣、靈活的模型選擇

新款Nvidia Titan GPU正在開發(fā)中？或?qū)魯∥窗l(fā)布的RTX 5090

機(jī)智云助力小程序開發(fā)：連接智能硬件與智能生活

使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

在AMD GPU上如何安裝和配置triton？