2014世界杯吉祥物由来,全迅网特码开奖直播,海立方娱乐场官网现金开户(中国)·官方网站

我們將談?wù)撛诓煌腘VIDIA Jetson 系列設(shè)備上運(yùn)行YOLOv8 模型的性能基準(zhǔn)測試。我們特別選擇了3種不同的Jetson設(shè)備進(jìn)行測試，它們是 Jetson AGX Orin 32GB H01套件、使用Orin NX 16GB構(gòu)建的reComputer J4012，以及使用Xavier NX 8GB構(gòu)建的reComputer J2021。

什么是 YOLOv8 ？

YOLOv8 由 Ultralytics 公司開發(fā)，是一個(gè)尖端的、最先進(jìn)的（SOTA）模型，它建立在以前的 YOLO 版本的成功基礎(chǔ)上，并引入了新的功能和改進(jìn)，以進(jìn)一步提高性能和靈活性。YOLOv8 被設(shè)計(jì)為快速、準(zhǔn)確和易于使用，使其成為廣泛的物體檢測、圖像分割和圖像分類任務(wù)的絕佳選擇。

YOLOv8 模型

YOLOv8有不同的模型類型，基于參數(shù)的數(shù)量，將關(guān)系到模型的準(zhǔn)確性。因此，模型越大，它就越準(zhǔn)確。例如，YOLOv8x是最大的模型，它在所有模型中具有最高的準(zhǔn)確性。

為什么我們需要進(jìn)行性能基準(zhǔn)測試？

通過運(yùn)行性能基準(zhǔn)，你可以知道在特定設(shè)備上運(yùn)行的特定模型類型可以獲得多大的推理性能。這對于NVIDIA Jetson平臺等嵌入式設(shè)備來說更為重要，因?yàn)槿绻阒滥愕膽?yīng)用程序想要使用的確切模型類型，你就可以決定哪種硬件適合運(yùn)行該模型。

為什么我們需要 TensorRT基準(zhǔn)測試？

TensorRT是由NVIDIA開發(fā)的一個(gè)庫，用于在NVIDIA GPU上提高推理速度。TensorRT建立在CUDA之上，與運(yùn)行PyTorch和ONNX等本地模型相比，在許多實(shí)時(shí)服務(wù)和嵌入式應(yīng)用中，它的推理速度可以提高2到3倍。

在NVIDIA Jetson 設(shè)備上安裝YOLOv8

第1步：按照Wiki中的介紹步驟，在Jetson設(shè)備中安裝JetPack 系統(tǒng)。

第2步：按照wiki的 "安裝必要的軟件包 "和 "安裝PyTorch和Torchvision "部分，在Jetson設(shè)備上安裝YOLOv8。

如何運(yùn)行基準(zhǔn)測試？

當(dāng)你在NVIDIA Jetson設(shè)備上安裝帶有SDK組件的NVIDIA JetPack時(shí)，會有一個(gè)名為trtexec的工具。該工具實(shí)際上位于隨SDK組件安裝而來的TensorRT內(nèi)。這是一個(gè)使用TensorRT的工具，無需開發(fā)自己的應(yīng)用程序。

trtexec工具有三個(gè)主要用途

在隨機(jī)或用戶提供的輸入數(shù)據(jù)上對網(wǎng)絡(luò)進(jìn)行基準(zhǔn)測試。

從模型中生成序列化的引擎。

從構(gòu)建器中生成一個(gè)序列化的時(shí)序緩存。

在這里，我們可以使用trtexec工具對不同參數(shù)的模型進(jìn)行快速基準(zhǔn)測試。但首先，你需要有一個(gè)ONNX模型，我們可以通過使用Ultralytics YOLOv8來生成這個(gè)ONNX模型。

第1步：使用ONNX模型建立：

yolo mode=export model=yolov8s.pt format=onnx

這將下載最新的yolov8s.pt模型并轉(zhuǎn)換為ONNX格式。

第2步：使用trtexec建立引擎文件，如下所示：

cd /usr/src/tensorrt/bin 
./trtexec  --onnx= --saveEngine=

比如說：

./trtexec --onnx=/home/nvidia/yolov8s.onnx -- saveEngine=/home/nvidia/yolov8s.engine

這將輸出性能結(jié)果，如下所示，同時(shí)生成一個(gè).引擎文件。默認(rèn)情況下，它將把ONNX轉(zhuǎn)換為FP32精度的TensorRT優(yōu)化的文件，你可以看到輸出如下：

在這里，我們可以把平均延遲看作是7.2ms，換算成139FPS。

然而，如果你想要INT8精度，提供更好的性能，你可以執(zhí)行上述命令，如下所示：

./trtexec --onnx=/home/nvidia/yolov8s.onnx --saveEngine=/home/nvidia/yolov8s.engine --int8

在這里，我們可以把平均延遲看作是3.2ms，換算成313FPS。

如果你也想在FP16精度下運(yùn)行，你可以執(zhí)行如下命令：

./trtexec --onnx=/home/nvidia/yolov8s.onnx --saveEngine=/home/nvidia/yolov8s.engine --fp16

要檢查YOLOv8模型的默認(rèn)PyTorch版本的性能，你可以簡單地運(yùn)行推理并檢查延遲，如下所示：

yolo detect predict model=yolov8s.pt source='<>'

在這里，你可以根據(jù)本頁面上的表格來改變來源。

另外，如果你不指定來源，它將默認(rèn)使用一個(gè)名為 "bus.jpg "的圖像。

基準(zhǔn)測試結(jié)果

在進(jìn)入基準(zhǔn)測試結(jié)果之前，我將快速強(qiáng)調(diào)我們用于基準(zhǔn)測試過程的每臺設(shè)備的AI性能。

Jetson Device	AGX Orin 32GB H01 Kit	reComputer J4012 built with Orin NX 16GB	reComputer J2021 built with Xavier NX 8GB
AI Performance	200TOPS	100TOPS	21TOPS

現(xiàn)在我們將看一下基準(zhǔn)圖，以比較YOLOv8在單個(gè)設(shè)備上的性能。我已經(jīng)用640×640的默認(rèn)PyTorch模型文件進(jìn)行了所有的基準(zhǔn)測試，如上文所解釋的那樣轉(zhuǎn)換為ONNX格式。

AGX Orin 32GB H01 Kit

reComputer J4012 built with Orin NX 16GB

reComputer J2021 built with Xavier NX 8GB

正如我們所看到的，TensorRT可以帶來性能上的大幅提升。

接下來，我們將從不同的角度看一下基準(zhǔn)圖，在不同的設(shè)備上比較每個(gè)YOLOv8模型的性能。

如果我們比較一下最大的YOLOv8模型，即在上述3個(gè)設(shè)備上運(yùn)行的YOLOv8x，我們會得到以下結(jié)果：

正如你所看到的，在最大的YOLOv8x模型上使用INT8精度，我們可以在AGX Orin 32GB上實(shí)現(xiàn)約75的FPS，這對于一個(gè)嵌入式設(shè)備來說是非常令人印象深刻的！我們可以看到，在AGX Orin 32GB上的FPS為1.5，而在AGX Orin 32GB上的FPS為2.5！

AI 邊緣計(jì)算盒子

reComputer J2021-Edge AI 設(shè)備

J2021是一款采用Jetson Xavier NX 8GB模塊的邊緣AI設(shè)備，可提供高達(dá)21TOPS算力，豐富的IO端口包括USB 3.1端口（4x）、用于WIFI的M.2接口、用于SSD的M.2接口、RTC、CAN、樹莓派 GPIO 40針擴(kuò)展接口等；外殼采用鋁合金材質(zhì)帶冷卻風(fēng)扇，預(yù)裝JetPack系統(tǒng)，可以作為NVIDIA Jetson Xavier NX Dev Kit的替代品，為您的AI應(yīng)用開發(fā)和部署提供支持。

reComputer J4012-Edge AI 邊緣計(jì)算設(shè)備

reComputer J4012是一款采用NVIDIA Jetson Orin NX 16GB模塊的邊緣AI設(shè)備，可提供高達(dá)100 TOPS算力的AI性能，并擁有豐富的IO接口，包括USB 3.2端口（4x）、HDMI 2.1、用于WIFI的M.2接口、用于SSD的M.2接口、RTC、CAN、樹莓派GPIO 40針接口等；外殼采用鋁合金材質(zhì)自帶散熱風(fēng)扇，預(yù)裝NVIDIA JetPack的Jetpack系統(tǒng)。作為NVIDIA Jetson生態(tài)系統(tǒng)的一部分，reComputer J4012可以為您的AI應(yīng)用開發(fā)和部署提供支持。

寫在最后

根據(jù)上述所有基準(zhǔn)測試，多年來，在英偉達(dá)Jetson Orin平臺等嵌入式設(shè)備上，推理性能似乎有了顯著提高，現(xiàn)在我們幾乎可以用這種緊湊的設(shè)備來匹配服務(wù)器級別的性能了!

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴