成都棋牌游戏开发商,palipali轻量版线路检测辽宁教育,卡塔尔世界杯开幕时间20号几点钟(中国)·官方网站

語義分割是對圖像中的每個像素進行識別的一種算法，可以對圖像進行像素級別的理解。作為計算機視覺中的基礎任務之一，其不僅僅在學術界廣受關注，也在無人駕駛、工業檢測、輔助診斷等領域有著廣泛的應用。

近期，計圖團隊與南開大學程明明教授團隊、非十科技劉政寧博士等合作，提出了一種全新的語義分割模型 SegNeXt，該方法大幅提高了當前語義分割方法的性能，并在Pascal VOC 分割排行榜上名列第一。該論文已被 NeurIPS 2022 接收。

Part1

語義分割模型SegNeXt

研究背景 自2015年FCN[2] 被提出以來，語義分割開始逐漸走向深度學習算法，其常用架構為編碼-解碼器結構(Encoder-Decoder)。在 vision transformer 被提出之前，人們通常采用卷積神經網絡(如 ResNet、VGGNet、GoogleNet 等) 作為其編碼器部分；最近，由于vision transformer 在視覺領域的成功，語義分割編碼器部分開始逐漸被換成基于vision transformer的模型(如 ViT、SegFormer、HRFormer等)。但是，基于 vision transformer編碼器的方法真的比基于卷積神經網絡的方法更好么？為了回答這個問題，Jittor團隊重新思考了語義分割任務對神經網絡的要求，并針對語義分割的任務專門設計了一個基于卷積神經網絡的編碼器MSCAN 和一個語義分割模型 SegNeXt。

圖1. SegNeXt 和其他語義分割方法的性能對比，其中紅色為SegNeXt

方法概述

論文首先分析了語義分割任務本身以及之前的相關工作，總結出四點語義分割任務所需的關鍵因素。1）強大的骨干網絡作為編碼器。與之前基于 CNN 的模型相比，基于Transformer 的模型的性能提升主要來自更強大的骨干網絡。2）多尺度信息交互。與主要識別單個對象的圖像分類任務不同，語義分割是一項密集的預測任務，因此需要在單個圖像中處理不同大小的對象，這就使得針對語義分割任務的網絡需要多尺度信息的交互。3）注意力機制：注意力可以使得模型關注到重點的部分，并且可以使得網絡獲得自適應性。4）低計算復雜度：這對于常常處理高分辨率圖像的語義分割任務來說至關重要。

表 1 不同方法所具有的的屬性對比

為了滿足上述四點要求，作者設計了一種簡單的多尺度卷積注意力機制（MSCA）。如圖 2 所示，MSCA 主要是采用大卷積核分解、多分支并行架構以及類似VAN[3]的注意力機制。這使得 MSCA 可以獲得大感受野、多尺度信息以及自適應性等有益屬性。基于 MSCA，該論文搭建了一種層次化神經網絡 MSCAN 作為SegNeXt 的編碼器部分。除此之外，作者采用了 UNet 架構，并選擇了HamNet[4] 作為 SegNeXt 的解碼器部分。分析和實驗證明，MSCAN和 Ham 優勢互補，兩者相互配合，使得 SegNeXt 實現了優異的性能。

圖 2：多尺度卷積注意力（MSCA）示意圖 實驗結果 本文在五個常見分割數據集上 ADE20K, Cityscapes,COCO-Stuff, Pascal VOC, Pascal Context 和一個遙感分割數據集 iSAID做了測評，SegNeXt均超過了之前的方法。限于篇幅，我們僅展示部分結果。

表2：在 ADE20K、Cityscapes, COCO-Stuff 上的實驗結果

表 3 SegNeXt 在遙感數據集上的實驗結果

Part2 計圖語義分割算法庫JSeg Jittor團隊基于自主深度學習框架Jittor[5]，并借鑒MMSegmentation語義分割算法庫的特點，開發了語義分割算法庫JSeg。MMSegmentation是廣泛使用的功能強大的語義分割算法庫，新推出的JSeg可以直接加載MMSegmentation的模型，同時借助Jittor深度學習平臺的優勢，使其更高效、穩定運行，可以實現訓練和推理快速的從PyTorch向Jittor遷移。目前JSeg已經支持4個模型、4個數據集，其中模型包括在Pascal VOC test dataset斬獲第一的SegNeXt模型，數據集包括經典的ADE20K Dataset、CityScapes Dataset以及遙感分割中的iSAID Dataset等，后續JSeg也將支持更多的模型和數據集！ 性能提升 我們使用SegNeX-Tiny模型，與Pytorch實現的版本在NVIDIA TITAN RTX上進行了對比，可以顯著縮短模型訓練所需要的時間。

表1JSeg和mmseg（PyTorch）的訓練時間對比

易用性提升

由于Jittor動態編譯的特性及code算子對python內聯C++及CUDA的支持，JSeg在不同環境下無需對任何算子進行手動編譯，即可輕松運行不同模型，免去了用戶對不同模型分別配置環境的負擔，同時方便用戶對不同方法進行更公平的比較。此外，JSeg的設計易于拓展，用戶可以基于JSeg已有的模型和功能方便地開展進一步的研究和開發。

實踐案例

下面，我們將簡要介紹如何使用JSeg訓練一個基礎模型。

首先，下載數據集到原始數據集目錄。

通過tools/convert_datasets下的數據處理腳本對原始數據進行預處理，得到處理后的數據集。然后即可對模型進行單卡或者多卡訓練、評估和測試，同時提供了推理接口，用戶可以使用10行代碼完成一張圖片的語義分割，盡可能地降低了用戶的使用成本。

審核編輯：彭靜

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

解碼器

解碼器

+關注

關注
9

文章
1147

瀏覽量
40932
模型

模型

+關注

關注
1

文章
3305

瀏覽量
49221
計算機視覺

計算機視覺

+關注

關注
8

文章
1700

瀏覽量
46127
深度學習

深度學習

+關注

關注
73

文章
5513

瀏覽量
121551

原文標題：NeurIPS 2022 | 清華&南開提出SegNeXt：重新思考語義分割的卷積注意力設計

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關注！文章轉載請注明出處。

聚焦語義分割任務，如何用卷積神經網絡處理語義圖像分割？

CNN架構圖像語義分割圖像分割是根據圖像內容對指定區域進行標記的計算機視覺任務，簡言之就是「這張圖片里有什么，其在圖片中的位置是什么？」本文聚焦于語義

發表于 09-17 15:21 ?583次閱讀

Facebook AI使用單一神經網絡架構來同時完成實例分割和語義分割

這一新架構“全景 FPN ”在 Facebook 2017 年發布的 Mask R-CNN 的基礎上添加了一個用于語義分割的分支。這一新架構可以同時對圖像進行實例和語義分割，而且精確度

發表于 04-22 11:46 ?2934次閱讀

Facebook AI使用單一神經網絡架構來同時完成實例<b class='flag-5'>分割</b>和<b class='flag-5'>語義</b><b class='flag-5'>分割</b>

DeepLab進行語義分割的研究分析

DeepLab是谷歌使用tensorflow基于CNN開發的語義分割模型，至今已更新4個版本。最新版本是DeepLabv3+，在此模型中進一步將深度可分離卷積應用到孔空間金字塔池化和解

發表于 10-24 08:00 ?11次下載

DeepLab進行<b class='flag-5'>語義</b><b class='flag-5'>分割</b>的研究分析

語義分割算法系統介紹

圖像語義分割是圖像處理和是機器視覺技術中關于圖像理解的重要任務。語義分割即是對圖像中每一個像素點進行分類，確定每個點的類別，從而進行區域劃分，為了能夠幫助大家更好的了解

發表于 11-05 10:34 ?6807次閱讀

語義分割方法發展過程

語義分割的最簡單形式是對一個區域設定必須滿足的硬編碼規則或屬性，進而指定特定類別標簽. 編碼規則可以根據像素的屬性來構建，如灰度級強度(gray level intensity). 基于該技術的一種

發表于 12-28 14:28 ?5164次閱讀

分析總結基于深度神經網絡的圖像語義分割方法

隨著深度學習技術的快速發展及其在語義分割領域的廣泛應用，語義分割效果得到顯著提升。對基于深度神經網絡的圖像語義

發表于 03-19 14:14 ?21次下載

分析總結基于深度神經網絡的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

結合雙目圖像的深度信息跨層次特征的語義分割模型

為改善單目圖像語義分割網絡對圖像深度變化區域的分割效果，提出一種結合雙目圖像的深度信息和跨層次特征進行互補應用的語義分割

發表于 03-19 14:35 ?21次下載

結合雙目圖像的深度信息跨層次特征的<b class='flag-5'>語義</b><b class='flag-5'>分割</b><b class='flag-5'>模型</b>

基于深度神經網絡的圖像語義分割方法

對應用于圖像語義分割的幾種深度神經網絡模型進行簡單介紹，接著詳細闡述了現有主流的基于深度神經網絡的圖像語義分割

發表于 04-02 13:59 ?11次下載

基于深度神經網絡的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>

基于SEGNET模型的圖像語義分割方法

使用原始 SEGNET模型對圖像進行語義分割時，未對圖像中相鄰像素點間的關系進行考慮，導致同一目標中像素點類別預測結果不一致。通過在 SEGNET結構中加入一條自上而下的通道，使得 SEGNET包含

發表于 05-27 14:54 ?15次下載

圖像語義分割的概念與原理以及常用的方法

從最簡單的像素級別“閾值法”（Thresholding methods）、基于像素聚類的分割方法（Clustering-based segmentation methods）到“圖劃分”的分割

發表于 04-20 10:01 ?4834次閱讀

語義分割標注：從認知到實踐

隨著人工智能技術的不斷發展，語義分割標注已經成為計算機視覺領域的一個熱門話題。語義分割是指將圖像中的每個像素分配給一個預定義的語義類別，以便

發表于 04-30 21:20 ?1156次閱讀

CVPR 2023 | 華科&MSRA新作：基于CLIP的輕量級開放詞匯語義分割架構

Adapter Network (SAN)的新框架，用于基于預訓練的視覺語言模型進行開放式語義分割。該方法將語義

發表于 07-10 10:05 ?1172次閱讀

深度學習圖像語義分割指標介紹

深度學習在圖像語義分割上已經取得了重大進展與明顯的效果，產生了很多專注于圖像語義分割的模型與基準數據集，這些基準數據集提供了一套統一的批判

發表于 10-09 15:26 ?451次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計算機視覺領域的重要任務，旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡（CNN）作為深度學習的一種核心模型

發表于 07-09 11:51 ?1158次閱讀

圖像語義分割的實用性是什么

圖像語義分割是一種重要的計算機視覺任務，它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用，如自動駕駛、醫學圖像分析、機器人導航等。一、圖像語義

發表于 07-17 09:56 ?534次閱讀

衡阳派盒市场营销有限公司

搜索歷史

語義分割模型 SegNeXt方法概述

評論

聚焦語義分割任務，如何用卷積神經網絡處理語義圖像分割？

Facebook AI使用單一神經網絡架構來同時完成實例分割和語義分割

DeepLab進行語義分割的研究分析

語義分割算法系統介紹

語義分割方法發展過程

分析總結基于深度神經網絡的圖像語義分割方法

結合雙目圖像的深度信息跨層次特征的語義分割模型

基于深度神經網絡的圖像語義分割方法

基于SEGNET模型的圖像語義分割方法

圖像語義分割的概念與原理以及常用的方法

語義分割標注：從認知到實踐

CVPR 2023 | 華科&MSRA新作：基于CLIP的輕量級開放詞匯語義分割架構

深度學習圖像語義分割指標介紹

圖像分割與語義分割中的CNN模型綜述

圖像語義分割的實用性是什么