衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度學(xué)習(xí)中的圖像分割

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 2023-05-05 11:35 ? 次閱讀

深度學(xué)習(xí)中的圖像分割

深度學(xué)習(xí)可以學(xué)習(xí)視覺輸入的模式,以預(yù)測(cè)組成圖像的對(duì)象類。用于圖像處理的主要深度學(xué)習(xí)架構(gòu)是卷積神經(jīng)網(wǎng)絡(luò)(CNN),或者是特定的CNN框架,如AlexNet、VGG、Inception和ResNet。計(jì)算機(jī)視覺的深度學(xué)習(xí)模型通常在專門的圖形處理單元(GPU)上訓(xùn)練和執(zhí)行,以減少計(jì)算時(shí)間。

圖像分割

圖像分割是計(jì)算機(jī)視覺中的一個(gè)關(guān)鍵過程。它包括將視覺輸入分割成片段以簡(jiǎn)化圖像分析。片段表示目標(biāo)或目標(biāo)的一部分,并由像素集或“超像素”組成。圖像分割將像素組織成更大的部分,消除了將單個(gè)像素作為觀察單位的需要。

圖像分析有三個(gè)層次

分類:將整幅圖片分成若干類別

目標(biāo)檢測(cè):檢測(cè)圖像中的目標(biāo)并在其周圍畫一個(gè)矩形

分割:識(shí)別圖像的部分,并理解它們屬于什么對(duì)象。分割是進(jìn)行目標(biāo)檢測(cè)和分類的基礎(chǔ)

語(yǔ)義分割 實(shí)例分割

在分割時(shí),依據(jù)分割結(jié)果,有兩個(gè)粒度級(jí)別

語(yǔ)義分割:將圖像中的所有像素劃分為有意義的對(duì)象類。這些類是“語(yǔ)義上可解釋的”,并對(duì)應(yīng)于現(xiàn)實(shí)世界的類別。例如,你可以將與貓相關(guān)的所有像素分離出來,并將它們涂成綠色。這也被稱為dense預(yù)測(cè),因?yàn)樗A(yù)測(cè)了每個(gè)像素的含義。

實(shí)例分割- 標(biāo)識(shí)圖像中每個(gè)對(duì)象的每個(gè)實(shí)例。它與語(yǔ)義分割的不同之處在于它不是對(duì)每個(gè)像素進(jìn)行分類。

傳統(tǒng)的圖像分割方法

還有一些過去常用的圖像分割技術(shù),但效率不如深度學(xué)習(xí)技術(shù),因?yàn)樗鼈兪褂脟?yán)格的算法,需要人工干預(yù)和專業(yè)知識(shí)。這些包括

閾值:將圖像分割為前景和背景。指定的閾值將像素分為兩個(gè)級(jí)別之一,以隔離對(duì)象。閾值化將灰度圖像轉(zhuǎn)換為二值圖像或?qū)⒉噬珗D像的較亮和較暗像素進(jìn)行區(qū)分。

K-means聚類:算法識(shí)別數(shù)據(jù)中的組,變量K表示組的數(shù)量。該算法根據(jù)特征相似性將每個(gè)數(shù)據(jù)點(diǎn)(或像素)分配到其中一組。聚類不是分析預(yù)定義的組,而是迭代地工作,從而有機(jī)地形成組。

基于直方圖的圖像分割:使用直方圖根據(jù)“灰度”對(duì)像素進(jìn)行分組。簡(jiǎn)單的圖像由一個(gè)對(duì)象和一個(gè)背景組成。背景通常是一個(gè)灰度級(jí),是較大的實(shí)體。因此,一個(gè)較大的峰值代表了直方圖中的背景灰度。一個(gè)較小的峰值代表這個(gè)物體,這是另一個(gè)灰色級(jí)別。

邊緣檢測(cè):識(shí)別亮度的急劇變化或不連續(xù)的地方。邊緣檢測(cè)通常包括將不連續(xù)點(diǎn)排列成曲線線段或邊緣。例如,一塊紅色和一塊藍(lán)色之間的邊界。

深度學(xué)習(xí)如何助力圖像分割方法

現(xiàn)代圖像分割技術(shù)以深度學(xué)習(xí)技術(shù)為動(dòng)力。

下面是幾種用于分割的深度學(xué)習(xí)架構(gòu)

使用CNN進(jìn)行圖像分割,是將圖像的patch作為輸入輸入給卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)對(duì)像素進(jìn)行標(biāo)記。CNN不能一次處理整個(gè)圖像。它掃描圖像,每次看一個(gè)由幾個(gè)像素組成的小“濾鏡”,直到它映射出整個(gè)圖像。

傳統(tǒng)的cnn網(wǎng)絡(luò)具有全連接的層,不能處理不同的輸入大小。FCNs使用卷積層來處理不同大小的輸入,可以工作得更快。最終的輸出層具有較大的感受野,對(duì)應(yīng)于圖像的高度和寬度,而通道的數(shù)量對(duì)應(yīng)于類的數(shù)量。卷積層對(duì)每個(gè)像素進(jìn)行分類,以確定圖像的上下文,包括目標(biāo)的位置。

集成學(xué)習(xí):將兩個(gè)或兩個(gè)以上相關(guān)分析模型的結(jié)果合成為單個(gè)。集成學(xué)習(xí)可以提高預(yù)測(cè)精度,減少泛化誤差。這樣就可以對(duì)圖像進(jìn)行精確的分類和分割。通過集成學(xué)習(xí)嘗試生成一組弱的基礎(chǔ)學(xué)習(xí)器,對(duì)圖像的部分進(jìn)行分類,并組合它們的輸出,而不是試圖創(chuàng)建一個(gè)單一的最優(yōu)學(xué)習(xí)者。

DeepLab:使用DeepLab的一個(gè)主要?jiǎng)訖C(jī)是在幫助控制信號(hào)抽取的同時(shí)執(zhí)行圖像分割 —— 減少樣本的數(shù)量和網(wǎng)絡(luò)必須處理的數(shù)據(jù)量。另一個(gè)動(dòng)機(jī)是啟用多尺度上下文特征學(xué)習(xí) —— 從不同尺度的圖像中聚合特征。DeepLab使用ImageNet預(yù)訓(xùn)練的ResNet進(jìn)行特征提取。DeepLab使用空洞卷積而不是規(guī)則的卷積。每個(gè)卷積的不同擴(kuò)張率使ResNet塊能夠捕獲多尺度的上下文信息

DeepLab由三個(gè)部分組成

Atrous convolutions— 使用一個(gè)因子,可以擴(kuò)展或收縮卷積濾波器的視場(chǎng)。

ResNet— 微軟的深度卷積網(wǎng)絡(luò)(DCNN)。它提供了一個(gè)框架,可以在保持性能的同時(shí)訓(xùn)練數(shù)千個(gè)層。ResNet強(qiáng)大的表征能力促進(jìn)了計(jì)算機(jī)視覺應(yīng)用的發(fā)展,如物體檢測(cè)和人臉識(shí)別。

Atrous spatial pyramid pooling (ASPP)— 提供多尺度信息。它使用一組具有不同擴(kuò)展率的復(fù)雜函數(shù)來捕獲大范圍的上下文。ASPP還使用全局平均池(GAP)來合并圖像級(jí)特征并添加全局上下文信息。

SegNet neural network:一種基于深度編碼器和解碼器的架構(gòu),也稱為語(yǔ)義像素分割。它包括對(duì)輸入圖像進(jìn)行低維編碼,然后在解碼器中利用方向不變性能力恢復(fù)圖像。然后在解碼器端生成一個(gè)分割圖像。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4779

    瀏覽量

    101165
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4774

    瀏覽量

    129350
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7536

    瀏覽量

    88638
  • 圖像分割
    +關(guān)注

    關(guān)注

    4

    文章

    182

    瀏覽量

    18046
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5513

    瀏覽量

    121544

原文標(biāo)題:深度學(xué)習(xí)中的圖像分割

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    主動(dòng)脈夾層分割深度學(xué)習(xí)模型是如何煉成的?

    利用深度學(xué)習(xí)進(jìn)行主動(dòng)脈真假腔分割有賴于大量手動(dòng)標(biāo)注的主動(dòng)脈圖像來訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò),計(jì)算量大,且對(duì)
    的頭像 發(fā)表于 07-17 09:14 ?6118次閱讀

    深度學(xué)習(xí)在醫(yī)學(xué)圖像分割與病變識(shí)別的應(yīng)用實(shí)戰(zhàn)

    等方面具有重要意義。本文將介紹這一領(lǐng)域的背景、挑戰(zhàn),以及通過一個(gè)代碼實(shí)例展示如何利用深度學(xué)習(xí)方法進(jìn)行醫(yī)學(xué)圖像分割與病變識(shí)別。 背景與挑戰(zhàn)醫(yī)學(xué)圖像
    發(fā)表于 09-04 11:11

    圖像分割圖像邊緣檢測(cè)

     圖像分割的研究多年來一直受到人們的高度重視,至今提出了各種類型的分割算法。Pal把圖像分割算法分成了6類:閾值
    發(fā)表于 12-19 09:29 ?1.1w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>和<b class='flag-5'>圖像</b>邊緣檢測(cè)

    深度學(xué)習(xí)圖像分割的方法和應(yīng)用

    介紹使圖像分割的方法,包括傳統(tǒng)方法和深度學(xué)習(xí)方法,以及應(yīng)用場(chǎng)景。 基于人工智能和深度學(xué)習(xí)方法的現(xiàn)
    的頭像 發(fā)表于 11-27 10:29 ?3243次閱讀

    詳解深度學(xué)習(xí)圖像分割

    基于人工智能和深度學(xué)習(xí)方法的現(xiàn)代計(jì)算機(jī)視覺技術(shù)在過去10年里取得了顯著進(jìn)展。如今,它被用于圖像分類、人臉識(shí)別、圖像物體的識(shí)別、視頻分析和分
    的頭像 發(fā)表于 01-06 15:50 ?3725次閱讀

    圖像分割的方法,包括傳統(tǒng)方法和深度學(xué)習(xí)方法

    許多計(jì)算機(jī)視覺任務(wù)需要對(duì)圖像進(jìn)行智能分割,以理解圖像的內(nèi)容,并使每個(gè)部分的分析更加容易。今天的圖像分割
    的頭像 發(fā)表于 01-08 14:44 ?9368次閱讀

    分析總結(jié)基于深度神經(jīng)網(wǎng)絡(luò)的圖像語(yǔ)義分割方法

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展及其在語(yǔ)義分割領(lǐng)域的廣泛應(yīng)用,語(yǔ)義分割效果得到顯著提升。對(duì)基于深度神經(jīng)網(wǎng)絡(luò)的
    發(fā)表于 03-19 14:14 ?21次下載
    分析總結(jié)基于<b class='flag-5'>深度</b>神經(jīng)網(wǎng)絡(luò)的<b class='flag-5'>圖像</b>語(yǔ)義<b class='flag-5'>分割</b>方法

    深度學(xué)習(xí)在視頻對(duì)象分割的應(yīng)用及相關(guān)研究

    視頻對(duì)象分割是指在給定的一段視頻序列的各幀圖像,找岀屬于特定前景對(duì)象的所有像素點(diǎn)位置區(qū)域。隨著硬件平臺(tái)計(jì)算能力的提升,深度學(xué)習(xí)受到了越來越
    發(fā)表于 03-24 15:47 ?9次下載
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在視頻對(duì)象<b class='flag-5'>分割</b><b class='flag-5'>中</b>的應(yīng)用及相關(guān)研究

    基于深度神經(jīng)網(wǎng)絡(luò)的圖像語(yǔ)義分割方法

    圖像語(yǔ)義分割是計(jì)算機(jī)視覺領(lǐng)堿近年來的熱點(diǎn)硏究課題,隨著深度學(xué)習(xí)技術(shù)的興起,圖像語(yǔ)義分割
    發(fā)表于 04-02 13:59 ?11次下載
    基于<b class='flag-5'>深度</b>神經(jīng)網(wǎng)絡(luò)的<b class='flag-5'>圖像</b>語(yǔ)義<b class='flag-5'>分割</b>方法

    淺談關(guān)于深度學(xué)習(xí)方法的圖像分割

    許多計(jì)算機(jī)視覺任務(wù)需要對(duì)圖像進(jìn)行智能分割,以理解圖像的內(nèi)容,并使每個(gè)部分的分析更加容易。今天的圖像分割
    的頭像 發(fā)表于 07-06 10:50 ?2245次閱讀

    基于深度學(xué)習(xí)的場(chǎng)景分割算法研究

    場(chǎng)景分割的目標(biāo)是判斷場(chǎng)景圖像每個(gè)像素的類別.場(chǎng)景分割是計(jì)算機(jī)視覺領(lǐng)域重要的基本問題之一,對(duì)場(chǎng)景圖像的分析和理解具有重要意義,同時(shí)在自動(dòng)駕駛
    發(fā)表于 02-12 11:28 ?598次閱讀

    基于深度學(xué)習(xí)的點(diǎn)云分割的方法介紹

      摘 要:點(diǎn)云分割是點(diǎn)云數(shù)據(jù)理解的一個(gè)關(guān)鍵技術(shù),但傳統(tǒng)算法無法進(jìn)行實(shí)時(shí)語(yǔ)義分割。近年來深度學(xué)習(xí)被應(yīng)用在點(diǎn)云
    發(fā)表于 07-20 15:23 ?3次下載

    深度學(xué)習(xí)圖像語(yǔ)義分割指標(biāo)介紹

    深度學(xué)習(xí)圖像語(yǔ)義分割上已經(jīng)取得了重大進(jìn)展與明顯的效果,產(chǎn)生了很多專注于圖像語(yǔ)義分割的模型與基準(zhǔn)
    發(fā)表于 10-09 15:26 ?451次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>圖像</b>語(yǔ)義<b class='flag-5'>分割</b>指標(biāo)介紹

    機(jī)器人視覺技術(shù)圖像分割方法有哪些

    和分析。本文將詳細(xì)介紹圖像分割的各種方法,包括傳統(tǒng)的圖像處理方法和基于深度學(xué)習(xí)的方法。 閾值分割
    的頭像 發(fā)表于 07-04 11:34 ?1153次閱讀

    圖像分割與語(yǔ)義分割的CNN模型綜述

    圖像分割與語(yǔ)義分割是計(jì)算機(jī)視覺領(lǐng)域的重要任務(wù),旨在將圖像劃分為多個(gè)具有特定語(yǔ)義含義的區(qū)域或?qū)ο蟆>矸e神經(jīng)網(wǎng)絡(luò)(CNN)作為深度
    的頭像 發(fā)表于 07-09 11:51 ?1156次閱讀
    澳门百家乐娱乐场开户注册| 仕達屋百家乐官网的玩法技巧和规则| 顶级赌场官方直营| 网页百家乐| 网上百家乐官网官方网站| 大发888体育竞技| 网上百家乐赢钱公式| 百家乐官网全自动分析软件| 97玩棋牌游戏中心| 申请百家乐会员送彩金| 百家乐官网庄闲排列| 峨眉山市| 威尼斯人娱乐城金杯娱乐城| 现金百家乐| 百家乐官网赌博机玩法| 现金棋牌评测网| 利都百家乐国际娱乐场| 曼哈顿百家乐官网的玩法技巧和规则| 百家乐官网百家乐官网游戏| 德州扑克官方下载| 百家乐破解版| 百家乐波浪法则| 温州市百家乐官网鞋业有限公司| 米兰国际娱乐城| 百家百家乐视频游戏世界| 百家乐最新套路| 模拟百家乐官网下载| 百家乐官网技巧之写路| 财神娱乐城打不开| 百家乐网站那个诚信好| 玩机器百家乐心得| 自贡百家乐官网赌场| 百家乐官网投注助手| 总统娱乐城返水| 全讯网分析| 百家乐皇室百家乐| 宝马会百家乐现金网| 广州百家乐官网赌城| 百家乐官网博彩技巧视频| 澳门赌场攻略| 德州扑克 梭哈|