衡阳派盒市场营销有限公司

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
電子發燒友網>電子資料下載>電子資料>PyTorch教程14.9之語義分割和數據集

PyTorch教程14.9之語義分割和數據集

2023-06-05 | pdf | 0.26 MB | 次下載 | 免費

資料介紹

第 14.3 節-第 14.8 節討論對象檢測任務時,矩形邊界框用于標記和預測圖像中的對象。本節將討論語義分割問題,重點關注如何將圖像劃分為屬于不同語義類的區域。與目標檢測不同,語義分割在像素級別識別和理解圖像中的內容:它對語義區域的標記和預測是在像素級別。 圖 14.9.1顯示了語義分割中圖像的狗、貓和背景的標簽與目標檢測相比,語義分割中標記的像素級邊界明顯更細粒度。

https://file.elecfans.com/web2/M00/A9/CD/poYBAGR9O9WAJnnkAAdSBrW48yA985.svg

圖 14.9.1語義分割中圖像的狗、貓和背景的標簽。

14.9.1。圖像分割和實例分割

計算機視覺領域還有兩個與語義分割類似的重要任務,即圖像分割和實例分割。我們將如下簡要地將它們與語義分割區分開來。

  • 圖像分割將圖像分成幾個組成區域。這類問題的方法通常利用圖像中像素之間的相關性。它在訓練時不需要圖像像素的標簽信息,也不能保證分割后的區域在預測時具有我們希望得到的語義。以圖 14.9.1中的圖像 作為輸入,圖像分割可以將狗分成兩個區域:一個覆蓋以黑色為主的嘴巴和眼睛,另一個覆蓋以黃色為主的身體其余部分。

  • 實例分割也稱為同時檢測和分割。它研究如何識別圖像中每個對象實例的像素級區域。與語義分割不同,實例分割不僅需要區分語義,還需要區分不同的對象實例。例如,如果圖像中有兩只狗,實例分割需要區分一個像素屬于這兩只狗中的哪一只。

14.9.2。Pascal VOC2012 語義分割數據集

最重要的語義分割數據集之一是Pascal VOC2012。下面,我們將看看這個數據集。

%matplotlib inline
import os
import torch
import torchvision
from d2l import torch as d2l
%matplotlib inline
import os
from mxnet import gluon, image, np, npx
from d2l import mxnet as d2l

npx.set_np()

數據集的 tar 文件大約 2 GB,因此下載文件可能需要一段時間。提取的數據集位于 ../data/VOCdevkit/VOC2012.

#@save
d2l.DATA_HUB['voc2012'] = (d2l.DATA_URL + 'VOCtrainval_11-May-2012.tar',
              '4e443f8a2eca6b1dac8a6c57641b67dd40621a49')

voc_dir = d2l.download_extract('voc2012', 'VOCdevkit/VOC2012')
Downloading ../data/VOCtrainval_11-May-2012.tar from http://d2l-data.s3-accelerate.amazonaws.com/VOCtrainval_11-May-2012.tar...
#@save
d2l.DATA_HUB['voc2012'] = (d2l.DATA_URL + 'VOCtrainval_11-May-2012.tar',
              '4e443f8a2eca6b1dac8a6c57641b67dd40621a49')

voc_dir = d2l.download_extract('voc2012', 'VOCdevkit/VOC2012')

進入路徑后../data/VOCdevkit/VOC2012,我們可以看到數據集的不同組成部分。ImageSets/Segmentation路徑包含指定訓練和測試樣本的文本文件,而 JPEGImagesSegmentationClass路徑分別存儲每個示例的輸入圖像和標簽。這里的label也是image格式的,和它的labeled input image大小一樣。此外,任何標簽圖像中具有相同顏色的像素屬于同一語義類。下面定義了read_voc_images將所有輸入圖像和標簽讀入內存的函數。

#@save
def read_voc_images(voc_dir, is_train=True):
  """Read all VOC feature and label images."""
  txt_fname = os.path.join(voc_dir, 'ImageSets', 'Segmentation',
               'train.txt' if is_train else 'val.txt')
  mode = torchvision.io.image.ImageReadMode.RGB
  with open(txt_fname, 'r') as f:
    images = f.read().split()
  features, labels = [], []
  for i, fname in enumerate(images):
    features.append(torchvision.io.read_image(os.path.join(
      voc_dir, 'JPEGImages', f'{fname}.jpg')))
    labels.append(torchvision.io.read_image(os.path.join(
      voc_dir, 'SegmentationClass' ,f'{fname}.png'), mode))
  return features, labels

train_features, train_labels = read_voc_images(voc_dir, True)
#@save
def read_voc_images(voc_dir, is_train=True):
  """Read all VOC feature and label images."""
  txt_fname = os.path.join(voc_dir, 'ImageSets', 'Segmentation',
               'train.txt' if is_train else 'val.txt')
  with open(txt_fname, 'r') as f:
    images = f.read().split()
  features, labels = [], []
  for i, fname in enumerate(images):
    features.append(image.imread(os.path.join(
      voc_dir, 'JPEGImages', f'{fname}.jpg')))
    labels.append(image.imread(os.path.join(
      voc_dir, 'SegmentationClass', f'{fname}.png')))
  return features, labels

train_features, train_labels = read_voc_images(voc_dir, True)

我們繪制前五個輸入圖像及其標簽。在標簽圖像中,白色和黑色分別代表邊框和背景,而其他顏色對應不同的類別。

n = 5
imgs = train_features[:n] + train_labels[:n]
imgs = [img.permute(1,2,0) for img in imgs]
d2l.show_images(imgs, 2, n);
https://file.elecfans.com/web2/M00/A9/00/poYBAGR4YpiAUiS-AAFQfESlL94544.png
n = 5
imgs = train_features[:n] + train_labels[:n]
d2l.show_images(imgs, 2, n);
https://file.elecfans.com/web2/M00/A9/00/poYBAGR4YpiAUiS-AAFQfESlL94544.png

接下來,我們枚舉該數據集中所有標簽的 RGB 顏色值和類名。

#@save
VOC_COLORMAP = [[0, 0, 0], [128, 0, 0], [0, 128, 0], [128, 128, 0],
        [0, 0, 128], [128, 0, 128], [0, 128, 128], [128, 128, 128],
        [64, 0, 0], [192, 0, 0], [64, 128, 0], [192, 128, 0],
        [64, 0, 128], [192, 0, 128], [64, 128, 128], [192, 128, 128],
        [0, 64, 0], [128, 64, 0], [0, 192, 0], [128, 192, 0],
        [0, 64, 128]]

#@save
VOC_CLASSES = ['background', 'aeroplane', 'bicycle', 'bird', 'boat',
        'bottle', 'bus', 'car', 'cat', 'chair', 'cow',
        'diningtable', 'dog', 'horse', 'motorbike', 'person',
        'potted plant', 'sheep', 'sofa', 'train', 'tv/monitor']
#@save
VOC_COLORMAP = [[0, 0, 0], [128, 0, 0], [0, 128, 0], [128, 128, 0],
        [0, 0, 128], [128, 0, 128], [0, 128, 128], [128, 128, 128],
        [64, 0, 0], [192, 0, 0], [64, 128, 0], [192, 128, 0],
        [64, 0, 128], [192, 0, 128], [64, 128, 128], [192, 128, 128],
        [0, 64, 0], [128, 64, 0], [0, 192, 0], [128, 192, 0],
        [0, 64, 128]]

#@save
VOC_CLASSES = ['background', 'aeroplane', 'bicycle', 'bird', 'boat',
        'bottle', 'bus', 'car', 'cat', 'chair', 'cow',
        'diningtable', 'dog', 'horse', 'motorbike', 'person',
        'potted plant', 'sheep', 'sofa', 'train', 'tv/monitor']

使用上面定義的兩個常量,我們可以方便地找到標簽中每個像素的類索引我們定義了voc_colormap2label 構建從上述 RGB 顏色值到類索引的映射的函數,以及voc_label_indices將任何 RGB 值映射到此 Pascal VOC2012 數據集中它們的類索引的函數。

#@save
def voc_colormap2label():
  """Build the mapping from RGB to class indices for VOC labels."""
  colormap2label = torch.zeros(256 ** 3, dtype=torch.long)
  for i

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1A7159和A7139射頻芯片的資料免費下載
  2. 0.20 MB   |  55次下載  |  5 積分
  3. 2PIC12F629/675 數據手冊免費下載
  4. 2.38 MB   |  36次下載  |  5 積分
  5. 3PIC16F716 數據手冊免費下載
  6. 2.35 MB   |  18次下載  |  5 積分
  7. 4dsPIC33EDV64MC205電機控制開發板用戶指南
  8. 5.78MB   |  8次下載  |  免費
  9. 5STC15系列常用寄存器匯總免費下載
  10. 1.60 MB   |  7次下載  |  5 積分
  11. 6模擬電路仿真實現
  12. 2.94MB   |  4次下載  |  免費
  13. 7PCB圖繪制實例操作
  14. 2.92MB   |  2次下載  |  免費
  15. 8零死角玩轉STM32F103—指南者
  16. 26.78 MB   |  1次下載  |  1 積分

本月

  1. 1ADI高性能電源管理解決方案
  2. 2.43 MB   |  452次下載  |  免費
  3. 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
  4. 5.67 MB   |  141次下載  |  1 積分
  5. 3基于STM32單片機智能手環心率計步器體溫顯示設計
  6. 0.10 MB   |  137次下載  |  免費
  7. 4A7159和A7139射頻芯片的資料免費下載
  8. 0.20 MB   |  55次下載  |  5 積分
  9. 5PIC12F629/675 數據手冊免費下載
  10. 2.38 MB   |  36次下載  |  5 積分
  11. 6如何正確測試電源的紋波
  12. 0.36 MB   |  19次下載  |  免費
  13. 7PIC16F716 數據手冊免費下載
  14. 2.35 MB   |  18次下載  |  5 積分
  15. 8Q/SQR E8-4-2024乘用車電子電器零部件及子系統EMC試驗方法及要求
  16. 1.97 MB   |  8次下載  |  10 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935121次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
  4. 1.48MB  |  420062次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233088次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191367次下載  |  10 積分
  9. 5十天學會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183335次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81581次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73810次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65988次下載  |  10 積分
百家乐bp| 大发8888| 168棋牌游戏| 百家乐官网tt娱乐| 百家乐官网如何打轮盘| 中国百家乐游戏| 大发888网址是什么| 百家乐官网试玩活动| 喜力百家乐官网的玩法技巧和规则 | 大发888非法吗| 网上百家乐官网真实度| 澳门百家乐官网赌场| 百家乐手论坛48491| 至尊百家| 百家乐官网桌子黑色| 老虎机下载| 百家乐官网试玩平台| 百家乐游戏平台架设| 大发888黄金版| 网上百家乐官网内幕| 壹贰博百家乐娱乐城| 娱乐城新用户送彩金| 百家乐官网单机游戏下| 菲彩百家乐的玩法技巧和规则| 喀喇沁旗| 百家乐扑克投注赢钱法| 大发888官网www.dafa888.com| 网上百家乐官网大赢家| 大西洋百家乐的玩法技巧和规则| 百家乐官网试玩活动| 百家乐电脑游戏高手| 六合彩特码| 百家乐官网光纤冼牌机| 大发888电子游艺| 如何看百家乐官网的玩法技巧和规则| 百家乐黏土筹码| 百家乐官网开庄几率| 百家乐免费改| 百家乐官网技巧头头娱乐| 网上百家乐骗人| 线上老虎机|