亚洲综合男人的天堂色婷婷,亚洲白虎,五月一区二区久久综合天堂

導讀

一個很好的入門小短文，內容很全，適合上手。

在這篇文章中，我們將進入使用深度學習進行圖像分割的世界。我們將討論：

圖像分割是什么以及圖像分割的兩種主要類型

圖像分割結構

圖像分割中使用的損失函數

你可以使用的框架

就讓我們一探究竟吧。

什么是圖像分割？

顧名思義，這是將圖像分割為多個部分的過程。在這個過程中，圖像中的每個像素都與一個對象類型相關聯。圖像分割主要有兩種類型：語義分割和實例分割。

在語義分割中，所有相同類型的對象都使用一個類標簽進行標記，而在實例分割中，相似的對象使用各自的標簽。

圖像分割結構

圖像分割的基本結構包括編碼器和解碼器。

編碼器通過濾波器從圖像中提取特征。解碼器負責生成最終輸出，該輸出通常是包含對象輪廓的分割掩碼。大多數架構都有這種架構或它的變體。

讓我們來看幾個例子。

U-Net

U-Net是一種卷積神經網絡，最初是為分割生物醫學圖像而開發的。當它被可視化的時候，它的架構看起來像字母U，因此被命名為U-Net。其體系結構由兩部分組成，左側為收縮路徑，右側為擴展路徑。收縮路徑的目的是獲取上下文，而擴展路徑的作用是幫助精確定位。

U-Net是由右側的擴張路徑和左側的收縮路徑組成的。收縮路徑由兩個3乘3的卷積組成。卷積之后是一個ReLU和一個2x2的最大池計算用于下采樣。

你可以在這里找到U-Net的完整實現：https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/。

FastFCN —Fast Fully-connected network

在這個架構中，使用一個聯合金字塔上采樣(JPU)模塊來替換膨脹卷積，因為它們消耗大量的內存和時間。在應用JPU進行上采樣時，其核心部分采用全連接網絡。JPU將低分辨率的feature map采樣到高分辨率feature map。

如果你想動手實現一些代碼，看這里：https://github.com/wuhuikai/FastFCN。

Gated-SCNN

這個架構由一個 two-stream CNN架構組成。在該模型中，使用一個單獨的分支來處理圖像的形狀信息。利用形狀流來處理邊界信息。

實現參考代碼：https://github.com/nv-tlabs/gscnn

DeepLab

在這種架構中，上采樣濾波器的卷積用于涉及密集預測的任務。多尺度的目標分割是通過空間金字塔池實現的。最后，利用DCNNs來改進目標邊界的定位。通過對濾波器插入零進行上采樣或對輸入特征圖進行稀疏采樣來實現卷積。

實現參考代碼：https://github.com/fregu856/deeplabv3，https://github.com/sthalles/deeplab_v3

Mask R-CNN

在這個架構中，使用邊界框和語義分割將每個像素劃分為一組類別，對對象進行分類和局部化。對每個感興趣的區域得到一個分割掩碼，生成一個類標簽和一個邊界框作為最終輸出。該架構是Faster R-CNN的擴展。Faster R-CNN由regions proposer和深度卷積網絡和利局部檢測器組成。

這里是COCO測試集中的一張圖像的結果：

圖像分割損失函數

語義分割模型在訓練過程中通常使用一個簡單的交叉分類熵損失函數。但是，如果你對獲取圖像的細粒度信息感興趣，那么你需要用到稍微高級一點的損失函數。

我們來看看其中的幾個。

Focal Loss

這種損失是對標準交叉熵的改進。這是通過改變它的形狀來實現的，這樣分配給分類良好的樣本的損失就降低了。最終，這確保了沒有類別不平衡。在這個損失函數中，交叉熵損失被縮放，隨著對正確類的置信度的增加，縮放因子衰減為零。在訓練時，比例因子會自動降低簡單樣本的權重，并聚焦于困難樣本。

Dice loss

這個損失是通過計算smooth dice coefficient得到的。這種損失是最常用的分割損失。

Intersection over Union (IoU)-balanced Loss

IoU平衡分類損失的目的是增加高IoU樣本的梯度，降低低IoU樣本的梯度。這樣提高了機器學習模型的定位精度。

Boundary loss

邊界損失的一種變體應用于分割高度不平衡的任務。這種損失的形式是空間等高線上的距離度量，而不是區域。這種方法解決了高度不平衡的分割任務中區域損失的問題。

Weighted cross-entropy

在交叉熵的一種變體中，所有正樣本都用一定的系數進行加權。它用于類別不平衡的場景。

Lovász-Softmax loss

該損失是對基于子模塊損失凸Lovasz擴展的神經網絡平均IoU損失的直接優化。

其他值得一提的損失包括：

TopK loss，其目的是確保網絡在訓練過程中聚焦于困難樣本上。

距離懲罰交叉熵損失，引導網絡難以分割的邊界地區。

敏感性-特異性(SS)損失，計算特異性和敏感性的均方差的加權和。

Hausdorff distance(HD) loss，估計了卷積神經網絡的Hausdorff距離。

這只是在圖像分割中使用的幾個損失函數。想了解更多內容，看這里：https://github.com/JunMa11/SegLoss。

圖像分割數據集

從哪里可以得到一些數據集來開始？讓我們來看幾個例子。

Common Objects in COntext?—?Coco Dataset

COCO是一個大型物體檢測、分割和圖像描述數據集。數據集包含91個類。它有25萬個人標注了關鍵點。它的大小是37.57 GiB。它包含80個物體類別。它遵循Apache 2.0許可，下載鏈接：http://cocodataset.org/#download。

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有9963個圖像和20個不同的類。訓練/驗證集是一個2GB的tar文件。數據集下載：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/。

The Cityscapes Dataset

此數據集包含城市場景的圖像。它可以用來評估城市場景中視覺算法的性能。數據集下載：https://www.cityscapes-dataset.com/downloads/。

The Cambridge-driving Labeled Video Database?—?CamVid

這是一個基于運動的分割和識別數據集。它包含32個語義類。數據集下載：http://mi.eng.cam.ac.uk/research/projects/VideoRec/CamVid/。

圖像分割框架

現在你已經有了數據集，讓我們介紹一些工具/框架，你可以使用它們來開始。

FastAI library- 給定一幅圖像，該庫能夠創建該圖像中對象的mask。

Sefexa Image Segmentation Tool?- Sefexa是一個免費的工具，可以用于半自動圖像分割，圖像分析，創建ground truth

Deepmask- Deepmask由Facebook Research開發，是Deepmask和SharpMask的Torch實現。

MultiPath- 這是來源于A MultiPath Network for Object Detection的物體檢測網絡的Torch實現。

OpenCV- 這是一個開源的計算機視覺庫，有超過2500個優化算法。

MIScnn- 這是一個醫學圖像分割開源庫。它使用最先進的卷積神經網絡和深度學習模型建立管道，只需幾行代碼。

Fritz- Fritz提供多種計算機視覺工具，包括用于移動設備的圖像分割工具。

總結

本文為你提供了一些圖像分割的背景知識，并為你提供了一些工具和框架，可以用于入門。

我們討論了:

什么是圖像分割，

圖像分割架構，

圖像分割損失，

圖像分割工具和框架。

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4774

瀏覽量
100899
圖像分割

圖像分割

+關注

關注
4

文章
182

瀏覽量
18019
數據集

數據集

+關注

關注
4

文章
1208

瀏覽量
24738

原文標題：圖像分割2020總結：結構，損失函數，數據集和框架

文章出處：【微信號：vision263com，微信公眾號：新機器視覺】歡迎添加關注！文章轉載請注明出處。

語義分割25種損失函數綜述和展望

本綜述提供了對25種用于圖像分割的損失函數的全面且統一的回顧。我們提供了一種新穎的分類法，并詳細審查了這些損失函數如何在圖像分割中被定制和利用，強調了它們的重要特征和應用，并進行了系統

發表于 10-22 08:04 ?672次閱讀

畫面分割器怎么調試

畫面分割器，通常指的是視頻畫面分割器，它是一種可以將一個視頻信號分割成多個小畫面的設備。這種設備廣泛應用于監控系統、視頻會議、多畫面顯示等場景。調試畫面分割器是一個技術性很強的工作，需

發表于 10-17 09:32 ?457次閱讀

畫面分割器怎么連接

器的基本原理畫面分割器的工作原理是通過數字信號處理技術，將多個視頻信號源（如攝像頭、DVR等）的圖像數據進行處理，然后在一個監視器上以分割的形式顯示出來。這些分割可以是1畫面、4畫面

發表于 10-17 09:29 ?352次閱讀

DSP教學實驗箱_數字圖像處理操作_案例分享:5-13 灰度圖像二值化

比較的分割效果。如果物體同背景的差別表現不在灰度值上（比如紋理不同），可以將這個差別特征轉換為灰度的差別，然后利用閾值選取技術來分割該圖像。動態調節閾值實現

發表于 07-25 15:03

圖像語義分割的實用性是什么

圖像語義分割是一種重要的計算機視覺任務，它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用，如自動駕駛、醫學圖像分析、機器人導航等。一、

發表于 07-17 09:56 ?456次閱讀

圖像分割和語義分割的區別與聯系

、亮度等。圖像分割的目的是將圖像中感興趣的部分與背景分離，以便進行進一步的處理和分析。 1.1 圖像分割

發表于 07-17 09:55 ?1057次閱讀

圖像分割與目標檢測的區別是什么

圖像分割與目標檢測是計算機視覺領域的兩個重要任務，它們在許多應用場景中都發揮著關鍵作用。然而，盡管它們在某些方面有相似之處，但它們的目標、方法和應用場景有很大的不同。本文將介紹圖像分割

發表于 07-17 09:53 ?1402次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計算機視覺領域的重要任務，旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡（CNN）作為深度學習的一種核心模型，在

發表于 07-09 11:51 ?1013次閱讀

機器人視覺技術中常見的圖像分割方法

機器人視覺技術中的圖像分割方法是一個廣泛且深入的研究領域。圖像分割是將圖像劃分為多個區域或對象的過程，這些區域或對象具有某種共同的特征，如顏

發表于 07-09 09:31 ?773次閱讀

機器人視覺技術中圖像分割方法有哪些

機器人視覺技術是人工智能領域的一個重要分支，它涉及到圖像處理、模式識別、機器學習等多個學科。圖像分割是機器人視覺技術中的一個重要環節，它的目標是從一幅圖像中將目標物體與

發表于 07-04 11:34 ?1047次閱讀

常見的醫學圖像讀取方式和預處理方法

基于深度學習做醫學圖像數據分析，例如病灶檢測、腫瘤或者器官分割等任務，第一步就是要對數據有一個大概的認識。但是我剛剛入門醫學圖像分割的時候，很迷茫不知道自己該干啥，不知道需要準備哪些

發表于 04-19 11:43 ?911次閱讀

計算機視覺領域的十大核心技術算法

圖像分割算法是計算機視覺領域的基礎算法之一，它的主要任務是將圖像分割成不同的區域或對象。常見的圖像分割

發表于 02-25 09:38 ?1051次閱讀

改進棉花根系圖像分割方法

棉花是錦葵科棉屬植物，棉花生產的纖維是我國各類衣服、家具布和工業用布的材料，目前我國的棉花產量也非常高，主要以新疆地區為主。根系是植物組成的重要部分，其生長發育至關重要。根系圖像分割是根系表型分析

發表于 01-18 16:18 ?310次閱讀

機器視覺的圖像目標識別方法操作要點

通過加強圖像分割，能夠提高機器視覺的圖像目標識別的自動化水平，使得圖像目標識別效果更加顯著。圖像分割

發表于 01-15 12:17 ?448次閱讀

什么是分割？圖像分割知識點總結

盡管FCN意義重大，在當時來講效果也相當驚人，但是FCN本身仍然有許多局限。

發表于 01-13 15:53 ?2146次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

圖像分割的背景知識

評論

語義分割25種損失函數綜述和展望

畫面分割器怎么調試

畫面分割器怎么連接

DSP教學實驗箱_數字圖像處理操作_案例分享:5-13 灰度圖像二值化

圖像語義分割的實用性是什么

圖像分割和語義分割的區別與聯系

圖像分割與目標檢測的區別是什么

圖像分割與語義分割中的CNN模型綜述

機器人視覺技術中常見的圖像分割方法

機器人視覺技術中圖像分割方法有哪些

常見的醫學圖像讀取方式和預處理方法

計算機視覺領域的十大核心技術算法

改進棉花根系圖像分割方法

機器視覺的圖像目標識別方法操作要點

什么是分割？圖像分割知識點總結