今天的博客文章是我?guī)啄昵白龅囊粋€關(guān)于尋找圖像中最亮點(diǎn)的教程的后續(xù)。
我之前的教程假設(shè)在圖像中只有一個亮點(diǎn)你想要檢測...
但如果有多個亮點(diǎn)呢?
如果您想在圖像中檢測多個亮點(diǎn),代碼會稍微復(fù)雜一點(diǎn),但不會太復(fù)雜。不過不用擔(dān)心:我將詳細(xì)解釋每一個步驟。
看看下面的圖片:
在這幅圖中,我們有五個燈泡。
我們的目標(biāo)是檢測圖像中的這五個燈泡,并對它們進(jìn)行唯一的標(biāo)記。
首先,打開一個新文件并將其命名為detect_bright_spot .py。然后,插入以下代碼:
# import the necessary packages from imutils import contours from skimage import measure import numpy as np import argparse import imutils import cv2 # construct the argument parse and parse the arguments ap = argparse.ArgumentParser() ap.add_argument("-i", "--image", required=True, help="path to the image file") args = vars(ap.parse_args())
導(dǎo)入一些必要的包和命令行參數(shù)。
要開始檢測圖像中最亮的區(qū)域,我們首先需要從磁盤加載我們的圖像,然后將其轉(zhuǎn)換為灰度圖并進(jìn)行平滑濾波,以減少高頻噪聲:
# load the image, convert it to grayscale, and blur it image = cv2.imread(args["image"]) gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) blurred = cv2.GaussianBlur(gray, (11, 11), 0)
這些操作的輸出如下:
為了顯示模糊圖像中最亮的區(qū)域,我們需要應(yīng)用閾值化:
# threshold the image to reveal light regions in the # blurred image thresh = cv2.threshold(blurred, 200, 255, cv2.THRESH_BINARY)[1]
操作取任意像素值p >= 200,并將其設(shè)置為255(白色)。像素值< 200被設(shè)置為0(黑色)。
閾值化后,我們得到如下圖像:
注意圖像的明亮區(qū)域現(xiàn)在都是白色的,而其余的圖像被設(shè)置為黑色。
然而,在這幅圖像中有一點(diǎn)噪聲(即,小斑點(diǎn)),所以讓我們通過執(zhí)行一系列的腐蝕和膨脹操作來清除它:
# perform a series of erosions and dilations to remove # any small blobs of noise from the thresholded image thresh = cv2.erode(thresh, None, iterations=2) thresh = cv2.dilate(thresh, None, iterations=4)
在應(yīng)用這些操作之后,你可以看到我們的thresh圖像變得更加“干凈”,但是仍然有一些我們想要移除的斑點(diǎn)。
本項(xiàng)目的關(guān)鍵步驟是對上圖中的每個區(qū)域進(jìn)行標(biāo)記,然而,即使在應(yīng)用了腐蝕和膨脹后,我們?nèi)匀幌胍^濾掉剩余的小塊兒區(qū)域。
一個很好的方法是執(zhí)行連接組件分析:
# perform a connected component analysis on the thresholded # image, then initialize a mask to store only the "large" # components labels = measure.label(thresh, neighbors=8, background=0) mask = np.zeros(thresh.shape, dtype="uint8") # loop over the unique components for label in np.unique(labels): # if this is the background label, ignore it if label == 0: continue # otherwise, construct the label mask and count the # number of pixels labelMask = np.zeros(thresh.shape, dtype="uint8") labelMask[labels == label] = 255 numPixels = cv2.countNonZero(labelMask) # if the number of pixels in the component is sufficiently # large, then add it to our mask of "large blobs" if numPixels > 300: mask = cv2.add(mask, labelMask)
第4行使用scikit-image庫執(zhí)行實(shí)際的連接組件分析。measure.lable返回的label和我們的閾值圖像有相同的大小,唯一的區(qū)別就是label存儲的為閾值圖像每一斑點(diǎn)對應(yīng)的正整數(shù)。
然后我們在第5行初始化一個掩膜來存儲大的斑點(diǎn)。
第7行我們開始循環(huán)遍歷每個label中的正整數(shù)標(biāo)簽,如果標(biāo)簽為零,則表示我們正在檢測背景并可以安全的忽略它(9,10行)。
否則,我們?yōu)楫?dāng)前區(qū)域構(gòu)建一個掩碼。
下面我提供了一個GIF動畫,它可視化地構(gòu)建了每個標(biāo)簽的labelMask。使用這個動畫來幫助你了解如何訪問和顯示每個單獨(dú)的組件:
然后第15行對labelMask中的非零像素進(jìn)行計(jì)數(shù)。如果numPixels超過了一個預(yù)先定義的閾值(在本例中,總數(shù)為300像素),那么我們認(rèn)為這個斑點(diǎn)“足夠大”,并將其添加到掩膜中。
輸出掩模如下圖:
注意,所有小的斑點(diǎn)都被過濾掉了,只有大的斑點(diǎn)被保留了下來。
最后一步是在我們的圖像上繪制標(biāo)記的斑點(diǎn):
# find the contours in the mask, then sort them from left to # right cnts = cv2.findContours(mask.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) cnts = imutils.grab_contours(cnts) cnts = contours.sort_contours(cnts)[0] # loop over the contours for (i, c) in enumerate(cnts): # draw the bright spot on the image (x, y, w, h) = cv2.boundingRect(c) ((cX, cY), radius) = cv2.minEnclosingCircle(c) cv2.circle(image, (int(cX), int(cY)), int(radius), (0, 0, 255), 3) cv2.putText(image, "#{}".format(i + 1), (x, y - 15), cv2.FONT_HERSHEY_SIMPLEX, 0.45, (0, 0, 255), 2) # show the output image cv2.imshow("Image", image) cv2.waitKey(0)
首先,我們需要檢測掩模圖像中的輪廓,然后按從左到右排序(3-7行)。
一旦我們的輪廓已經(jīng)排序,我們可以對它們進(jìn)行單獨(dú)的循環(huán)處理(第8行)。
對于這些輪廓線,我們將計(jì)算出代表明亮區(qū)域的最小包圍圓(第12行)。
然后,我們唯一地標(biāo)記該區(qū)域并在圖像上繪制它(第12-15行)。
最后,第17行和第18行顯示了輸出結(jié)果。
運(yùn)行程序,你應(yīng)該會看到以下輸出圖像:
請注意,每個燈泡都被獨(dú)特地標(biāo)上了圓圈,圓圈圍繞著每個單獨(dú)的明亮區(qū)域。
編輯:黃飛
評論
查看更多