3.2 視覺技術
視覺技術主要用計算機來模擬人的視覺功能,但并不僅是人眼的簡單延伸,更重要的是具有大腦的一部分視覺分析功能,即從客觀事物的圖像中提取特征信息,對特征借息降維處理后加以分析、理解,最終用于實際檢測、工業測量和控制。
計算機視覺作為視覺技術的關鍵代表和組成部分,諸如圖像檢測、分類、識別和定位等功能的實現均依賴計算機視覺技術。下面介紹幾種基于計算機視覺技術的重要應用及其學習模型。
3.2.1圖像分類
圖3-4圖像分類
對于給定一組被標記為單一類別的圖像,對一組新的測試圖像的類別進行預測,并測量預測的準確性結果,這就是圖像分類向題。計算機視覺技術研究提出了一種基于數據驅動的方法。該方法并不是直接在算法程序中指定每個感興趣的圖像類別,而是為計算機的每個圖像類別都提供許多示例,然后設計一個學習算法,查看這些示例并學習每個類別的視覺外觀。也就是說,首先積累一個帶有標記圖像的訓練集,然后將其輸入計算機中,由計算機來處理這些數據。
可以按照下面的步驟來分解。
(1)輸入是由N個圖像組成的訓練集,共有K個類別,每個圖像都被標記為其中一個類別。
(2)使用該訓練集訓練一個分類器,來學習每個類別的外部特征。
(3)預測一組新圖像的類標簽,評估分類器的性能,用分類器預測的類別標簽與其真實的類別標簽進行比較。
目前較為流行的圖像分類架構是卷積神經網絡(Convolutional Neural Networks,CNN)-將圖像送入網絡,然后網絡對圖像數據進行分類。
-
智慧燈桿
+關注
關注
1文章
813瀏覽量
11758
發布評論請先 登錄
相關推薦
評論