高光譜遙感技術(shù)具有能同時(shí)反映遙感對(duì)象空間特征和光譜特征等獨(dú)特優(yōu)勢(shì),但這些優(yōu)勢(shì)也帶來了波段眾多 且相關(guān)性強(qiáng)、數(shù)據(jù)冗余度高、不利于進(jìn)一步處理與利用等問題。 通過降維可以減少數(shù)據(jù)中的冗余信息,提高處理效率, 而特征提取作為降維的一種重要方法,具有降維速度快等優(yōu)點(diǎn)。 因此,特征提取對(duì)高光譜圖像的利用有重要意義。
1高光譜圖像降維基本原理
高光譜圖像降維方法可分為基于特征提取( Fea- ture Extraction)的方法和基于特征選擇( Feature Selec- tion)的方法兩類] 。高光譜圖像特征選擇又稱波段選擇,波段選擇的 定義是從一組數(shù)量為 K 的原始特征中,按照令準(zhǔn)則函 數(shù) J(X)最大的原則,選擇出數(shù)量為 k(k < K)的一組特征 X,如圖 2 所示。波段選擇降維方法又可分為兩類:一類是基于信息量的波段選擇方法,例如熵與聯(lián)合熵 的方法、最佳指數(shù)法(OIF)、自適應(yīng)波段選擇法等;另 一類是基于類間可分性的波段選擇方法,例如時(shí)空維方法與光譜維方法等。
圖 1 高光譜圖像示意圖
圖 2 波段選擇過程
圖3 特征提取過程
高光譜圖像特征提取,即將原始高光譜數(shù)據(jù)從高維 光譜特征空間按照某一變換方式,投影到一個(gè)維數(shù)更低 的子空間。特征提取過程如圖 3 所示,其中 F(X1 ,…, X5 )表示一個(gè)線性或者非線性的變換方程。
波段選擇受搜索算法和準(zhǔn)則函數(shù)的影響,不可避 免地會(huì)損失大量信息 ,而特征提取方法可以經(jīng)過變 換直接將高維數(shù)據(jù)降維到目標(biāo)維數(shù),降維速度快。
2高光譜圖像特征提取研究現(xiàn)狀
特征提取方法可分為傳統(tǒng)機(jī)器學(xué)習(xí)方法以及深度 學(xué)習(xí)方法兩類,如圖 4 所示。其中,傳統(tǒng)機(jī)器學(xué)習(xí)方法 根據(jù)特征空間映射函數(shù)的形式又可分為線性方法和非線性方法。
圖4 高光譜特征提取方法分類
2.1傳統(tǒng)機(jī)器學(xué)習(xí)方法
2.1.1線性方法
假設(shè)高維數(shù)據(jù)采樣于線性結(jié)構(gòu)中,并通過一個(gè)線性形式的變換實(shí)現(xiàn)高光譜圖像特征提取。根據(jù)利用樣本類別信息的情況,線性方法可進(jìn)一步細(xì)分為無監(jiān)督、有監(jiān)督及半監(jiān)督學(xué)習(xí)3種學(xué)習(xí)方法。其中,數(shù)據(jù)集中只有部分樣本含有類別標(biāo)簽,同時(shí)使用有標(biāo)記和無標(biāo)記樣本實(shí)現(xiàn)降維的算法屬于半監(jiān)督學(xué)習(xí)方法。因?yàn)榘氡O(jiān)督方法的相關(guān)研究較少,所以本文著重對(duì)無監(jiān)督和有監(jiān)督方法進(jìn)行介紹。1) 無監(jiān)督方法。數(shù)據(jù)集不包含類別標(biāo)簽,只利用無標(biāo)記樣本實(shí)現(xiàn)降維的算法屬于無監(jiān)督學(xué)習(xí)方法。2) 有監(jiān)督方法。 利用含有標(biāo)簽信息的標(biāo)記樣本實(shí)現(xiàn)降維的算法屬于有監(jiān)督方法,線性判別分析(LDA)等即為有監(jiān)督特征提取算法。
2.1.2非線性方法
雖然線性方法普遍具有理論成熟、原理簡(jiǎn)單、便于實(shí)現(xiàn)和使用等優(yōu)點(diǎn),但高光譜數(shù)據(jù)屬于非線性數(shù)據(jù),利用線性方法對(duì)高光譜圖像數(shù)據(jù)進(jìn)行維數(shù)約減往往無法取得滿意的效果。1) 核方法 核方法的主要思想是:在原始低維空間中無法線性劃分的數(shù)據(jù),利用核函數(shù)將其投影到高維希爾伯特空間中線性可分,最后對(duì)變換后的數(shù)據(jù)進(jìn)行降維。 核方法的優(yōu)點(diǎn)是有效解決了非線性數(shù)據(jù)線性不可分的問題,且計(jì)算量并沒有隨著維度的升高而顯著增加。2) 流形學(xué)習(xí)。 流形學(xué)習(xí)假設(shè)高維數(shù)據(jù)采樣于一個(gè)低維流形中,通過學(xué)習(xí)高維數(shù)據(jù)內(nèi)蘊(yùn)的幾何結(jié)構(gòu),求解數(shù)據(jù)的低維坐標(biāo)及對(duì)應(yīng)的映射,從而實(shí)現(xiàn)對(duì)高維數(shù)據(jù)的降維或可視化。
2.2深度學(xué)習(xí)方法
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的分支之一,旨在構(gòu)造一個(gè)可訓(xùn)練的深層模型仿效人腦分析和處理問題的過程。高光譜圖像多種多樣,一種特征提取方法很難在所有類型的數(shù)據(jù)中均取得良好的效果,這是傳統(tǒng)機(jī)器學(xué)習(xí)方法普遍存在的問題。深度學(xué)習(xí)方法很好地解決了這個(gè)問題,針對(duì)不同類型的數(shù)據(jù)學(xué)習(xí)特征,深度學(xué)習(xí)模型可以根據(jù)不同的數(shù)據(jù)自主地學(xué)習(xí)特征。
3高光譜圖像特征提取存在的問題與研究方向
3.1存在的問題高光譜圖像特征提取技術(shù)作為一種預(yù)處理技術(shù),減少了數(shù)據(jù)中的冗余信息,提高了目標(biāo)檢測(cè)、分類等后續(xù)應(yīng)用的效果,極大地促進(jìn)了高光譜遙感技術(shù)的發(fā)展。但目前的特征提取技術(shù)及算法還存在很多局限性,主要表現(xiàn)在以下幾個(gè)方面。 1) 有些高光譜特征提取算法時(shí)間復(fù)雜度過高、運(yùn)算時(shí)間過長(zhǎng),即使精度有一定提高也得不償失,不適于某些對(duì)算法實(shí)時(shí)性要求很高的場(chǎng)合。2) 許多高光譜特征提取算法都含有參數(shù),對(duì)于算法的使用者而言,調(diào)參是一個(gè)耗時(shí)費(fèi)力的過程,且參數(shù)的取值對(duì)算法的效果有顯著影響,所以最佳參數(shù)的選擇是一個(gè)難以解決的問題。 3) 高光譜圖像提供了豐富的空間、光譜信息,但目前絕大多數(shù)特征提取算法都只利用了高光譜圖像的光譜信息,如何高效地綜合利用高光譜圖像的空間、光譜信息是有待進(jìn)一步深入研究的問題。
3.2研究方向
針對(duì)高光譜圖像特征提取方法的研究現(xiàn)狀及存在的問題,提出了一些解決問題的思路及有價(jià)值的研究方向。
1) 利用 Spark 或 CUDA 并行編程框架實(shí)現(xiàn)諸如流形學(xué)習(xí)等時(shí)間復(fù)雜度較高算法的并行化,可以有效縮短算法的運(yùn)行時(shí)間。
2) 完善特征提取算法的理論體系,為解決目前存在的問題提供理論依據(jù),例如為核方法中核函數(shù)以及核參數(shù)的選擇提供理論依據(jù)。
3) 在對(duì)高光譜圖像數(shù)據(jù)進(jìn)行特征提取之前對(duì)高光譜圖像進(jìn)行空間濾波,從而綜合利用高光譜圖像的空間信息及光譜信息。
4) 在實(shí)際應(yīng)用中,對(duì)高光譜圖像數(shù)據(jù)進(jìn)行標(biāo)記的成本較高且有些數(shù)據(jù)無法進(jìn)行標(biāo)記,所以無監(jiān)督或半監(jiān)督特征提取算法是后續(xù)研究的重點(diǎn)。
5) 深度學(xué)習(xí)作為目前機(jī)器學(xué)習(xí)領(lǐng)域最熱門的研究方向,具有許多傳統(tǒng)機(jī)器學(xué)習(xí)方法所不具備的獨(dú)特優(yōu)勢(shì),基于深度學(xué)習(xí)的高光譜特征提取方法是一個(gè)極具價(jià)值的研究方向。
審核編輯:湯梓紅
-
遙感
+關(guān)注
關(guān)注
0文章
248瀏覽量
16863 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132916 -
高光譜
+關(guān)注
關(guān)注
0文章
343瀏覽量
9978
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論