一、引言
目前,在分析高光譜數(shù)據(jù)這樣的高維數(shù)據(jù)時,進行特征波段的提取是非常必要的。首先,提取特征波段可以從原始數(shù)據(jù)中獲取最具代表性和區(qū)分性的特征集,從而有效地降低數(shù)據(jù)的維度,減少存儲和計算成本。其次,特征波段的提取可以通過選擇與目標相關的波段來減少噪聲和冗余的影響,提高數(shù)據(jù)的準確性和可靠性。關于在田間復雜環(huán)境下,高光譜技術如何實現(xiàn)對早期水稻秧苗與稗草精準識別的具體方法及能力,以及利用競爭性自適應重加權采樣算法從高光譜數(shù)據(jù)中高效篩選出對水稻和稗草分類最有效的特征波長方面的研究鮮見報道。本研究以二葉-四葉期水稻秧苗和稗草為研究對象,利用高光譜技術分別獲取田間和實驗室培育的苗期水稻和稗草的光譜數(shù)據(jù),采用CARS篩選出特征波長,利用MATLAB分類學習器工具箱進行種類識別,構建一種高效、準確的早期水稻與稗草分類識別模型,旨在探究水稻秧苗與稗草的早期準確識別方法,以期為農(nóng)田雜草的精準防控、減少化學除草劑的使用提供科學依據(jù)。
二、材料與方法
2.1 材料
以水稻、稗草為研究對象,供試水稻品種為‘農(nóng)香優(yōu)204’。試驗對象數(shù)據(jù)采集為秧田直接采集和實驗室內(nèi)培育后采集,田間數(shù)據(jù)采集地點為湖南省長沙縣春華鎮(zhèn)張家坊的春華基地(28.29085°N,113.27462°E,海拔73.7m)。根據(jù)其生長發(fā)育階段的不同,具體分為二葉期和二葉-四葉期2個樣本集,樣本數(shù)據(jù)情況見表1。
表1樣本數(shù)據(jù)采集信息情況
2.2 技術方法
通過分別采集秧田和實驗室培育2種試驗條件下的苗期水稻和稗草的高光譜反射率,利用光譜參數(shù)構建苗期水稻和稗草快速無損分類模型,并進行模型精度驗證(圖1)。
2.2.1試驗設計和數(shù)據(jù)采集方法
圖2實驗室培育、田間種植的水稻和稗草的生長情況
田間試驗小區(qū)的種植密度為22萬株/hm2,設置2個小區(qū),每個小區(qū)面積180m2,分別種植水稻和稗草。樣本進行光譜數(shù)據(jù)取樣時,按照五點取樣法,每個取樣點12個光譜數(shù)據(jù),取樣時間分為2次,分別為2023年8月11日和8月15日(10:00—11:30),水稻或稗草的樣本量計120個(圖2)。2023年8月18日于實驗室培養(yǎng)箱中培育水稻和稗草(圖2),分別于8月26日、8月31日和9月1日在室外進行光譜數(shù)據(jù)采集。利用地物光譜儀對早期水稻和稗草樣本進行光譜測定,該儀器波段范圍是400~920nm。便攜光譜儀經(jīng)白板校準后進行測試,光纖探頭置于葉片表面上方20~30mm,探頭視場角為25°。試驗采用黑色背景以防影響植物的反射率。
2.2.2光譜數(shù)據(jù)處理
原始光譜數(shù)據(jù)采用SG平滑和SG求導進行預處理,對二葉期數(shù)據(jù)集和二葉-四葉期數(shù)據(jù)集分別進行SG卷積平滑、SG卷積平滑-SG卷積求導和SG卷積平滑-SG卷積求導-CARS處理。其中,SG卷積平滑的寬口寬度設置為5,SG卷積求導的階數(shù)設置為2,寬口寬度設置為5。
采用競爭性自適應重加權采樣算法(CARS)來進行特征波段的提取。CARS的參數(shù)設置為:最大主因子數(shù)為10,交叉驗證次數(shù)為10,數(shù)據(jù)預處理方法設置為“center”,蒙特卡羅采樣次數(shù)為1000。
2.2.3建模方法
采用10折交叉驗證的方法建立LDA、PLSDA、二次SVM、子空間判別和RBF-SVM模型對稗草和水稻進行分類。基于上述處理后的數(shù)據(jù)集,進行了校正集和驗證集的劃分。對于二葉期數(shù)據(jù)集,從水稻和稗草樣品中隨機各取20個樣品劃入驗證集中,剩下的79個樣品被劃入校正集。對于二葉-四葉期數(shù)據(jù)集,從水稻和稗草樣品中隨機各取40個
樣品劃入驗證集中,剩下的151個樣品被劃入校正集。將劃分好的校正集作為輸入數(shù)據(jù)結合PLSDA、線性判別、二次SVM、子空間判別、RBF-SVM等建模方法分別建立模型,且對建立的所有模型進行10折交叉驗證和外部驗證集驗證。
在建立分類模型之前,需要先進行參數(shù)設置。其中,二次SVM模型有3個參數(shù),分別是核函數(shù)、框約束級別和核尺度模式,將其分別設置為“二次”“1”和“自動”。子空間判別模型有集成方法、學習器類型、學習器數(shù)量和子空間維度4個參數(shù),將其分別設置為“Subspace”“判別”“30”和“256”。RBFSVM有學習器、擴展維度數(shù)、Lambda、核尺度和迭代次數(shù)等參數(shù),將其分別設置為“SVM”“16384”“0.006623”“1”和“1000”。
三、結果與分析
3.1 水稻秧苗及早期稗草高光譜特征分析
由圖3可知,在700~900nm二葉期水稻的吸收強度略高于稗草,但從光譜曲線趨勢來看,水稻和稗草的吸收峰位置大致相同,且曲線相互混雜,無法進行分類。通過主成分分析(PCA)發(fā)現(xiàn),盡管前3個主成分能夠解釋數(shù)據(jù)集中97.70%的總方差,有效降低了數(shù)據(jù)維度,水稻與稗草在PCA得分圖上的分布也具有一定的區(qū)分趨勢,水稻偏右上方(PC2:?10%~20%),稗草偏左下方(PC2:?20%~0%),其重疊與聚集現(xiàn)象仍較為嚴重,不足以作為直接分類的依據(jù)(圖3(b))。
二葉-四葉期水稻和稗草在400~900nm波段的吸收光譜特性與二葉期水稻和稗草的光譜特性基本一致,但混雜程度更高(圖3(c))。對光譜數(shù)據(jù)進行主成分分析發(fā)現(xiàn),該時期數(shù)據(jù)集的聚集程度也高于二葉期數(shù)據(jù)集(圖3(d))。綜上,水稻秧苗與稗草在光譜特征上存在重疊,難以直接分類,且隨著生長階段變化,混雜程度增加,需結合多特征參數(shù)或高級分類算法以提高分類準確性。
圖3不同時期水稻和稗草的光譜曲線及主成分分析
3.2 光譜數(shù)據(jù)處理
圖4競爭自適應重加權采樣算法(CARS)篩選的特征波長
由圖4可知,CARS算法在二葉期和二葉-四葉期數(shù)據(jù)集選擇的特征光譜變量位置大致一致,在二葉期數(shù)據(jù)集中選擇了54個變量,在二葉-四葉期數(shù)據(jù)集中選中了58個變量,在2個數(shù)據(jù)集共同選擇了12個變量。綜上,盡管數(shù)據(jù)集的時間背景存在差異(一個是二葉期,另一個覆蓋了二葉-四葉期)CARS算法仍能有效識別出跨時期穩(wěn)定的特征光譜波段,意味著這12個共同的變量可能是區(qū)分不同水稻和穆草的關鍵特征波段。
3.3 水稻秧苗及早期稗草識別估測模型的建立及檢驗
3.3.1 PLS-DA和線性判別分類模型分析
表2不同處理和建模方法下稗草與水稻的識別準確率
由表2可知,PLS-DA模型中2個數(shù)據(jù)集中表現(xiàn)最好的是基于SG平滑-SG求導-CARS優(yōu)化后的模型,其中二葉期準確率在校正集、交叉驗證集和外部驗證集中都為100.00%,二葉-四葉期數(shù)據(jù)集校正集、交叉驗證集和外部驗證集的準確率分別為100.00%、98.00%和99.00%。對于無處理和SG平滑-SG求導建立的模型,其在二葉期數(shù)據(jù)集中表現(xiàn)一致,在二葉-四葉期數(shù)據(jù)集中基于無處理所建立的模型效果更好。
基于二葉期數(shù)據(jù)集建立的線性判別模型性能略低于PLS-DA模型,其中于SG平滑-SG求導-CARS優(yōu)化后的模型效果最優(yōu),校正集、交叉驗證集和外部驗證集的準確率分別為100.00%、98.70%和100.00%。但在二葉-四葉期數(shù)據(jù)集中,線性判別模型表現(xiàn)較差,對于無處理和SG平滑-SG求導建立的模型,其交叉驗證集的正確識別率僅在75.00%左右。但基于SG平滑-SG求導-CARS優(yōu)化后的模型,其交叉驗證集的正確識別率提升到97.40%,表明CARS算法能夠提取有效光譜信息,提升模型的性能。
3.3.2非線性分類模型分析
在二葉期數(shù)據(jù)集中,基于SG平滑-SG求導-CARS處理建立的二次SVM模型和子空間判別模型表現(xiàn)最優(yōu),二者校正集、交叉驗證集和外部驗證集的準確率分別為100.00%、98.70%和100.00%(表2)。在二葉-四葉期數(shù)據(jù)集中,基于SG平滑-SG求導-CARS處理建立的子空間判別模型表現(xiàn)最好,其校正集、交叉驗證集和外部驗證集的準確率分別為98.00%、96.70%和97.50%。但子空間判別在無處理和SG平滑-SG求導處理的數(shù)據(jù)集中的交叉驗證集中的正確識別率為84.00%左右,低于二次SVM和RBF-SVM建模方法。
四、討論
本研究應用高光譜技術于稻田稗草的早期識別,為除草機器人的精準作業(yè)提供了有力的決策支持,是實現(xiàn)農(nóng)業(yè)變量施藥、精準除草策略的關鍵一步。研究表明,705nm是區(qū)別水稻和稗草的特征光譜波長,本研究中使用的CARS算法在兩類數(shù)據(jù)集都在705nm附近進行變量選擇,這更加表明CARS算法能夠成功的提取區(qū)分水稻和稗草的特征光譜變量。采用低成本的地物光譜儀,結合特征光譜篩選算法,成功構建高敏感性的稻田稗草識別模型,該模型在二葉期達到100.00%的識別準確率,在二葉-四葉期也保持98.00%的高精度,相較于利用圖像識別技術獲得的識別準確率范圍在91.01%~97.48%,本模型展現(xiàn)出更為優(yōu)越的性能。這不僅證明了光譜技術在雜草識別中的有效性,也凸顯了其在提高農(nóng)業(yè)生產(chǎn)效率方面的巨大潛力。
與圖像識別技術相比,光譜識別技術以其較低的時間成本具有更大的應用潛力。研究中采用的人工光譜數(shù)據(jù)采集方式保證數(shù)據(jù)的準確性,但其耗時費力的問題限制了在大面積稻田中的廣泛應用。因此,未來的研究應聚焦于開發(fā)高效的數(shù)據(jù)采集系統(tǒng),如引入無人機或田間自主移動機器人,以實現(xiàn)光譜數(shù)據(jù)的快速、實時獲取與分析,從而加速稻田稗草識別與施藥過程的智能化集成。此外,高光譜數(shù)據(jù)在采集過程中易受多種噪聲源干擾,這些噪聲不僅降低了數(shù)據(jù)質(zhì)量,也影響了后續(xù)建模的準確性和可靠性。針對這一問題,本研究均強調(diào)了數(shù)據(jù)預處理的重要性,包括平滑、求導和散射校正等措施對減少或消除噪聲、提升數(shù)據(jù)質(zhì)量具有顯著效果。
然而,隨著應用環(huán)境的復雜化,如何進一步優(yōu)化預處理算法,以適應不同條件下光譜數(shù)據(jù)的處理需求,仍是下一步研究的重要方向。
五、結論
利用高光譜技術結合多種分類算法對二葉-四葉期水稻和稗草的葉片光譜數(shù)據(jù)進行識別分析發(fā)現(xiàn),SG平滑-SG求導結合CARS預處理再結合PLS-DA算法在提升模型識別精度和穩(wěn)定性方面表現(xiàn)最優(yōu),可顯著提升二葉-四葉期水稻和稗草識別模型的交叉驗證和外部驗證的正確率,分別高達98%和99%,尤其在水稻二葉期單一時期的樣本集上,無論是校正集、交叉驗證集還是外部驗證集,均實現(xiàn)100%的識別率,該模型充分驗證其在水稻二葉期數(shù)據(jù)建模中的高效性和準確性,可應用于水稻早期田間稗草識別和防除。
推薦:
便攜式地物光譜儀iSpecField-NIR/WNIR
專門用于野外遙感測量、土壤環(huán)境、礦物地質(zhì)勘探等領域的最新明星產(chǎn)品,由于其操作靈活、便攜方便、光譜測試速度快、光譜數(shù)據(jù)準確是一款真正意義上便攜式地物光譜儀。
審核編輯 黃宇
-
地物光譜儀
+關注
關注
0文章
81瀏覽量
3325
發(fā)布評論請先 登錄
相關推薦
便攜式地物光譜儀在農(nóng)業(yè)中的應用

如何通過地物光譜儀提升生態(tài)研究的精度?

地物高光譜儀的發(fā)展趨勢如何?
地物光譜儀在森林樹冠研究中的具體應用

地物光譜儀在植物冠層測定中的應用

地物光譜儀如何助力森林樹冠研究?
地物光譜儀:原理、應用與技術特點
地物光譜儀是測什么的

地物光譜儀怎么選?

iSpecField-NIR便攜式地物光譜儀:多領域應用的高效工具

地物光譜儀在土壤中油脂分析中的應用

地物光譜儀在環(huán)境植物分析中的應用

地物光譜儀是測什么的

評論