本章基于原位LIBS技術利用煤炭全光譜波點與目標校準值之間的相關性對獨立變量進行重組,并分別建立了測定煤樣灰分、揮發分和熱值的定量模型。為了評估這種特征工程方法的合理性,又從物質成分的角度對重組變量光譜進行了可解釋性實驗。
一、引言
煤質分析對于促進煤炭資源的合理利用具有重要意義,其中煤炭的灰分、揮發分和熱值是影響燃煤電廠混煤入爐、爐膛燃燒等工作的關鍵信息。傳統的LIBS光譜檢測需要耗費很長時間從煤樣光譜中篩選元素的特征譜線。這種選擇特征譜線的方法費時費力,而且對于不同鍋爐的煤炭樣品,需要重新根據LIBS光譜數據來選擇特征譜線。為解決上述問題,本章基于原位LIBS技術利用煤炭全光譜波點與目標校準值之間的相關性對獨立變量進行重組,并分別建立了測定煤樣灰分、揮發分和熱值的定量模型。為了評估這種特征工程方法的合理性,又從物質成分的角度對重組變量光譜進行了可解釋性實驗。
定量分析方法
本章采用主成分分析法來獲取LIBS全光譜中的特征信息作為獨立變量,然后通過普通最小二乘回歸法來構建煤炭灰分、揮發分和熱值的定量模型。為解決獨立變量中的高階噪聲問題,提出一種基于變量重組的特征選擇方法來提取LIBS光譜中的關鍵信息,并通過波點載荷提取的元素特征譜線對這種特征選擇方法進行驗證。
1、主成分分析法
主成分分析(PCA)是一種常用的多元數據統計分析方法。主成分表示原始數據在正交方向上的分解,主成分分析可以在保留最大信息量的前提下消除共線性問題、同時降低輸入變量的維度。
2、基于變量重組的特征選擇方法
主成分分析是遵循解釋方差大小的順序對主成分PC進行排序,通常只選擇少數主成分來校準模型,因為高階的主成分會存在較大噪音。傳統PCA只根據光譜數據無法保證所選擇的主成分與校準值更相關,而且隨著主成分幅度的減小,無法在循環中選擇原始主成分的最優數量。因此,通過引入校準值與每個主成分全譜波點解釋方差的相關性得分,并對輸入變量進行特定排序、篩選。使用這種重組方式可以選擇與校準值更相關的主成分,實現最大化回歸指標,而不是僅限于選擇少數的原始主成分作為定量模型的輸入變量。
3、基于波點載荷提取元素特征譜線
主成分載荷是一種用于衡量每個變量對主成分貢獻程度的統計量,通過計算變量在主成分上的權重或系數來解釋兩者之間的關系。
4、普通最小二乘回歸法
普通最小二乘法(OLS)是一種用于估計線性回歸中未知參數的方法。線性回歸的目標是找到最佳的參數向量,使得預測值和真實值之間的誤差最小化。可以選擇不同的損失函數來衡量誤差,并通過最小化損失函數求解最佳回歸參數。
本章的數據處理及定量分析過程可以分為4個部分:(1)根光譜預處理方法對采集到的LIBS煤炭光譜進行處理,包括背景光譜去除、多通道光譜歸一化、基于極小值點篩選法的基線校正、異常光譜處理以及元素特征光譜峰值的洛倫茲擬合。(2)劃分煤炭光譜數據集,并基于校準值相關性和建模結果對主成分進行特定排序、篩選,從而實現變量重組。(3)變量重組后的普通最小二乘法建模以及定量分析。(4)基于全光譜變量重組后的載荷信息及相關性提取元素特征譜線。上述處理過程中的第(2)部分使用R和RMSECV用于變量重組后定量模型的性能分析,第(3)部分使用R、RMSECV和RMSEP來評估回歸模型的性能,第(4)部分使用NIST數據庫與元素特征譜線進行對比。
煤炭灰分、揮發分和熱值定量分析
本章使用135個煤樣作為訓練集,用于構建灰分、揮發分和熱值定量模型并完成十折交叉驗證,33個煤樣用于模型測試。其中,需要分別選擇不同數量未重組和重組后的主成分作為定量模型的獨立變量。然后,對訓練集樣本進行10折交叉驗證,獲得R2和RMSECV的平均值。如圖1所示,當選擇前40個未重組的主成分作為獨立變量時,獨立變量對全部光譜波點的累積解釋率達99.0321%。
圖1LIBS煤樣全光譜的主成分分析結果
對于不同的定量任務,重組變量的數量需要根據獨特模型來選擇,灰分、揮發分和熱值定量模型所最終選擇的獨立變量個數如圖2所示。隨著獨立變量數量的增加,定量模型R的總體趨勢先變大后變小,而RMSECV總體趨勢先變小后變大。值得注意的是,變量未重組和變量重組后的定量模型在交叉驗證曲線上存在巨大差異。這是因為,隨著未重組變量數量的增加,累積解釋率的方向不一定更好解釋校準值的變化。而且,更高階的未重組變量會存在更多噪聲,這會降低回歸模型的性能,從而導致RMSECV增加。通過變量重組,可以選擇更多真實特征而不是噪聲作為獨立變量,得到更平坦的收斂曲線。在交叉驗證過程中,R、RMSECV和N(獨立變量的個數)同時考慮。當R最大、RMSECV最小時,此時所選擇的N對應回歸模型的校準效果越好。
圖2變量重組前后獨立變量個數的提取結果
變量重組前后,普通最小二乘定量模型分析煤質參數的流程為:首先,對煤樣中的訓練集樣本進行交叉驗證,得到R和RMSECV。然后,使用訓練模型對33個測試樣本進行分析,定量結果如圖3所示。其中,誤差棒是10次重復測量測試集RMSEP的結果。從圖3可以明顯看出,灰分、揮發分和熱值的預測結果都優于定量模型在變量未重組時獲得的結果。對于變量重組后的灰分定量模型,訓練集和測試集的R、RMSECV、RMSEP分別為0.9701,0.9818,0.7153wt%,0.7037wt%。其中灰分的RMSECV下降59.91%,RMSEP下降60.23%。對于變量重組后的揮發分定量模型,訓練集和測試集的R、RMSECV、RMSEP分別為0.9458,0.9429,0.5678wt%,0.6628wt%。揮發分的RMSECV下降51.87%,RMSEP下降53.65%。對于變量重組后的熱值定量模型,訓練集和測試集的R、RMSECV、RMSEP分別為0.9858,0.9811,0.1518MJ/kg,0.1613MJ/kg。其中,RMSECV下降84.06%,RMSEP下降84.15%。表1為變量重組前后的定量模型評估指標,表中灰分和揮發分含量的單位為wt%,熱值的單位為MJ/kg。綜上所述,變量重組后灰分、揮發性物質和熱值校準模型的RMSEP降低53~84%,這意味著變量重組后的定量模型可以更好的預測煤質工業指標含量。
圖3變量重組前后的定量分析結果
表1變量重組前后OLS定量模型的評估指標
四、特征工程的可解釋性實驗
為了驗證這種全光譜特征選擇方法對于LIBS煤炭原始光譜數據集的可解釋性,分別對灰分、揮發分和熱值校準模型中獲取的重組變量進行相關性排序。并基于煤樣LIBS全光譜波點載荷的累積值,來提取三種煤質指標相關的原子或分子特征譜線。首先,對每個校準模型重組變量的相關性進行排序,排序結果如圖4中的(a)、(c)和(e)所示。由圖可知,前20個重組變量與目標校準值的相關性較高。但是,隨著重組變量個數的增加,可以看到重組變量的相關性曲線并不平坦。這是因為解釋原始光譜方差的方向不一定與校準值更相關。雖然,后續重組變量的相關性減弱,但是依舊包含與目標校準值相關的真實信息。經過重組變量,從煤炭光譜數據中提取了更多的相關特征作為輸入變量。
圖4變量重組的相關性排序和全光譜波點的篩選結果
然后,計算每個校準模型中重組變量在全光譜波點載荷上的累積相關值,并將每個波點載荷的累積相關值調整到區間[1,-1]。最后再分為以下四個步驟:(1)對LIBS全光譜進行尋峰,得到283個譜線。(2)選定C@761.21nm和O@764.86nm兩條連續元素特征譜線進行洛倫茲峰值擬合。(3)對累積相關值中絕對值較大的波點進行篩選。(4)根據NIST原子光譜數據庫對篩選后的波點進行判定,從而得到三種煤質指標相關的元素特征譜線。基于全光譜波點載荷篩選后的結果如圖4中的(b)、(d)和(f)所示,從灰分、揮發分和熱值定量模型的輸入變量中提取的元素特征譜線如表2所示。
表2從NIST數據庫中提取灰分、揮發分和熱值的特征譜線波長
煤中的灰分主要由金屬元素氧化物組成,包括CaO、MgO、KO、NaO、SiO、TiO、AlO、FeO等。因此,Ca、Mg、K、Na、Si、Ti、Al、Fe和Zn等金屬元素可作為影響灰分含量的關鍵指標。類似地,C、H、O、N、S等非金屬元素和Si、Fe、Ca、Mg和Ti等金屬元素決定了煤的揮發性成分和熱值。變量重組后,提取煤炭灰分、揮發分和熱值相關的元素特征譜線分別如圖5中的(a)、(b)和(c)所示。對于灰分含量,獲得了二十九條特征譜線,包括八種金屬元素(K、Ti、Fe、Zn、Na、Mg、Ca、Si)、三種非金屬元素(C、N、O)和一條CN雙分子譜線。其中,金屬元素對應于灰分的主要成分,非金屬元素和CN@387.25nm均與灰分呈負相關。對于揮發分,獲得了包括金屬和非金屬元素在內的25條特征譜線。其中,有五種金屬元素(Ti、Fe、Ca、Si、Na),五種非金屬元素(C、H、O、N、S)和三種CN雙分子譜線。值得注意的是,C@260.08nm、CN@385.10nm、CN@387.25nm、CN@387.64nm、H@486.13nm、C@581.83nm、C@761.21nm、O@764.86nm與揮發性物質呈正相關,S@579.75nm呈負相關。
圖5變量重組后元素特征譜線的提取結果
這是因為揮發分的組成成分主要包括碳氫化合物、氫氣和一氧化碳等物質。而在高溫下,硫與碳會反應形成硫化物,從而抑制煤中揮發性物質的釋放。因此,隨著煤中硫含量的增加,煤中的揮發分會減少。C@193.04nm、C@247.86nm和N@493.51nm的負相關可能是揮發分測試集擬合系數僅為94.29%的主要原因。對于熱值,獲得了包括金屬元素、非金屬元素和CN雙分子譜線在內的27條特征譜線。其中,有五種非金屬元素(C、H、O、N、S)和六種金屬元素(Fe、Mg、Ca、Si、Ti、Na)。C、H、O、N和CN的譜線與熱值呈正相關,而S@579.75nm與熱值呈負相關。這是因為煤中的C、H、O、N是產生熱量的主要來源,硫化物的形成會導致煤的熱值下降。因此,降低煤中的硫含量可以增加其揮發分和熱值。而當煤炭在正常空氣氛圍下進行LIBS實驗時,碳和氮反應產生的CN雙分子線也會通過碳元素間接影響揮發分和熱值。
五、結論
對于煤炭的灰分、揮發分和熱值,利用LIBS技術并基于全譜點解釋方差與校準值之間的相關性,對輸入變量進行了重組處理,分別建立了三種定量檢測模型。經變量重組后,從原始光譜中提取了更多與目標任務相關的元素特征譜線來預測灰分(從18到100)、揮發分(從7到99)和熱值(從18至113)。結果表明,變量重組后灰分、揮發分和熱值定量模型的R分別為0.9818、0.9429和0.9811,RMSECV和RMSEP分別降低了51.87~84.06%和53.65~84.15%。為了證明變量重組對于煤炭LIBS光譜的可解釋性,本章又基于全光譜波點載荷和變量重組的相關性完成了進一步的可解釋性實驗。結果表明,八種金屬元素與灰分的主要成分相對應,三種非金屬元素與CN雙分子譜線均呈負相關。揮發分包括五種非金屬元素和五種金屬元素,其中氮和一些碳元素的負相關性降低了校準模型的預測能力。熱值包括五種非金屬元素和六種金屬元素。揮發分和熱值與非金屬元素的正相關性符合其物質組成成分。硫元素的負相關性是由于煤在燃燒過程中產生了硫酸鹽和含硫氧化物,而較高的硫元素水平會導致煤炭揮發量和熱值較低。上述定量分析過程證明了LIBS技術結合變量重組后的定量模型能夠準確煤炭的灰分、揮發分和熱值。后續對于不同類型的煤樣,該方法還可以通過基體效應校正進行優化。此外,該方法還可以推廣到煤炭和其他物質中主要元素的檢測。
推薦:
激光誘導擊穿光譜技術在低碳鋼鐵冶金行業的應用
LlBS激光誘導擊穿光譜系統是該技術通過超短脈沖激光聚焦樣品表面形成等離子體,利用光譜儀對等離子體發射光譜進行分析,識別樣品中的元素組成成分,可以進行材料的識別、分類、定性以及定量分析。
歡迎關注公眾號:萊森光學,了解更多光譜知識。
萊森光學(深圳)有限公司是一家提供光機電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應用系統的研發、生產和銷售。
審核編輯 黃宇
-
光譜
+關注
關注
4文章
832瀏覽量
35237 -
PCA
+關注
關注
0文章
89瀏覽量
29633
發布評論請先 登錄
相關推薦
評論