1、引言
巖屑錄井工作是油氣勘探和開發(fā)的基本過程之一,取不同井深的巖屑樣品,分析其元素組成及含量,可以為油氣開采和評估提供第一手的參考信息,對油氣勘探具有重要意義。激光誘導(dǎo)擊穿光譜(LIBS)技術(shù)具有實(shí)時(shí)在線、多元素同時(shí)檢測、樣品無需復(fù)雜前處理等優(yōu)點(diǎn)。與目前巖屑錄井中最常用的X射線熒光分析技術(shù)(XRF)相比,LIBS技術(shù)的檢測過程更為快速便捷,沒有XRF儀的輻射風(fēng)險(xiǎn),并可分析XRF不能很好識別的輕元素。作為近年來迅速發(fā)展的元素分析技術(shù),LIBS技術(shù)的特點(diǎn)與油氣勘探領(lǐng)域的巖屑錄井需求十分契合,具有很好的應(yīng)用前景和推廣潛力。但由于LIBS巖屑樣品分析中基體效應(yīng)、譜線干擾和自吸收效應(yīng)等問題,采用傳統(tǒng)的一元定標(biāo)法和內(nèi)定標(biāo)法對樣品的元素進(jìn)行定量分析通常不能滿足實(shí)際應(yīng)用的需要。獲得更為精準(zhǔn)的元素定量分析結(jié)果一直是LIBS技術(shù)在油氣勘探領(lǐng)域應(yīng)用推廣所面臨的挑戰(zhàn)之一。近年來,在LIBS數(shù)據(jù)分析研究中,基于多變量統(tǒng)計(jì)學(xué)習(xí)的偏最小二乘回歸(PLSR)、遺傳算法(GA)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)回歸(SVR)得到更多運(yùn)用。Sarkar等將PLSR運(yùn)用于鋼鐵樣品中Co、Mo、Cr、Ni元素定量分析。鄒孝恒等將遺傳算法與偏最小二乘法結(jié)合(GA-PLS)用于土壤元素定量分析,結(jié)果表明將遺傳算法作為一種譜線選擇預(yù)處理方法可以改善PLS模型的預(yù)測能力。Haddad等通過手持式LIBS儀器采集譜圖,運(yùn)用ANN算法對土壤進(jìn)行分類和元素含量定量分析,也取得了較好的效果。張瑩等在標(biāo)樣較少的情況下,將SVR算法運(yùn)用于鋼鐵樣品中的Cr和Ni元素定量分析,對比了以峰強(qiáng)度和峰面積作為模型輸入變量的模型效果,發(fā)現(xiàn)以峰面積作為變量獲得的模型效果更好。胡麗等將SVR算法結(jié)合LIBS技術(shù)運(yùn)用于水中Pb元素預(yù)測,測試集的相對標(biāo)準(zhǔn)偏差和相對誤差平均值分別為4.5%和12.1%。
目前,LIBS技術(shù)已廣泛應(yīng)用于鋁合金、鋼鐵、土壤、水體、食品和煤炭等元素的定量分析,而針對鉆井巖屑的元素定量研究還較少。本研究選擇在小樣本、非線性學(xué)習(xí)方面具有優(yōu)勢獨(dú)特的SVR算法,建立優(yōu)化8種元素(Si、Al、Ca、K、Mg、Mn、Ti、Fe)定量模型。針對實(shí)際應(yīng)用需求開發(fā)專用型儀器,并用于實(shí)踐工作,是LIBS技術(shù)推廣的關(guān)鍵。
2.實(shí)驗(yàn)部分
2.1儀器
測量儀器采用Nd:YAG激光器,激光波長1064nm,最大發(fā)射頻率1Hz,最大脈沖能量為100mJ。光譜檢測范圍為200~800nm,分辨率為0.1nm。儀器內(nèi)集成的延時(shí)器模塊可以為光譜儀提供0.5~200μs的外觸發(fā)延時(shí)信號。激光束通過平凸透鏡聚焦于巖屑樣品表面,產(chǎn)生的等離子體發(fā)出包含元素特性的原子發(fā)射譜線,經(jīng)過合適的延時(shí)時(shí)間后通過光纖探頭收集由光譜儀光電轉(zhuǎn)換完成數(shù)據(jù)采集。樣品置于儀器三維樣品臺上,依據(jù)軟件提供的參考圖像,通過旋轉(zhuǎn)三維平移臺改變樣品的檢測位置。經(jīng)過優(yōu)化,本研究采用的延時(shí)時(shí)間為4μs,激光能量為100mJ,激光頻率為1Hz。
圖1儀器原理示意圖
2.2樣品及樣品制備
18個(gè)巖屑樣品來自西南某油氣錄井現(xiàn)場,基本覆蓋應(yīng)用現(xiàn)象的巖性種類,編號為YW1~YW18。將樣品送至國家地質(zhì)實(shí)驗(yàn)測試中心,樣品玻璃熔片制樣法處理后,采用XRF技術(shù)進(jìn)行檢測,得到各個(gè)樣品中Si、Al、Ca、K、Mg、Mn、Ti、Fe元素濃度及巖性信息(表1)。由于PDC鉆頭廣泛應(yīng)用,鉆井取出的巖屑樣品十分細(xì)碎,甚至呈粉末狀,處于較為一致狀態(tài)。為了使樣品處于更為一致的狀態(tài),減少或消除環(huán)境及基體差異的影響,取1.5g各干燥的巖屑樣品,置于瑪瑙缽中研磨,利用壓片機(jī)在20MPa壓強(qiáng)下保持20s,壓制成直徑約30mm薄厚均勻的塊狀壓片樣品,用于譜圖采集??紤]到更大的樣品量所獲得的模型更為可靠,在YW1~YW18中隨機(jī)選擇兩種樣品,按一定比例混合,經(jīng)過稱量、攪拌、研磨和壓片后,另外配制了42個(gè)樣品,編號為A1~C42,按比例計(jì)算的成分含量見表1。表1中樣品編號標(biāo)有*號的樣品為測試集,其余樣品作為訓(xùn)練集。由于每個(gè)樣品重復(fù)采集6次,訓(xùn)練集和測試集分別包含240和120張LIBS譜圖。
表1巖屑樣品元素質(zhì)量分?jǐn)?shù)(wt%)
3.結(jié)果與討論
3.1 SVR建模簡介
支持向量機(jī)(SVM)最早作為一種二分類算法由貝爾實(shí)驗(yàn)室的Vapnik等在1995年提出,而后逐步運(yùn)用于回歸分析(SVR)。選取合適的訓(xùn)練集和測試集樣本數(shù)據(jù),確立輸入變量和因變量后,尋找最佳參數(shù)的SVR回歸模型,可以歸納為以下步驟:
歸一化對訓(xùn)練集和測試集數(shù)據(jù)進(jìn)行歸一化處理。
選擇核函數(shù)依據(jù)數(shù)據(jù)特點(diǎn)選擇核函數(shù),在本研究中選用徑向基核函數(shù)(RBF),其表達(dá)式為:
,
式中,xj為核函數(shù)中心點(diǎn)在高維空間的位置,xi為輸入輸入變量;xi-xj絕對值為高維空間兩點(diǎn)間的歐式距離。γ為標(biāo)準(zhǔn)高斯方程中的參數(shù)。
參數(shù)優(yōu)化在訓(xùn)練集內(nèi),通過網(wǎng)格搜尋(Gridsearch)的方式,尋找模型最佳的關(guān)鍵參數(shù)懲罰因子C及RBF核的關(guān)鍵參數(shù)γ。評估指標(biāo)為十折交叉驗(yàn)證方式得到的平方相關(guān)系數(shù)R2和交叉驗(yàn)證均方根誤差(RMSECV)。
驗(yàn)證將確立的最佳參數(shù)建立的模型用于測試集數(shù)據(jù)預(yù)測,并評估其預(yù)測效果。評估指標(biāo)為預(yù)測均方根誤差(RMSEP)和平均百分比誤差(MPE)??紤]到算法與儀器的集成,算法采用C#語言編寫,用開源的LIBSVM算法庫(Library)二次開發(fā),更為詳盡算法推導(dǎo)過程以及參數(shù)尋優(yōu)過程介紹可以參見文獻(xiàn)。
3.2光譜數(shù)據(jù)評估和預(yù)處理
由典型的巖屑樣品LIBS譜圖(圖2)可見,獲得的巖屑樣品光譜具有豐富的元素特征譜線,且具有較好的信噪比。
圖2典型巖屑樣品譜圖
以相對標(biāo)準(zhǔn)差(RSD)為指標(biāo),對YW3、YW4、YW8、YW16樣品分別采集12張譜圖,考察對SiI288.16、FeII275.57、KI766.49譜線的峰強(qiáng)度。由表2可知,獲得的數(shù)據(jù)重復(fù)性和穩(wěn)定性較好。此外,為建立更穩(wěn)定的模型,對原始譜圖各個(gè)光譜強(qiáng)度變量減去相應(yīng)基線值進(jìn)行基線校正,隨后對譜圖進(jìn)行五點(diǎn)平滑濾波降低噪聲,最后為使參數(shù)尋優(yōu)計(jì)算更容易正確的收斂,將LIBS譜圖的所有譜線強(qiáng)度值除以強(qiáng)度最大值,對所有譜圖數(shù)據(jù)進(jìn)行歸一化處理。
表2部分樣品部分特征譜線峰強(qiáng)度相對標(biāo)準(zhǔn)差
3.3 SVR模型輸入變量的選擇
巖屑樣品元素組成豐富,特征譜線豐富,同時(shí)也包含了交疊干擾、無用冗余的信息。輸入變量的合理選擇,是模型預(yù)測效果的關(guān)鍵因素。分別以全部光譜數(shù)據(jù)、特征譜線聚集數(shù)據(jù)段、部分優(yōu)選特征譜線峰面積和峰強(qiáng)度分別作為輸入變量,建立模型,考察獲得的模型效果。
在獲取樣品LIBS譜圖后,通過譜圖與NIST原子光譜數(shù)據(jù)庫對比,選擇信號強(qiáng)且干擾較少的一些特征譜線,分別以峰強(qiáng)度與峰面積作為變量,建立模型,所選擇的特征譜線見表3??紤]到選擇部分信號強(qiáng)、干擾少的譜線,不可避免地忽略一些其它相關(guān)信息,選擇所需分析元素特征譜線富集的8個(gè)光譜數(shù)據(jù)段(238~239nm、250~253nm、256~276nm、278~290nm、308~310nm、390~399nm、402~404nm、765~770nm)作為輸入變量,建立模型。此外,將200~800nm范圍內(nèi)所有波長的信號強(qiáng)度數(shù)據(jù)作為輸入變量,建立了相應(yīng)對比模型。以Si、Mn、Fe為例,最終各SVR模型輸入變量與訓(xùn)練結(jié)果見表4,以光譜數(shù)據(jù)段及全譜所有數(shù)據(jù)作為變量,雖然包含了更多特征信息,但由于無法很好地排除冗余無用信息干擾,整體效果較差,尤其對于含量較少、特征譜線強(qiáng)度較弱的元素效果尤為明顯。以部分優(yōu)選特征譜線峰面積作為輸入變量的效果最好,包含了峰高、峰寬、形狀等更全面信息,優(yōu)于峰強(qiáng)度作為輸入變量的模型效果。
表3支持向量機(jī)回歸模型特征光譜變量選擇
表4Si、Mn、Fe不同輸入變量的支持向量機(jī)回歸模型訓(xùn)練結(jié)果
3.4定量分析結(jié)果
根據(jù)3.3節(jié)的分析,以表3中的特征光譜峰面積為輸入變量。依照3.1節(jié)的步驟,以RBF為核函數(shù),交叉驗(yàn)證、網(wǎng)格搜索方式得到最優(yōu)的參數(shù)C和γ后,建立相應(yīng)模型對測試集中8種元素的含量進(jìn)行預(yù)測。以橫坐標(biāo)為預(yù)測值,縱坐標(biāo)為樣品XRF檢測值,各元素模型的最佳參數(shù)及預(yù)測效果見圖3,8種元素預(yù)測的平均百分比誤差(MPE)分別為Si5.68%、Al7.22%、Ca7.45%、K9.76%、Mg8.79%、Mn11.9%、Ti11.4%和Fe10.4%,滿足錄井工作的要求。
3.5應(yīng)用測試
依據(jù)錄井工作實(shí)際需求,將建立并優(yōu)化好的各元素SVR定量模型集成于軟件中,并對儀器硬件參數(shù)、軟件功能及操作界面進(jìn)行修改,將儀器改造成為錄井專用型號。在錄井現(xiàn)場按照巖屑錄井現(xiàn)場工作流程,對巖屑樣品研磨壓片、采集譜圖、預(yù)測定量結(jié)果,最后儀器軟件以報(bào)表形式進(jìn)行存檔。整個(gè)過程中,研磨壓片過程耗時(shí)1~2min,可考慮多樣品同時(shí)壓片,提高效率,而從采集譜圖到計(jì)算定量結(jié)果耗時(shí)僅為數(shù)秒。測試結(jié)果表明,集成了算法的整套儀器系統(tǒng)可以滿足巖屑錄井工作需求。
4結(jié)論
將自行研制的儀器結(jié)合SVR算法應(yīng)用于巖屑樣品中Si、Al、Ca、K、Mg、Mn、Ti、Fe的LIBS定量分析,對LIBS譜圖數(shù)據(jù)進(jìn)行基線扣除、平滑濾波及歸一化處理后,考察了不同輸入變量情況下SVR模型的訓(xùn)練效果。結(jié)果表明,以峰面積為輸入變量,得到的訓(xùn)練效果最好,各元素的平均百分比誤差在5.68%~11.9%之間。本研究針對巖屑錄井工作的實(shí)際應(yīng)用需求,優(yōu)化儀器硬件參數(shù),并將研究確立的定量模型集成于儀器中,使算法結(jié)合儀器成為專用型儀器,可用于應(yīng)用現(xiàn)場。此外,本研究中巖屑標(biāo)樣巖性種類、元素種類仍不全面,且對于含量較低的元素預(yù)測效果還有提升空間,提高LIBS信號的穩(wěn)定性、信噪比,建立更大巖屑樣本數(shù)據(jù)庫及優(yōu)化建立基于此數(shù)據(jù)庫的更多元素種類的定量模型將是下一步研究的重點(diǎn)。
圖3Si,Al,Ca,K,Mg,Mn,Ti和Fe8種元素預(yù)測效果圖
歡迎關(guān)注公眾號:萊森光學(xué),了解更多光譜知識。
萊森光學(xué)(深圳)有限公司是一家提供光機(jī)電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應(yīng)用系統(tǒng)的研發(fā)、生產(chǎn)和銷售。
審核編輯黃宇
-
激光
+關(guān)注
關(guān)注
19文章
3222瀏覽量
64595 -
光譜儀
+關(guān)注
關(guān)注
2文章
969瀏覽量
30841 -
SVR
+關(guān)注
關(guān)注
0文章
7瀏覽量
10760
發(fā)布評論請先 登錄
相關(guān)推薦
評論