一、引言
激光誘導擊穿光譜作為一種新興的基于原子發(fā)射光譜的元素分析技術,憑借樣品前處理簡單、微損甚至無損、在線原位檢測等優(yōu)點,已被廣泛應用于地質勘探、工業(yè)監(jiān)測、醫(yī)學檢測等方面,是一種極具應用前景的成分分析技術。
近年來,LIBS在中藥成分檢測領域逐漸興起。運用LIBS信號強度變化率結合移動窗標準差法快速評價朱砂和雄黃混合過程,結果證明了LIBS在監(jiān)測中藥制藥生產(chǎn)方面的潛力。采用LIBS技術測定了18種波蘭草藥中鈣、鉀和鎂等其他金屬元素(鈉、銅、鐵、錳、鋅等),并對其中的鈣、鉀和鎂進行定量分析,結果與一致。將近紅外光譜與LIBS光譜相結合來區(qū)分國產(chǎn)和進口黃芪,使用近紅外光譜的SVR系數(shù)與35個LIBS譜峰值進行識別準確率達95.8%,與單獨使用近紅外光譜(91.5%)相比,準確率提高了4.3%。
以上研究證明了LIBS技術在中藥成分檢測中的可行性。然而,基于LIBS技術的中藥產(chǎn)地溯源研究較少,仍處于起步階段,目前的研究都存在藥材產(chǎn)地數(shù)量少,識別準確率較低等問題。因此,基于LIBS技術結合人工智能算法對不同產(chǎn)地的山藥進行系統(tǒng)性研究。我們搭建LIBS試驗系統(tǒng)并結合多元散射矯正-改進遺傳算法-支持模型來識別8種不同產(chǎn)地的山藥飲片。八種產(chǎn)地的山藥飲片磨粉過篩后制成粉末壓片,通過采集山藥飲片的LIBS光譜,分別使用單一分類器與光譜預處理、特征提取及模式識別算法的模型對光譜的識別結果進行對比。結果顯示,LIBS技術結合模型可以準確且快速識別山藥產(chǎn)地。
實驗部分
2.1 儀器
所用的LIBS實驗裝置如圖1所示
2.2 樣品制備
用八類不同產(chǎn)地的山藥飲片,如表1所示,由于山藥飲片產(chǎn)地、炮制工藝以及價格各不相同,導致它們藥用價值存在差異。實驗中樣本的處理流程如圖2所示。首先,使用研缽將飲片研磨成粉過100目篩。然后,使用電子天平稱量9g硼酸粉末和1g樣品粉末,在壓樣機30t壓力下將待測樣品壓制成直徑為40mm的圓餅狀壓片。每種產(chǎn)地的山藥飲片使用3個重復樣本,共制備24個壓片。
表1實驗所用藥材飲片
結果與討論
3.1 光譜分析
各類藥材飲片(S1-S8)的平均光譜及典型峰值如圖3所示。各類藥材的平均光譜整體趨勢一致,所含譜峰基本相同,但峰強度各不相同,分析認為不同產(chǎn)地的山藥富集能力存在差異,道地山藥對一些金屬元素的富集能力大于非道地產(chǎn)區(qū)山藥。圖中,譜峰代表的金屬元素有K,Na,Ca,Mg,Al等,非金屬元素有C,H,O及C-N鍵等。其中,K元素特征譜線(769.90nm)的峰值最強,即山藥飲片中K元素含量最多,相關研究表明山藥根莖對K元素的富集能力最強。為剔除光譜中大量的冗余信息,觀察圖3并選擇峰值較為明顯的35條特征譜線作為特征提取的預選譜線,如表2所示。
圖2藥材飲片的平均光譜
表2所選特征譜線
3.2 單一分類器產(chǎn)地溯源
對八種產(chǎn)地山藥飲片24565維的原始光譜進行產(chǎn)地溯源,使用SVM,KNN和EML三種模式識別方法的分類結果如圖4所示。圖中顯示,三種模型的交叉驗證集和測試集準確率均在90%以上,SVM模型的分類效果最好,交叉驗證集準確率為93.50%,測試集準確率為96.43%。由于山藥飲片產(chǎn)地種類多、光譜維度高,原始信號數(shù)據(jù)量大且包含噪聲和冗余特征,致使分類耗時長且分類準確率低,因此有必要對原始光譜進行數(shù)據(jù)預處理和特征提取。
圖4原信號產(chǎn)地溯源結果
3.3 模型改進
首先,使用三種預處理方法對八種產(chǎn)地山藥飲片的原始光譜進行處理。在SG卷積平滑法中,選用5,7,9和11的窗口寬度進行參數(shù)優(yōu)化,通過比較識別準確率,確定本研究中所用窗口寬度為5。在WT預處理過程中,小波函數(shù)采用常用的db2,db4,db8,sym2,sym5和sym8,分解層數(shù)采用1-9層,最終確定選用db2函數(shù)2層小波分解為WT的最優(yōu)參數(shù)。
經(jīng)過預處理后,各類光譜的CV均值和標準差如圖5所示。圖5顯示,無預處理時光譜的波動性最大,各類光譜的CV均值為12.54%,經(jīng)過三種預處理后CV均值明顯下降,光譜的穩(wěn)定性明顯提升。MSC和WT的CV均值較為接近且小于SG卷積平滑法的CV均值,表明MSC和WT對光譜穩(wěn)定性的提升效果好于SG卷積平滑法。WT的CV均值小于MSC,但WT各類光譜CV的標準差較大,即各類光譜的波動差距較大,而MSC各類光譜的波動差距較小,MSC在減小光譜波動性方面整體表現(xiàn)較好。
圖5各產(chǎn)地山藥光譜CV均值和標準差
對預處理后的光譜數(shù)據(jù)進行特征提取。按表2選出35條特征譜線后,分別使用PCA和IGA進行特征提取。不同光譜預處理下PCA選擇的主成分數(shù)量與累積貢獻率的關系如圖6所示。當累積貢獻率達到99%以上時,MSC、SG卷積平滑、WT三種預處理方式下各選擇6,5和5個主成分,其累積貢獻率分別為99.23%(黑線)、99.03%(紅線)、99.07%(藍線)。針對不同預處理和模式識別方法處理的光譜,使用IGA提取的特征數(shù)量如表3所示。
圖6成分累積貢獻
表3在各方法下IGA提取的特征數(shù)量
表4各模型分類結果排序
表4顯示,排名前十的模型中接近一半的模型使用了MSC預處理方法,接近一半的模型使用了SVM模式識別方法。結果表明,MSC預處理方法和SVM模式識別方法有助于準確識別山藥飲片產(chǎn)地。測試集準確率排名前五的模型均使用了IGA進行特征提取,在識別種類多、識別難度大的情況下,IGA比PCA更能清楚辨別光譜中的非線性關系,同時受噪聲的影響更小。MSC-IGA-SVM模型的產(chǎn)地溯源效果最好。MSC-IGA-SVM模型的交叉驗證集準確率為96.9%,測試集的準確率為97.32%,與直接使用原信號建立的最好模型SVM(96.43%)相比,測試集準確率提高了0.87%。同時,MSC-IGA-SVM模型將輸入變量的維度減少了99.93%。
MSC-IGA-SVM模型對八種山藥飲片產(chǎn)地溯源的混淆矩陣如圖7所示,除了S4和S7有錯誤分類現(xiàn)象外,其他類別均能正確識別。S1和S2雖然產(chǎn)地相同,但兩批山藥飲片炮制工藝不同,價格相差較遠,因此品質存在差異,能進行精確分類。而對于S4和S7,兩種產(chǎn)地山藥產(chǎn)地雖然不同,但存在錯分現(xiàn)象。10.7%的S4錯分為S7,同時10.7%的S7錯分為S10。
為進一步探究錯誤分類原因,對IGA選取的特征進行三維成像,如圖8所示,S4與S7存在重疊區(qū)域,其數(shù)據(jù)存在相似性。S4為廣西南寧無硫高溫烘焙的價值為31元/500g的山藥飲片,S7為安徽池州無硫低溫烘焙的價值為18.5元/500g的山藥飲片。兩者產(chǎn)地相差較遠,且炮制工藝不同,難以辨別的原因推測是山藥種植品種、種植條件等方面存在共性。
圖7MSC-IGA-SVM模型分類結果的混淆矩陣
圖8MSC-IGA數(shù)據(jù)圖
(a):前三個特征;(b):次三個特征
四、總結
針對山藥飲片的產(chǎn)地溯源問題,使用LIBS技術結合MSC-IGA-SVM模型對產(chǎn)地識別的準確度進行了改善。使用KNN、SVM和EML分類器對八類光譜直接使用原信號進行分類,SVM模型具有較強魯棒性,效果最好,其準確率為96.43%。使用預處理(MSC、SG卷積平滑、WT)、特征提取(PCA和IGA)的方法對模型改進,MSC-IGS-SCM模型的識別效果最好,其能有效降低光譜波動性,同時輸入變量維度降低了99.93%,將測試集準確率提升為97.30%。結果表明,LIBS技術結合MSC-IGA-SVM模型能夠準確且快速對山藥飲片進行產(chǎn)地溯源。
推薦:
激光誘導擊穿光譜技術在低碳鋼鐵冶金行業(yè)的應用
LlBS激光誘導擊穿光譜系統(tǒng)是該技術通過超短脈沖激光聚焦樣品表面形成等離子體,利用光譜儀對等離子體發(fā)射光譜進行分析,識別樣品中的元素組成成分,可以進行材料的識別、分類、定性以及定量分析。
審核編輯 黃宇
-
光譜
+關注
關注
4文章
798瀏覽量
35090 -
激光誘導
+關注
關注
0文章
20瀏覽量
5585
發(fā)布評論請先 登錄
相關推薦
評論