為了改善空氣質量、防風固沙、減少水土流失等環境問題,中國政府進行了大規模的植樹造林活動。臭椿、云南松和欒樹作為中國常見的綠化樹種,自然而然地成為植樹造林的首選。由于我國綠化造林面積巨大,林業病蟲害幾乎是不可避免的問題,而解決這一問題要花費巨大的人力物力。高光譜激光雷達探測系統可以快速同步獲得地物目標的測距信息和光譜信息,可應用于目標的探測與識別等。這為研究一種精準高效的林業病蟲害監測方法提供了保障,因此開展基于高光譜激光雷達的林業病蟲害監測方法的研究具有重要的意義。
1實驗系統與分類方法
1.1新型可調諧高光譜激光雷達系統
新型可調諧高光譜激光雷達系統主要由發射系統、接收探測系統、掃描控制系統三個主要部分組成。發射系統主要由激光器和聲光可調諧濾波器(AOTF)組成;接收探測系統主要包括接收光學系統、光電探測器和數據采集系統;掃描控制系統負責對發射光束進行空間位置和激光出射方向的控制,實現預定的空間掃描。圖1為高光譜激光雷達原理,表1為高光譜激光雷達系統的主要參數。
圖1高光譜激光雷達原理示意圖
表1高光譜激光雷達的主要參數
高光譜激光雷達系統首先將超連續激光光束注入AOTF中,經AOTF調諧濾波后按照設置要求在不同時刻發射不同波長的單色光,激光經準直擴散鏡和反射鏡出射,出射光束有小部分投射到光束采樣鏡后進入主波探測器中并傳遞到數據采集系統,大部分光束通過掃描轉鏡后投射到目標上,目標的回波信號由光學接收系統接收,再經光電探測器轉化為電信號,由數據采集系統保存至上位機。對于采集到的數據首先進行預處理,即將采集到的樣本回波強度信息轉化為樣本光譜反射率信息。為了減少外部環境因素的影響,保證同一次實驗的數據之間可以橫向比較,使用回波反射率對每個測量目標進行歸一化。回波反射率由同一光譜通道的目標回波強度與參考板回波強度的歸一化處理得到。待測目標的反射率可表示為
式中:Itarget和Ireference分別為待測目標和參考靶標的激光回波強度;Rreference為參考靶標的反射率,參考靶標的反射率可通過地物光譜儀測量得到。起始波長為650m,終止波長為1100nm,波長間隔為5nm,共91個光譜通道,參考靶標可以選用不同反射率的白色參考板。
1.2分類方法
支持向量機是一種二類分類模型,其基本模型是定義在特征空間上間隔最大化的線性分類器,在分類問題中給定輸入數據和學習目標x={x1,x2,x3,…,xn}和y={y1,y2,y3,…,yn},其中輸入數據的每個樣本都包含多個特征并由此構成特征空間,而學習目標為二元變量并分別表示負類和正類。若輸入數據所在的特征空間存在作為決策邊界的超平面,則將學習目標按正類和負類分開,并使任意樣本的點X到平面距離不小于最小距離,則稱該分類問題具有線性可分性,超平面的法向量ω和截距b可表示為
但是支持向量機還是局限于線性可分的數據,當引入核函數之后,則使其成為實質上的非線性分類器。最早Cortes等提出了線性支持向量機,之后Stephan通過引入核技巧提出了非線性支持向量機。支持向量機是一種常用的數據分類和回歸的機器學習方法,該方法已成功地應用于遙感監測領域。支持向量機的優點是魯棒性強,對維數不敏感,對訓練樣本數量要求較低,而且支持向量機具有良好的泛化性能,具有較強的統計學習理論基礎。
2分類實驗與數據分析
2.1實驗樣本與樣本光譜反射率
本實驗采用的樣本包括標準反射率白板、健康的臭椿樣本、感染溝眶象的臭椿樣本、健康的云南松樣本、感染云南松切梢小蠹的云南松樣本、健康的欒樹樣本、感染潔長棒長蠹的欒樹樣本等。植被、土壤和水體等物質是地球表面的主要組成部分,具有顯著不同的光譜特征。色素吸收決定著可見光波段的光譜反射率,細胞結構決定近紅外波段的光譜反射率。一般情況下,植被在350~2500nm波長范圍內具有典型的反射光譜特征,而且植被分析常使用紅邊區域和近紅外區域的工作波段。因此,本實驗的工作波長選定為650~1100nm,光譜通道數量為91個,光譜分辨率為5nm,在吸收率100%的黑色參考板背景下對上述目標在固定距離處分別采集回波強度信號。實驗采集的部分樣本如圖2所示。
圖2高光譜激光雷達數據采集的樣本實例
由于林木樣本的生長環境和保存狀況一直處于變化之中,而且木質樣本易受大氣介質等因素的影響,所以林木樣本表面的成分隨著時間推移而不斷變化,因此激光回波強度受林木樣本表面特性的影響很大。首先對健康林木樣本表面與感染林木樣本表面的光譜反射率差異進行初步分析。圖3為健康樣本表面與染病樣本表面的反射率趨勢。從圖3可以看到,除了健康臭椿與感染溝眶象臭椿的反射率在部分波長范圍內反射率差異較大,其他幾種林木樣本健康與染病的反射率都十分接近。
圖3健康樣本表面與染病樣本表面的反射率。(a)臭椿;(b)云南松;(c)欒樹
2.2支持向量機分類器模型的構建及參數選擇
由于林木樣本的波長與反射率是非線性的,為此本文采用了非線性支持向量機分類器。支持向量機可以配置不同的核函數來處理各種非線性決策邊界,目前常用的核函數有多項式核函數、高斯徑向基核函數、線性核函數。因為高斯徑向基核函數具有平滑、穩定、同步的特性,所以本研究采用的是高斯徑向基核函數,即
式中:x和z為空間內不同的樣本點;σ為核半徑。關于實驗數據處理,本文使用軟件對回波信號進行處理、劃分樣本集、建模以及評價。通過數據預處理得到了樣本的光譜信息,之后將健康的臭椿樣本與感染溝眶象的臭椿樣本、健康的云南松樣本與感染云南松切梢小蠹的云南松樣本、健康的欒樹樣本與感染潔長棒長蠹的欒樹樣本的表面反射率數據一分為二,一半作為支持向量機的訓練集并用于構建支持向量機模型,另一半作為測試集并用來驗證支持向量機分類器模型的分類效果。得到三組不同的支持向量機模型之后,調節模型參數使模型性能更加優越。使用基于高斯徑向基核函數的SVM模型有兩個非常重要的參數C與γ。
C為懲罰系數,即對誤差的寬容度,若C值越大,則說明越不能容忍出現誤差,容易過擬合;若C值越小,則容易欠擬合,綜上C值過大或過小,都會影響模型的泛化能力。γ是選擇高斯徑向基函數作為核函數后,該函數自帶的一個參數,其隱含地決定了數據映射到新的特征空間后的分布,γ值越大,則支持向量越少,這會造成SVM只作用于支持向量樣本附近,則訓練集上的準確率很高,而測試集上的準確率較低,存在過擬合的風險;γ值越小,則支持向量越多,則會造成平滑效應太大,無法在訓練集上得到特別高的準確率,也會影響測試集的準確率。此外高斯徑向基核函數公式里面的σ和γ的關系,可以通過改變σ值來影響γ,先根據經驗對其懲罰因子C和核函數的固有參數進行初始化賦值,然后通過實驗測試,再根據測試數據反復調整參數值,直到得到滿意的結果為止。因為實驗選用正類與負類的數據數量一樣多,所以對懲罰系數在0~64之間進行選擇。根據臺灣大學林智仁教授的研究表明σ值通常可以在2-5~25之間,所以對σ在2-5~25之間進行選擇。圖4為不同σ值條件下健康林木樣本與染病林木樣本的分類精度趨勢,圖5為不同C值條件下健康林木樣本與染病林木樣本的分類精度趨勢。
圖4不同σ值條件下健康林木樣本與染病林木樣本的分類精度趨勢。(a)臭椿;(b)云南松;(c)欒樹
σ的取值集中在0~1之間,γ的取值較大、支持向量減少,則展現出較高的分類精度;當σ增大時,γ值減小、支持向量增多,則樣本的分類精度呈現出明顯的下降趨勢。從圖4(a)可以看到,健康臭椿與感染溝眶象臭椿在σ=2-2.7附近的分類精度可達0.9890。從圖4(b)可以看到,健康云南松和感染切梢小蠹云南松在σ=2-2.1附近的分類精度可達0.9286。從圖4(c)可以看到,健康欒樹與感染潔長棒長蠹欒樹在σ=2-2.5附近的分類精度可達0.6703。對于懲罰系數C來說,隨著C值的增加,分類精度迅速增加,當前取值超過一定范圍之后分類器模型的性能將不會有較大提升。通過分析發現,剛開始C值增加,模型的復雜度增加,支持向量減少;而當C值足夠大之后,模型中邊界支持向量的數量為0,C的變化就不會對模型的性能產生較大的影響。從圖5(a)可以看到,健康臭椿與感染溝眶象臭椿在參數C=47附近的分類精度可達0.9945。從圖5(b)可以看到,健康云南松和感染切梢小蠹云南松在C=18附近的分類精度可達0.9286。從圖5(c)可以看到健康欒樹與感染潔長棒長蠹欒樹在C=48附近的分類精度可達0.6593。
圖5不同C值條件下健康林木樣本與染病林木樣本的分類精度趨勢。(a)臭椿;(b)云南松;(c)欒樹
2.2測試集數據實驗結果驗證
完成支持向量機模型優化之后,就得到了適合識別不同種類林木樣本健康或者染病的支持向量機模型。將測試集數據輸入支持向量機分類器模型中,用來驗證其分類效果。表2為樣本測試數據的分類精度。
表2測試集樣本數據的分類精度
通過測試集數據的驗證,經過參數優化之后的支持向量機模型可以很好地分類識別各種林木樣本目標,而且都達到了預期效果,并未出現過擬合的現象。從表2可以看到,臭椿和云南松的分類精度較高,可以達到90%以上;欒樹的分類精度也接近70%。分類精度較高主要是因為其在650~1100nm整個波長范圍內的反射率差異顯著,除了部分波段有混疊現象外,其他部分差異十分明顯。而欒樹在650~1100nm整個波長范圍內的反射率非常接近,這也是其分類精度較低的主要原因。綜合來看支持向量機對于健康與染病的多種林木樣本,分類效果明顯,原因在于新型可調諧的高光譜激光雷達的91通道光譜信息為分類提供了豐富的光譜信息,而且具有主動測量、占地面積小、抗干擾能力強等優點,這就使測量精度得到保證。
2結論
本研究利用自研的新型可調諧高光譜激光雷達系統,對固定距離下不同種類的健康林木樣本和染病林木樣本進行了分類研究,通過分析健康林木樣本表面光譜與橫截面光譜的關系證實表面光譜用于分類的可行性;運用支持向量機對健康和染病的林木樣本的表面光譜反射率展開了關于核函數選取、模型參數選擇、分類精度的相關研究;將實驗獲得的數據輸入到優化之后的支持向量機模型中并進行驗證,發現其對實驗樣本有良好的分類效果。其中健康臭椿和感染溝眶象臭椿在參數σ=2-2.7、C=47附近的分類精度可達96.98%;健康云南松和感染切梢小蠹云南松在參數σ=2-2.1、C=18附近的分類精度可達91.21%;健康欒樹與感染潔長棒長蠹欒樹在參數σ=2-2.5、C=48附近的分類精度66.21%。
雖然欒樹的分類精度沒有臭椿和云南松高,但在日后的研究中可以通過對模型的調整優化來進一步提升分類精度。本文在有限的光譜通道條件下對健康和染病的林木樣本表面光譜反射率進行分類識別,探索了一種適用于基于可調諧高光譜激光雷達光譜的病蟲害林木樣本分類方法,目前只獲得了初步結果,但具有一定的參考價值。本文的研究并未關注林木樣本的染病程度,只是定性地分析了林木樣本的健康染病與否,日后可以展開林木樣本染病程度的相關研究,實現更加精確的監測。
萊森光學(深圳)有限公司是一家提供光機電一體化集成解決方案的高科技公司,我們專注于光譜傳感和光電應用系統的研發、生產和銷售。
審核編輯 黃昊宇
-
激光雷達
+關注
關注
967文章
3943瀏覽量
189627 -
高光譜
+關注
關注
0文章
328瀏覽量
9918
發布評論請先 登錄
相關推薦
評論