續上文
3、退化指示種識別與結果分析
3.1 識別目標波段特征分析
通過野外調查和現場樣方照片可知,該實驗區的植被主要為冷蒿,其他植被數量較少并且類型較多,混雜生長,難以獲取單一物種植被的實地光譜信息。因此,將把實驗區的地物分為3類,分別為裸土、冷蒿、其他綠色植被。
首先,使用訓練樣本管理器選擇每個分類對象的訓練樣本數據;其次,在樣本里提取了每個對象數據的平均光譜曲線,得到地物的真實的反射率數據;實測光譜曲線如圖3所示。
圖3 實測反射光譜曲線
由圖3可知,在450~540nm范圍內植被的光譜特征差異并不是很明顯,在715~730nm范圍內冷蒿與其他綠色植被的光譜曲線有混淆現象。由于存在光譜曲線的混線問題及難以分辨植被類型的問題。因此,通過原始光譜曲線進行微分變換和包絡線去除變換(如圖4和圖5所示),放大植被波段之間的差異,減少植被之間的光譜曲線的混淆現象。
圖4 微分變換曲線圖
由圖4可知,原始光譜曲線進行離散變量差分方程后,依然存在植被的光譜曲線的混淆的現象。
圖5 包絡線去除變換光譜曲線
故進一步包絡線去除變換(圖5)后,位于500nm處的吸收谷,550nm處的反射峰、670nm處的吸收谷,其他綠色植被和冷蒿的光譜曲線有明顯的差異。為了能夠有效地選擇地物特征波段,進一步計算光譜反射率數據均值和標準差值,繪制了標準差的誤差棒圖,如圖6所示。
圖6 訓練樣本光譜特征曲線和標準差
由圖6可知,在波段700~950nm范圍內,兩類植被的光譜反射率的標準差值重疊的,不參與植被識別中,故剔除重疊部分,以利于選出識別退化指示種的特征波段。經微分變換、包絡線去除和計算標準差處理后,發現在500、550、670nm處有明顯的差異,此3個波段滿足了所選的波段信息具有較大的光譜差異的條件,故選取此3個波段作為特征波段并進行特征波段組合。特征波段組合數據對細小地物的紋理結構和圖像的色彩差別增強,對退化指示種的識別成為可能。因此,在特征波段組合數據基礎上,進行了模型的構建。
3.2 構建識別模型與驗證
基于軟件,特征波段組合數據為底圖,結合實地調查數據,隨機均勻的選取訓練樣本,如圖7所示。
圖7 訓練樣本分布圖
在此基礎上,采用隨機森林和支持向量機作為分類器,選擇合適的模型參數,對所選擇的訓練樣本進行模型訓練并分類,2種模型的分類結果如圖8所示。
圖8 支持向量機和隨機森林分類結果
為了準確描述2種機器學習模型的分類精度,本實驗采用混淆矩陣對獨立驗證樣本的分類準確率進行評估。通過混淆矩陣得到分類影像的Kappa系數、生產者的精度、用戶的精度和整體精度等評估指標,以量化2種模型的性能對分類準確率的貢獻。本實驗中驗證樣本一共選取了600個,與訓練樣本的比例為5∶3,對2種模型的性能進行評估,結果如表2和表3所示。
表2 支持向量機的混淆矩陣結果統計表
從支持向量機的混淆矩陣結果(如表2所示)可知,總體精度為96.92%,Kappa系數為0.95,分類中出現了冷蒿錯分為裸土的有6個、其他綠色植被的有19個、裸土錯分為冷蒿的有5個、其他綠色植被錯分為冷蒿的有7個。因為裸土和其他綠色植被的光譜特征比較明顯的差異,所以錯分的現象不是很明顯。
表3 隨機森林的混淆矩陣結果統計表
從隨機森林的混淆矩陣結果(如表3所示),得到的結果可以看出,總體精度為97.34%,Kappa系數為0.96。冷蒿和其他綠色植被之間錯分數量有16例,這可能是因為選取訓練樣本時冷蒿與其他綠色植被之間混淆的現象。通過對2種分類方法的精度評價結果表明,隨機森林的分類精度總體優于支持向量機的分類精度。故隨機森林的識別分類效果更佳。
3.3 退化程度的評價分析
對分類識別結果進行像元統計計算,從結果(如表4)可知,冷蒿的面積占研究區的56.8%,其他綠色植被占39.5%。退化指示種的覆蓋度達到了56.8%,從草地退化程度指標看,本實驗區現狀屬于重度退化草地。
表4 像元統計表
為了準確表述退化指示物種和其他覆蓋類型的聚集程度,為此,利用景觀聚集度指數AI和分離度指數SPLIT對分別表征退化指示物種和其他覆蓋類型的聚集和分離程度,其值越小,越緊湊。通過計算SPLIT指數和AI指數(如表5所示)可知,隨機森林的SPLIT指數為3.7294,破碎度較強,支持。
表5 景觀格局指數統計表
4、總結
本文對典型草原地物的光譜分析發現,裸土光譜曲線呈現吸收谷,這是由于研究區的裸土并不是完全沒有植被的,故裸土光譜波段具有吸收谷。退化指示物種和其他綠色植被在可見光波段均表現為“低-高-低”的光譜反射率趨勢,具有典型的植被光譜特征。由于高光譜數據波段數較多,會造成不必要的運算。
本文主要對比分析了傳統的支持向量機和隨機森林分類方法對典型草原退化指示物種識別的有效性。結果表明隨機森林的分類結果表現優于支持向量機模型,這與楊紅艷的實驗結果一致。楊紅艷等研究發現隨機森林模型在30m的飛行高度可以較好地識別植被種類,隨著飛行高度的增加,地物的空間分辨率和反射率降低,使識別較小的植被會有所難度。但本研究由于在50m的飛行高度,利用隨機森林方法對典型草原植物進行分類并獲了較高的識別精度,證明了50m的飛行高度,在識別植被方面研究中具有一定的可行性。研究結果精度相對較高的原因之一,是因為數據采集的時間是在8月份,這正是草原植物的生長旺盛期,光譜特征更加的明顯,更有利于對草原物種的信息提取。
在分類器的選擇中支持向量機的優點是小樣本、結構風險最小化、具有更強的泛化能力,隨機森林的優點是處理高維數據、訓練速度快、實現比較簡單。從分類結果上看是對退化指示物種的識別較好的分類器選擇。支持向量機雖然比隨機森林訓練時間更短,訓練參數更少,但是,該研究中支持持向量機相比隨機森林的識別準確率較低,這說明隨機森林模型更適合本研究并具有一定的可行性。具體結果如下所述:
(1)支持向量機和隨機森林的分類整體準確率分別為96.92%和97.34%,Kappa系數值分別為0.9537和0.9600。隨機森林效果為優。
(2)支持向量機的AI指數為95.0713,聚集程度較強,分類結果為聚集。隨機森林的SPLIT指數為3.7294,破碎度較強,分類結果為分散,更貼切于實際。
(3)本實驗中退化指示植物的面積占研究區的56.8%,超過重度退化指標,實驗區現狀屬于重度退化草地。
本文所進行識別的地物類型較少,在今后的研究中,會擴大地域范圍、增加植被類型、將實驗區的植被更進一步精確分類;另外,選取的識別方法僅有隨機森林與支持向量機兩種,在下一步的研究中選擇更多的分類方法進行對比,這也是未來研究發展的方向。
推薦:
便攜式高光譜成像系統 iSpecHyper-VS1000
專門用于公安刑偵、物證鑒定、醫學醫療、精準農業、礦物地質勘探等領域的最新產品,主要優勢具有體積小、幀率高、高光譜分辨率高、高像質等性價比特點采用了透射光柵內推掃原理高光譜成像,系統集成高性能數據采集與分析處理系統,高速USB3.0接口傳輸,全靶面高成像質量光學設計,物鏡接口為標準C-Mount,可根據用戶需求更換物鏡。
審核編輯 黃宇
-
遙感
+關注
關注
0文章
244瀏覽量
16792 -
無人機
+關注
關注
228文章
10340瀏覽量
179624 -
高光譜
+關注
關注
0文章
327瀏覽量
9916
發布評論請先 登錄
相關推薦
評論