垃圾分類作為資源回收利用的重要環(huán)節(jié)之一,?可以有效地提高資源回收利用效率,?進(jìn)一步減輕環(huán)境污染帶 來的危害.?隨著現(xiàn)代工業(yè)逐步智能化,?傳統(tǒng)的圖像分類算法已經(jīng)不能滿足垃圾分揀設(shè)備的要求.?本文提出一種基于 卷積神經(jīng)網(wǎng)絡(luò)的垃圾圖像分類模型 (Garbage?Classification?Network,?GCNet).?通過構(gòu)建注意力機(jī)制,?模型完成局部 和全局的特征提取,?能夠獲取到更加完善、有效的特征信息;?同時,?通過特征融合機(jī)制,?將不同層級、尺寸的特征進(jìn) 行融合,?更加有效地利用特征,?避免梯度消失現(xiàn)象.?實(shí)驗(yàn)結(jié)果證明,?GCNet 在相關(guān)垃圾分類數(shù)據(jù)集上取得了優(yōu)異的 結(jié)果,?能夠有效地提高垃圾識別精度.
1???引言?
垃圾回收利用作為發(fā)展循環(huán)經(jīng)濟(jì)的必經(jīng)之路,?是 根治污染、提高環(huán)境治理效果的關(guān)鍵所在.?隨著我國 生產(chǎn)力水平的發(fā)展,?生活垃圾、工業(yè)垃圾數(shù)量不斷增 加,?困擾著很多城市.?據(jù)統(tǒng)計,?僅 2018 年,?中國垃圾的 清運(yùn)量已經(jīng)達(dá)到了 2.28 億噸[1] .?在人們將垃圾投放進(jìn)垃圾箱之后,?垃圾被運(yùn)送到垃圾處理廠統(tǒng)一處理.?當(dāng)前 國內(nèi)的垃圾處理廠,?更多依靠人工在流水線上作業(yè)去 分揀垃圾,?對作業(yè)者健康不利且分揀效率較低,?已不能 滿足大量垃圾處理需求.?此外,?人工分揀的垃圾種類極 為有限,?大部分垃圾無法重新回收利用,?造成很大浪費(fèi). 隨著深度學(xué)習(xí)技術(shù)的發(fā)展,?卷積神經(jīng)網(wǎng)絡(luò)使圖像分類 算法在精度和速度上得到了巨大的提升,?讓我們看到 了借助視覺技術(shù)自動分揀垃圾的可能性.?通過攝像頭 拍攝垃圾圖片,?利用卷積神經(jīng)網(wǎng)絡(luò)檢測出垃圾的類別, 之后就可以借助機(jī)械手或推板自動完成分揀任務(wù),?可 以降低人工成本,?提高分揀效率.?因此,?開展垃圾圖像 分類算法的研究,?具有重要的應(yīng)用價值.
2???相關(guān)工作?
早期,?學(xué)者們只能借助經(jīng)典的圖像分類算法[2–5] 完 成垃圾圖像分類任務(wù),?這要通過手動提取的圖像特征 并結(jié)合相應(yīng)的分類器完成.?吳健等[6] 利用顏色和紋理 特征,?初步完成了廢物垃圾識別.?由于不同數(shù)據(jù)集的圖 像背景、尺寸、質(zhì)量不盡相同,?傳統(tǒng)算法需要根據(jù)相 應(yīng)數(shù)據(jù)人工提取不同的特征,?算法的魯棒性較差,?并且 處理方式復(fù)雜,?所需時間較長,?無法達(dá)到實(shí)時的效果. 隨著卷積神經(jīng)網(wǎng)絡(luò) (Convolution?Neural?Network, CNN) 的飛速發(fā)展,?深度學(xué)習(xí)廣泛應(yīng)用于圖像識別領(lǐng) 域.?作為數(shù)據(jù)驅(qū)動的算法,?CNN 具有強(qiáng)大的特征擬合 能力,?可以有效、自動地提取圖像特征,?并具有較快的 運(yùn)行速度.?2012 年,?AlexNet[7] 取得了 ImageNet 圖像分 類競賽的冠軍,?標(biāo)志著深度學(xué)習(xí)的崛起.?隨后幾年, GoogleNet[8]、VGGNet[9]、ResNet[10] 等算法提升了圖 像分類的精度,?并成功應(yīng)用于人臉識別、車輛檢測等 多個領(lǐng)域.?
垃圾圖像分類,?在深度學(xué)習(xí)算法的幫助下同 樣取得了較大的突破.?斯坦福大學(xué)的 Yang 等建立了 TrashNet?Dataset 公開數(shù)據(jù)集,?包含 6 個類別,?共計 2527 張圖片.?Ozkaya 等[11] 通過對比不同 CNN 網(wǎng)絡(luò)的 分類能力,?搭建神經(jīng)網(wǎng)絡(luò) (本文稱之為 TrashNet) 并進(jìn) 行參數(shù)微調(diào),?在數(shù)據(jù)集 TrashNet?Dataset 上取得了 97.86% 的準(zhǔn)確率,?是目前這一數(shù)據(jù)集上最佳分類網(wǎng)絡(luò).?在非公 開數(shù)據(jù)集方面,?Mittal 等[12] 自制了 2561 張的垃圾圖片 數(shù)據(jù)集 GINI,?使用 GarbNet 模型,?得到了 87.69% 的準(zhǔn) 確率.?國內(nèi)方面,?鄭海龍等[13] 用 SVM 方法進(jìn)行了建筑 垃圾分類方面的研究.?向偉等[14] 使用分類網(wǎng)絡(luò) CaffeNet, 調(diào)整卷積核尺寸和網(wǎng)絡(luò)深度,?使其適用于水面垃圾分 類,?在其自制的 1500 張圖片數(shù)據(jù)集上取得了 95.75% 的識別率.?
2019 年,?華為舉辦垃圾圖像分類競賽,?構(gòu)建 了樣本容量為一萬余張的數(shù)據(jù)集,?進(jìn)一步促進(jìn)了該領(lǐng) 域的發(fā)展. 我國各地區(qū)生活垃圾分類標(biāo)準(zhǔn)有所不同,?大致可 分為可回收垃圾、有害垃圾、廚余垃圾和其他垃圾這 4 大類,?且每個類別下又包含若干子類別,?種類繁多且 十分復(fù)雜.?按照這樣的分類標(biāo)準(zhǔn)做的垃圾圖像識別研 究,?國內(nèi)目前還處于起步階段.?現(xiàn)有的圖形分類算法在 垃圾處理領(lǐng)域的應(yīng)用較少,?且存在準(zhǔn)確率不足、泛化 性能差、處理效率低的缺點(diǎn).?針對現(xiàn)有方法的不足,?本 文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的垃圾圖像分類算法 (Garbage?Classification?Net,?GCNet),?在網(wǎng)絡(luò)結(jié)構(gòu)中融合 了注意力機(jī)制模塊與特征融合模塊,?提高了模型在垃 圾分類任務(wù)上的準(zhǔn)確性與魯棒性.
3???算法設(shè)計?
3.1 模型結(jié)構(gòu)
本文構(gòu)建的 GCNet 模型包括特征提取器、分類 器兩部分,?整體結(jié)構(gòu)如圖 1 所示.?圖中特征提取器由 Resnet101 作為主干部分,?共包括 5 個 bottleneck,?并在 不同的 bottleneck 后加入注意力機(jī)制模塊,?同時對不同 模塊提取到的特征進(jìn)行特征融合 (如圖 1 中虛線所示) 以從輸入 中提取圖像的特征信息 :
其中,?Me表示特征提取器. F1 yi 分類器由兩層全連接層和一個 Softmax 分類器組 成,?對提取到的特征信息 進(jìn)行分類,?以得到圖像在每 個類別下的最終得分 :
其中,?Mc表示分類器.?
3.2 注意力機(jī)制?
注意力機(jī)制源于對人類視覺的研究,?人類會根據(jù) 實(shí)際需要選擇視網(wǎng)膜內(nèi)特定區(qū)域進(jìn)行集中關(guān)注,?可以 將有限的處理資源分配至重要的部分.?由于相同類別 垃圾的特征表征差異性可能較大,?不利于圖片的正確 分類,?這就要求準(zhǔn)確地關(guān)注圖像中的顯著區(qū)域.?受這一 思想的啟發(fā),?通過構(gòu)建注意力機(jī)制模塊,?使網(wǎng)絡(luò)模型重 點(diǎn)關(guān)注有利于分類的特征區(qū)域,?以實(shí)現(xiàn)更好的特征提 取功能,?其具體結(jié)構(gòu)如圖 2 所示.
5???結(jié)論?
本文針對垃圾圖像分類問題,?構(gòu)建了一種基于卷 積神經(jīng)網(wǎng)絡(luò)的算法 GCNet,?該網(wǎng)絡(luò)通過構(gòu)建注意力機(jī) 制和特征融合機(jī)制,?能夠有效地提取圖像特征、降低 類別差異性帶來的影響,?并在相關(guān)數(shù)據(jù)集上取得了 96.73% 的平均準(zhǔn)確率,?相較于現(xiàn)有的分類算法提升了 約 4% 的準(zhǔn)確率,?滿足了實(shí)際的應(yīng)用需求,?具有良好的 應(yīng)用前景.
編輯:黃飛
評論
查看更多