導讀近日,全球三大計算機視覺頂級會議之一CVPR如期舉行,深蘭科技DeepBlueAI團隊斬獲TinyAction Challenge(低分辨率視頻行為識別挑戰賽)的冠軍。
TinyAction Challenge是第六屆動作識別國際挑戰賽系列競賽之一,該系列競賽由CVPR2021 International Challenge on Activity Recognition (ActivityNet) workshop 主辦,旨在推動視頻理解的進一步發展。
冠軍方案解讀
賽題介紹
TinyAction Challenge使用TinyVirat-v2[1]數據集,旨在提高低分辨率高噪聲等真實監控場景下的視頻行為識別能力。比賽提供大量真實場景視頻片段及標注,每個視頻片段中可能含有多個動作,本質是一個多標簽的行為識別任務,比賽結果采用precision、recall、F1-score等多個指標來評測。
賽題難點
視頻分辨率很低,最小只有10x10像素尺度;
視頻尺度多樣,從10x10到128x128不等;
視頻質量較差,含有大量噪聲;
視頻場景多樣,行為多樣,每個視頻可能含有多個行為。
解決方案
在算法選擇上,團隊廣泛嘗試了TSM[2]、TPN-Slowonly[3]等經典算法,最終采用交互移除的CSN[4](ir-CSN)模型,在保證性能的前提下適當減少計算量,同時減輕對數據的過擬合。
數據增強方面,訓練時團隊首先隨機調整尺度裁剪,再統一調整尺度到128x128,最后再隨機翻轉。而在測試時,通過Tencrop,即對視頻幀及其水平翻轉在中心與四角區域分別裁剪求平均,有效提高了inference時單模型性能。
測試階段團隊進一步使用了五折交叉驗證的模型融合方法。另外由于觀察到在比賽數據集的26類行為中有些類別是互斥的,因而對最終的結果添加了后處理規則,使得F1指標進一步提高0.6個點。通過一步步優化,DeepBlueAI團隊單模型的F1指標即超過了第二名達到0.4447,并最終達到0.4782,實現大幅度領先。
總結
在本次比賽中,團隊對任務及數據做了仔細的分析,合理地選擇了模型算法,進行了精細的模型訓練,同時在數據的后處理上做了大量的優化,有效實現了低分辨率高噪聲視頻中行為識別,并最終獲得冠軍。相信隨著計算機視覺及多模態技術的深入發展,行為識別等視頻理解問題能夠得到更好的解決,并獲得越來越廣泛的實際應用。
參考文獻:
[1] Demir U, Rawat Y S, Shah M. TinyVIRAT: low-resolution video action recognition[C]//2020 25th International Conference on Pattern Recognition (ICPR)。 IEEE, 2021: 7387-7394
[2] Yang C, Xu Y, Shi J, et al. Temporal pyramid network for action recognition[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 591-600.
[3] Lin J, Gan C, Han S. TSM: Temporal Shift Module for Efficient Video Understanding[C]// 2019 IEEE/CVF International Conference on Computer Vision (ICCV)。 IEEE, 2019.
[4] Du T, Wang H, Feiszli M, et al. Video Classification With Channel-Separated Convolutional Networks[C]// International Conference on Computer Vision. 0.
編輯:jq
-
計算機視覺
+關注
關注
8文章
1696瀏覽量
45927 -
高噪聲率
+關注
關注
0文章
2瀏覽量
5992 -
數據集
+關注
關注
4文章
1205瀏覽量
24644 -
CSN
+關注
關注
0文章
2瀏覽量
8790 -
深蘭科技
+關注
關注
1文章
55瀏覽量
5951
原文標題:賽道 | CVPR2021深蘭冠軍方案解讀- TinyAction Challenge低分辨率視頻行為識別挑戰賽
文章出處:【微信號:kmdian,微信公眾號:深蘭科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論