Torchvision介紹
Torchvision是基于Pytorch的視覺深度學習遷移學習訓練框架,當前支持的圖像分類、對象檢測、實例分割、語義分割、姿態(tài)評估模型的遷移學習訓練與評估。支持對數(shù)據(jù)集的合成、變換、增強等,此外還支持預訓練模型庫下載相關的模型,直接預測推理。
對象檢測支持
Pytorch中的torchvision是一個輕量化的遷移學習框架,支持圖像分類、對象檢測、實例分割、語義分割模型的自定義數(shù)據(jù)集的遷移學習,其中對象檢測遷移學習支持模型包括:
- Faster-RCNN - FCOS - RetinaNet - SSD - SSDlite其中Faster-RCNN支持骨干網(wǎng)絡基于ResNet50,RPN支持FPN方式,同時支持ViT Block作為骨干網(wǎng)絡。Torchvision中的對象檢測模型參數(shù)指標列表如下:
Faster-RCNN改進
在多數(shù)深度學習開發(fā)者的印象中Faster-RCNN與Mask-RCNN作為早期的RCNN系列網(wǎng)絡現(xiàn)在應該是日薄西山,再也沒有什么值得留戀的地方,但是你卻會發(fā)現(xiàn)Pytorch無論哪個版本的torchvision都一直在支持Faster-RCNN與Mask-RCNN模型網(wǎng)絡的遷移學習訓練。原因不難理解,因為torchvision框架的開發(fā)者與維護者一直在不斷改善與提升Faster-RCNN的模型,它已經(jīng)不是2015的Faster-RCNN了,torchvision 0.13版本以后的Faster-RCNN支持兩個版本分別是
- Faster-RCNN V1版本 - Faster-RCNN V2版本 V1版本是基于FPN加持、
V2版本是基于VIT+FPN加持
對應的論文分別發(fā)表于2017年與2021年底。所以說雖然是2023年了,但是torchvision中的Faster-RCNN模型還是可以用的,而且還是很有用的。
Faster-RCNN訓練與部署
torchvision中支持的模型都可以一鍵導出ONNX格式模型,然后直接通過ONNXRUNTIME與OpenVINO實現(xiàn)模型部署與加速推理,通過torchvision框架可以實現(xiàn)自定義數(shù)據(jù)集的Faster-RCNN對象檢測模型訓練,我自己分別基于無人機與飛鳥數(shù)據(jù)集、寵物數(shù)據(jù)集實現(xiàn)了Faster-RCNN的自定義模型訓練與部署,運行截圖如下:
全網(wǎng)最高性價比的Pytorch框架CV開發(fā)課程,錯過了不是時間,而是給自己改變的機會!
-
圖像分類
+關注
關注
0文章
90瀏覽量
11907 -
深度學習
+關注
關注
73文章
5492瀏覽量
120977
原文標題:都2023年了,F(xiàn)aster-RCNN還能用嗎?
文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論