99久久国产综合精品无码_国产精品免费观看视频播放_高潮视频一区在线观看_亚洲综合欧美日本另类激情_在线观看?v网站永久免费观看

目前 DETR 類模型已經(jīng)成為了目標(biāo)檢測的一個(gè)主流范式。但 DETR 算法模型復(fù)雜度高，推理速度低，嚴(yán)重影響了高準(zhǔn)確度目標(biāo)檢測模型在端側(cè)設(shè)備的部署，加大了學(xué)術(shù)研究和產(chǎn)業(yè)應(yīng)用之間的鴻溝。

來自華為諾亞、華中科技大學(xué)的研究者們設(shè)計(jì)了一種新型的 DETR 輕量化模型 Focus-DETR 來解決這個(gè)難題。

論文地址：https://arxiv.org/abs/2307.12612

代碼地址 - mindspore：https://github.com/linxid/Focus-DETR

代碼地址 - torch：https://github.com/huawei-noah/noah-research/tree/master/Focus-DETR

為實(shí)現(xiàn)模型性能和計(jì)算資源消耗、顯存消耗、推理時(shí)延之間的平衡，F(xiàn)ocus-DETR 利用精細(xì)設(shè)計(jì)的前景特征選擇策略，實(shí)現(xiàn)了目標(biāo)檢測高相關(guān)特征的精確篩選；繼而，F(xiàn)ocus-DETR 進(jìn)一步提出了針對篩選后特征的注意力增強(qiáng)機(jī)制，來彌補(bǔ) Deformable attention 遠(yuǎn)距離信息交互的缺失。相比業(yè)界全輸入 SOTA 模型， AP 降低 0.5 以內(nèi)，計(jì)算量降低 45%，F(xiàn)PS 提高 41%，并在多個(gè) DETR-like 模型中進(jìn)行了適配。作者對多個(gè) DETR 類檢測器的 GFLOPs 和時(shí)延進(jìn)行了對比分析，如圖 1 所示。從圖中發(fā)現(xiàn)，在 Deformable-DETR 和 DINO 中，encoder 的計(jì)算量分別是 decoder 計(jì)算量的 8.8 倍和 7 倍。同時(shí)，encoder 的時(shí)延大概是 decoder 時(shí)延的 4~8 倍。這表明，提升 encoder 的效率至關(guān)重要。

圖 1：多個(gè) DETR 類檢測器的計(jì)算量和時(shí)延對比分析網(wǎng)絡(luò)結(jié)構(gòu) Focus-DETR 包括一個(gè) backbone，一個(gè)由 dual-attention 組成的 encoder 和一個(gè) decoder。前景選擇器（Foreground Token Selector）在 backbone 和 encoder 之間，是一個(gè)基于跨多尺度特征的自頂向下評分調(diào)制，用來確定一個(gè) token 是否屬于前景。Dual attention 模塊通過多類別評分機(jī)制，選擇更細(xì)粒度的目標(biāo) token，然后將其輸入到一個(gè)自注意模塊來彌補(bǔ) token 交互信息的缺失。

圖 2 ：Focus-DETR 整體網(wǎng)絡(luò)結(jié)構(gòu) 計(jì)算量降低：前景篩選策略目前已經(jīng)有一些對于前景 token 進(jìn)行剪枝提升性能的方法。例如，Sparse DETR（ICLR2022）提出采用 decoder 的 DAM（decoder attention map）作為監(jiān)督信息。然而作者發(fā)現(xiàn)，如圖 3 所示，Sparse DETR 篩選的 token 并不都是前景區(qū)域。作者認(rèn)為，這是由于 Sparse DETR 使用 DAM 來監(jiān)督前景 token 導(dǎo)致的，DAM 會在訓(xùn)練的時(shí)候引入誤差。而 Focus-DETR 使用 ground truth（boxes 和 label）來監(jiān)督前景的 token 的篩選。

圖 3：Focus-DETR 和 Sparse DETR 在不同 feature map 上保留的 token 對比為了更好地訓(xùn)練前景篩選器，作者優(yōu)化了 FCOS 的前背景標(biāo)簽分配策略，如圖 4 所示。作者首先為不同特征映射的包圍框設(shè)置了一個(gè)大小范圍。與傳統(tǒng)的多尺度特征標(biāo)簽分配方法不同，它允許相鄰兩個(gè)特征尺度之間的范圍重疊，以增強(qiáng)邊界附近的預(yù)測能力。對每個(gè)擁有步長?的特征? ，其中代表多尺度特征的層級序號，代表在二維特征圖上的位置坐標(biāo)，作者定義該特征在原圖上的映射位置為?，那么?

，因此特征所對應(yīng)的標(biāo)簽應(yīng)該為： ?

其中代表坐標(biāo)和真值框中心之間的最大棋盤距離，代表真值目標(biāo)框，分別代表被第層特征圖預(yù)測的目標(biāo)的尺度的最大值和最小值，由于尺度重疊設(shè)置，

。

圖 4. 前背景標(biāo)簽分配可視化此外，來自不同特征映射的特征選擇的差異也被忽略，這限制了從最合適的分辨率選擇特征的潛力。為彌補(bǔ)這一差距，F(xiàn)ocus-DETR 構(gòu)造了基于多尺度 feature map 的自頂向下的評分調(diào)制模塊，如圖 5 所示。為了充分利用多尺度特征圖之間的語義關(guān)聯(lián)，作者首先使用多層感知器 (MLP)模塊來預(yù)測每個(gè)特征圖中的多類別語義得分。考慮到高層語義特征，低層語義特征包含更豐富的語義信息，作者利用高層 feature map 的 token 重要性得分，作為補(bǔ)充信息來調(diào)制低層 feature map 的預(yù)測結(jié)果。

圖 5：top-down 前景篩選評分調(diào)制策略細(xì)粒度特征增強(qiáng)策略在依靠前期設(shè)計(jì)的前景篩選器得到較為準(zhǔn)確的前景特征后，F(xiàn)ocus-DETR 使用一種有效的操作來獲得更為細(xì)粒度的特征，利用這些細(xì)粒度特征以獲得更好的檢測性能。直觀地說，作者假設(shè)在這個(gè)場景中引入更細(xì)粒度的類別信息將是有益的。基于這一動(dòng)機(jī)，作者提出了一種新的注意力機(jī)制，并結(jié)合前景特征選擇，以更好地結(jié)合利用細(xì)粒度特征和前景特征。如圖 2 所示，為了避免對背景 token 進(jìn)行冗余的計(jì)算，作者采用了一種同時(shí)考慮位置信息和類別語義信息的堆疊策略。具體來說，預(yù)測器?(?) 計(jì)算出的前景評分和類別評分的乘積將作為作者最終的標(biāo)準(zhǔn)來確定注意力計(jì)算中涉及的細(xì)粒度特征，即: ?

其中和分別代表前景得分和類別概率。 ? 與兩階段 Deformable DETR 的 query 選擇策略不同，F(xiàn)ocus-DETR 的多類別概率不包括背景類別 (?)。該模塊可以被視為一個(gè) self-attention ，對細(xì)粒度特征進(jìn)行增強(qiáng)計(jì)算。然后，已增強(qiáng)的特征將被 scatter 回原始的前景特征并對其進(jìn)行更新。 ?實(shí)驗(yàn)結(jié)果?主要結(jié)果? 如表一所示，作者將 Focus-DETR 在 COCO 驗(yàn)證集上和其他模型的性能進(jìn)行比較。可以發(fā)現(xiàn)同樣基于 DINO，F(xiàn)ocus-DETR 僅使用 30% token 的情況下，超過 Sparse DETR 2.2 個(gè) AP。相比原始 DINO，僅損失 0.5 個(gè) AP，但是計(jì)算量降低 45%，推理速度提升 40.8%。 ?

表 1：總體對比實(shí)驗(yàn)結(jié)果模型效能分析在圖 6 中，從不同模型的精度和計(jì)算量之間的關(guān)系來看，F(xiàn)ocus-DETR 在精度和計(jì)算復(fù)雜度之間達(dá)到了最好的平衡。整體來看對比其他模型，獲得了 SOTA 的性能。

圖 6 不同模型測試精度和計(jì)算復(fù)雜度之間的關(guān)聯(lián)分析消融實(shí)驗(yàn) 如表 2 所示，作者針對模型設(shè)計(jì)進(jìn)行消融實(shí)驗(yàn)，以驗(yàn)證作者提出的算法的有效性。

表 2 本研究提出的前景特征剪枝策略和細(xì)粒度特征自注意力增強(qiáng)模塊對實(shí)驗(yàn)性能的影響 1. 前景特征選擇策略的影響直接使用前景得分預(yù)測 AP 為 47.8，增加 label assignment 策略生成的標(biāo)簽作為監(jiān)督，AP 提升 1.0。增加自上而下的調(diào)制策略，能夠提升多尺度特征圖之間的交互，AP 提升 0.4。這表明提出的策略對于提升精度是非常有效的。如圖 7 可視化可以發(fā)現(xiàn)，F(xiàn)ocus-DETR 可以精確地選擇多尺度特征上的前景 token。并且可以發(fā)現(xiàn)，在不同尺度的特征度之間，可以檢測的物體存在重疊，這正是因?yàn)?Focus-DETR 使用了交疊的設(shè)置導(dǎo)致的。

圖 7 多尺度特征保留的 token 2. 自上而下的評分調(diào)制策略的影響

表 3. 多尺度特征圖前景評分的關(guān)聯(lián)方法，作者嘗試自頂向下和自底向上的調(diào)制。作者對比了自上而下的調(diào)制策略和自下而上的調(diào)制策略的影響，對比結(jié)果可以發(fā)現(xiàn)，作者提出的自上而下的調(diào)制策略可以獲得更好的性能。 3. 前景保留比率對實(shí)驗(yàn)性能的影響

表 4.Focus-DETR、Sparse DETR 和 DINO+Sparse DETR 保留前景 token 的比例作者對比了不同的剪枝比例的性能，從實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)，F(xiàn)ocus-DETR 在相同的剪枝比例情況下，均獲得了更優(yōu)的結(jié)果。總結(jié) Focus-DETR 僅利用 30% 的前景 token 便實(shí)現(xiàn)了近似的性能，在計(jì)算效率和模型精度之間取得了更好的權(quán)衡。Focus-DETR 的核心組件是一種基于多層次的語義特征的前景 token 選擇器，同時(shí)考慮了位置和語義信息。Focus-DETR 通過精確地選擇前景和細(xì)粒度特征，并且對細(xì)粒度特征進(jìn)行語義增強(qiáng)，使得模型復(fù)雜度和精度實(shí)現(xiàn)更好平衡。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

檢測器

檢測器

+關(guān)注

關(guān)注
1

文章
860

瀏覽量
47654
模型

模型

+關(guān)注

關(guān)注
1

文章
3178

瀏覽量
48731

原文標(biāo)題：ICCV 2023 | 華為諾亞提出全新目標(biāo)檢測器Focus-DETR

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

ECD檢測器的原理是什么？

ECD的發(fā)現(xiàn)是一系列射線電離檢測器發(fā)展的結(jié)果。1952 年首次出現(xiàn)了 β-射線橫截面電離檢測器；1958 年 Lovelock 提出 β-射線氬電離檢測器。

發(fā)表于 10-16 09:01

Arm連接到新目標(biāo)時(shí)的常見問題

了解使用Arm連接到新目標(biāo)時(shí)的常見問題和答案開發(fā)工作室（Arm DS）。此內(nèi)容側(cè)重于使用的自動(dòng)檢測、連接和調(diào)試新的或定制的仿真、FPGA和硅靶。如果您無法在此處找到問題的解決方案： ?單擊我需要幫助連接到我的目標(biāo)。我該去哪里？

發(fā)表于 08-02 08:54

一種基于順序統(tǒng)計(jì)量的距離擴(kuò)展目標(biāo)檢測器

一種基于順序統(tǒng)計(jì)量的距離擴(kuò)展目標(biāo)檢測器:：該文提出一種高斯白噪聲中的距離擴(kuò)展目標(biāo)檢測器。實(shí)際目標(biāo)

發(fā)表于 10-29 13:07 ?13次下載

電池檢測器原理

電池檢測器原理電池或電池包裝上的一次性小型電池檢測器是綜合技術(shù)得以應(yīng)用的好例子。綜合技術(shù)是用全新的方式組合多種現(xiàn)有的技術(shù)！電池檢測器依賴兩種特殊墨水：

發(fā)表于 08-20 18:10 ?3465次閱讀

Xilinx推出基于28nm Kintex-7 FPGA 的全新目標(biāo)參考設(shè)計(jì)和全新開發(fā)基板

賽靈思公司 (Xilinx, Inc. (NASDAQ:XLNX) )今天宣布推出基于 28 nm Kintex?-7 FPGA 的全新目標(biāo)參考設(shè)計(jì)和全新開發(fā)基板

發(fā)表于 01-09 09:44 ?1657次閱讀

介紹RT-DETR兩種風(fēng)格的onnx格式和推理方式

RT-DETR是由百度近期推出的DETR-liked目標(biāo)檢測器，該檢測器由HGNetv2、混合編碼器

發(fā)表于 05-17 17:46 ?3161次閱讀

Focus-DETR：30%Token就能實(shí)現(xiàn)SOTA性能，效率倍增

目前 DETR 類模型已經(jīng)成為了目標(biāo)檢測的一個(gè)主流范式。但 DETR 算法模型復(fù)雜度高，推理速度低，嚴(yán)重影響了高準(zhǔn)確度目標(biāo)

發(fā)表于 08-02 15:12 ?766次閱讀

一種新型的DETR輕量化模型Focus-DETR

作者對多個(gè) DETR 類檢測器的 GFLOPs 和時(shí)延進(jìn)行了對比分析，如圖 1 所示。從圖中發(fā)現(xiàn)，在 Deformable-DETR 和 DINO 中，encoder 的計(jì)算量分別是 decoder

發(fā)表于 08-02 15:34 ?625次閱讀

基于BEV的視覺3D目標(biāo)檢測器

根據(jù)我們的實(shí)驗(yàn)分析，我們認(rèn)為實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵在于提升檢測器在 BEV 空間和 2D 空間的適應(yīng)性。這種適應(yīng)性是針對 query 而言的，即對于不同的 query，檢測器要能以不同的方式來編碼和解碼特征。

發(fā)表于 09-16 10:09 ?723次閱讀

CCV 2023 | SparseBEV：高性能、全稀疏的純視覺3D目標(biāo)檢測器

本文介紹在3D 目標(biāo)檢測領(lǐng)域的新工作：SparseBEV。我們所處的 3D 世界是稀疏的，因此稀疏 3D 目標(biāo)檢測是一個(gè)重要的發(fā)展方向。然而，現(xiàn)有的稀疏 3D

發(fā)表于 09-19 10:00 ?953次閱讀

基于OpenVINO Python API部署RT-DETR模型

RT-DETR 是在 DETR 模型基礎(chǔ)上進(jìn)行改進(jìn)的，一種基于 DETR 架構(gòu)的實(shí)時(shí)端到端檢測器，它通過使用一系列新的技術(shù)和算法，實(shí)現(xiàn)了更高效的訓(xùn)練和推理，我們將在 Python、C+

發(fā)表于 10-20 11:15 ?912次閱讀

基于OpenVINO C# API部署RT-DETR模型

RT-DETR 是在 DETR 模型基礎(chǔ)上進(jìn)行改進(jìn)的，一種基于 DETR 架構(gòu)的實(shí)時(shí)端到端檢測器，它通過使用一系列新的技術(shù)和算法，實(shí)現(xiàn)了更高效的訓(xùn)練和推理，在前文我們發(fā)表了《基于 Op

發(fā)表于 11-10 16:59 ?716次閱讀

百度開源DETRs在實(shí)時(shí)目標(biāo)檢測中勝過YOLOs

這篇論文介紹了一種名為RT-DETR的實(shí)時(shí)檢測Transformer，是第一個(gè)實(shí)時(shí)端到端目標(biāo)檢測器。

發(fā)表于 03-06 09:24 ?1436次閱讀

OpenVINO? Java API應(yīng)用RT-DETR做目標(biāo)檢測器實(shí)戰(zhàn)

本文將從零開始詳細(xì)介紹環(huán)境搭建的完整步驟，我們基于英特爾開發(fā)套件AIxBoard為硬件基礎(chǔ)實(shí)現(xiàn)了Java在Ubuntu 22.04系統(tǒng)上成功使用OpenVINO? Java API，并且成功運(yùn)行了RT-DETR實(shí)現(xiàn)實(shí)時(shí)端到端目標(biāo)檢測器

發(fā)表于 03-18 15:04 ?761次閱讀

微波檢測器的原理是什么微波檢測器的工作原理和用途

的傳播規(guī)律。微波是一種頻率在300MHz至300GHz之間的電磁波，具有波長較短、穿透力強(qiáng)、抗干擾能力好等特點(diǎn)。微波檢測器利用這些特性，通過接收和處理微波信號，實(shí)現(xiàn)對目標(biāo)物體的檢測和識別。微波的傳播特性：微波在傳播過程中，

發(fā)表于 05-27 16:09 ?1484次閱讀