国产V片在线播放免费无码_国产色噜噜噜在线精品_久久综合亚洲色一区二区三区

1. DeiT概述

1.1 項目簡介

Deit（Data-efficient image Transformers）是由Facebook與索邦大學的Matthieu Cord教授合作開發的圖像分類模型。作為一種基于Transformer架構的深度學習模型，DeiT在保持高性能的同時，能夠大大提高數據效率，為圖像識別領域帶來了顛覆性的變化。

與傳統的CNN不同，DeiT模型采用了Transformer的自注意力機制，將圖像分割成若干個固定大小的塊，并對每個塊進行編碼，捕捉圖像中的長程依賴關系。

本文將為大家介紹如何將DeiT移植到算能BM1684X平臺上。

1.2 模型介紹

DeiT目前有3個版本的模型（tiny, small, base)，均由12個Attention結構組成，模型區別在于輸入的header個數及embed_dim不同。

Attention結構如下圖所示：

attention

不同版本的模型具體參數區別如下表：

version

2. 模型移植

以下部分介紹如何將DeiT移植到算能BM1684X平臺上。

2.1 模型trace

原始DeiT模型基于Pytorch框架訓練及推理。算能TPU-MLIR工具鏈可以編譯通過jit trace過的靜態模型。

首先進行模型trace，命令如下，需要修改原推理代碼。

trace

2.2 模型編譯

以下介紹如何使用算能TPU-MLIR工具鏈將上一步trace過的模型編譯成可以在算能BM1684X上推理的bmodel。在模型移植過程中遇到一些算子邊界的處理問題，均已修復。

transformdeploy

2.3 精度測試

DeiT為分類模型，精度測試采用topk來進行。

精度測試及性能測試結果如下：

precision

3 小結

總體看移植過程相對順利，在解決了部分算子邊界問題之后可以成功編譯出bmodel。F32精度基本可與原始框架對齊。由于第一個Conv stride > 15，在進行F16/BF16轉換時遇到比對問題，這部分代碼目前仍在重構，生成bmodel過程中這部分采用F32混精度處理。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

圖像

圖像

+關注

關注
2

文章
1083

瀏覽量
40418
模型

模型

+關注

關注
1

文章
3178

瀏覽量
48731
深度學習

深度學習

+關注

關注
73

文章
5493

瀏覽量
120999

高通AI Hub：輕松實現Android圖像分類

高通AI Hub為開發者提供了一個強大的平臺，以優化、驗證和部署在Android設備上的機器學習模型。這篇文章將介紹如何使用高通AI Hub進行圖像分類的程式碼開發，并提供一個實際的例子來展示其在Android平臺上的應用。

發表于 11-26 01:03 ?73次閱讀

高通AI Hub：輕松實現Android<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>

使用卷積神經網絡進行圖像分類的步驟

使用卷積神經網絡（CNN）進行圖像分類是一個涉及多個步驟的過程。 1. 問題定義確定目標：明確你想要分類的圖像類型，例如貓和狗、不同的植物種類等。數據需求：確定需要多少數據以及

發表于 11-15 15:01 ?214次閱讀

高效大模型的推理綜述

大模型由于其在各種任務中的出色表現而引起了廣泛的關注。然而，大模型推理的大量計算和內存需求對其在資源受限場景的部署提出了挑戰。業內一直在努力開發旨在提高大模型推理效率的技術。本文對現有的關于高

發表于 11-15 11:45 ?246次閱讀

主動學習在圖像分類技術中的應用:當前狀態與未來展望

本文對近年來提出的主動學習圖像分類算法進行了詳細綜述，并根據所用樣本數據處理及模型優化方案，將現有算法分為三類：基于數據增強的算法，包括利用圖像增廣來擴充訓練數據，或者根據

發表于 11-14 10:12 ?153次閱讀

字節發布SeedEdit圖像編輯模型

近日，字節跳動公司在其豆包大模型團隊的官方網站上，正式公布了其最新的通用圖像編輯模型——SeedEdit。這款創新性的圖像編輯模型，為用戶提

發表于 11-12 10:43 ?208次閱讀

AI大模型在圖像識別中的優勢

AI大模型在圖像識別中展現出了顯著的優勢，這些優勢主要源于其強大的計算能力、深度學習算法以及大規模的數據處理能力。以下是對AI大模型在圖像識別中優勢的介紹：一、

發表于 10-23 15:01 ?400次閱讀

浪潮信息源2.0大模型與百度PaddleNLP全面適配

近日，浪潮信息宣布其開源大模型源2.0已全面適配百度PaddleNLP。這一舉措標志著大模型開發生態正加速進化，為用戶提供了更加便捷、高效的大模型

發表于 10-17 18:15 ?472次閱讀

GaN如何實現更高效、更緊湊的電源

電子發燒友網站提供《GaN如何實現更高效、更緊湊的電源.pdf》資料免費下載

發表于 09-12 10:00 ?0次下載

計算機視覺怎么給圖像分類

圖像分類是計算機視覺領域中的一項核心任務，其目標是將輸入的圖像自動分配到預定義的類別集合中。這一過程涉及圖像的特征提取、特征表示以及分類器的

發表于 07-08 17:06 ?534次閱讀

如何使用PyTorch構建更高效的人工智能

術界和工業界得到了廣泛應用。本文將深入探討如何使用PyTorch構建更高效的人工智能系統，從框架基礎、模型訓練、實戰應用等多個方面進行詳細解析。

發表于 07-02 13:12 ?342次閱讀

鴻蒙應用模型：【應用模型】解析

應用模型是系統為開發者提供的應用程序所需能力的抽象提煉，它提供了應用程序必備的組件和運行機制。有了應用模型，開發者可以基于一套統一的模型進行應用開發，使應用開發更簡單、高效。

發表于 05-31 11:38 ?469次閱讀

一種利用光電容積描記（PPG）信號和深度學習模型對高血壓分類的新方法

，因此在醫療信號方面它比其他模型產生了更高的準確度結果。從我們提出的模型 AvgPool_VGG-16 獲得的結果表明，平均池化是比最大池化更適合信號圖像

發表于 05-11 20:01

搭載星火認知大模型的AI鼠標：一鍵呼出AI助手，辦公更高效

搭載星火認知大模型的AI鼠標：一鍵呼出AI助手，辦公更高效 在這個AI時代，如果你想在激烈競爭的職場中不被淘汰，訊飛AI鼠標AM30就是你的不二選擇。這款鼠標搭載了星火認知大模型AI，為你提供了

發表于 03-25 11:52 ?462次閱讀

自動駕駛和多模態大語言模型的發展歷程

多模態大語言模型(MLLM) 最近引起了廣泛的關注，其將 LLM 的推理能力與圖像、視頻和音頻數據相結合，通過多模態對齊使它們能夠更高效地執行各種任務，包括圖像

發表于 12-28 11:45 ?492次閱讀

CNN圖像分類策略

在深度學習出現之前，自然圖像中的對象識別過程相當粗暴簡單：定義一組關鍵視覺特征（“單詞”），識別每個視覺特征在圖像中的存在頻率（“包”），然后根據這些數字對圖像進行分類。這些

發表于 12-25 11:36 ?277次閱讀