精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算機視覺可以學習美式手語,進而幫助聽力障礙群體嗎?

新機器視覺 ? 來源:計算機視覺研究院 ? 作者:計算機視覺研究院 ? 2021-04-15 15:09 ? 次閱讀

前言

計算機視覺可以學習美式手語,進而幫助聽力障礙群體嗎?數據科學家David Lee用一個項目給出了答案。

如果聽不到了,你會怎么辦?如果只能用手語交流呢?

當對方無法理解你時,即使像訂餐、討論財務事項,甚至和朋友家人對話這樣簡單的事情也可能令你氣餒。對普通人而言輕輕松松的事情對于聽障群體可能是很困難的,他們甚至還會因此遭到歧視。

在很多場景下,他們無法獲取合格的翻譯服務,從而導致失業、社會隔絕和公共衛生問題。為了讓更多人聽到聽障群體的聲音,數據科學家 David Lee 嘗試利用數據科學項目來解決這一問題:計算機視覺可以學習美式手語,進而幫助聽力障礙群體嗎?

4b05bf14-9cde-11eb-8b86-12bb97331649.gif

如果通過機器學習應用可以精確地翻譯美式手語,即使從最基礎的字母表開始,我們也能向著為聽力障礙群體提供更多的便利和教育資源前進一步。

數據和項目介紹

出于多種原因,David Lee決定創建一個原始圖像數據集。首先,基于移動設備或攝像頭設置想要的環境,需要的分辨率一般是720p或1080p。現有的幾個數據集分辨率較低,而且很多不包括字母「J」和「Z」,因為這兩個字母需要一些動作才能完成。

5049be6c-9cde-11eb-8b86-12bb97331649.png

為此,David Lee 在社交平臺上發送了手語圖像數據收集請求,介紹了這個項目和如何提交手語圖像的說明,希望借此提高大家的認識并收集數據。

數據變形和過采樣

David Lee 為該項目收集了 720 張圖片,其中還有幾張是他自己的手部圖像。由于這個數據集規模較小,于是 David 使用 labelImg 軟件手動進行邊界框標記,設置變換函數的概率以基于同一張圖像創建多個實例,每個實例上的邊界框有所不同。下圖展示了數據增強示例:

508d49fc-9cde-11eb-8b86-12bb97331649.png

經過數據增強后,該數據集的規模從 720 張圖像擴展到 18,000 張圖像。

建模

David 選擇使用 YOLOv5 進行建模。將數據集中 90% 的圖像用作訓練數據,10% 的圖像用作驗證集。使用遷移學習和 YOLOv5m 預訓練權重訓練 300 個 epoch。

51b213ee-9cde-11eb-8b86-12bb97331649.jpg

在驗證集上成功創建具備標簽和預測置信度的新邊界框。

51c1af8e-9cde-11eb-8b86-12bb97331649.png

由于損失值并未出現增長,表明模型未過擬合,因此該模型或許可以訓練更多輪次。模型最終獲得了 85.27% 的 mAP@.5:.95 分數。

圖像推斷測試

David 額外收集了他兒子的手部圖像數據作為測試集。事實上,還沒有兒童手部圖像用于訓練該模型。理想情況下,再多幾張圖像有助于展示模型的性能,但這只是個開始。

5234549e-9cde-11eb-8b86-12bb97331649.png

26 個字母中,有 4 個沒有預測結果(分別是 G、H、J 和 Z)。四個沒有得到準確預測:

D 被預測為 F;

E 被預測為 T;

P 被預測為 Q;

R 被預測為 U。

視頻推斷測試

4b05bf14-9cde-11eb-8b86-12bb97331649.gif

即使只有幾個手部圖像用于訓練,模型仍能在如此小的數據集上展現不錯的性能,而且還能以一定的速度提供優秀的預測結果,這一結果表現出了很大的潛力。更多數據有助于創建可在多種新環境中使用的模型。如以上視頻所示,即使字母有一部分出框了,模型仍能給出不錯的預測結果。最令人驚訝的是,字母 J 和 Z 也得到了準確識別。

其他測試

執行其他一些測試,例如:左手手語測試

5c5be158-9cde-11eb-8b86-12bb97331649.gif

幾乎所有原始圖像都顯示的是右手,但驚喜地發現數據增強在這里起到了作用,因為有 50% 的可能性是針對左手用戶進行水平翻轉。

兒童手語測試

6984db3c-9cde-11eb-8b86-12bb97331649.gif

兒童的手語數據未被用于訓練集,但模型對此仍有不錯的預測。

多實例

6a320726-9cde-11eb-8b86-12bb97331649.gif

盡管手語的使用和視頻中有所不同,但這個示例表明當多個人出現在屏幕上時,模型可以分辨出不止一個手語實例。

模型局限性

發現該模型還有一些地方有待改進。

距離

6c0830e8-9cde-11eb-8b86-12bb97331649.gif

許多原始圖像是用手機拍攝的,手到攝像頭的距離比較近,這對遠距離推斷有一定負面影響。

新環境

83cf19d0-9cde-11eb-8b86-12bb97331649.gif

這支視頻來自于志愿者,未用于模型訓練。盡管模型看到過很多字母,但對此的預測置信度較低,還有一些錯誤分類。

背景推斷

84fc4ef4-9cde-11eb-8b86-12bb97331649.gif

該測試旨在驗證不同的背景會影響模型的性能。

結論

這個項目表明:計算機視覺可用于幫助聽力障礙群體獲取更多便利和教育資源!該模型在僅使用小型數據集的情況下仍能取得不錯的性能。即使對于不同環境中的不同手部,模型也能實現良好的檢測結果。

而且一些局限性是可以通過更多訓練數據得到解決的。經過調整和數據集的擴大,該模型或許可以擴展到美式手語字母表以外的場景。

8bee280e-9cde-11eb-8b86-12bb97331649.gif

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 手勢識別
    +關注

    關注

    8

    文章

    225

    瀏覽量

    47772
  • 計算機視覺
    +關注

    關注

    8

    文章

    1696

    瀏覽量

    45928
  • 數據集
    +關注

    關注

    4

    文章

    1205

    瀏覽量

    24644

原文標題:YOLOv5的項目實踐 | 手勢識別項目落地全過程(附源碼)

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    計算機視覺有哪些優缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術的發展不僅推動了多個行業的變革,也帶來了諸多優勢,但同時也伴隨著一些挑戰和局限性。以下是對
    的頭像 發表于 08-14 09:49 ?731次閱讀

    機器視覺計算機視覺有什么區別

    機器視覺計算機視覺是兩個密切相關但又有所區別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發表于 07-16 10:23 ?467次閱讀

    計算機視覺的五大技術

    計算機視覺作為深度學習領域最熱門的研究方向之一,其技術涵蓋了多個方面,為人工智能的發展開拓了廣闊的道路。以下是對計算機視覺五大技術的詳細解析
    的頭像 發表于 07-10 18:26 ?1196次閱讀

    計算機視覺的工作原理和應用

    圖像和視頻中提取有用信息,進而進行決策和行動。自1960年代第一批學術論文問世以來,計算機視覺技術已經取得了長足的發展,并在多個領域展現出巨大的應用潛力和價值。
    的頭像 發表于 07-10 18:24 ?1643次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如
    的頭像 發表于 07-09 09:25 ?518次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習
    的頭像 發表于 07-09 09:23 ?795次閱讀

    計算機視覺和機器視覺區別在哪

    計算機視覺和機器視覺是兩個密切相關但又有明顯區別的領域。 一、定義 計算機視覺 計算機
    的頭像 發表于 07-09 09:22 ?407次閱讀

    計算機視覺和圖像處理的區別和聯系

    計算機視覺和圖像處理是兩個密切相關但又有明顯區別的領域。 1. 基本概念 1.1 計算機視覺 計算機視覺
    的頭像 發表于 07-09 09:16 ?1151次閱讀

    計算機視覺在人工智能領域有哪些主要應用?

    與分類是計算機視覺的基礎應用之一。通過訓練機器學習模型,計算機可以識別和分類各種圖像,如動物、植物、物體等。這種技術在許多領域都有應用,如搜
    的頭像 發表于 07-09 09:14 ?1187次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發表于 07-09 09:11 ?1148次閱讀

    深度學習計算機視覺領域的應用

    隨著人工智能技術的飛速發展,深度學習作為其中的核心技術之一,已經在計算機視覺領域取得了顯著的成果。計算機視覺,作為
    的頭像 發表于 07-01 11:38 ?679次閱讀

    機器視覺計算機視覺的區別

    在人工智能和自動化技術的快速發展中,機器視覺(Machine Vision, MV)和計算機視覺(Computer Vision, CV)作為兩個重要的分支領域,都扮演著至關重要的角色。盡管它們在
    的頭像 發表于 06-06 17:24 ?1242次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數據等技術的快速發展,
    的頭像 發表于 06-06 17:17 ?849次閱讀

    開源項目!設計一款智能手語翻譯眼鏡

    和精確的手語翻譯。這款智能手語翻譯眼鏡不僅是一個技術突破,更是通向無障礙溝通世界的一大步。 硬件部分 本項目中,需要一臺功能強大的單板計算機(SBC)來處理
    發表于 05-20 15:59

    計算機視覺的十大算法

    隨著科技的不斷發展,計算機視覺領域也取得了長足的進步。本文將介紹計算機視覺領域的十大算法,包括它們的基本原理、應用場景和優缺點。這些算法在圖像處理、目標檢測、人臉識別等領域有著廣泛的應
    的頭像 發表于 02-19 13:26 ?1203次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的十大算法