精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

什么是無聲語音接口?

SSDFans ? 來源:SSDFans ? 2023-04-28 10:16 ? 次閱讀

可穿戴設備依賴于具有標準物理能力的人機界面,如語音、觸摸或運動。雖然這種形式的機器交互適用于大多數消費者,但殘疾人可能很難或無法操作標準的可穿戴設備。為了使更多人能夠使用可穿戴設備,研究人員正在研究新的人機界面。

最近,康奈爾大學的一個團隊發表了一篇論文,描述了一副為不能發聲的用戶配備了無聲語音接口(SSI)的智能眼鏡。本文將討論無聲語音接口和來自康奈爾大學的可穿戴原型。

什么是無聲語音接口?

無聲語音接口(Silent speech interface,簡稱SSI)允許人們無需發聲就能與機器互動。雖然AI助手(如蘋果的Siri)等技術是通過聲音交流工作的,但SSI通過與語音相關的動作來完成交流。

SSI技術通過嘴巴和舌頭的運動而不是聲音來識別語音。為了做到這一點,SSI依賴于各種不同的傳感器,包括放置在嘴巴附近的振動傳感器,用于檢測人們嘴巴的振動,以及跟蹤和分類與語音相關運動的攝像頭。在許多情況下,這些信息會被機器學習算法處理,該算法會解釋嘴巴的動作,并將其翻譯成文字。

雖然大多數人可能找不到SSI的用途,但這項技術對于因疾病或受傷而失聲的人來說是必不可少的,可以讓他們更容易地交流。例如,患有聲帶損傷或影響語言的神經系統疾病的患者可以從SSI中獲益良多。

康奈爾大學開發無攝像頭SSI眼鏡

最近,康奈爾大學的研究人員在SSI技術方面取得了重大進展,發明了基于SSI的智能眼鏡。

該系統被稱為EchoSpeech,是一種新穎的、侵入性最小的SSI技術,它使用低功率有源聲學傳感來捕捉由無聲語音引起的細微皮膚變形,并將這些信息轉換為可操作的數據。這款智能眼鏡的原型建立在康奈爾大學之前對一種類似的聲學傳感可穿戴設備(“EarIO”)的研究基礎上,EarIO可以從耳朵內追蹤面部運動。

cf967ebe-e4fb-11ed-ab56-dac502259ad0.png

該系統依靠安裝在眼鏡框架上的一系列揚聲器和麥克風向皮膚發射聽不見的聲波。發出的聲波產生沿多條路徑傳播的回聲,并被系統解釋推斷為佩戴者的無聲語音。EchoSpeech完全可以在標準的智能手機上運行,只需要1到6分鐘的訓練數據,并以73.3 mW的低功耗實時運行。該團隊的深度學習算法可以實時分析回聲,準確率約為95%。

該系統通過12名用戶研究進行了評估,成功展示了識別31個獨立命令和三到六位連接數字的能力,單詞錯誤率(WER)分別為4.5%(標準3.5%)和6.1%(標準4.2%)。此外,在行走和噪聲注入等場景中測試了系統的魯棒性。

更私密、低功耗、易使用

大多數SSI技術使用面部攝像頭,從用戶和與其交流的人那里收集數據。除了造成隱私問題外,可穿戴攝像頭還會收集高帶寬視頻數據。

由于EchoSpeech不需要可穿戴攝像機,設備只捕捉音頻數據,這比圖像或視頻數據需要的帶寬要少得多,并且可以通過藍牙實時發送到手機。隱私信息永遠不會脫離用戶的控制,因為數據是在智能手機上本地處理的(不用在云中處理)。研究人員表示,純音頻傳感器的電池效率也更高:音頻傳感器可以工作10個小時,而攝像頭只能工作30分鐘。

康奈爾大學的研究小組表示,他們發現EchoSpeech在很多應用中都有應用價值,從默念密碼來解鎖智能手機,到跳過播放列表中的歌曲。該設備還可以與智能手機配對,在說話不方便的地方與他人交談,比如嘈雜的餐廳或安靜的圖書館。研究人員表示,該界面與手寫筆和CAD等設計軟件兼容,從而消除了對鼠標和鍵盤的需求。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人機界面
    +關注

    關注

    5

    文章

    524

    瀏覽量

    44103
  • SSI
    SSI
    +關注

    關注

    0

    文章

    38

    瀏覽量

    19212
  • 可穿戴設備
    +關注

    關注

    55

    文章

    3807

    瀏覽量

    166852

原文標題:什么?無聲語音接口?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    想在ARM中把TVL320的編碼解出來,判斷有無聲音輸入?

    我想通過軟件,判斷有沒有聲音輸入。 我想在ARM中把TVL320的編碼解出來,判斷有無聲音輸入。
    發表于 11-08 06:59

    omap4460開發板錄音后播放無聲音是怎么回事?

    最近想調試一下omap4460的聲卡,發現omap4460可以播放聲音卻錄音以后播放無聲音?有么有搞過這塊的大神,能給些指點!非常感謝!
    發表于 11-05 07:27

    TLV320AIC33更換后數字mic無聲音是怎么回事?

    請問原本pcba上的TLV320AIC33發生不良后,重新更換新的TLV320AIC33后數字mic無聲音? 電壓供電都正常,是否需要重新code編譯? 怎樣才能數字MIC正常工作?需要燒錄軟件嗎?
    發表于 10-29 07:57

    功放SR5200中置音箱無聲音是什么原因?怎么解決?

    請教各位高手,馬蘭士功放SR5200,以前是在數字播放模式下選擇PRO LOGIC播放時,環繞有聲音,主聲道和中置無聲音,模擬播放主聲道有聲音,按照網友的指導,更換了IC4391。現在數字播放
    發表于 10-29 07:37

    TMS320C6000 MCBSP轉語音帶音頻處理器(VBAP)接口

    電子發燒友網站提供《TMS320C6000 MCBSP轉語音帶音頻處理器(VBAP)接口.pdf》資料免費下載
    發表于 10-26 10:17 ?0次下載
    TMS320C6000 MCBSP轉<b class='flag-5'>語音</b>帶音頻處理器(VBAP)<b class='flag-5'>接口</b>

    tas5711 EVM配置以后無聲音輸出是怎么回事?

    tas5711 EVM DEMO板按照文檔配置以后無聲音輸出 麻煩幫忙分析, 謝謝 。 配置如下圖: 硬件連接圖如下:
    發表于 10-25 14:25

    TAS2552+AM4379為什么無聲音輸出?

    上開發的,直接編譯會不成功,將相關的接口修改移植到3.12.10版本上后,編譯OK,運行正常。 4、目前在調試聲卡情況如下: A、 I2C控制正常,讀,寫寄存口信息正確; B、 GPIO使能管腳正確
    發表于 10-25 06:20

    請問PCM1795輸出無聲音是怎么解決?

    PCM1795輸出無聲問題,附件是原理圖請幫忙看一下有什么問題
    發表于 10-16 06:59

    TLV320AIC23B-Q1無聲音輸出的原因?

    目前我們配置這個codec,無聲音傳輸。 背景:codec做slave設備,使用I2S接口,采樣頻率48k,16bit,選擇I2C配置 已經確認進入codec的I2S信號沒有問題,引線外接一個
    發表于 10-09 08:00

    LM4916規格書中的BTL方案接后無聲音輸出,是什么問題呢?

    在應用lm4916產品提,規格書中的BTL方案接后無聲音輸出,是什么問題呢? 應用立體聲輸出,聲音聽起來有失真,請各高手指教,謝謝!!
    發表于 09-20 14:42

    LM4991 WSON封裝手工搭建的電路,通電后揚聲器無聲音,為什么?

    LM4991 WSON封裝,手工搭建的電路,5.2V供電,通電后,揚聲器無聲音。 測量2腳bypass有2.4V的電壓,說明整個芯片已經開始工作,但就是沒有聲音。 不知道電路在什么地方出問題?相同的電路我換上SOIC封裝的LM4991工作正常。
    發表于 08-27 06:32

    谷歌AI新突破:為無聲視頻智能配音

    近日,谷歌DeepMind團隊公布了一項革命性的技術——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術。這一技術的出現,不僅為視頻創作領域帶來了新的可能,也為觀眾帶來了更加豐富的視聽體驗。
    的頭像 發表于 06-21 10:50 ?465次閱讀

    MCU配對簡化了語音控制接口設計

    攜手合作,為STM32微控制器的嵌入式語音識別創建了一個完整的軟件、硬件和許可包,并使添加語音接口變得簡單。 它還將使設計工程師能夠在沒有編程,數據科學和機器學習專業知識的情況下部署以人工智能(AI)為中心的邊緣
    的頭像 發表于 05-06 16:21 ?2083次閱讀

    微軟發布視頻編輯新功能:自動消除無聲片段

    用戶只需要在Clipchamp工具欄中啟用人工智能建議,軟件即可自動掃描視頻并識別其中的靜音片段。用戶可以選擇單獨或批量刪除這些無聲音節。
    的頭像 發表于 04-19 14:42 ?623次閱讀

    未來之聲 | 人形機器人說話篇:無聲

    隨著一個個有關人形機器人的“核彈式”新聞的出現,機器人技術肉眼可見地快速發展。或許,與人們預想的“像人一樣說話”不同,未來人形機器人說話方式是:無聲
    的頭像 發表于 04-13 08:00 ?234次閱讀
    未來之聲 | 人形機器人說話篇:<b class='flag-5'>無聲</b>!