語音識別結(jié)合應(yīng)用場景各位大咖也有一些精彩論點

近二十年來，語音識別技術(shù)取得顯著進(jìn)步，開始從實驗室走向市場。人們預(yù)計，未來10年內(nèi)，語音識別技術(shù)走進(jìn)了工業(yè)、家電、通信、汽車電子、消費電子產(chǎn)品等各個領(lǐng)域。語音識別作為人工智能發(fā)展最早、且率先商業(yè)化的技術(shù)，近幾年來隨著深度學(xué)習(xí)技術(shù)的突破，識別準(zhǔn)確率大幅提升，帶動了一波產(chǎn)業(yè)熱潮。對語音識別未來發(fā)展，各位大咖也有一些精彩論點。

科大訊飛研究院副院長——王士進(jìn)

王士進(jìn)表示，語音識別是人機交互里很重要的模塊，從PC時代到現(xiàn)在的移動互聯(lián)時代，人機交互由鼠標(biāo)鍵盤走向智能手機、Pad等的多點觸摸。到了智能硬件時代，交互則更加多元，不僅有觸摸，還有基于語音、視覺的交互。原本是以機器為中心的人機交互，逐漸走向以人為中心的自然交互。

他認(rèn)為，在將來萬物互聯(lián)的浪潮下，以語音為主，鍵盤、觸摸、視覺、手勢為輔的交互時代很快會到來。

提到傳統(tǒng)的語音交互，王士進(jìn)列舉了幾個缺點：第一，交互距離要近;第二，發(fā)音必須標(biāo)準(zhǔn);第三，環(huán)境必須安靜;第四，人機不能持續(xù)對話。

科大訊飛在2015年提出AIUI，旨在解決上述問題同時期望在人工智能時代提供一種智能的人機交互界面。AIUI提供遠(yuǎn)場喚醒和識別降噪方案，兼容全國近17種方言，可以進(jìn)行全雙工交互和基于業(yè)務(wù)場景的多輪對話，同時結(jié)合訊飛超腦的認(rèn)知智能使得機器進(jìn)行更智能的交互。

AIUI實現(xiàn)了軟硬一體化、云端一體化、技術(shù)服務(wù)一體化，通過三個一體化提供人機智能交互整體解決方案，使得用戶可以快速切換到新的業(yè)務(wù)場景。

在提到基于AIUI交互技術(shù)的一些商業(yè)化嘗試時，王士進(jìn)列舉了幾種：

在交流方面，科大訊飛在05年推出了聽見智能會議這款產(chǎn)品。一般來說，會議場景的同傳準(zhǔn)確率為80%左右，而智能會議轉(zhuǎn)寫準(zhǔn)確率則能達(dá)到90%以上，之后，其在醫(yī)療和司法系統(tǒng)進(jìn)行了應(yīng)用。另外，科大訊飛還推出了便攜翻譯機，易于隨身攜帶，方便遠(yuǎn)程實時交流。

在電視方面，最早的電視是用數(shù)字加上下左右按鍵控制僅有的十幾個臺，而現(xiàn)在的智能電視后臺對接海量資源，通過訊飛智能電視助手可以進(jìn)行方便的語音交互，節(jié)省時間。

在汽車方面，由于人在駕駛時候手不能離開方向盤，故把語音引入代替手進(jìn)行交互會方便許多。實際上相比其他應(yīng)用場景，語音識別由于汽車場景的噪音更強，面臨更大挑戰(zhàn)，而科大訊飛也在基于車載的語音識別做了許多優(yōu)化，更在寶馬、奔馳、通用舉行的全球車載語音識別比賽取得第一名，有效的支撐了車載場景的交互。

在機器人方面，機器人與人的語音交互滿足自然交互、個性化服務(wù)以及基于業(yè)務(wù)場景的整合服務(wù)，可以方便的任意打斷，在理解用戶的需求下進(jìn)行精準(zhǔn)的內(nèi)容推薦和服務(wù)。

語音識別和自然語言理解都是基于統(tǒng)計和概率體系，所以商業(yè)化過程建議選擇人受到一定限制（如車載）或者很難做百分之百正確（如會議同傳）的場景，然后隨著技術(shù)的進(jìn)一步成熟，可以進(jìn)入到更多的場景。

最后，王士進(jìn)總結(jié)道，“語音識別和人機交互技術(shù)在進(jìn)行技術(shù)優(yōu)化的同時更要結(jié)合應(yīng)用場景，最終可使得技術(shù)完善，產(chǎn)業(yè)更好的發(fā)展?！?/p>

百度語音技術(shù)部聲學(xué)技術(shù)負(fù)責(zé)人——李先剛

提到這些年對手機百度語音搜索的不斷優(yōu)化過程，李先剛認(rèn)為要做好這樣一個產(chǎn)品，先要收集相關(guān)數(shù)據(jù)，然后將語音識別應(yīng)用推廣到相關(guān)產(chǎn)品線上供用戶使用，用戶使用后反饋回來數(shù)據(jù)形成完整鏈條，最終達(dá)到非常完美的狀態(tài)。

他把輸入法在語音識別中的作用表述為：輸入法這一場景對語音識別性能提升有非常大的幫助。

而今年，百度在語音技術(shù)方面的進(jìn)展包括基于GramCTC的端對端語音識別系統(tǒng)以及端對端說話人識別技術(shù)。

基于CTC的端對端語音識別系統(tǒng)是目前主流的工業(yè)系統(tǒng)，在2015年底，百度實現(xiàn)了CTC端對端語音識別系統(tǒng)的上線。而今年，百度進(jìn)一步提出了GramCTC算法。

主流的說話人識別技術(shù)使用經(jīng)典的DNN-IVECTOR技術(shù)，其框架基于統(tǒng)計模型，并將DNN引入此框架去學(xué)習(xí)。

可以看到的是，語音識別已走向大數(shù)據(jù)和端對端的道路，百度也將把說話人識別技術(shù)向此發(fā)展，進(jìn)一步提升相關(guān)性能。

李先剛表示，人臉識別與說話人識別有技術(shù)共性，二者之間的差異僅僅只是人臉識別對象可以是固定尺寸的圖片，而語音的時長會有很多變化。因此，百度說話人識別技術(shù)借鑒了目前人臉識別最好的方法——度量學(xué)習(xí)，搭建了端對端度量學(xué)習(xí)的說話人識別系統(tǒng)。百度內(nèi)部的實驗顯示，基于端對端的說話人技術(shù)顯著提升了說話人識別的性能。

從商業(yè)化的角度分析語音識別，可將其應(yīng)用分為兩個維度，第一個是近場和遠(yuǎn)場，第二個是人配合機器說話和人對人說話的不同說話風(fēng)格。經(jīng)過這樣劃分會發(fā)現(xiàn)很多語音場景其實是處在不同的語音象限里面，目前業(yè)界所做的近場人對機器說話的識別準(zhǔn)確率可達(dá)90%以上，但另外幾個場景所做不盡人意。

在李先剛看來，隨著語音技術(shù)的推進(jìn)，輔之商業(yè)化情景必將推動產(chǎn)品和技術(shù)的發(fā)展。

搜狗語音交互技術(shù)中心研發(fā)總監(jiān)——陳偉

從2012年到現(xiàn)在，隨著數(shù)據(jù)和算法的提升，搜狗的語音識別的識別錯誤率是逐年下降的。陳偉分享了一組數(shù)據(jù)：到目前為止，搜狗輸入法每天的語音識別請求量高達(dá)2億次，每天產(chǎn)生語料達(dá)到18萬小時。

陳偉表示，搜狗在2016年發(fā)布知音引擎，對外輸出完整的語音交互解決方案，也一直在探索語音識別和交互的不同場景和經(jīng)驗。語音識別可以更好提升輸入、記錄、交流的效率，其可分為聽寫和轉(zhuǎn)寫，聽寫更多要求實時性，轉(zhuǎn)寫則面向客服數(shù)據(jù)，不要求實時。另外，語音識別技術(shù)面向不同客戶，除了直接提供給消費者，還有一些公司、企業(yè)如法院、醫(yī)院等，語音識別的應(yīng)用場合則更多是在演講、直播、語音分析中。

語音識別不是一個單獨的技術(shù)，其需要同其他技術(shù)進(jìn)行融合，比如機器同傳、語音交互，未來的產(chǎn)品將會是技術(shù)與技術(shù)的組合，產(chǎn)品與產(chǎn)品的組合。

對如何做出一款好的語音交互產(chǎn)品，陳偉認(rèn)為首先是要重視場景和知識。只有技術(shù)（ASR、NLU等）與具體應(yīng)用場景比如車載、智能家具、可穿設(shè)備結(jié)合在一起，才能得到穩(wěn)定的產(chǎn)品。另外，僅僅有技術(shù)是不夠的，還需要技術(shù)創(chuàng)新。在得到良好的使用體驗之后用戶基數(shù)會擴大，帶來更多數(shù)據(jù)，這些累積的數(shù)據(jù)也是推動技術(shù)提升的關(guān)鍵。只有有了產(chǎn)品的迭代、有了真實的數(shù)據(jù)才能更好的分析出用戶需求，更好的推動產(chǎn)品發(fā)展。

他表示，技術(shù)與產(chǎn)品缺一不可。

“語音交互以技術(shù)為驅(qū)動，加之好的運算力帶來大量數(shù)據(jù)，以此進(jìn)行迭代，不斷通過技術(shù)和產(chǎn)品的耦合得到更好的產(chǎn)品。”

思必馳CMO——龍夢竹

“目前的語音產(chǎn)品識別率再高，也只是作為一個參考?！?/p>

龍夢竹提到，在識別率的數(shù)字背后，諸如降噪、遠(yuǎn)場、回聲消除及聲源定位等也需要關(guān)注。

那這幾個詞在整個語音技術(shù)里面有什么作用呢？

其可以影響識別率和準(zhǔn)確性以及是判斷語音交互產(chǎn)品是否實用的重要方向。

目前，各個公司做的都是端到端的，非配合的私人交互系統(tǒng)，在這整個系統(tǒng)里基本分為三個層面：從感知、到認(rèn)知、到抽象思維的智能。

首先從感知的方向，要保障機器能夠聽得清，在克服環(huán)境、降噪的方面有很大挑戰(zhàn)的。以思必馳為例，其依靠強大的數(shù)據(jù)庫，已經(jīng)把錯詞率降低到了7.19%，比業(yè)界普遍的10%有了非常大的效率提升。

另外，聽清以后需要讓機器快速反應(yīng)。常常會有客戶好奇“你們的產(chǎn)品是本地還是云端？”實際上，現(xiàn)在業(yè)界包括思必馳所做的都是本地+云端，一些簡單的喚醒詞、指令可能會放在本地。思必馳目前的本地識別指令最高支持三千條，當(dāng)然，最高支持?jǐn)?shù)目和產(chǎn)品的硬件配置、系統(tǒng)是相關(guān)的。而更多的需要交流的，需要機器思考的部分放到云端。

最后，機器能夠聽清并且能夠快速反應(yīng)了，反應(yīng)出來的效果如何？這個效果用專業(yè)術(shù)語可以稱為TTS，TTS的優(yōu)劣很大程度會決定產(chǎn)品體驗的優(yōu)劣。許多人理解的TTS可能是明星的合成音，而這些合成音不能適用于所有場景。

目前業(yè)界提出的97%、98%、99%的識別率這只是單獨針對語音識別而言，在不同的領(lǐng)域、場景下，針對不同業(yè)務(wù)方向的語音識別和語意理解其實是有層次不齊的，這個圖顯示了在家庭和車載環(huán)境下不同的準(zhǔn)確率。

龍夢竹談到，無論在哪個領(lǐng)域做語音交互技術(shù)，都必須要滿足幾個要求：

第一要滿足用戶剛需;

第二不一定是高頻使用，但在某一場景能讓用戶形成依賴性;

第三，語音技術(shù)背后一定要有第三方的內(nèi)容和服務(wù)作支持，因為它只是一種交互手段;

“我們一再強調(diào)的是，語音只是一個交互的手段，而不是一種功能。”現(xiàn)在的語音還沒有達(dá)到全國人民普及的程度，但未來一定會實現(xiàn)。而這一手段，其背后第三方的內(nèi)容和服務(wù)是比語音本身更重要的東西。

最后，交互體驗一定要好。

閱讀全文

搜狗(13835) 搜狗(13835)
百度(88848) 百度(88848)
語音識別(111781) 語音識別(111781)
科大訊飛(60302) 科大訊飛(60302)

雷達(dá)和硅麥結(jié)合音頻處理器實現(xiàn)最優(yōu)語音識別

英飛凌科技股份公司攜手XMOS有限公司推出全新的語音識別構(gòu)件。該構(gòu)件將英飛凌的雷達(dá)和硅麥克風(fēng)傳感器與XMOS 的音頻處理器相結(jié)合，通過音頻波束成形和雷達(dá)目標(biāo)位置檢測進(jìn)行遠(yuǎn)場語音識別。這些器件融合在一起能夠?qū)崿F(xiàn)最優(yōu)語音識別，并能實現(xiàn)語音控制設(shè)備的完美執(zhí)行。

2017-03-21 10:12:05

1784

語音識別

做了一個語音識別的，很不準(zhǔn)確，誰有厲害一點的算法

2020-03-16 21:25:17

語音識別技術(shù)的概念及應(yīng)用前景

一種最自然的交互方式，和IOT結(jié)合可以解決IOT控制中配網(wǎng)麻煩、需要中心的一些痛點，又可以讓設(shè)備互聯(lián)后共同為用戶提供服務(wù)，實現(xiàn)一個語音入口設(shè)備控制全部IOT設(shè)備，非常方便。特別是隨著專用智能語音芯片的出現(xiàn)，使得其方案成本大大降低，已經(jīng)廣泛應(yīng)用到了中控屏、面板、插座、大小家電等IOT設(shè)備中。 ?

2023-05-27 09:41:03

語音識別設(shè)計要素與電路圖集錦

語音識別，一項被比做“機器聽覺系統(tǒng)”的技術(shù)，能夠讓機器通過識別和理解把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令，與機器進(jìn)行語音交流，這在很久以前是人們夢寐以求的事情，但是現(xiàn)在看來，它似乎與我們漸行漸近

2014-12-20 15:52:06

語音識別問題

各位大神，我想完成用SPCE061A來實現(xiàn)非特定人的語音識別技術(shù)，并能夠使得發(fā)出的命令能在LCD上顯示，不知有沒有能夠指導(dǎo)一下的，大概的框架和模塊，拜托各位了。。。

2015-01-06 22:47:31

=>的使用場景有哪些

使用場景

2020-10-27 13:25:02

ARM MPcore系統(tǒng)中ACP（加速器一致性接口的）應(yīng)用場景如何配置

ARM MPcore系統(tǒng)中ACP（加速器一致性接口的）作用，具體應(yīng)用場景？如何配置？

2022-09-08 11:24:54

ARM的技術(shù)特征是什么？應(yīng)用場景有哪些？

ARM的技術(shù)特征是什么？應(yīng)用場景有哪些？

2021-11-05 07:32:17

ATMEGE128語音識別

求atmega128L和LD3320結(jié)合的語音識別的程序，我已經(jīng)做了半個多月了，沒有一次成功過

2016-07-14 11:30:55

CP-OFMD調(diào)制波形應(yīng)用場景

圖1、5G的應(yīng)用場景5G使用5G多載波波形來為智能手機，辦公室，工廠自動化，智能電網(wǎng)，智慧城市，物聯(lián)網(wǎng)，M2M，M2X等多種設(shè)備提供應(yīng)用平臺。5G新無線電(5G NR)根據(jù)應(yīng)用場景可分為三大類服務(wù)

2019-06-18 06:51:08

FPGA的應(yīng)用場景

目錄文章目錄目錄FPGAFPGA 的應(yīng)用場景FPGA 的技術(shù)難點FPGA 的工作原理FPGA 的體系結(jié)構(gòu)FPGA 的開發(fā)FPGA 的使用FPGA 的優(yōu)缺點參考文檔FPGAFPGA（Field

2021-07-28 08:43:58

Firefly智能語音套件通過CAEDemo程序?qū)崿F(xiàn)語音識別功能

Audition CC/Audacity等軟件，可查看該文件夾內(nèi)的PCM格式文件，從圖中可以看到，發(fā)送到AIUI平臺的音頻只有測試者的語音，麥克風(fēng)拾音到喇叭播放的歌曲聲音已被消除掉。應(yīng)用場景智能語音開發(fā)

2022-07-22 16:25:36

JQ6500語音模塊的相關(guān)資料分享

一：Note今天分享一下最近用到的JQ6500語音模塊，我主要是用它來做個語音播報功能，同時在使用中遇到的一些問題。二：使用說明這個模塊一些什么使用場景的廢話我就不講了，主要講一些比較重要的部分。1

2022-01-07 08:06:49

LD3320語音模塊有哪幾種工作模式

識別；按鍵模式：按鍵觸發(fā)開始ASR進(jìn)程；口令模式：需要一級喚醒詞（口令）；推薦使用口令模式，這樣避免嘈雜環(huán)境下誤動作。應(yīng)用場景：1、家居智能控制2、智能小車DIY設(shè)計3、畢業(yè)設(shè)計創(chuàng)新功能4、個人DIY設(shè)計5、語音控制嵌入式產(chǎn)品設(shè)計...

2022-02-18 06:32:52

MB-1126-JD4開發(fā)板下的應(yīng)用場景都有哪些呢

應(yīng)用場景CORE-1126-JD4/CORE-1109-JD4 金手指保留了 Soc 的大部分接口，用戶可以根據(jù)自身需要自己制作底板來滿足各種應(yīng)用場景。下面介紹一下配到官方 MB-1126-JD4

2022-07-13 16:28:03

MOS管的應(yīng)用場景

mos管的應(yīng)用場景，你了解么？低壓MOS管可稱為金屬氧化物半導(dǎo)體場效應(yīng)管，因為低壓MOS管具有良好的開關(guān)特性，廣泛應(yīng)用在電子開關(guān)的電路中。如開關(guān)電源，電動馬達(dá)、照明調(diào)光等！下面銀聯(lián)寶科技就跟大家一

2018-11-14 09:24:34

MS9331的應(yīng)用場景是什么？

MS9331的應(yīng)用場景是什么？

2022-02-11 06:41:04

NAS存儲+AI語音，智能音箱+物聯(lián)網(wǎng)結(jié)合的產(chǎn)品，邀請各位發(fā)燒友來內(nèi)測

現(xiàn)在我們在做一款NAS存儲和AI語音相結(jié)合的智能硬件，并通過嵌套在主機中的加密芯片，實現(xiàn)了數(shù)據(jù)的非對稱加密、數(shù)字資產(chǎn)管理、隱私保護(hù)等功能。然后現(xiàn)在測試版本已經(jīng)出來了，想邀請一些發(fā)燒友來內(nèi)測，也歡迎大家提出一些技術(shù)上的建議，我們會有獎勵。有興趣的留下微信我來加你們。

2020-10-14 13:51:04

NanoEdge AI的技術(shù)原理、應(yīng)用場景及優(yōu)勢

等領(lǐng)域。以下是一些具體的應(yīng)用場景： 1 . 智能家居：通過將 NanoEdge AI 集成到智能家居設(shè)備中，可以實現(xiàn)對家庭環(huán)境的實時監(jiān)控和智能控制，如溫度調(diào)節(jié)、照明控制、安防監(jiān)控等。 2.工業(yè)自動化

2024-03-12 08:09:00

RK3308的特點及應(yīng)用場景是什么？

RK3308的特點及應(yīng)用場景是什么？

2022-03-09 08:04:31

SMT組裝工藝流程的應(yīng)用場景

工藝流程的應(yīng)用場景。 01單面純貼片工藝應(yīng)用場景：僅在一面有需要焊接的貼片器件。 02雙面純貼片工藝應(yīng)用場景： A/B面均為貼片元件。 03單面混裝工藝應(yīng)用場景： A面有貼片元件+插件元件，B

2023-10-20 10:31:48

SSD268G主要應(yīng)用場景分享

加HDMI擴展，能夠同時呈現(xiàn)不同畫面；安防級別的多攝像頭輸入，最高可達(dá)4K@30fps；豐富的接口和內(nèi)置Ip，可以滿足各種不同的應(yīng)用場景和產(chǎn)品形態(tài)，是多模態(tài)交互場景的理想選擇。該芯片主要應(yīng)用于以下場景中：

2022-03-17 14:30:25

WAPI的用戶使用場景有哪幾種？

WAPI的用戶使用場景有哪幾種？基于WAI的安全接入控制分類有哪些？WPI的封裝過程是怎樣的？

2021-05-31 06:51:07

Wi-Fi6創(chuàng)新技術(shù)特點及應(yīng)用場景

Wi-Fi 6創(chuàng)新技術(shù)特點Wi-Fi 6典型應(yīng)用場景

2020-12-04 06:11:18

eMBB中的CP-OFMD調(diào)制波形的應(yīng)用場景

5G新的無線電接口：eMBB中的CP-OFMD調(diào)制波形的應(yīng)用場景

2021-01-04 07:11:51

jlink的主要使用場景有沒有可以替代的非硬件方案？

jlink的主要使用場景，有沒有可以替代的非硬件方案？

2023-10-07 09:00:45

labview 和 wincc 的區(qū)別使用場景

labview 和 wincc 的區(qū)別使用場景 都是上位機軟件，都可以做監(jiān)控軟件 wincc的名氣也比較大對比的資料較少寫這些文章的人，從自己的從事的行業(yè)出發(fā)，帶有自己的思維使用的場景肯定

2023-10-27 18:01:14

this的使用場景及與C,Java中的this的區(qū)別

【JS】this有哪些使用場景？跟C,Java中的this有什么區(qū)別？如何改變this的值？

2019-03-11 10:17:18

【平頭哥CB5654語音開發(fā)板試用連載】智能門禁語音識別

項目名稱：智能門禁語音識別試用計劃：1、計劃開發(fā)一個智能門禁系統(tǒng)，申請理由本人一致工作再電子行業(yè)，最近再做一些語音識別和智能家居整合項目，基于語音識別輔助用戶管理安全防護(hù)和客人識別管理。項目計劃

2020-03-13 16:20:47

【語音識別】你知道什么是離線語音識別和在線語音識別嗎?

率是可以達(dá)到90%以上的；而對于一些不連接網(wǎng)絡(luò)的產(chǎn)品,如：移動照明,按摩器等,離線語音識別比在線的就更加適合,而且從價格方面來說,離線語音識別應(yīng)用能滿足挺多場合的,價格比在線的便宜,應(yīng)用在線語音識別最終的產(chǎn)品價格也會相對偏高,看用戶的一個研發(fā)產(chǎn)品市場定位跟選擇的。

2021-04-01 17:11:18

【HarmonyOS HiSpark AI Camera】小區(qū)人臉識別及社區(qū)精準(zhǔn)治理

、精準(zhǔn)治理識別，結(jié)合大數(shù)據(jù)分析，得到相關(guān)數(shù)據(jù)結(jié)果，并結(jié)合社區(qū)等應(yīng)用場景進(jìn)行分析，推送相關(guān)的數(shù)據(jù)結(jié)果。1、根據(jù)HiSpark AI Camera HarmonyOS開發(fā)板實現(xiàn)人臉識別。2、根據(jù)開發(fā)板結(jié)合已有的相關(guān)經(jīng)驗實現(xiàn)相關(guān)的技術(shù)點。3、貼合實際社區(qū)的使用場景，實現(xiàn)數(shù)據(jù)分析和結(jié)果應(yīng)用。

2020-11-19 20:48:21

【Nuvoton ISD9160語音識別申請】語音識別

申請理由：項目描述：通過該模塊的語音識別控制，例如WIFI聯(lián)網(wǎng)、獲取服務(wù)器文件，以及MCU控制本地的一些設(shè)備，例如傳感器采集數(shù)據(jù)，完成后再利用語音控制將數(shù)據(jù)上傳到服務(wù)器。我一直在無線領(lǐng)域，例如GPSWIFIBT/BLE等，目前又開始在IOT領(lǐng)域開發(fā)，加入該語音控制項目，可以實現(xiàn)一些控制要求。

2016-11-09 15:05:16

【Nuvoton ISD9160語音識別申請】OpenHamtaro

/thread-3016-1-1.html目前在項目產(chǎn)品化過程中遇到一些問題，由于GoKit3的語音功能嚴(yán)重依賴Lark7618模組，該方案目前只能做小幅度的語音詞條修改，wifi等部分都無法做修改，覺得ISD9160

2016-10-24 10:15:35

【Nuvoton ISD9160語音識別試用體驗】ISD9160語音識別代碼分析

的伙伴呢?## 總結(jié)可以看到ISD9160是可以實現(xiàn)本地一些預(yù)置的語音命令，基本上可以比的上一些幾十塊錢的模塊。但是如何實現(xiàn)自定義的語音命令，還需要繼續(xù)研究。

2016-12-22 00:53:46

【Nuvoton ISD9160語音識別試用體驗】結(jié)項總結(jié) 語音識別智能抽屜控制~~~~~~~~~

家居自動化進(jìn)行分析理解,以及語音識別在控制方面的具體應(yīng)用結(jié)合當(dāng)前實際情況,設(shè)計出一套通過非特定人的特定語音控制家具抽屜的打開和關(guān)閉。該語音識別系統(tǒng)控制抽屜的打開和關(guān)閉通過驅(qū)動步進(jìn)電機來實現(xiàn)。在一些特殊

2016-12-23 09:19:55

【W(wǎng)isCore AVS套件申請】智能家居語音識別

項目名稱：智能家居語音識別試用計劃：目前從事智能家居研究，了解過各種語音方案。目前也有在評估的方案，看到這個開發(fā)板感覺眼前一亮。想用來研究語音識別。1會仔細(xì)研究語音識別的精度和遠(yuǎn)場識別的能力。2

2017-05-23 14:27:05

【大聯(lián)大品佳 Nuvoton ISD9160語音識別試用體驗】-深圳志芯

測試使用語音識別開發(fā)板，經(jīng)過測試的11條語音指令基本識別準(zhǔn)確，有正確反饋，揚聲器會播報指令I(lǐng)D號。同時也發(fā)現(xiàn)一些問題：1.語音指令無法自由修改，必須通過開發(fā)板公司進(jìn)行修改；2.發(fā)出語音指令的距離太近

2020-08-21 20:12:08

【大聯(lián)大品佳 Nuvoton ISD9160語音識別試用體驗】基于 ISD9160的語音控制燈具場景模式

。ISD9160需要原廠的支持，進(jìn)行定制語音識別，雖然麻煩些，但是可以進(jìn)行誤別訓(xùn)練，應(yīng)該是可以訓(xùn)練得更加提高識別精度。下面說說我試用的項目，使用ISD9160進(jìn)行語音交互，用于設(shè)置燈光的不同場景模式，語音

2020-10-19 09:26:23

【大聯(lián)大品佳 Nuvoton ISD9160語音識別試用申請】語音控制智能燈光

項目名稱：語音控制智能燈光試用計劃：現(xiàn)在使用在線語音控制，由于網(wǎng)絡(luò)原因，導(dǎo)致出現(xiàn)有時識別慢，或識別不了的問題，現(xiàn)市面也有離線識別的方案，但對普通話標(biāo)準(zhǔn)度比較高。所以想嘗試新的離線語音識別方案。

2020-08-10 17:37:37

【龍邱Lark7618試用申請】對龍邱Lark7618語音識別開發(fā)板的測評

申請理由：之前做機器人項目使用過語音識別的開發(fā)板，對它的特性有一定了解。項目描述：通過2周時間，對開發(fā)板的特性和使用場景等做一個有趣的介紹

2016-05-25 14:13:17

不接地氣的機器人終將消失，垂直應(yīng)用場景的切入才能促進(jìn)消費升級

用來代替人類，解放部分生產(chǎn)力的，目前也有一些很好的產(chǎn)品能夠應(yīng)用于現(xiàn)實生活中，比如人臉識別、人機交互、語音識別、語音智能翻譯等產(chǎn)品。但是要實現(xiàn)強人工智能的轉(zhuǎn)變，達(dá)到大家心目中對“人工智能”的超高期盼

2018-05-23 16:37:48

云知聲-蜂鳥-智能語音

離線命令詞對話交互。在線語音場景下，可提供在線定制命令詞工具，方便快速導(dǎo)入產(chǎn)品。應(yīng)用場景及產(chǎn)品可包含在家居環(huán)境下的廚房、客廳、臥室、浴室等在內(nèi)的白電（空調(diào)、洗衣機）、燈具（臺燈、吊燈）、86 面板

2020-05-27 10:47:46

低成本的語音識別方案（離線+在線）整理一下預(yù)研思路

識別模塊，以便公司各個產(chǎn)品線上快速開發(fā)使用。最好能夠兼容離線識別與在線識別。背景：我所在的公司是從事廚房小家電開發(fā)銷售的，比如一些電飯煲、榨汁機、豆?jié){機、電磁爐之類的，我所在的部門負(fù)責(zé)基礎(chǔ)功能模塊研發(fā)

2017-03-20 15:56:01

幾種LED調(diào)光協(xié)議分析及具體應(yīng)用場景介紹

汽車的CAN總線協(xié)議，汽車上的LED大燈必須搭配兼容CAN協(xié)議的LED調(diào)光驅(qū)動裝置，在路燈應(yīng)用上為避免接線的過于復(fù)雜則無線更適用一些，這個時候...

2021-12-31 08:04:57

單片機語音識別的原理是什么

。語音識別聽寫機在一些領(lǐng)域的應(yīng)用被美國新聞界評為1997年計算機發(fā)展十件大事之一。很多專家都認(rèn)為語音識別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語音識別技術(shù)所涉及的領(lǐng)域包括：...

2021-11-17 08:02:48

基于語音識別做一款能識別語音的App

最近做了一款語音識別的App，想著利用手機控制arduino實現(xiàn)RGB的調(diào)節(jié)，開發(fā)思路：基于訊飛語音識別做一款能識別我們語音的App，識別出文本之后，對應(yīng)的文字轉(zhuǎn)UTF-8編碼，通過藍(lán)牙串口通訊發(fā)送到arduino，實現(xiàn)對RGB的控制。...

2022-03-01 07:05:08

基于語音識別的人機交互方式淺析

0 引言傳統(tǒng)的人機交互依靠復(fù)雜的鍵盤或按鈕來實現(xiàn)，隨著科技的發(fā)展，一些新型的人機交互方式也隨之誕生，帶給人們?nèi)碌捏w驗?；?b class="flag-6" style="color: red">語音識別的人機交互方式是目前熱門的技術(shù)之一。但是語音識別功能算法復(fù)雜、計算

2022-01-25 07:00:22

基于ATMEGAl28的語音識別系統(tǒng)設(shè)計

2014-03-17 13:31:40

基于LD3220的語音識別的模塊進(jìn)行DIY的小車

現(xiàn)在人工智能很火，人臉識別，語音識別控制都是一部分，語音識別技術(shù)現(xiàn)在有一些成熟的方案了，比如傳統(tǒng)的LD3220,還有科大訊飛的語音識別，也有百度的DuerOS，這個小車是基于LD3220的語音識別

2018-05-10 21:11:31

基于MSP432 MCU的語音識別設(shè)計概述

當(dāng)然，用戶也可以根據(jù)個人需要將短語庫中某些短語進(jìn)行刪除此外，連同語音識別庫一起提供的還有一些易于使用的頭文件和用戶與API指南，以幫助用戶快速上手。下載內(nèi)容還包括針對MSP432 MCU LaunchPad

2019-07-30 04:45:12

基于labview的語音識別

`1系統(tǒng)概述語音識別技術(shù)是二十世紀(jì)信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語音識別是一門交叉學(xué)科，語音識別正逐步成為信息技術(shù)中人機交互的關(guān)鍵技術(shù)，語音識別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤

2019-03-10 22:00:15

基于matlab一些語音處理

主要做了一些數(shù)字濾波器，和對語音去噪處理?。。⌒氯速N??！做的不太好。多多關(guān)照??！

2013-03-06 11:36:37

如何通過LD3320語音識別模塊識別我們預(yù)定的短語

LD3320A語音識別一、LD3320A語音識別模塊介紹二、本章節(jié)實現(xiàn)功能介紹三、接線圖四、完整代碼五、代碼運行結(jié)果六、一些優(yōu)化語音識別效果的建議一、LD3320A語音識別模塊介紹LD3320A

2022-01-12 08:19:47

小容量OLT應(yīng)用場景分析

是2U高的緊湊型OLT形態(tài)。盒式OLT一般是固定式設(shè)備，線卡不可插拔，成本低；而2U高OLT一般具備電信級的保護(hù)，具備良好的電源、風(fēng)扇、主控板冗余等能力?！　《?、小容量OLT應(yīng)用場景分析　　下面將按照

2020-12-03 14:29:02

嵌入式語音識別系統(tǒng)中的電路設(shè)計是如何的

現(xiàn)在社會發(fā)展的這么快，什么高科技都涌現(xiàn)出來，什么智能機器人啦，智能手機等，有很多在這里就不一一列舉了，在這里我們要說的就是語音識別系統(tǒng)了，現(xiàn)在嵌入式產(chǎn)品如此的多，就像一些智能空調(diào)啦，我們可以對著他說

2021-12-20 07:52:03

應(yīng)用Bluetooth Smart技術(shù)的全套智能騎行設(shè)備的技術(shù)細(xì)節(jié)和應(yīng)用場景，不看肯定后悔

應(yīng)用Bluetooth Smart技術(shù)的全套智能騎行設(shè)備的技術(shù)細(xì)節(jié)和應(yīng)用場景，不看肯定后悔

2021-05-21 06:47:43

怎么設(shè)計基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)？

隨著計算機技術(shù)和信息技術(shù)的迅速發(fā)展，語音口令識別已經(jīng)成為了人機交互的一個重要方式之一。語音口令識別系統(tǒng)將根據(jù)人發(fā)出的聲音、音節(jié)或短語給出響應(yīng)，如通過語音口令控制一些執(zhí)行機構(gòu)、控制家用電器的運行或做出

2019-09-03 08:27:23

想學(xué)習(xí)arm，求各位大牛推薦一些什么好書

2013-08-06 12:45:23

方言離線語音控制場景解決方案

　　隨著科技的不斷發(fā)展，離線語音識別技術(shù)已經(jīng)變得越來越成熟。在日常生活中，老人或小孩可能會遇到一些困難，如操作復(fù)雜的電子設(shè)備。為了解決這一問題，離線語音識別模塊成為了一個很好的解決方案。　　一

2023-11-17 17:57:18

步進(jìn)電機是什么工作原理？有哪些分類？應(yīng)用場景是什么？

步進(jìn)電機是什么工作原理？有哪些分類？應(yīng)用場景是什么？

2021-10-19 08:21:37

物聯(lián)網(wǎng)應(yīng)用廣泛嗎？應(yīng)用場景有哪些？

`物聯(lián)網(wǎng)應(yīng)用廣泛嗎？應(yīng)用場景有哪些？物聯(lián)網(wǎng)（ IoT ，Internet of things ）即“萬物相連的互聯(lián)網(wǎng)”，是新一代信息技術(shù)的重要組成部分。廣泛應(yīng)用于智能交通、環(huán)境保護(hù)、***工作

2021-03-16 16:01:16

真趣科技：讓室內(nèi)定位的應(yīng)用場景走的更廣

發(fā)展?jié)摿?，室?nèi)定位的應(yīng)用場景也在向多元化發(fā)展。室內(nèi)定位巨大的市場發(fā)展空間，促使了許多企業(yè)的誕生，蘇州真趣科技就是一家專業(yè)提供室內(nèi)定位位置服務(wù)方案的企業(yè)，致力提供更多室內(nèi)定位解決方案，助力打造更多的室內(nèi)

2016-11-07 14:23:20

離線語音識別及控制是怎樣的技術(shù)？

可以在沒有網(wǎng)絡(luò)連接的情況下進(jìn)行使用，適用于一些特殊場景，如旅行、戶外等無法連接網(wǎng)絡(luò)的環(huán)境。　6. 開發(fā)周期短：在客戶的產(chǎn)品已經(jīng)完善的情況下，可以快速接入離線語音識別。使用深圳雷龍發(fā)展有限公司的推出的LSYT201B模組，最快一天即可根據(jù)客戶要求完成自定義產(chǎn)品。

2023-11-24 17:41:39

離線語音識別和控制的工作原理及應(yīng)用

風(fēng)險。在某些需要高可靠性的應(yīng)用場景，如智能客服、電話會議和智能交通等，離線語音識別能夠發(fā)揮重要作用。雷龍發(fā)展公司致力于為客戶提供一站式的離線語音解決方案。我們的服務(wù)涵蓋了多個領(lǐng)域，包括家電、醫(yī)療器械

2023-11-07 18:01:32

離線語音Snowboy熱詞喚醒語音識別

離線語音Snowboy熱詞喚醒語音識別現(xiàn)在有非常廣泛的應(yīng)用場景,如手機的語音助手,智能音響(小愛,叮咚,天貓精靈...)等.語音識別一般包含三個階段:熱詞喚醒,語音錄入,識別和邏輯控制階段.熱詞喚醒

2021-07-30 08:06:37

自制基于ESP32的語音識別模塊

識別距離越近誤觸發(fā)越低，根據(jù)自己的實際使用場景進(jìn)行合適的調(diào)整，閾值數(shù)值有效范圍1–99。注意：使用前請確保已開通免費試用或者購買開通付費權(quán)限，否則模塊無法正常調(diào)用百度云接口。百度云語音識別新用戶注冊贈送

2021-08-24 15:03:47

自動語音識別的原理是什么？

自動語音識別的原理是什么？如何利用WaveNet實現(xiàn)自動語音識別？

2021-06-15 09:14:07

藍(lán)牙低功耗常見的應(yīng)用場景及架構(gòu)

淺談藍(lán)牙低功耗（BLE）的幾種常見的應(yīng)用場景及架構(gòu)

2021-06-15 09:51:18

藍(lán)牙多連接應(yīng)用場景舉例

藍(lán)牙多連接應(yīng)用場景舉例一、藍(lán)牙多連接的通信方式： 1-1、藍(lán)牙MESH組網(wǎng)圖： 1-2、藍(lán)牙星型組網(wǎng)圖；二、兩種方案的優(yōu)劣勢： 2-1、 MESH方式網(wǎng)絡(luò)中的節(jié)點數(shù)量多，能夠?qū)崿F(xiàn)單播、組播

2023-05-09 09:09:02

虛擬現(xiàn)實+工業(yè)該如何發(fā)展？六大應(yīng)用場景搶先看

的工作方式，成為當(dāng)前虛擬現(xiàn)實+工業(yè)生產(chǎn)中最成熟的落地應(yīng)用場景，解決了在電網(wǎng)巡檢、管路巡檢等特殊場合下的痛點需求。場景三：虛擬現(xiàn)實+遠(yuǎn)程協(xié)作。通過將現(xiàn)場工人的第一人稱實時畫面?zhèn)鬟f至遠(yuǎn)端，并可通過語音

2018-09-27 17:37:28

談?wù)剉oid指針的一些妙用

關(guān)注+星標(biāo)公眾號，不錯過精彩內(nèi)容轉(zhuǎn)自 | 嵌入式客棧要比較靈活的使用C語言實現(xiàn)一些高層級的框架時，需要掌握一些進(jìn)階編程技巧，這篇來談?wù)剉oid指針的一些妙用。測試環(huán)境采用 IAR for ...

2022-01-26 07:20:53

車聯(lián)網(wǎng)語音識別技術(shù)發(fā)展與應(yīng)用

延伸。但是對于高速行駛、行為受限的車載應(yīng)用場景中，社交功能的實現(xiàn)存在很大的挑戰(zhàn)。智能設(shè)備的交互方式中按鍵交互和觸摸屏交互應(yīng)用最廣也最為成熟，但對于車輛駕駛是“危險的動作”。在此背景下基于語音識別技術(shù)

2013-07-26 15:40:55

運放電路有哪些應(yīng)用場景?

運放電路的七大應(yīng)用場景

2021-03-11 07:49:46

逐一介紹Linux各個系統(tǒng)的特點以及應(yīng)用場景

rootfs 與一些需要的應(yīng)用軟件。**Firefly Buildroot 特點如下：**Firefly Buildroot 應(yīng)用場景：如果您的產(chǎn)品 CPU 性能比較弱、硬件資源比較緊張可以首選

2022-08-02 16:42:17

通用型AI語音識別芯片音旋風(fēng)611如何？

進(jìn)行控制的應(yīng)用場景，真正解放用戶的雙手。當(dāng)用戶使用搭載了音旋風(fēng)611芯片的各類設(shè)備時，直接下指令即可動口不動手地完成操作，無需聯(lián)網(wǎng)、沒有延遲、識別精準(zhǔn)，從而獲得比云端交互的AI設(shè)備更好的體驗。

2019-09-11 11:52:12

語音識別,什么是語音識別

語音識別,什么是語音識別語音識別　與機器進(jìn)行語音交流，讓機器明白你說什么，這是人們長期以來

2010-03-06 11:19:25

2537

語音識別的應(yīng)用場景

在西方經(jīng)濟發(fā)達(dá)國家，大量的語音識別產(chǎn)品已經(jīng)進(jìn)入市場和服務(wù)領(lǐng)域。一些用戶交換機、電話機、手機已經(jīng)包含了語音識別撥號功能、語音記事本、語音智能玩具等產(chǎn)品，同時也包括語音識別與語音合成功能。人們可以通過電話網(wǎng)絡(luò)用語音識別口語對話系統(tǒng)查詢有關(guān)的機票、旅游、銀行信息。下面一起來看看語音識別的應(yīng)用場景：

2019-03-27 15:04:58

19310

語音識別技術(shù)在安防行業(yè)的應(yīng)用涉足到了多個智慧化場景

大環(huán)境表明，智能語音技術(shù)最廣泛的應(yīng)用還是智能單品（智能音箱、機器人）以及智能家居等領(lǐng)域，且語音識別技術(shù)是智能語音技術(shù)最為核心的落地技術(shù)。但需要提及的是，進(jìn)入智能語音技術(shù)的發(fā)展＊＊期，智能語音技術(shù)是時候該有一些比較新穎的落地場景出現(xiàn)了。

2019-04-22 09:04:14

1113

關(guān)于語音識別類產(chǎn)品細(xì)分及其應(yīng)用場景分析

語音識別是語義識別的前提基礎(chǔ)。語音識別將聲音轉(zhuǎn)化成文字，語義識別提取文字中的相關(guān)信息和相應(yīng)意圖，通過執(zhí)行模塊進(jìn)行相應(yīng)的問題回復(fù)或者反饋動作。

2019-09-27 14:07:31

3138

人臉支付的使用場景有哪些

近幾年來，人臉識別支付的應(yīng)用場景進(jìn)一步擴大。隨著非接觸式支付勢頭持續(xù)高漲，人臉支付已受到市場的廣泛關(guān)注，其應(yīng)用領(lǐng)域也越來越廣泛。那么，人臉支付的使用場景是什么？

2020-10-30 11:16:15

998

區(qū)塊鏈技術(shù)的落地應(yīng)用場景

在應(yīng)用場景落地方面，我們重點結(jié)合一些典型的應(yīng)用場景，研究和設(shè)計相應(yīng)的區(qū)塊鏈體系結(jié)構(gòu)。這里面包括我們目前正在廣州生物島開展的“基于區(qū)塊鏈技術(shù)的醫(yī)療數(shù)據(jù)共享和管理系統(tǒng)”項目。

2020-11-19 10:08:51

3997

人臉識別技術(shù)應(yīng)用場景瘋狂發(fā)掘到了什么程度

對于人臉識別技術(shù)應(yīng)用場景的瘋狂發(fā)掘到了什么程度？

2020-12-07 17:13:40

786

生物識別各類應(yīng)用場景正逐步打開

在我國，生物識別各類應(yīng)用場景正逐步打開，人臉識別、指紋識別、生物識別、步態(tài)識別也正在醫(yī)療機構(gòu)、居民社區(qū)、商業(yè)大樓等場所得到推廣普及。綜合來看，生物識別技術(shù)就是利用人體固有的生理特征(如虹膜、靜脈

2020-12-08 09:46:35

2263

關(guān)于論辯圖譜的互動論點對識別

Knowledge Graph for Interactive Argument Pair Identification，通過構(gòu)建論辯領(lǐng)域的知識圖譜并融合其中的相關(guān)知識，提升互動論點對識別任務(wù)的準(zhǔn)確性

2021-06-15 16:28:06

1374

語音識別芯片的潛在應(yīng)用場景分析

由于語音識別芯片是屬于非特定人識別，因此其可以應(yīng)用的范圍幾乎可以滿足所有需要語音識別/聲控的電子產(chǎn)品的需求其潛在的應(yīng)用場景主要包括：燈具類：吊燈、吸頂燈、落地?zé)?、壁燈、臺燈等等按摩器：頸部

2021-10-29 11:52:00

1316

物聯(lián)網(wǎng)結(jié)合機器學(xué)習(xí)(ML)的應(yīng)用場景

本篇博客文章介紹了物聯(lián)網(wǎng)結(jié)合機器學(xué)習(xí)(ML)的應(yīng)用場景，以及如何基于Silicon Labs(亦稱“芯科科技”)的無線SoC平臺展開機器學(xué)習(xí)的開發(fā)。

2022-06-13 16:26:55

1361

NRK3301語音識別芯片在取暖器上的應(yīng)用方案

語音控制智能家居，是將智能語音交互技術(shù)運用到智能家居之中，通過語音識別技術(shù)，為家居多種實際應(yīng)用場景賦予產(chǎn)品“能聽、會說、懂你”式的智能人機交互體驗，適用于多個應(yīng)用場景中，包括，語音控制開關(guān)、語音控制情景模式。

2022-11-01 17:00:47

756

深度學(xué)習(xí)在語音識別中的應(yīng)用及挑戰(zhàn)

一、引言隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展，其在語音識別領(lǐng)域的應(yīng)用也日益廣泛。深度學(xué)習(xí)技術(shù)可以有效地提高語音識別的精度和效率，并且被廣泛應(yīng)用于各種應(yīng)用場景。本文將探討深度學(xué)習(xí)在語音識別中的應(yīng)用及所面臨

2023-10-10 18:14:53

449

已全部加載完成

搜索歷史

語音識別結(jié)合應(yīng)用場景 各位大咖也有一些精彩論點

科大訊飛研究院副院長——王士進(jìn)

百度語音技術(shù)部聲學(xué)技術(shù)負(fù)責(zé)人——李先剛

搜狗語音交互技術(shù)中心研發(fā)總監(jiān)——陳偉

思必馳CMO——龍夢竹

評論

語音識別結(jié)合應(yīng)用場景各位大咖也有一些精彩論點