人工智能(AI)和機(jī)器學(xué)習(xí)(ML)將通過將其整合到自動(dòng)駕駛汽車設(shè)計(jì)中,在汽車行業(yè)的巨大轉(zhuǎn)型中占據(jù)關(guān)鍵地位。與供應(yīng)鏈管理、制造運(yùn)營、移動(dòng)服務(wù)、圖像和視頻分析等其他領(lǐng)域一起,音頻分析在自動(dòng)駕駛汽車取得成功方面發(fā)揮著重要作用。隨著技術(shù)的進(jìn)步和創(chuàng)新,汽車行業(yè)正在重塑和采用新技術(shù)。音頻分析極大地改變了汽車公司對(duì)其產(chǎn)品的關(guān)注,以提高客戶滿意度。到2030年,自動(dòng)駕駛汽車的全球市場(chǎng)規(guī)模將增長(zhǎng)到600億美元。
無人駕駛汽車機(jī)器學(xué)習(xí)下的音頻分析包括音頻分類、NLP、語音/語音和聲音識(shí)別。語音和語音識(shí)別已成為自動(dòng)駕駛汽車和汽車行業(yè)不可或缺的一部分。在以前的汽車模型中,語音和語音識(shí)別是一個(gè)挑戰(zhàn),因?yàn)槿狈Ω咝У?a href="http://www.nxhydt.com/v/tag/2562/" target="_blank">算法、可靠的連接和邊緣的處理能力。此外,車內(nèi)機(jī)艙噪音降低了音頻分析的性能,從而導(dǎo)致錯(cuò)誤識(shí)別。
長(zhǎng)期以來,機(jī)器中的音頻分析一直是不斷研究的主題。隨著技術(shù)的進(jìn)步,市場(chǎng)上的新產(chǎn)品,如亞馬遜的Alexa和蘋果的Siri,利用了云技術(shù)的關(guān)鍵優(yōu)勢(shì),而這些優(yōu)勢(shì)是其他識(shí)別系統(tǒng)以前所缺乏的。然而,為了使這些系統(tǒng)在自動(dòng)駕駛汽車中順利運(yùn)行,將需要不間斷的無線互聯(lián)網(wǎng)服務(wù)。
最近,各種機(jī)器學(xué)習(xí)算法,如kNN(K最近鄰),SVM(支持向量機(jī)),EBT(集成袋樹),深度神經(jīng)網(wǎng)絡(luò)(DNN)和自然語言處理(NLP)廣泛用于音頻分析。
正在從原始音頻中提取各種音頻特征,并將其作為輸入提供給機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法。
對(duì)于音頻分析,音頻數(shù)據(jù)經(jīng)過預(yù)處理以消除噪聲,然后從音頻數(shù)據(jù)中提取音頻特征。此處使用了諸如MFCC(梅爾頻率倒譜系數(shù))之類的音頻特征以及諸如峰度,方差之類的統(tǒng)計(jì)特征。MFCC的頻段在Mel量表上等距,非常接近人類聽覺系統(tǒng)的響應(yīng)。出于同樣的原因,使用此功能訓(xùn)練模型。最后,使用經(jīng)過訓(xùn)練的模型進(jìn)行推理,從安裝在汽車中的多個(gè)麥克風(fēng)中獲取實(shí)時(shí)音頻流,然后對(duì)其進(jìn)行預(yù)處理并提取特征。提取的特征將被傳遞給訓(xùn)練好的模型,以便正確識(shí)別音頻,這對(duì)于在自動(dòng)駕駛汽車中做出正確的決定很有用。
有了新技術(shù),最終用戶的信任是關(guān)鍵點(diǎn),NLP是建立自動(dòng)駕駛汽車信任的游戲規(guī)則改變者。NLP允許乘客使用語音命令控制汽車,例如要求在餐廳停車,改變路線,在最近的購物中心停車,打開/關(guān)閉燈,打開和關(guān)閉車門等等。這使得乘客體驗(yàn)豐富且互動(dòng)。
讓我們看看使用音頻分析為自動(dòng)駕駛汽車開發(fā)的幾個(gè)用例
緊急警報(bào)器檢測(cè)
任何緊急車輛(如救護(hù)車、消防車或警車)的警笛聲都可以使用各種深度學(xué)習(xí)模型以及 SVM(支持向量機(jī))等機(jī)器學(xué)習(xí)模型來檢測(cè)。監(jiān)督學(xué)習(xí)模型 – SVM 用于分類和回歸分析。SVM分類模型使用緊急警報(bào)聲和非緊急聲音的海量數(shù)據(jù)進(jìn)行訓(xùn)練。通過該模型,開發(fā)了識(shí)別警報(bào)器聲音的系統(tǒng),以便為自動(dòng)駕駛汽車做出適當(dāng)?shù)臎Q策,以避免任何危險(xiǎn)情況。有了這個(gè)檢測(cè)系統(tǒng),自動(dòng)駕駛汽車可以做出靠邊停車的決定,并為緊急車輛通過提供道路。
發(fā)動(dòng)機(jī)聲音異常檢測(cè)
自動(dòng)早期檢測(cè)可能的發(fā)動(dòng)機(jī)故障可能是自動(dòng)駕駛汽車的基本功能。汽車發(fā)動(dòng)機(jī)在正常情況下工作時(shí)會(huì)發(fā)出一定的聲音,當(dāng)出現(xiàn)一些問題/故障時(shí)會(huì)發(fā)出不同的聲音。K-means聚類中可用的許多機(jī)器學(xué)習(xí)算法可用于檢測(cè)發(fā)動(dòng)機(jī)聲音中的異常。在 k 均值聚類中,聲音的每個(gè)數(shù)據(jù)點(diǎn)都分配給 k 組聚類。數(shù)據(jù)點(diǎn)的分配基于接近該聚類質(zhì)心的平均值。在引擎聲音異常的情況下,數(shù)據(jù)點(diǎn)將落在正常群集之外,并且將成為異常群集的一部分。使用此模型,可以持續(xù)監(jiān)控發(fā)動(dòng)機(jī)的健康狀況,如果出現(xiàn)任何異常聲音事件,那么自動(dòng)駕駛汽車可以警告用戶并幫助做出正確的決策以避免任何危險(xiǎn)情況。這可以避免發(fā)動(dòng)機(jī)完全故障/故障。
按喇叭時(shí)變道
為了使自動(dòng)駕駛汽車完全像人類駕駛的汽車一樣工作,它必須在以下情況下有效工作:當(dāng)后面的車輛需要緊急通過并按喇叭指示時(shí),必須改變車道。隨機(jī)森林,機(jī)器學(xué)習(xí)算法將最適合這種類型的分類問題。它是一種監(jiān)督分類算法。顧名思義,它將創(chuàng)建決策樹森林,并最終合并所有決策樹以獲得準(zhǔn)確的分類。可以使用該模型開發(fā)一個(gè)系統(tǒng),該系統(tǒng)將識(shí)別喇叭的特定模式并做出相應(yīng)的決定。
自動(dòng)駕駛汽車的車內(nèi)交互
NLP(自然語言處理)處理人類語言以提取有助于做出決策的含義。乘員不僅可以發(fā)出命令,還可以與自動(dòng)駕駛汽車交談。假設(shè)你給你的自動(dòng)駕駛汽車分配了一個(gè)像Adriana這樣的名字,那么你就可以對(duì)你的車說“Adriana,帶我去我最喜歡的咖啡店”。這仍然是一個(gè)簡(jiǎn)單的句子,但我們也可以讓自動(dòng)駕駛汽車?yán)斫飧鼜?fù)雜的句子,例如“帶我去我最喜歡的咖啡店,在到達(dá)那里之前,在吉姆的家里停下來接他”。您可以在車內(nèi)與更多東西互動(dòng)。但是,自動(dòng)駕駛汽車不應(yīng)盲目聽從車主的指示,以避免任何危險(xiǎn)情況,例如死亡和生境。為了做到這一點(diǎn),自動(dòng)駕駛汽車需要一個(gè)更強(qiáng)大的NLP,它實(shí)際上可以解釋人類所告訴的內(nèi)容,并且可以回響其后果。
因此,基于機(jī)器學(xué)習(xí)的音頻分析歸因于安全可靠的自動(dòng)駕駛汽車的日益普及。在 VOLANSYS,我們幫助汽車開發(fā)基于 ML 技術(shù)的定制解決方案,如音頻分析、NLP、語音識(shí)別等,從而增強(qiáng)乘客體驗(yàn)、道路安全和及時(shí)的汽車發(fā)動(dòng)機(jī)維護(hù)。我們的機(jī)器學(xué)習(xí)專家擁有使用高效框架、數(shù)據(jù)分析和可視化工具處理從數(shù)字、音頻、文本、視頻到圖像等多種形式的數(shù)據(jù)的技能。
審核編輯:郭婷
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8377瀏覽量
132410 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
783文章
13684瀏覽量
166147 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5492瀏覽量
120978
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論