資料介紹
描述
本實驗的目的:
在本實驗中,我們分析了“Khule Dao”和“Bondho Koro”的真實音頻信號。之后,我們開發了一種算法,可以自動識別測試數據。
研究趨勢:
這里簡要討論最近關于孟加拉語語音識別的兩項研究。
在語音識別方面,世界各地在各種語言中進行了大量的研究實驗并取得了成果。但是,在孟加拉語中,該領域的早期研究人員取得了一定的成功,盡管近年來情況正在發生變化。本研究工作旨在開發一種基于神經網絡的孟加拉語連接數字識別系統。首先,開發了一個由男性和女性說話者組成的孟加拉語數字語料庫。語音以連接方式記錄,單詞通過自動分割提取。然后計算分割詞的 MFCC 特征,并將這些特征值作為輸入發送到反向傳播神經網絡 (BPNN)。BPNN 學習算法用于訓練網絡。訓練網絡所需的時間、隱藏層的數量、在訓練網絡以達到最佳識別精度時,會考慮錯誤閾值和時期數。這個提議的系統已經使用面向對象的編程實現了,所獲得的識別精度非常令人滿意和一致。該網絡已經針對三種不同的設置進行了測試,數字數據集的最佳識別準確率為 98.46%。[1]
語音識別是一種生物識別技術,用于識別特定的個人語音。特定語音的語音波構成了說話人識別的基礎。我們可以在電話銀行、電話購物、訪問數據庫信息和語音郵件等多個應用領域使用語音識別。語音識別的強大應用之一是出于安全目的,一個人可以輸入他/她的語音進行身份驗證。每種類型的聲音都有其獨特的特征,稱為特征,從單個聲音中提取這些特征的過程稱為特征提取。將提取的語音特征與數據庫中已保存的語音進行比較以進行匹配。[2]
提取技術:
audioread、num2str、strcat、fft、abs、最大值、長度。
建議功能:
1.我們的技術特點是基于快速傅立葉變換(fft)的簡單語音識別系統。
2.首先使用MATLAB的audioread函數分析音頻信號
對于 I = 1:116
s1 ='Z:\EEE 309\Open_Ended\Train_Data\Train_Open\OP-';
s2 = num2str(i);
s3 = '.mp3';
文件1 = strcat(s1,s2,s3);
如果存在 (file1, 'file') == [y, t] = audioread(file1);
3. 然后對所有循環中的所有信號的給定輸入數據應用 fft
NFFT=長度(y);% 找到 y 的長度
x=fft(y, NFFT);
4.使用max函數求最大幅度
x1=abs(x);
F=((0:1/NFFT:1-1/NFFT)*Fs);
max_amp=max(x1);
5.使用find函數找到最大幅度的對應頻率
b=find(x1==max_amp(1));
F_KD_max(i)=F(b(1));
6. “Khule Dao”和“Bondho Koro”的頻率值相加并取平均值
7. if(F_KD_max(i)>50 && F_KD_max(i)<600)
c1 = c1 +1;
sum1=sum1+F_KD_max(i);
結尾
average_max_frequency_of_Khule_Dao=sum1/c1
8. 我們建議,如果測試數據的頻率之差(絕對值)對應于最大幅度,并且“Khule Dao”的平均頻率值小于測試數據的頻率與“Bondho Koro”的平均頻率之差,那么測試數據將被預測為“Khule Dao”,反之亦然“Bondho Koro”
Diff_khule_dao_max(i)= abs(F_max(i)-average_max_frequency_of_Khule_Dao);
Diff_bondo_koro_max(i)= abs(F_max(i)-average_max_frequency_of_bondo_koro);
if(Diff_bondo_koro_max(i) >= Diff_khule_dao_max(i))
disp('Khule 道')
No_of_khule_dao=No_of_khule_dao+1;
別的
disp('邦多科羅')
No_of_bondho_koro=No_of_bondho_koro+1;
?
- 自定義神經網絡對象識別開源分享
- 開源硬件邊緣語音識別
- 語音識別芯片LD3320開發手冊 45次下載
- NRK330X語音識別芯片離線語音喚醒模塊資料說明書!
- 語音識別_ML-KWS-for-MCU_資料整理
- NRK220X語音識別模塊語音芯片語音ic數據資料
- 結合MFCC和特征的語音情感識別方法 23次下載
- 基于性能影響因素分析的語音識別平臺體系結構 20次下載
- 基于改進長短時記憶網絡的兒童語音情感識別模型 14次下載
- 如何使用LVQ進行普米語語譜圖的識別說明 7次下載
- 如何進行馬來語語音合成系統的設計與實現概述 4次下載
- 如何使用MATLAB進行語音識別算法研究的論文資料免費下載 43次下載
- 科大訊飛5.0語音軟件的安裝和操作要領資料說明 11次下載
- 緬甸語分詞方法及其實現方法來開發緬甸語的語音合成系統 0次下載
- 云知聲語音識別開發平臺 27次下載
- 自動語音識別技術基本指南 1834次閱讀
- 基于JuliUS語音識別引擎實現機器人孤立詞語音識別系統的設計 1695次閱讀
- dfrobot語音識別控制板 介紹 2972次閱讀
- firefly百度人臉識別開發套件介紹 2207次閱讀
- 語音識別系統功能_語音識別系統的應用 5549次閱讀
- 語音識別芯片的原理_語音識別芯片有哪些 5171次閱讀
- 一文解讀語音識別的運行原理 3831次閱讀
- 使用3D卷積神經網絡的交叉視聽識別技術進行唇語識別 6768次閱讀
- 語音識別技術的發展歷程,語音識別是如何工作的?語音識別資料概述 1w次閱讀
- 語音識別技術的發展及難點分析 2.3w次閱讀
- 語音識別技術是什么_語音識別技術應用領域介紹 1.6w次閱讀
- 語音識別技術原理全面解析 1.2w次閱讀
- 語音識別技術的應用及發展 2318次閱讀
- 基于語音識別技術的聲控鼠標光標程序設計 5071次閱讀
- 如何關閉word語音識別 (數據丟失) 5115次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多