聲音的基礎知識
聲音的產生是由于物體的振動,造成空間內空氣的波動而共鳴發音,再由大氣的傳播,使人的聽覺神經感受到的一種物理現象。
聲音的三要素是響度,音調和音色。
響度,和聲音震動的幅度有關,用的力越大,人的鼓膜震動幅度就越大,發出的聲音越響。
音調,主要是和頻率有關。聲波的頻率越高,音調也越高。
音色在同樣的音調(頻率)和響度(振幅)下,鋼琴和小提琴的聲音聽起來是完全不相同的,因為它們的音色不同。
聲音傳播的介質是固體、液體、氣體。介質不同,傳播的速度也不同。真空的情況下聲音是無法傳播的。
數字音頻
對自然界的聲音(模擬信號)進行采樣,采樣就是根據奈奎斯特定理在時間軸上對信號進行數字化信號,即按照一定時間間隔△t 在模擬信號 x(t)上逐點采取其瞬時值。采樣率越高,聲音的還原程度越高,質量就越好,同時占用空間會變大。
量化是用有限個幅度值近似原來連續變化的幅度值,把模擬信號的連續幅度變為有限數量的有一定間隔的離散值。
編碼是按照一定的規律,把量化后的值用二進制數字表示,然后轉化成二值或多值的數字信號流。這樣得到的數字信號通過可以通過電纜,衛星通道等數字線路傳輸。在接收端與上述模擬信號數字化過程相反,再經過后置濾波再恢復成原來的模擬信號。
上面數字化的過程又叫做脈沖編碼調制,通常我們說的音頻的裸數據格式就是脈沖編碼調制(PCM)數據。描述一段 PCM 數據需要幾個量化指標,常用的量化指標是采樣率,位深度,字節序,聲道數。
采樣率(Sample rate):每秒鐘采樣多少次,以 Hz 為單位。
位深度(Bit-depth):表示用多少個二進制位來描述采樣數據,一般為 16bit。
字節序:表示音頻 PCM 數據存儲的字節序是大端存儲(big-endian)還是小端存儲(little-endian),為了數據處理效率的高效,通常為小端存儲。
聲道數(channel number):當前 PCM 文件中包含的聲道數,是單聲道(mono)、雙聲道。
-
音頻
+關注
關注
29文章
2839瀏覽量
81373 -
音視頻
+關注
關注
4文章
466瀏覽量
29856 -
數字化
+關注
關注
8文章
8628瀏覽量
61648
發布評論請先 登錄
相關推薦
評論