自然界中的聲音非常復雜,波形極其復雜,通常我們采用脈沖編碼碼調制編碼,即PCM編碼。PCM編碼通過抽樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字信號
采樣(sample)
數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的(原始聲音是模擬信號),實現這個步驟使用的設備是模/數轉換器(A/D轉換器,或者ADC,或者analog to digital convert)。它以每秒上萬次的速率對聲波進行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之為樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鐘所采樣的數目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。采樣率決定聲音頻率的范圍(相當于音調),可以用數字波形表示。以波形表示的頻率范圍通常被稱為帶寬。要正確理解音頻采樣可以分為采樣的位數和采樣的頻率。
采樣位數(采樣精度)
電腦中的聲音文件是用數字0和1來表示的。所以在電腦上錄音的本質就是把模擬聲音信號轉換成數字信號。反之,在播放時則是把數字信號還原成模擬聲音信號輸出。采樣位數可以理解為采集卡處理聲音的解析度。這個數值越大,解析度就越高,錄制和回放的聲音就越真實。采集卡的位是指采集卡在采集和播放聲音文件時所使用數字聲音信號的二進制位數。采集卡的位客觀地反映了數字聲音信號對輸入聲音信號描述的準確程度。8位代表2的8次方--256,16 位則代表2的16次方--64K。
采樣率(sample rate)
單位時間內對媒體對象的采樣次數,單位Hz。采樣頻率是指錄音設備在一秒鐘內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。在當今的主流采集卡上,采樣頻率一般共分為 22.05KHz、44.1KHz(44100Hz)、48KHz三個等級,22.05 KHz只能達到FM廣播的聲音品質,44.1KHz則是理論上的CD音質界限,48KHz則更加精確一些。對于高于48KHz的采樣頻率人耳已無法辨別出來了,所以在電腦上沒有多少使用價值。
5kHz的采樣率僅能達到人們講話的聲音質量。
11kHz的采樣率是播放小段聲音的最低標準,是CD音質的四分之一。
22kHz采樣率的聲音可以達到CD音質的一半,目前大多數網站都選用這樣的采樣率。
44kHz的采樣率是標準的CD音質,可以達到很好的聽覺效果。
通道數(channel)
分為單聲道mono;立體聲stereo。當然還存在更多的通道數。舉個列子,聲道多,效果好,兩個聲道,說明只有左右兩邊有聲音傳過來, 四聲道,說明前后左右都有聲音傳過來
比特率(bitrate)
也叫碼率。針對編碼格式,表示壓縮編碼后每秒的音頻數據量大小。計算公式:比特率 = 采樣率 x 采樣精度 x 聲道數。單位kbps,這里的k為1000
VBR、ABR、CBR
VBR(Variable Bitrate)動態比特率。也就是沒有固定的比特率,壓縮軟件在壓縮時根據音頻數據即時確定使用什么比特率。這是Xing發展的算法,他們將一首歌的復雜部分用高Bitrate編碼,簡單部分用低Bitrate編碼。主意雖然不錯,可惜Xing編碼器的VBR算法很差,音質與CBR相去甚遠。幸運的是, Lame完美地優化了VBR算法,使之成為MP3的最佳編碼模式。這是以質量為前提兼顧文件大小的方式時推薦的編碼模式。
ABR(Average Bitrate)平均比特率,是VBR的一種插值參數。Lame針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR也被稱為“Safe VBR”,它是在指定的平均Bitrate內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量。舉例來說,當指定用192kbps ABR對一段wav文件進行編碼時,Lame會將該文件的85%用192kbps固定編碼,然后對剩余15%進行動態優化:復雜部分用高于192kbps 來編碼、簡單部分用低于192kbps來編碼。與192kbps CBR相比,192kbps ABR在文件大小上相差不多,音質卻提高不少。ABR編碼在速度上是VBR編碼的2到3倍,在128-256kbps范圍內質量要好于CBR。可以做為 VBR和CBR的一種折衷選擇。
CBR(Constant Bitrate),常數比特率,指文件從頭到尾都是一種位速率。相對于VBR和ABR來講,它壓縮出來的文件體積很大,但音質卻不會有明顯的提高。
有損和無損
根據采樣和量化的過程可知,音頻編碼最多只能做到無限接近 自然界的信號 ,至少目前的技術還不可能將其完全一樣。這是因為自然界的信號是連續的,而音頻編碼后的 值 是離散的。因此,任何數字音頻編碼方案都是有損的,這也就意味著任何的音頻都不可能完全還原出自然界的聲音。
在計算機應用中, PCM編碼 能夠達到最高保真水平。它已經被廣泛地應用于素材保存及音樂欣賞,包括CD、DVD以及 WAV文件等等。因此,PCM約定俗成了無損編碼,但是這并不意味著PCM就能夠確保信號絕對保真,PCM也只能做到最大程度的無限接近。
我們習慣性地把MP3列入有損音頻編碼范疇,這是相對PCM編碼的。
強調編碼的相對性的有損和無損,要做到真正的無損是非常困難,甚至是不可能的。就如同,我們用小數去表達圓周率,不管小數精度有多高,也只能無限地接近,而不是真正等于圓周率的值。
評論
查看更多