音質標準和音質評價方法
●音質標準
所謂聲音的質量,是指經傳輸、處理后音頻信號的保真度。目前,業界公認的聲音質量標準分為4級,即數字激光唱盤CD-DA質量,其信號帶寬為10Hz~20kHz;調頻廣播FM質量,其信號帶寬為20Hz~15kHz;調幅廣播AM質量,其信號帶寬為50Hz~7kHz;電話的話音質量,其信號帶寬為200Hz~3400Hz??梢?,數字激光唱盤的聲音質量最高,電話的話音質量最低。除了頻率范圍外,人們往往還用其它方法和指標來進一步描述不同用途的音質標準。
對模擬音頻來說,再現聲音的頻率成分越多,失真與干擾越小,聲音保真度越高,音質也越好。如在通信科學中,聲音質量的等級除了用音頻信號的頻率范圍外,還用失真度、信噪比等指標來衡量。 對數字音頻來說,再現聲音頻率的成分越多,誤碼率越小,音質越好。通常用數碼率(或存儲容量)來衡量,取樣頻率越高、量化比特數越大,聲道數越多,存儲容量越大,當然保真度就高,音質就好。
聲音的類別特點不同,音質要求也不一樣。如,語音音質保真度主要體現在清晰、不失真、再現平面聲象;樂音的保真度要求較高,營造空間聲象主要體現在用多聲道模擬立體環繞聲,或虛擬雙聲道3D環繞聲等方法,再現原來聲源的一切聲象。
音頻信號的用途不同,采用壓縮的質量標準也不一樣。如,電話質量的音頻信號采用ITU-TG·711標準,8kHz取樣,8bit量化,碼率64Kbps。AM廣播采用ITU-TG·722標準,16kHz取樣,14bit量化,碼率224Kbps。高保真立體聲音頻壓縮標準由ISO和ITU-T聯合制訂,CD11172-3MPEG音頻標準為48kHz、44.1kHz、32kHz取樣,每聲道數碼率32Kbps~448Kbps,適合CD-DA光盤用。
對聲音質量要求過高,則設備復雜;反之,則不能滿足應用。一般以“夠用,又不浪費”為原則。
●音質評價方法
評價再現聲音的質量有主觀評價和客觀評價兩種方法。例如:
1.語音音質
評定語音編碼質量的方法為主觀評定和客觀評定。目前常用的是主觀評定,即以主觀打分 (MOS)來度量,它分為以下五級:5(優),不察覺失真;4(良),剛察覺失真,但不討厭;3(中),察覺失真,稍微討厭;2(差),討厭,但不令人反感;1(劣),極其討厭,令人反感。一般再現語音頻率若達7kHz以上,MOS可評5分。這種評價標準廣泛應用于多媒體技術和通信中,如可視電話、電視會議、語音電子郵件、語音信箱等。
2.樂音音質
樂音音質的優劣取決于多種因素,如聲源特性(聲壓、頻率、頻譜等)、音響器材的信號特性(如失真度、頻響、動態范圍、信噪比、瞬態特性、立體聲分離度等)、聲場特性(如直達聲、前期反射聲、混響聲、兩耳間互相關系數、基準振動、吸聲率等)、聽覺特性(如響度曲線、可聽范圍、各種聽感)等。所以,對音響設備再現音質的評價難度較大。
通常用下列兩種方法:一是使用儀器測試技術指標;二是憑主觀聆聽各種音效。由于樂音音質屬性復雜,主觀評價的個人色彩較濃,而現有的音響測試技術又只能從某些側面反映其保真度。所以,迄今為止,還沒有一個能真正定量反映樂音音質保真度的國際公認的評價標準。但也有報道,國際電信聯盟(ITU-T)近期已批準一種客觀評價音質的被稱之為電子耳的新型測量方法,可對任何音響器材的音質進行客觀聽音評價,也可用于檢測電話通訊語音編碼系統的缺陷。
現將樂音音質評價方法綜述如下:
(1)主觀聽判音效
通常,據樂音音質聽感三要素,即響度、音調和愉快感的變化和組合來主觀評價音質的各種屬性,如低頻響亮為聲音豐滿,高頻響亮為聲音明亮,低頻微弱為聲音平滑,高頻微弱為聲音清澄。下面結合聲源、聲場及信號特性介紹幾種典型的聽感。
①立體感
主要由聲音的空間感(環繞感)、定位感(方向感)、層次感(厚度感)等所構成的聽感,具有這些聽感的聲音稱為立體聲。自然界的各種聲場本身都是富有立體感的,它是模擬聲源聲象最重要的一個特征。德·波爾效應證明,人耳的生理特點是:人耳在兩聲源的對稱軸上,當聲壓差△p=0dB和時間差△t=0ms時,感覺兩聲源聲象相同,分不出有兩個聲源;而當△p>15dB或△t>3ms時,人耳就感覺到有兩個聲源,聲像往聲壓大或導前的聲源移動,每5dB的聲壓差相當于lms的時間差。哈斯效應又進一步證明,當△t=5ms~35ms時,人耳感到有兩個聲源;而當近次反射聲、滯后直達聲或兩個聲源的時間差△t>50ms時,即使一次反射聲(又稱近次或前期反射聲)或滯后聲的響度比直達聲或導前聲的響度大許多倍,聲源方位仍由直達聲或導前聲決定。
根據人耳的這個生理特點,只要通過對聲音的強度、延時、混響、空間效應等進行適當控制和處理,在兩耳人為的制造具有一定的時間差△t、相位差△θ、聲壓差△P的聲波狀態,并使這種狀態和原聲源在雙耳處產生的聲波狀態完全相同,人就能真實、完整地感受到重現聲音的立體感。與單聲道聲音相比,立體聲通常具有聲象分散、各聲部音量分布得當、清晰度高、背景噪聲低的特點。
②定位感
若聲源是以左右、上下、前后不同方位錄音后發送,則接收重放的聲音應能將原聲場中聲源的方位重現出來,這就是定位感。根據人耳的生理特點,由同一聲源首先到達兩耳的直達聲的最大時間差為0.44ms~0.5ms,同時還有一定的聲壓差、相位差。生理心理學證明:20Hz~200Hz低音主要靠人兩耳的相位差定位,300Hz~4kHz中音主要靠聲壓差定位,更高的高音主要靠時間差定位??梢?,定位感主要由首先到達兩耳的直達聲決定,而滯后到達兩耳的一次反射聲和經四面八方多次反射的混響聲主要模擬聲象的空間環繞感。
③空間感
一次反射聲和多次反射混響聲雖然滯后直達聲,對聲音方向感影響不大,但反射聲總是從四面八方到達兩耳,對聽覺判斷周圍空間大小有重要影響,使人耳有被環繞包圍的感覺,這就是空間感。空間感比定位感更重要。
④層次感 聲音高、中、低頻頻響均衡,高音諧音豐富,清澈纖細而不刺耳,中音明亮突出,豐滿充實而不生硬,低音厚實而無鼻音。
⑤厚度感
低音沉穩有力,重厚而不渾濁,高音不缺,音量適中,有一定亮度,混響合適,失真小。
除此之外,還有許多評價音質的聽感,象力度感、亮度感、臨場感、軟硬感、松緊感、寬窄感等。
(2)客觀測試技術指標
①失真度
諧波失真,主要引起聲音發硬、發炸;而穩態或瞬態互調失真主要引起聲音毛糙、尖硬和混濁。二者均使音質劣化,若失真度超過3%時,音質劣化明顯。音響系統的音箱失真度最大,一般最小的失真度也要超過1%。
相位失真,主要引起1kHz以下的低頻聲音模糊,同時影響中頻聲音層次和聲象定位。
抖晃失真,主要是電機轉速不穩,主導軸-壓帶輪壓力不穩,磁頭拍打磁帶等造成磁帶震動和卷帶量變化,進而使信號頻率被調制,聲音音調出現混濁、顫抖。抖晃通常用音調變化的均方根值表示,通常,錄音機的抖晃率<0.1%,Hi-Fi錄音機<0.005%,普通錄像機<0.3%,視盤機<0.001%。
②頻響與瞬態響應
頻響,指音響設備的增益或靈敏度隨信號頻率變化的情況,用通頻帶寬度和帶內不均勻度表示(如優質功放的頻響1Hz~200kHz±ldB)。帶寬越寬,高、低頻響應越好:不均勻度越小,頻率均衡性能越好。通常,30Hz~150Hz低頻使聲音有一定厚度基礎,150Hz~500Hz中低頻使聲音有一定力度,300Hz~500Hz中低頻聲壓過分加強時,聲音渾濁,過分衰減時,聲音乏力;500Hz~5kHz中高頻使聲音有一定明亮度,過分加強時,聲音生硬;過分衰減時,聲音散、飄;5kHz~10kHz高頻段使聲音有一定層次、色彩;過分加強時,聲音尖刺;過分衰減時,聲音暗淡、發悶。按此規律,可根據各種聽感,定量調節音響系統的頻響效果。
瞬態響應,是指音響系統對突變信號的跟隨能力。實質上它反映脈沖信號的高次諧波失真大小,嚴重時影響音質的透明度和層次感。瞬態響應常用轉換速率V/μs表示,指標越高,諧波失真越小。如,一般放大器的轉換速率>10V/μs。
③信噪比
信噪比,表示信號與噪聲電平的分貝差,用S/N或SNR(dB)表示。噪聲頻率的高低,信號的強弱對人耳的影響不一樣。通常,人耳對4~8kHz的噪聲最靈敏,弱信號比強信號受噪聲影響較突出。而音響設備不同,信噪比要求也不一樣,如Hi-Fi音響要求SNR>70dB,CD機要求SNR>90dB。
④聲道分離度和平衡度
聲道分離度,是指不同聲道間立體聲的隔離程度,用一個聲道的信號電平與串入另一聲道的信號電平差來表示。這個差值越大越好。一般要求Hi-Fi音響分離度>50dB。聲道平衡度,是指兩個聲道的增益、頻響等特性的一致性。否則,將造成聲道聲象的偏移。
評論
查看更多