數(shù)字信號(hào)有自身相應(yīng)的缺點(diǎn),即存儲(chǔ)容量需求的增加及傳輸時(shí)信道容量要求的增加。以CD為例,其采樣率為44.1 kHz,量化精度為16 bit,則1 min的立體聲音頻信號(hào)需占約10 MB的存儲(chǔ)容量,也就是說(shuō),張CD唱盤(pán)的容量只有1 h左右。
當(dāng)然,在帶寬高得多的數(shù)字視頻領(lǐng)城這一問(wèn)題就顯得更加突出。是不是所有這些比特都是必需的呢?研究發(fā)現(xiàn),接采用PCM碼流進(jìn)行存儲(chǔ)和傳輸存在非常大的冗余度。事實(shí)上,在無(wú)損的條件下對(duì)聲首至少可進(jìn)行4:1壓縮,即只用25%的數(shù)字量保留所有的信息,而在視頻領(lǐng)域壓縮比甚至可以達(dá)到幾百倍。因此,為利用有限的資源,壓縮技術(shù)從一出現(xiàn)便受到廣泛的重視。
信號(hào)(數(shù)據(jù))之所以能進(jìn)行壓縮,是因?yàn)樾盘?hào)本身存在很大冗余度。根據(jù)統(tǒng)計(jì)分析結(jié)果,音頻信號(hào)中存在著多種冗余,其主要部分可分別從時(shí)域和頻域來(lái)考慮。另外,由于音頻主要是給人聽(tīng)的,所以考慮人的聽(tīng)覺(jué)機(jī)理,也能對(duì)音頻信號(hào)實(shí)行壓縮。
1、時(shí)城冗余
音頻信號(hào)在時(shí)城上的冗余主要表現(xiàn)為以下幾個(gè)方面:
(1)幅度分布的非均勻性
統(tǒng)計(jì)表明,在大多數(shù)類(lèi)型的音頻信號(hào)中,小幅度樣值出現(xiàn)的概率比大幅度樣值出現(xiàn)的概率要高。人的語(yǔ)音中,間歇、停頓等出現(xiàn)了大量的低電平樣值;實(shí)際講話(huà)的功率電平也趨向于出現(xiàn)在編碼范圍的較低電平端。
(2)樣值間的相關(guān)性
對(duì)語(yǔ)音波形的分析表明,相鄰樣值之間存在很強(qiáng)的相關(guān)性。當(dāng)采樣頻率為8 kHz時(shí),相鄰樣值之間的相關(guān)系數(shù)大于0.85。如果進(jìn)步提高采樣頻率,則相鄰樣值之間的相關(guān)性將更強(qiáng)。因此,根據(jù)較強(qiáng)的維相關(guān)性,可以利用差分編碼技術(shù)進(jìn)行有效的數(shù)據(jù)壓縮。
(3)周期之間的相關(guān)性
雖然音頻信號(hào)分布于20 Hz ~ 20 kHz的頻帶范圍,但在特定的瞬間,某一聲音卻往往只是該頻帶內(nèi)的少數(shù)頻率成分在起作用。當(dāng)聲音中只存在少數(shù)幾個(gè)頻率時(shí),就會(huì)像某些振蕩波形一樣,在周期與周期之間存在著一定的相關(guān)性。利用音頻信號(hào)周期之間的相關(guān)性進(jìn)行壓縮的編碼器,比僅僅利用鄰近樣值間的相關(guān)性的編碼器效果好,但要復(fù)雜得多。
(4)靜止系數(shù)
兩個(gè)人之間打電話(huà),平均每人講話(huà)時(shí)間為通話(huà)時(shí)間的一半,并且在這一半的通話(huà)過(guò)程中也會(huì)出現(xiàn)間歇停頓。分析表明,話(huà)音間隙使全雙工話(huà)路的典型效率約為40% (或稱(chēng)靜止系數(shù)為0.6)。?顯然,話(huà)音間隔本身就是一種冗余,若能正確檢測(cè)出這些靜止段,可“插空”傳輸更多信息。
(5)長(zhǎng)時(shí)自相關(guān)函數(shù)
統(tǒng)計(jì)樣值、周期間的一些相關(guān)性時(shí),在20 ms時(shí)間間隔內(nèi)進(jìn)行統(tǒng)計(jì)的稱(chēng)為短時(shí)自相關(guān)函數(shù)。如果在較長(zhǎng)的時(shí)間間隔(如幾十秒)內(nèi)進(jìn)行統(tǒng)計(jì)時(shí),則稱(chēng)為長(zhǎng)時(shí)自相關(guān)函數(shù)。長(zhǎng)時(shí)統(tǒng)計(jì)表明,當(dāng)采樣頻率為8 kHz時(shí),相鄰的樣值之間的平均相關(guān)系數(shù)可高達(dá)0.9。
2、頻域冗余
音頻信號(hào)的頻域冗余主要表現(xiàn)為以下幾個(gè)方面:
(1)長(zhǎng)時(shí)功率譜密度的非均勻性
在相當(dāng)長(zhǎng)的時(shí)間間隔內(nèi)進(jìn)行統(tǒng)計(jì)平均,可以得到長(zhǎng)時(shí)功率譜密度函數(shù),其功率譜呈現(xiàn)明顯的非平坦性。從統(tǒng)計(jì)的觀(guān)點(diǎn)看,這意味著沒(méi)有充分利用給定的頻段?;蛘哒f(shuō)存在固有的冗余度。功率譜的高頻成分能量較低。
(2)語(yǔ)音特有的短時(shí)功率譜密度
語(yǔ)音信號(hào)的短時(shí)功率譜,在某些頻率上出現(xiàn)“峰值”,而在另一些頻率 上出現(xiàn)“谷值”。這些峰值頻率,也就是能量較大的頻率,通常稱(chēng)其為共振峰頻率。共振峰頻率不止一個(gè),最主要的是前三個(gè),由它們決定不同的語(yǔ)音特征。另外,整個(gè)功率譜也是隨頻率的增加而遞減的。更重要的是整個(gè)功率譜的細(xì)節(jié)以基音頻率為基礎(chǔ),形成了高次諧波結(jié)構(gòu)。
3、聽(tīng)覺(jué)冗余
人是音頻信號(hào)的最終用戶(hù),因此,要充分利用人類(lèi)聽(tīng)覺(jué)的生理和心理特性對(duì)音頻信號(hào)感知的影響。利用人耳的頻率特性靈敏度以及掩蔽效應(yīng),可以壓縮數(shù)字音頻的數(shù)據(jù)量。
①可以將會(huì)被掩蔽的信號(hào)分量在傳輸之前就去除,因?yàn)檫@部分信號(hào)即使傳輸了也不會(huì)被聽(tīng)見(jiàn)。
②可以不理會(huì)可能被掩蔽的量化噪聲。
③可以將人耳不敏感的頻率信號(hào)在數(shù)字化之前濾除,如語(yǔ)音信號(hào)只保留300 -3 400 Hz的信號(hào)。
編輯:jq
-
噪聲
+關(guān)注
關(guān)注
13文章
1118瀏覽量
47369 -
音頻信號(hào)
+關(guān)注
關(guān)注
9文章
249瀏覽量
33444 -
函數(shù)
+關(guān)注
關(guān)注
3文章
4307瀏覽量
62432 -
PCM碼
+關(guān)注
關(guān)注
0文章
2瀏覽量
5248
原文標(biāo)題:音頻冗余的主要表現(xiàn)形式
文章出處:【微信號(hào):xunwei201508,微信公眾號(hào):訊維官方公眾號(hào)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論