MP4的由來
與早已眾所周知的 MP3相比,人們對MP4的了解還不多。盡管從邏輯上來說,當我們聽到或看到MP4時,會推斷這是MP3的后繼格式,事實卻要復雜得多。實際上,MP4與 MP3有著太多的不同。MP3是一種音頻壓縮的國際標準,而MP4卻是一個商標的名稱。雖然兩者都屬于網絡音樂格式的范疇,但也代表著完全不同的兩種音頻 壓縮技術和格式。
MP4的出現,使原來就容易混淆的MPEG標準系列變得更加 難以分辨了。MP3并不是指MPEG-3標準,而是MPEG Layer 3的簡稱,這是個ISO/IEC國際標準,是一種完全公開的音頻壓縮技術。而MP4既不是MPEG Layer 4的簡稱,更不是MPEG-4標準。它是GMO公司針對MP3侵犯音樂出版物的版權,采用了AT&T授權的基于MPEG-2 AAC(Advanced Audio Coding)的A2B音樂,并將其命名為MP4,其用意大概是想表明MP4是繼MP3之后的一種升級換代技術,這正好符合人們的思維習慣。
A2B 技術主要由以下三個部分組成。第一,AT&T的音頻壓縮技術專利,以“知覺編碼”為關鍵技術可以將AAC壓縮比提高到 20:1而不損失音質;第二,安全數據庫,它可以為你的A2B音樂文件創建一個特定的密鑰,并將此密鑰置于其數據庫中,只有A2B的播放器才能播放含有這 種密鑰的音樂;第三,協議認證,這個認證包含了復制許可、允許復制副本數量、歌曲總時間、歌曲可以播放時間以及經營銷售許可等信息。
相對MP3等以往的音樂格式,MP4具有如下特點:
(1)每首MP4樂曲就是一個擴展名為exe的可執行文件,其內嵌播放器,操作簡便,在Windows里直接雙擊就可以運行播放,十分方便;
(2)由于采用先進的A2B音頻壓縮技術,使MP4文件的大小僅為MP3的四分之三左右,更好的音質,更大的壓縮比,從這個角度來看MP4更適合在Internet上傳播,而且音質也更勝一籌;
(3)獨特的數字水印,MP4采用了名為“SOLANA”的數字水印技術,可方便的追蹤和發現盜版行為,而且,任何針對MP4的非法解壓行為都可能導致MP4原文件的損毀;
(4)支持版權保護,MP4樂曲內置了包括與作品版權持有者相關的文字、圖像等版權說明,既可說明版權,又表示了對作曲家和演唱(奏)者的尊重;
(5)較為完善的功能,MP4可獨立調節左右聲道的音量大小、內置的波形/分頻動態音頻顯示和音樂管理器可支持多種彩色圖像、網站鏈接及無限制的滾動顯示文本。
由此可知,MP4是一種商品,它是利用改進后的MPEG-2 AAC技術對音頻進行壓縮處理,并加上由出版公司直接授權的知識產權協議后形成一個全新形式的數字音樂標準。? ?
MPEG-2 AAC
MPEG-2 AAC(Advanced Audio Coding)是在1997年由以Bosi、Brandenburg、Johnston等為首的音頻編碼研究提出的,它總結了MPEG-1、MPEG-2 和AC-3等的長處,在MPEG 系統上進一步改進了很多新的功能,大大增強了編碼的靈活度,在保證音質的同時更大限度地壓縮了碼率。同時,MPEG-2 AAC已經成為MPEG-4標準中高質量音頻編碼的核心,是下一代音頻壓縮標準。
為了能夠適應于不同的應用場合,在AAC標準中定義了三種不同復雜度的框架(Profile)。分別為:
Main Profile(主框架):在這種框架具有最高的復雜度,可以用于存儲量和計算能力都很充足的場合。在這種框架中,利用了除增益控制以外的所有編碼工具來提高壓縮效率。
Low Complexity Profile(低復雜度框架):這種框架用于要求在有限的存儲空間和計算能力的條件下進行壓縮的場合。在這種框架中,沒有預測和增益控制這兩種工具,TNS的階數比較低。
SSR (Scalable Sample Rate) Profile(采樣率可分級框架):在這種框架中,使用增益控制工具,但是預測和耦合工具是不被允許的,具有較低的帶寬和TNS階數。對于最低的一個 PQF子帶不使用增益控制工具。當帶寬降低時,SSR框架的復雜度也可降低,特別適應于網絡帶寬變化的場合。
MPEG-2 AAC編解碼
編碼時,時域信號先經增益控制模塊(只在可分級檔次使用),把信號分成4個頻帶,對信號的幅度進行增益控制,在由濾波器組分解成為1024條頻域譜線。同時根 據輸入的時域信號進行心理聲學模型分析,計算當前的掩蔽域值。另外,心理聲學模型還輸出M/S立體聲和強度立體聲處理所需的控制信息。TNS模塊對濾波器 輸出的部分譜線進行線性預測以殘差信號代替原譜線,強度立體聲模塊提取信號高頻成分的包絡。M/S立體聲模塊以和信號M和差信號S代替左右聲道信號。量化 模塊進行比特分配,盡量使量化噪聲小于掩蔽域值。量化后的信號與比例因子進行哈夫曼編碼,最后進行AAC組碼。把上述過程逆過來就是解碼。具體過程見圖1 所示的框圖。??
MPEG-2 AAC把高分辨率的濾波器組、預測技術、噪聲整形技術、聯合立體聲編碼、非均勻量化和哈夫曼編碼結合在一起,可以滿足如下的要求:
(1)支持8kHz~96kHz的采樣頻率;
(2)支持輸入通道配置為1/0(單聲道)、2/0(雙聲道立體聲)和3/2+1(左/中/右、左環繞/右環繞、低頻增強通道)等的不同的多通道配置;
(3)在比特流語法中為更大數目和更小數目的通道配置留有余地;
(4)在384Kb/s的數據率和3/2通道配置中,可以獲得“不可分辨的”音質;
(5)為了改善誤碼的消除,支持在存在誤碼的情況下維持碼流同步的機制和某種誤碼消除機制。??
總結
MP3是目前最流行的一種音樂 格式,已經占據了大量的網絡資源,深受廣大音樂愛好者的喜愛。因此,GMO MP4的推廣將會遇到很大的困難。但是,MP4有其獨特的優越性,其壓縮技術優于MP3,音質好于MP3;從維護版權的角度看,會得到出版界的歡迎。尤其 是和A2B 壓縮技術相同的AAC 格式、編/ 解碼器、音樂已經在網絡上出現,正在被大眾接受并獲得發展。而且MPEG-2 AAC已經成為MPEG-4標準中高質量音頻編碼的核心,是下一代音頻壓縮標準。因此,隨著時間的推移和MPEG-4標準的推廣,作為MPEG-4音頻之 一的MPEG-2AAC必將受到重視而廣泛應用。
與早已眾所周知的 MP3相比,人們對MP4的了解還不多。盡管從邏輯上來說,當我們聽到或看到MP4時,會推斷這是MP3的后繼格式,事實卻要復雜得多。實際上,MP4與 MP3有著太多的不同。MP3是一種音頻壓縮的國際標準,而MP4卻是一個商標的名稱。雖然兩者都屬于網絡音樂格式的范疇,但也代表著完全不同的兩種音頻 壓縮技術和格式。
MP4的出現,使原來就容易混淆的MPEG標準系列變得更加 難以分辨了。MP3并不是指MPEG-3標準,而是MPEG Layer 3的簡稱,這是個ISO/IEC國際標準,是一種完全公開的音頻壓縮技術。而MP4既不是MPEG Layer 4的簡稱,更不是MPEG-4標準。它是GMO公司針對MP3侵犯音樂出版物的版權,采用了AT&T授權的基于MPEG-2 AAC(Advanced Audio Coding)的A2B音樂,并將其命名為MP4,其用意大概是想表明MP4是繼MP3之后的一種升級換代技術,這正好符合人們的思維習慣。
A2B 技術主要由以下三個部分組成。第一,AT&T的音頻壓縮技術專利,以“知覺編碼”為關鍵技術可以將AAC壓縮比提高到 20:1而不損失音質;第二,安全數據庫,它可以為你的A2B音樂文件創建一個特定的密鑰,并將此密鑰置于其數據庫中,只有A2B的播放器才能播放含有這 種密鑰的音樂;第三,協議認證,這個認證包含了復制許可、允許復制副本數量、歌曲總時間、歌曲可以播放時間以及經營銷售許可等信息。
相對MP3等以往的音樂格式,MP4具有如下特點:
(1)每首MP4樂曲就是一個擴展名為exe的可執行文件,其內嵌播放器,操作簡便,在Windows里直接雙擊就可以運行播放,十分方便;
(2)由于采用先進的A2B音頻壓縮技術,使MP4文件的大小僅為MP3的四分之三左右,更好的音質,更大的壓縮比,從這個角度來看MP4更適合在Internet上傳播,而且音質也更勝一籌;
(3)獨特的數字水印,MP4采用了名為“SOLANA”的數字水印技術,可方便的追蹤和發現盜版行為,而且,任何針對MP4的非法解壓行為都可能導致MP4原文件的損毀;
(4)支持版權保護,MP4樂曲內置了包括與作品版權持有者相關的文字、圖像等版權說明,既可說明版權,又表示了對作曲家和演唱(奏)者的尊重;
(5)較為完善的功能,MP4可獨立調節左右聲道的音量大小、內置的波形/分頻動態音頻顯示和音樂管理器可支持多種彩色圖像、網站鏈接及無限制的滾動顯示文本。
由此可知,MP4是一種商品,它是利用改進后的MPEG-2 AAC技術對音頻進行壓縮處理,并加上由出版公司直接授權的知識產權協議后形成一個全新形式的數字音樂標準。? ?
MPEG-2 AAC
MPEG-2 AAC(Advanced Audio Coding)是在1997年由以Bosi、Brandenburg、Johnston等為首的音頻編碼研究提出的,它總結了MPEG-1、MPEG-2 和AC-3等的長處,在MPEG 系統上進一步改進了很多新的功能,大大增強了編碼的靈活度,在保證音質的同時更大限度地壓縮了碼率。同時,MPEG-2 AAC已經成為MPEG-4標準中高質量音頻編碼的核心,是下一代音頻壓縮標準。
為了能夠適應于不同的應用場合,在AAC標準中定義了三種不同復雜度的框架(Profile)。分別為:
Main Profile(主框架):在這種框架具有最高的復雜度,可以用于存儲量和計算能力都很充足的場合。在這種框架中,利用了除增益控制以外的所有編碼工具來提高壓縮效率。
Low Complexity Profile(低復雜度框架):這種框架用于要求在有限的存儲空間和計算能力的條件下進行壓縮的場合。在這種框架中,沒有預測和增益控制這兩種工具,TNS的階數比較低。
SSR (Scalable Sample Rate) Profile(采樣率可分級框架):在這種框架中,使用增益控制工具,但是預測和耦合工具是不被允許的,具有較低的帶寬和TNS階數。對于最低的一個 PQF子帶不使用增益控制工具。當帶寬降低時,SSR框架的復雜度也可降低,特別適應于網絡帶寬變化的場合。
MPEG-2 AAC編解碼
編碼時,時域信號先經增益控制模塊(只在可分級檔次使用),把信號分成4個頻帶,對信號的幅度進行增益控制,在由濾波器組分解成為1024條頻域譜線。同時根 據輸入的時域信號進行心理聲學模型分析,計算當前的掩蔽域值。另外,心理聲學模型還輸出M/S立體聲和強度立體聲處理所需的控制信息。TNS模塊對濾波器 輸出的部分譜線進行線性預測以殘差信號代替原譜線,強度立體聲模塊提取信號高頻成分的包絡。M/S立體聲模塊以和信號M和差信號S代替左右聲道信號。量化 模塊進行比特分配,盡量使量化噪聲小于掩蔽域值。量化后的信號與比例因子進行哈夫曼編碼,最后進行AAC組碼。把上述過程逆過來就是解碼。具體過程見圖1 所示的框圖。??
MPEG-2 AAC把高分辨率的濾波器組、預測技術、噪聲整形技術、聯合立體聲編碼、非均勻量化和哈夫曼編碼結合在一起,可以滿足如下的要求:
(1)支持8kHz~96kHz的采樣頻率;
(2)支持輸入通道配置為1/0(單聲道)、2/0(雙聲道立體聲)和3/2+1(左/中/右、左環繞/右環繞、低頻增強通道)等的不同的多通道配置;
(3)在比特流語法中為更大數目和更小數目的通道配置留有余地;
(4)在384Kb/s的數據率和3/2通道配置中,可以獲得“不可分辨的”音質;
(5)為了改善誤碼的消除,支持在存在誤碼的情況下維持碼流同步的機制和某種誤碼消除機制。??
總結
MP3是目前最流行的一種音樂 格式,已經占據了大量的網絡資源,深受廣大音樂愛好者的喜愛。因此,GMO MP4的推廣將會遇到很大的困難。但是,MP4有其獨特的優越性,其壓縮技術優于MP3,音質好于MP3;從維護版權的角度看,會得到出版界的歡迎。尤其 是和A2B 壓縮技術相同的AAC 格式、編/ 解碼器、音樂已經在網絡上出現,正在被大眾接受并獲得發展。而且MPEG-2 AAC已經成為MPEG-4標準中高質量音頻編碼的核心,是下一代音頻壓縮標準。因此,隨著時間的推移和MPEG-4標準的推廣,作為MPEG-4音頻之 一的MPEG-2AAC必將受到重視而廣泛應用。
評論
查看更多