關鍵詞: IPTV , 編解碼 , 視頻
1、引言
IPTV業務是指基于寬帶互聯網與寬帶接入,以機頂盒或其它具有視頻編解碼能力的數字化設備作為終端,通過聚合SP的各種流媒體服務內容和增值應用,為用戶提供多種互動多媒體服務的寬帶增值業務。
IPTV能否成功開展的一個關鍵點是采用什么樣的視頻編解碼標準,因為IPTV業務需要在有限的網絡帶寬條件下提供清晰的圖像質量,對編碼效率有較高的要求;同時,視頻編碼標準的選擇會直接影響到整個IPTV產業鏈的發展,涉及從內容編碼到流媒體服務器以及組播復制點直至用戶機頂盒各個層面,要從某一種編碼格式轉換為另一種編碼格式,需要進行的系統升級甚至硬件更換的成本是極其巨大的。也正因為這一點,視頻編碼標準的選擇一直是IPTV業界關注的首要問題。
2、視頻編解碼標準簡介
視頻編解碼標準有很多種,目前國內IPTV產業中主要采用了MPEG-4、H.264技術以及中國提出的具有自主知識產權的標準AVS這3種標準,相對于H.264和AVS技術標準,MPEG4 ASP在流媒體和IPTV應用市場中起步時間最早,因此產業化程度最成熟,IPTV設備提供商的支持也最廣泛;AVS的產業化程度最低,H.264次之。下面對這3種標準進行介紹。
2.1 MPEG-4標準簡介
運動圖像專家組(MPEG)于1999年2月正式公布了MPEG-4(ISO/IEC14496)標準第一版本。同年年底公布了MPEG-4第 2版,且于2000年年初正式成為國際標準。MPEG-4與MPEG-1和MPEG-2有著很大的差異,MPEG-4不只是具體壓縮算法,它是針對數字電視、交互式繪圖應用、交互式多媒體等整合及壓縮技術的需求而制定的國際標準。
MPEG-4除采用第一代視頻編碼的核心技術,如變換編碼、運動估計與運動補償、量化、熵編碼外,還提出了一些有創見性的關鍵技術,其中包括:
(1)視頻對象提取技術
MPEG-4標準同以前標準的最顯著的差別在于它是采用基于對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯系的視頻音頻對象,分別編碼后再經過復用傳輸到接收端,然后再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣可以實現對不同的對象采用不同的編碼方法和表示方法,又有利于不同數據類型間的融合,同時也便于對各種對象進行操作及編輯。視頻對象提取(即視頻對象分割)是MPEG-4視頻編碼的關鍵技術,也是新一代視頻編碼的研究熱點和難點。
(2)VOP視頻編碼技術
視頻對象平面(VOP,Video Object Plane)是視頻對象(VO)在某一時刻的采樣,VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過程中針對不同VO采用不同的編碼策略,即對前景VO的壓縮編碼盡可能保留細節和平滑;對背景VO則采用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產生的方塊效應,而且使用戶可與場景交互,從而既提高了壓縮比,又實現了基于內容的交互,為視頻編碼提供了廣闊的發展空間。MPEG-4支持任意形狀圖像與視頻的編解碼。
(3)視頻編碼可分級性技術
MPEG-4通過視頻對象層(VOL,Video Object Layer)數據結構來實現分級編碼。MPEG-4提供了兩種基本分級工具,即時域分級(Temporal Scalability)和空域分級(Spatial Scalability),此外還支持時域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱為基本層,高層稱為增強層。基本層提供了視頻序列的基本信息,增強層提供了視頻序列更高的分辨率和細節。
(4)運動估計與運動補償技術
MPEG-4采用I-VOP、P-VOP、B-VOP3種幀格式來表征不同的運動補償類型。它采用了H.263中的半像素搜索技術和重疊運動補償技術,同時又引入重復填充(repetitive padding)技術和修改的塊匹配(modified block matching)技術以支持任意形狀的VOP區域。
在MPEG-4視頻編碼中,運動估計相當耗時,對編碼的實時性影響很大。因此這里特別強調快速算法。運動估計方法主要有像素遞歸法和塊匹配法兩大類,前者復雜度很高,實際中應用較少,后者則在H.263和MPEG中廣泛采用。
2.2 H.264標準簡介
2003年,ITU-T通過了一個新的數字視頻編解碼標準,即H.264標準,H.264是由ISO/IEC與ITU-T組成的聯合視頻組制定的新一代視頻壓縮編解碼標準。國際電信聯盟將該系統命名為H.264/AVC,國際標準化組織和國際電工委員會將其稱為14496-10/MPEG-4 AVC。
H.264標準只有3個子集:基本子集、主體子集和擴展子集。基本子集是專為視頻會議應用設計的,能夠提供強大的差錯隱消技術,并且支持低延時編/解碼技術,使視頻會議顯得更自然。主體子集和擴展子集更適合于電視應用(數字廣播、DVD)和延時影響不會太大的視頻流應用。
H.264標準的關鍵技術如下:
(1)幀內預測編碼
幀內編碼用來縮減圖像的空間冗余。為了提高H.264幀內編碼的效率,在給定幀中充分利用相鄰宏塊的空間相關性,相鄰的宏塊通常含有相似的屬性。因此,在對一給定宏塊編碼時,首先可以根據周圍的宏塊預測,然后對預測值與實際值的差值進行編碼,這樣,相對于直接對該幀編碼而言,可以大大減小碼率。H.264提供6種模式進行4×4像素宏塊預測,包括1種直流預測和5種方向預測,H.264也支持16×16的幀內編碼。
(2)幀間預測編碼
幀間預測編碼利用連續幀中的時間冗余來進行運動估計和補償。H.264的運動補償支持以往的視頻編碼標準中的大部分關鍵特性,而且靈活地添加了更多的功能,除了支持P幀、B幀外,H.264還支持一種新的流間傳送幀——SP幀,碼流中包含SP幀后,能在有類似內容但有不同碼率的碼流之間快速切換,同時支持隨機接入和快速回放模式。
(3)整數變換
在變換方面,H.264使用了基于4×4像素塊的類似于DCT的變換,但使用的是以整數為基礎的空間變換,不存在反變換。與浮點運算相比,整數 DCT變換會引起一些額外的誤差,但因為DCT變換后的量化也存在量化誤差,與之相比,整數DCT變換引起的量化誤差影響并不大。此外,整數DCT變換還具有減少運算量和復雜度,有利于向定點DSP移植的優點。
(4)量化
H.264中可選32種不同的量化步長,這與H.263中有31個量化步長很相似,但是在H.264中,步長是以12.5%的復合率遞進的,而不是一個固定常數。在H.264中,變換系數的讀出方式也有兩種:之字形(Zigzag)掃描和雙掃描,大多數情況下使用簡單的之字形掃描;雙掃描僅用于使用較小量化級的塊內,有助于提高編碼效率。
(5)熵編碼
視頻編碼處理的最后一步就是熵編碼,H.264標準采用的熵編碼有兩種:一種是基于內容的自適應變長編碼(CAVLC)與統一的變長編碼(UVLC)結合;另一種是基于內容的自適應二進制算術編碼(CABAC)。CAVLC與CABAC根據相臨塊的情況進行當前塊的編碼,以達到更好的編碼效率。CABAC比CAVLC壓縮效率高,但要復雜一些。
2.3 AVS標準簡介
AVS是基于我國創新技術和部分公開技術的自主標準,AVS標準包括系統、視頻、音頻、數字版權管理等4個主要技術標準和一致性測試等支撐標準。2002年在信息產業部支持下,成立了“數字音視頻編解碼技術標準”工作組(簡稱AVS工作組),在國內外上百家企業和科研單位共同參與下,AVS標準制定工作進展順利,其中最重要的視頻編碼標準于2005年通過國家廣電總局測試,2006年1月得到信息產業部批準,2月國家標準化管理委員會正式頒布,3月1日起實施。
AVS視頻編解碼的核心技術包括:8×8整數變換、量化、幀內預測、1/4精度像素插值、特殊的幀間預測運動補償、二維熵編碼等。
(1)變換量化
AVS的8×8變換與量化可以在16位處理器上無失配地實現,從而克服了H.264之前所有視頻壓縮編碼國際標準中采用的8×8 DCT變換存在失配的固有問題。而H.264所采用的4×4整數變換在高分辨率的視頻圖像上的去相關性能不及8×8的變換有效。AVS采用了64級量化,可以完全適應不同的應用和業務對碼率和質量的要求。
(2)幀內預測
AVS的幀內預測技術沿襲了H.264幀內預測的思路,用相鄰塊的像素預測當前塊,采用代表空間域紋理方向的多種預測模式。但AVS亮度和色度幀內預測都是以8×8塊為單位的。亮度塊采用5種預測模式,色度塊采用4種預測模式,而這4種模式中又有3種和亮度塊的預測模式相同。在編碼質量相當的前提下,AVS采用較少的預測模式,使方案更加簡潔、實現的復雜度大為降低。
(3)幀間預測
幀間運動補償編碼是混合編碼技術框架中最重要的部分之一。AVS標準采用了16×16,16×8,8×16和8×8的塊模式進行運動補償,而去除了H.264標準中的8×4,4×8,4×4的塊模式,目的是能更好地刻畫物體運動,提高運動搜索的準確性。較少的塊模式,能降低運動矢量和塊模式傳輸的開銷,從而提高壓縮效率、降低編解碼實現的復雜度。
(4)熵編碼
AVS熵編碼采用自適應變長編碼技術,在AVS熵編碼過程中,所有的語法元素和殘差數據都是以指數哥倫布碼的形式映射成二進制比特流。采用指數哥倫布碼的優勢在于:一方面 ,它的硬件復雜度比較低,可以根據閉合公式解析碼字,無需查表;另一方面,它可以根據編碼元素的概率分布靈活地確定以k階指數哥倫布碼編碼,如果k選得恰當,則編碼效率可以逼近信息熵。
3、三種編碼標準的對比與選擇
3.1 基本性能對比
3種編碼標準的基本功能對比如表1:
表1 3種視頻編解碼標準的基本功能
這3種主要編碼技術各有優缺點,MPEG-4標準因為發布較早,產業化程度較高,因此產品相對成熟,內容比較豐富、價格也較低,同時算法復雜度較低,但相應的問題是編碼效率也相對較低,需要占用較多的帶寬,對網絡要求較高,對于現有網絡需要進行升級改造才能滿足其需求。
對于H.264標準,目前市場上已經有多家廠商提供H.264芯片和機頂盒,產品開始成熟,內容也逐漸豐富,而且因為采用了多項提高圖像質量和增加壓縮比的技術措施,在不影響視頻效果的情況下能夠比MPEG-4節約39%的碼率,因而占用帶寬較低。例如要達到標清的播放質量,MPEG-4編碼需要1.5~2Mbit/s的碼率,而H.264只需要1.2~1.5Mbit/s碼率即可;對于高清圖像質量,MPEG-4編碼的視頻碼率需要 6~8Mbit/s,而H.264只需要4~6Mbit/s。因此采用H.264可以大大節約網絡帶寬,減少網絡改造的壓力,且在帶寬相同的情況下能夠覆蓋更多的用戶。同時,由于H.264是由ITU-T和ISO/IEC聯合制定的,所以對解碼兼容性有著明確的定義,具有較強的抗誤碼能力,容易獲得穩定的圖像,適用于丟包率高、干擾嚴重的信道傳輸。不過H.264的算法復雜度較高,系統開銷也比較大。
AVS是近幾年才提出的視頻標準,產業化進程落后于H.264。但是AVS的編碼效率與H.264相當,而算法復雜度比H.264明顯低,其編碼復雜度相當于H.264的30%;解碼復雜度相當于H.264的70%,軟硬件實現成本都低于H.264;同時由于我國掌握主要知識產權,專利授權模式簡單,專利費用低,因此可以預見AVS標準將會是支撐國家數字音視頻產業發展的重要標準。
3.2 專利費用對比
如果采用國外的技術標準,不得不面臨高昂的專利費用的問題。3種標準對應的專利費用如表2所示:
表2 3種標準的專利費用
可以看出在專利費方面AVS占有絕對的優勢。MPEG-4和H.264不僅要收軟硬件的專利費,而且還要收取節目點播費用等,如果按照這兩種標準的專利收費標準,中國龐大用戶群將給運營商帶來每年數以億計的巨大專利費負擔;而AVS只收取1元人民幣的象征性費用,對于運營商來講非常具有吸引力。
3.3 應用情況對比
從目前的應用情況來看,MPEG-4和H.264在中國市場具有一定的發展優勢,在中國電信和中國網通已經開展的IPTV試驗及商用網中, MPEG4和H.264同時存在,例如中國電信在上海截止目前已經有15萬左右的IPTV用戶,使用的是H.264編碼標準;廣東電信的IPTV商用網也將實現MPEG4向H.264標準的整體平移。中國網通現已開展了基于AVS標準的IPTV試驗。由于AVS推出較晚,還處于上下游產業鏈的完善階段,在市場的推廣和開拓方面還有待加強,真正商用有待驗證其圖像質量、商用情況是否滿足商用要求和產業鏈的逐漸成熟。目前3種標準常見的應用場景列舉如表3:
表3 3種標準的應用場景
3.4 三種編碼標準的選擇
由上面的對比可以看出,3種編碼標準在性能、設備成本、產業化程度及專利費用方面都各有千秋,具體選擇哪種視頻編碼標準還需綜合考慮各方面因素。對于IPTV產業來說,H.264得到了電信運營商及設備提供商的支持,目前已經逐漸占據市場主流的地位,而AVS憑借低廉的專利費優勢,長遠來說對運營商更具誘惑力,同時又得到了中國政府的支持,今后的應用前景將比較樂觀。
4、結束語
本文討論了目前國內IPTV產業中主要采用的3種編碼標準MPEG-4、H.264及AVS。通過介紹和對比這3種標準,可以看出 H.264/AVS是目前主流的選擇。當然事物都在不斷發展,音視頻編解碼技術也處于不斷演進的過程中,因此多種編碼標準在相當長的時間內還將繼續共存。今后的IPTV舞臺上,編碼標準將花落誰家,讓我們拭目以待。
評論
查看更多