精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于通過閾值預判方法進行宏塊選擇

電子設計 ? 來源:電視技術 ? 作者:盧六翮,薛永林,王 ? 2021-03-17 16:19 ? 次閱讀

1 引言

在H.264視頻編碼中,對于幀間預測,一個16×16的宏塊(MB)可分成16×16,16×8,8×16,8×8進行運動估計,其中8×8還可以進一步分為8×4,4×8,4×4的子塊。這樣,每個細分的模塊都去尋找更精確的匹配塊,可以增加預測精度提高壓縮率。但是,由于每種分類都要進行運動估計,這樣做直接的代價就是巨大的計算量。

針對多模式預測帶來的計算量增加的問題,近年出現的幀間模式選擇算法得到了深入的研究,其中利用閾值提前截止的模式選擇的思想得到非常廣泛的應用,在只有較小性能損失的代價下,減小計算復雜度。如文獻提出如果發現16×16模式已經適用,就直接跳過對16×8和8×16的模式檢查,否則全搜索;文獻提出利用多級閾值,且閾值依QP變化的方法等。本文的研究也基于通過閾值預判的方法進行宏塊選擇。

2 幀間模式快速選擇算法

2.1 幀間模式選擇使用自適應閾值的算法

利用閾值進行預判確實可以在視頻質量下降可忽略情況下使編碼復雜度盡量降低,然而以上方法有一定的局限性。文獻中提出的算法只考慮了3種模式,在很多情況下仍然使用全搜索,文獻雖然提出了可變的閾值,但是它的閾值只是隨著QP變化而變化的,并沒有考慮到不同視頻自身的特性。由于不同視頻序列特點不同,即使是同一個視頻序列內部的不同幀也有著不同的特點,而影響閾值的因素又較多。基于以上觀點,本文提出了一種利用統計分類的方法,通過對幀間預測模式進行分類,并選取自適應閾值對宏塊模式進行選擇。

一般情況下16×16模式使用率最高并且其SAD(Sum of Absolute Difference)值一定會經過計算,所以可建立16×16模式的SAD值(文中簡稱sad16)和最終選擇的模式之間的關系,這是一個標準的模式分類問題。通過視頻中相鄰幀之間的時間相關性,通過前一幀的模式對應的sad16分布情況,訓練得到下一幀的閾值,從而對下一幀的宏塊模式進行選擇。具體方法如下:

1) 分類

首先將H.264的多種幀問模式分為兩類:BSM(BigSize Mode),包括16×16,16×8,8×16模式,SSM(SmallSize Mode),包括8×8,8×4,4×8,4×4。經過對一些CIF格式的測試視頻序列的統計可以發現,一般情況下BSM的概率要大于SSM的概率(見表1),又由上文所述,SSM的計算量更大,所以可以在BSM和SSM之間設置一個閾值T,代表了對模式預測精度的可接受程度。如果小于閾值T則該宏塊只選擇BSM,如果大于閾值T則該宏塊對兩種模式都進行計算。

基于通過閾值預判方法進行宏塊選擇

2) 統計

分別計算兩種模式下的sad16,經過測試發現sad16值普遍小于8 000,為了便于統計,將計算得到的sad16值左移7位即除以128,將sad16分布在64個取值區間內。按照原始模式選擇算法對一幀中的每個宏塊進行模式選擇,記錄其對應的sad16值,從而統計該幀中每個模式對應的不同sad16區間內宏塊個數的分布。由于SSM的值比較小,為了便于觀察,將其統計結果乘以10。公式如下

式中:k為sad16的64個取值區間,取值為[0,63];sad16∈k代表sad16值在區間k內;若該宏塊被判斷為BSM模式則nBSM=1,nSSM=0;若該宏塊被判斷為SSM模式則nSSM=1,nBSM=0。圖1和圖2分別為兩種較具代表性的CIF序列foot-ball和foreman相鄰兩幀的統計分布圖。

由圖1,2的統計結果可以看出:取BSM模式的宏塊占大多數,且對應的sad16主要分布在較小值區域,在較大值區域也存在但較少;而取SSM模式的宏塊占少數,且對應的sad16主要分布在較大值區域,但是數量不多(圖1,2中SSM模式已乘10)。通過其他一些測試序列也可以得到相同結論。因此,可通過取一個閾值T,在只計算sad16的情況下,判斷該宏塊是否可直接決定為BSM模式。當sad16T時,既計算BSM模式也計算SSM模式。由圖1,2中還可看出,不管是運動較劇烈的football序列還是運動較平緩的foreman序列,任取的相鄰兩幀的分布圖都非常相似,所以可以基于序列相鄰兩幀間的時間相關性,利用前一幀的分布來預測下一幀的閾值。

3) 誤判率

本算法對計算量的節省較多,而且視頻質量幾乎沒有下降,其代價是一些SSM模式的宏塊被判斷為BSM,而損失了一些壓縮率。如圖3所示,閾值取T時,陰影部分所示本應為SSM,但由于sad16在閾值T左面,而被判斷為BSM,雖然陰影部分屬于誤判部分,但是由于陰影部分在閾值左面,屬于sad16相對較小區域,所以最終的SAD變化較小,壓縮率損失不大。則選取閾值的標準就是:使BSM模式盡量多地在閾值T左面,以減少判決時間;使SSM模式盡量在閾值右面,以減少損失的壓縮率。

2.2 4種自適應閾值選取方法

基于上文分析的選取閾值的標準,如何根據前一幀的統計結果設置下一幀的閾值有很多種方法,本文初步提出了4種閾值計算的方法:

1) 最小值閥值法(minimum value thresh,MVT)

該方法取BSM曲線的最大sad16,取SSM曲線的最小sad16,然后取兩者之中較小的一個作為閾值,如圖4所示。

閾值計算公式為

MIN(sad16,SSM)一般是取SSM時sad16的最小值,而為了避免有些幀不存在SSM的情況,選取MAX(sad16,BSM)進行比較,取二者最小值。由于MIN(sad16,SSM)一般是不斷變大的,而MAX(sad16,BSM)的值本身就很大,所以可以給它們乘以一個小于1的比例因子,以控制它的大小。則修正后的閾值計算公式為

式中:α1,α2∈(0,1)為修正系數,可取α1=1/2,α2=3/4。

2) 面積百分比閾值法(area percent thresh,APT)

該方法計算BSM曲線的總面積,取該總面積的β%的面積所對應的sad16作為閾值,如圖5所示。

閾值計算公式為

式中:β∈(0,100)為面積百分比因子,取β=75效果較好。

3) 最高點閾值法(highest point thresh,HPT)

該方法取BSM曲線中達到的最高點所對應的sad16作為閾值,如圖6所示。

閾值計算公式為

4) 衰減因子閾值法(attenuation factor thresh,AFT)

該方法取BSM曲線中達到的最高點,越過最高點后,取該高度的(1-ω)高度所對應的sad16作為閾值,如圖7所示。

閾值計算公式為

式中:ω∈(0,1)為衰減因子,取ω=0.75效果較好,可取TAFT>THPT的值。

本文只是實驗了4種計算閾值的方法,利用本文2.1得到的統計圖以及模式分類思想還可使用其他計算方法得到可用的閾值。

2.3 算法流程

由上一幀宏塊級別的步驟4記錄的每個宏塊的信息,按照本文所述幾種方法,計算本幀inter模式選擇需要的閾值T,并利用T對本幀中的每個宏塊進行分類,具體步驟如下:

1) 將16×16,16×8,8×16作為備選模式,計算sad(16×16),sad(16×8),sad(8×16),取最小值設為sadmin;

2) 若sadmin

3) 將16×16,16×8,8×16,8×8(其中8×8包括子塊subblock 8×4,4×8,4×4)作為備選模式,計算sad(8×8),與之前計算的sad(16×16),sad(16×8),sad(8×16)比較,求之中的最小值,選擇該模式,跳至步驟4;

4) 結束該宏塊模式選擇,記錄該宏塊相關信息以備計算下一幀閾值。

3 仿真結果

仿真條件:先用MPEG-2編碼器對6個CIF(352×288)序列mobile,football,bus,news,table,foreman的前100幀進行MPEG-2編碼,設定參數N=12,M=3,碼率6 Mbit/s得到源視頻。轉碼過程參考MPEG-2解碼器和T264編碼器實現。幀率為30 f/s,OP為30,GoP為200。實驗平臺為Intel P4 2.0 GHz,內存512 Mbyte,操作系統為Windows XP。使用自適應閾值算法且其中的閾值為最小值閾值方法,簡稱ATH_MVT,其他簡稱類似。經實驗得到最佳經驗因子:ATH_APT算法中取β=75,ATH_AFT算法中取ω=0.75。仿真結果見表2(給出3個典型序列:較多細節的mobile,運動較劇烈的football,較平穩的news的結果,其他序列結果略)。

由仿真結果可知:

ATH_MVT方法在搜索時間和編碼時間的減少上性能一般,除運動較劇烈的football序列外,其搜索時間減少大都在38%以上,其編碼時間減少大都在26%以上。該方法PSNR下降在0.01dB以內,碼率(bitrate)上升在0.39%以內,性能損失較小。

ATH_APT方法在搜索時間和編碼時間的減少上具有較好的性能,其搜索時間減少大都在45%以上,其編碼時間減少大都在30%以上,值得一提的是,對于運動相對較劇烈的football序列,它比其他方法更好的省時效果;該方法PSNR下降在0.01 dB以內,碼率上升在1.1%以內,性能損失稍大。

ATH_HPT方法在搜索時間和編碼時間的減少上對于所有序列都是最差的,其搜索時間減少最低為7%左右,其編碼時間減少最低為5%左右;該方法視頻質量最佳,PSNR值不低于原始算法,碼率上升在0.47%以內,性能損失較小。

ATH_AFT方法在搜索時間和編碼時間的減少上有最好的性能,除football序列外,其搜索時間減少大都在50%以上,其編碼時間減少大都在30%以上。該方法視頻質量較佳,PSNR值基本等于原始算法,碼率上升在0.15%以內,性能損失很小。

圖3中的陰影部分為SSM的誤判部分,利用公式

將使用了自適應閾值算法判定的SSM個數與原算法中判定的SSM的個數作比較得到的誤判率見表3(依然只列出3個典型序列)。其中TH_HPT(使用最高點閾值法的原算法)的誤判率相對較小,其他3種方法的誤判率相對稍大,但最大也不超過30%。

綜合考慮:TH_MVT各個方面性能表現比較平庸;TH_HPT雖然有更小的誤判率,但是其搜索時間和編碼時間的節約很小,并不實用;TH_APT更適合于視頻運動較劇烈且對性能損失要求不很嚴格的情況;TH_AFT方法取得的閾值在一般情況下具有最好的效果,它能使視頻編碼在保持良好性能的情況下更節省編碼時間,在4種方法中是針對一般序列的較好方法。

4 小結

基于相鄰幀之間的時間相關性并通過模式識別中分類統計的方法,本文提出了一種H.264編碼中幀間模式選擇的算法,并針對該算法給出了4種計算閾值的方法。經過多個測試序列的實驗證明:跟原始算法相比,本文提出的算法在性能下降可忽略情況下使編碼時間有顯著節省,其中TH_AFT的閾值選取方法針對一般序列得到的效果最佳。本文算法可進一步進行擴展,如增加多級閾值以及設計更好的閾值計算方法等。

責任編輯:gt

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1131

    瀏覽量

    40684
  • 編碼器
    +關注

    關注

    45

    文章

    3601

    瀏覽量

    134201
  • 視頻
    +關注

    關注

    6

    文章

    1937

    瀏覽量

    72820
收藏 人收藏

    評論

    相關推薦

    一種分裂的多描述視頻編碼方法

    一種分裂的多描述視頻編碼方法
    發表于 09-11 00:59

    七種奇電路實現方法的分析比較

    摘要: 以三輸入奇電路設計為例,通過對其輸出函數表達式的形式變換,分別采用多種門電路及譯碼器、數據選擇器等74 系列器件進行電路設計,給出了7 種電路實現形式,并分析了各種電路實現的
    發表于 11-07 16:13

    H.264視頻魯棒傳輸的最優模式選擇

    分析了受損的信道失真及其差錯擴散,研究了編碼模式對信源失真和信道失真的影響,提出了結合信源信道編碼的一種基于率失真優化的快速模式選擇
    發表于 02-28 16:48 ?25次下載

    H.264選擇的自適應算法研究

    在視頻編碼的過程中,運動估計占據了舉足輕重的地位.其性能優劣會在一定程度上決定了碼流質量.采用16×16 能夠提高壓縮比,但容易產生方塊效應,使用4×4可以提高圖
    發表于 08-05 09:01 ?6次下載

    一種分裂的多描述視頻編碼方法

    一種分裂的多描述視頻編碼方法:多描述編碼是近年來提出的用于不可靠網絡的視頻編碼方法。本文在基編碼的基礎上,提出了一種基于
    發表于 08-08 08:29 ?19次下載

    一種改進的小波閾值降噪方法性能分析

    結合小波閾值降噪中估計小波系數的軟閾值和硬閾值方法的各自特點,提出了一種改進的方案。將該方法用于疊加了噪聲的仿真信號
    發表于 08-14 09:36 ?15次下載

    基于AVS編碼的幀間模式選擇快速算法

    根據人眼對圖像內容邊緣比較敏感的特點,針對內水平方向或垂直方向邊緣點的個數及邊緣的總數選擇分割模式。對于邊緣點的
    發表于 09-14 16:05 ?13次下載

    小波變換閾值降噪方法及在工程中的應用

    研究了基于小波變換的信號降噪的原理和方法,從中選擇閾值法降噪。詳細論述了該方法的原理,特點和利用MatLAB 中小波分析工具箱進行設計的步驟
    發表于 12-14 11:35 ?15次下載

    奇電路實現方法探討

    以三輸入奇電路設計為例,通過對其輸出函數表達式的形式變換,分別采用多種門電路及譯碼器、數據選擇器等74系列器件進行電路設計,給出了7種電路實現形式,并分析了各種電路
    發表于 09-09 10:33 ?42次下載
    <b class='flag-5'>判</b>奇電路實現<b class='flag-5'>方法</b>探討

    一種插補時間的S形加減速插補算法

    一種插補時間的S形加減速插補算法,下來看看
    發表于 04-29 17:57 ?34次下載

    基于過載閾值選擇的虛擬機動態整合方法

    針對云環境下動態工作負載的不確定性,提出了基于自適應過載閾值選擇的虛擬機動態整合方法。為了權衡數據中心能源有效性與服務質量間的關系,將自適應過載閾值
    發表于 12-11 16:36 ?0次下載

    閾值自適應關聯分類方法研究

    本文采用評估反饋控制機制,對關聯分類方法閾值設定自適應調節進行了研究。首先建立了對分類規則集進行優評估的數學模型;然后基于此模型提出了運
    發表于 01-03 16:06 ?0次下載
    <b class='flag-5'>閾值</b>自適應關聯分類<b class='flag-5'>方法</b>研究

    面向系統的程序基本指令取技術

    實時任務WCET分析、降低任務WCET評估值為目標,提出一種基于程序基本的指令方法.該方法以基本為粒度執行指令
    發表于 01-10 15:36 ?0次下載

    自適應閾值及加權局部二值模式的人臉識別

    針對局部二值模式(LBP)和中心對稱局部二值模式(CS-LBP)方法描述圖像紋理特征時,閾值不能自動選 取并且圖像中不同子的貢獻也沒有進行區分的問題,該文提出一種自適應
    發表于 06-25 08:00 ?0次下載
    自適應<b class='flag-5'>閾值</b>及加權局部二值模式的人臉識別

    2020十大科技趨勢公布 對AI、云計算、芯片的未來進行

    1月2日,阿里達摩院發布了2020年十大科技趨勢,在科技浪潮新十年開啟之日,阿里圍繞人工智能、芯片、云計算、量子計算、區塊鏈等技術領域,做出了新的和發展方向預測。
    發表于 01-02 15:02 ?1094次閱讀