精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

講解霍夫曼編碼提出的思路歷程

LiveVideoStack ? 來源:Reducible ? 作者:Reducible ? 2022-05-18 14:28 ? 次閱讀

視頻詳細講解了霍夫曼編碼提出的思路歷程。

目錄

故事背景

思路歷程

通信系統示意

衡量信息

編碼和熵的關系

香農-馮諾編碼

霍夫曼的改進

故事背景1951 年,麻省理工學院的一名研究生 David Huffman 在 Robert Fano 的信息論課程上名列前茅。Fano 教授讓學生們在期末考試和學期論文間做出選擇,年輕的 Huffman 在一開始就選擇了學期論文。論文的題目如圖 1 所示,給定一組數字或符號,找到最有效的方法來使用二進制碼表示它們。

dc71761e-d63f-11ec-bce3-dac502259ad0.png

圖 1 Huffman 的學期論文題目

在基礎層面上,這是一個數據壓縮問題。事實上你在計算機上看到的文本和圖像本質上都是一組字母、數字或符號,如果將其歸結為最簡單的表示形式,那么它們其實都是一組 0 和 1 的組合,每個標準的數據類型都有一個標準的位表示。這個問題的本質是將它們壓縮成盡可能少的位數。這是一個自計算出現以來就存在的問題,但 Fano 沒有告訴學生的是,這在當時是信息論和數據壓縮領域的一個未解決的問題。Huffman 在研究生時解決了這個問題,他的解決方案就是大名鼎鼎的霍夫曼編碼算法

dc95d27a-d63f-11ec-bce3-dac502259ad0.png

圖 2 數據壓縮問題

思路歷程通信系統示意在一個通信系統中,我們通常有一個信息發送方和信息接受方。發送方想要通過網絡向接受方發送一些原始信息,但在網絡中唯一有意義的信息是二進制比特。因此,發送方必須根據符號和二進制代碼間的某種映射對原始信息進行編碼。而接收方需要對二進制代碼進行解碼以恢復原始信息。

dcb25e04-d63f-11ec-bce3-dac502259ad0.png

圖 3 通信系統示意圖

編碼方法一般針對從原始信息到二進制碼的映射進行優化,從原始信息到二進制碼的映射有一些內在要求。一是每個符號必須被映射到唯一的二進制碼,二是接收方必須能夠準確解碼出原始信息。霍夫曼編碼算法完全符合這些要求。

衡量信息量對數據進行壓縮時,我們需要考慮一種平衡。如果使用太多的比特表示符號,那么會導致冗余;如果使用太少的比特表示,則會導致信息丟失,因此最優的無損壓縮算法應該在兩者之間找到平衡。那么我們首先需要知道在不丟失原始信息的情況下,最大的壓縮率是多少。對于這個問題,我們可以理解為,需要找到在原始信息中包含的真正的信息量是多少。那我們如何衡量信息量的多少呢?

dcedc78c-d63f-11ec-bce3-dac502259ad0.png

圖 4 如何衡量信息量

一句話中包含的信息量與文字的長度并沒有直接的關聯。如圖 5 所示,對于這兩句話來說,顯然在沙哈拉沙漠下雪所包含的信息量更大,因為在沙漠下雪的概率極小。因此可以想到,事件相關的信息量與事件發生的概率有很大的關系。

dd3df4aa-d63f-11ec-bce3-dac502259ad0.png

圖 5 信息量例子

香農根據信息的性質總結了四個定律:

信息量的大小跟事件發生的概率反相關

信息量永遠大于等于 0,因為事件的發生不會導致信息損失

如果一件事發生的概率是 100%,那么它不包含任何信息量

如果兩個不相關事件被分別觀察到,那么它包含的信息量應該是這兩個事件單獨信息量的和

香農根據這四個定律給出了自信息的定義。當信息以 bit 為單位時,log 函數的底數取 2。

dd8492e8-d63f-11ec-bce3-dac502259ad0.png

圖 6 自信息定義

但香農更偉大的貢獻在于將自信息推廣到了更廣的分布上,給出了信息熵的概念,也就是著名的香農定理。香農定理作為信息論的基礎,給出了衡量信息量的標準公式。

ddb9c4b8-d63f-11ec-bce3-dac502259ad0.png

圖 7 香農定理

編碼和熵的關系當衡量不同編碼方式的性能時,我們需要計算不同編碼方式的平均字符長度。在信息論中,我們通常將符號編碼的長度根據符號出現的概率進行加權求和得到平均的符號長度。香農發現,無論對符號進行哪種方式的無損壓縮編碼,它的長度總是大于等于信息熵,這就是香農的源編碼定理。

de0c53d6-d63f-11ec-bce3-dac502259ad0.png

圖 8 香農源編碼定理

香農-馮諾編碼香農-馮諾編碼首先對符號按照概率進行升序排列。然后找到最好的分割方法將符號分為兩組,使得兩組的符號概率和盡可能接近。之后對每個組進行遞歸劃分,直到每個符號都被單獨分為一組。

de29f4ae-d63f-11ec-bce3-dac502259ad0.png

圖 9 香農-馮諾編碼分組

分完組之后,編碼就變得很簡單了。從頭部向下,如果向左,那么對符號編碼添加 0,向右走則添加 1,最終可以得到所有符號的二進制編碼。而且對于這個樹形圖的表示,在解碼端是不會存在歧義的。

de44cf90-d63f-11ec-bce3-dac502259ad0.png

圖 10 香農-馮諾編碼樹形圖

霍夫曼的改進但是香農-馮諾編碼并不總是最優的,在思考最小化平均符號長度時,可以想到,兩個最不可能出現的符號應該出現在二叉樹的最底部,也就是編碼長度最長的地方。這符合我們的直覺,那就是最不常出現的符號應該具有更長的編碼長度。因此我們可以想到,先將兩個最不可能出現的符號放在最底部去構建一個二叉樹,然后將這個二叉樹的根節點視作一個新的符號節點,該符號節點的概率是兩個子節點的和。然后對剩余的符號節點做相同的操作,直到構建出一個完整的二叉樹,這就是霍夫曼編碼。

dea4adca-d63f-11ec-bce3-dac502259ad0.png

圖 11 霍夫曼的改進1

deb44410-d63f-11ec-bce3-dac502259ad0.png

圖 12 霍夫曼的改進2

原文標題:[基礎知識] 霍夫曼編碼

文章出處:【微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 通信系統
    +關注

    關注

    6

    文章

    1176

    瀏覽量

    53287
  • 編碼
    +關注

    關注

    6

    文章

    935

    瀏覽量

    54765

原文標題:[基礎知識] 霍夫曼編碼

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    編碼器類型詳解:探索不同編碼技術的奧秘

    編碼器類型詳解:探索不同編碼技術的奧秘 在自動化、機器控制和數據處理等領域,編碼器作為關鍵的傳感器組件,扮演著至關重要的角色。它們通過將物理位置、速度或方向轉換為電信號,為各種設備提供精確的控制
    的頭像 發表于 11-19 08:58 ?183次閱讀
    <b class='flag-5'>編碼</b>器類型詳解:探索不同<b class='flag-5'>編碼</b>技術的奧秘

    磁電編碼器和光電編碼器的區別

    磁電編碼器和光電編碼器是兩種不同類型的編碼器,它們在原理、結構、性能和應用領域上都有所不同。 磁電編碼器和光電編碼器的區別 1. 引言
    的頭像 發表于 10-12 09:54 ?715次閱讀

    直徑測量工具的發展歷程

    關鍵字:直徑測量,工業直徑測量設備,線性尺量器,光電測徑儀, 直徑測量工具的發展歷程是一個悠久且不斷創新的過程,它隨著科學技術的進步而不斷演變。以下是直徑測量工具發展歷程的詳細概述: 一、古代測量
    發表于 10-10 16:55

    監控平臺設計思路

    電子發燒友網站提供《監控平臺設計思路.pptx》資料免費下載
    發表于 10-09 11:18 ?0次下載

    電感技術的講解

    詳細講解電感的原理及計算
    的頭像 發表于 09-06 02:07 ?1945次閱讀
    電感技術的<b class='flag-5'>講解</b>

    NAND閃存的發展歷程

    NAND閃存的發展歷程是一段充滿創新與突破的歷程,它自誕生以來就不斷推動著存儲技術的進步。以下是對NAND閃存發展歷程的詳細梳理,將全面且深入地介紹其關鍵節點和重要進展。
    的頭像 發表于 08-10 16:32 ?1112次閱讀

    GPT的定義和演進歷程

    GPT,全稱Generative Pretrained Transformer,是OpenAI公司在自然語言處理(NLP)領域的一項重大創新。這一模型不僅推動了AI技術的邊界,還深刻影響了我們與機器交互的方式。本文將從GPT的定義、來源、演進歷程以及其在各個領域的應用和影響等方面進行深度剖析。
    的頭像 發表于 07-10 10:41 ?926次閱讀

    PLC如何判斷編碼器正反轉

    器的工作原理、輸出信號特性以及PLC編程方法等方面,詳細闡述PLC如何判斷編碼器的正反轉,并提供相應的編程思路和實現方法。
    的頭像 發表于 06-17 09:31 ?1950次閱讀

    增量編碼器和絕對值編碼器的區別

    在工業自動化和精密測量領域,編碼器是不可或缺的關鍵設備。編碼器能夠將機械位移轉換為電信號,以便于計算機或其他數字系統進行處理。在編碼器的眾多類型中,增量編碼器和絕對值
    的頭像 發表于 06-03 15:40 ?2584次閱讀

    【RTC程序設計:實時音視頻權威指南】音視頻的編解碼壓縮技術

    音視頻所載有的信息在通過傳輸的時候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術,將文本數據表示為更緊湊的形式,以減少存儲空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據字符出現
    發表于 04-28 21:04

    編碼器分辨率是什么意思 編碼器分辨率和脈沖數的關系

    按照編碼器支持的分辨率可以把編碼器分成標清編碼器、高清編碼器、全高清編碼器,分辨率越高幀率越高視頻就越清楚。 1.
    的頭像 發表于 02-21 18:07 ?3950次閱讀
    <b class='flag-5'>編碼</b>器分辨率是什么意思 <b class='flag-5'>編碼</b>器分辨率和脈沖數的關系

    編碼器好壞怎么判斷,編碼器原理

    編碼器(Encoder)是將輸入數據轉化為特定編碼表示的一種技術。對于不同類型的編碼器,評判其好壞可以從多個方面進行考量,包括編碼質量、速度、模型結構等。
    的頭像 發表于 01-23 10:58 ?1809次閱讀

    磁性編碼器和光電編碼器的比較

    伺服電機編碼器是一種關鍵的反饋裝置,用于測量和控制電機的轉速和位置。在選擇伺服電機編碼器時,常常面臨一個選擇:使用磁電編碼器還是光電編碼器。接下來將從幾個關鍵方面比較這兩種類型的
    的頭像 發表于 01-18 10:29 ?2984次閱讀

    LDMOS在ESD設計中的應用設計思路

    LDMOS屬于功率半導體器件,主要應用于高壓場合。而針對高壓芯片的ESD防護領域,可采取GGNLDMOS的設計思路
    發表于 12-06 13:54 ?6189次閱讀
    LDMOS在ESD設計中的應用設計<b class='flag-5'>思路</b>

    EtherCAT超高速實時運動控制卡XPCIE1032H上位機C#開發(四):板載IO與總線擴展IO的編碼器與脈沖配置的應用

    以正運動EIO24088和EIO16084為例,講解編碼器與脈沖配置的應用。
    的頭像 發表于 12-01 09:04 ?531次閱讀
    EtherCAT超高速實時運動控制卡XPCIE1032H上位機C#開發(四):板載IO與總線擴展IO的<b class='flag-5'>編碼</b>器與脈沖配置的應用