精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于C++哈希表解決沖突

汽車玩家 ? 來源:IT知識課堂 ? 作者:IT知識課堂 ? 2020-05-05 23:11 ? 次閱讀

開放尋址是其中一種緩解散列沖突的編程技術,當使用開放尋址作為沖突解決技術時,鍵值對存儲在表(數組)中,而不是像單獨鏈表那樣的數據結構中。這意味著我們需要時刻留意哈希表的尺寸以及當前表中已有的元素數量。因為一旦哈希表中有太多元素,也將很難找到可用的位置來存放我們新插入的元素,因此這里我們需要引入一個重要的術語,負載系數(Load Factor)

負載系數

基于C++哈希表解決沖突


其實就是表中已有元素個數和表尺寸的比例,我們要密切關注這個系數的是因為哈希表的O(1)恒定時間行為假設負載因子k保持一定的固定值,這意味著一旦k>閾值,我們就需要增加表的大小(理想情況下是指數增長,例如,兩倍)

基于C++哈希表解決沖突


在上圖中,你會看到有兩種緩解沖突的方法,即單獨鏈表和線性探測(Linear Probing),在開放尋址(線性探測)技術看來,一旦達到某個閥值,它的時間復雜度就會呈現指數級惡化的趨勢

當我們想要將鍵值對插入哈希表時,我們對鍵進行哈希處理并獲得該鍵值對所屬位置的原始位置。如果我們的鍵被散列到的位置被占用(此時出現了沖突),對于開放尋址來說,同一個位置中不允許有兩個鍵的,這不是數組的工作方式,我們要做的是使用一個探測序列函數(Probing Seque Function) 這里簡稱p(x),因為我們已從散列函數獲取了沖突點的所在位置,現在我們使用p(x)進行探測直到在沿途發現一個空閑的位置為止

探測函數

您可以提出無限數量的探測序列,這里僅提及一些常見的探測函數:

線性探測(Linear Probing):p(x)= kx + b其中a,b是常數

二次探測(Quaratic Probing):p(x)= ax ^ 2 + bx + c,其中a,b,c是常數

雙重散列(Double Hashing):p(k,x)= x * h(k),其中h(k)是輔助s散列函數

偽隨機數發生器(Pseudo Random Number Generator): p(k,x)= x*RNG(h(k),x)其中RNG是以H(k)作為種子的隨機數生成器函數

本篇僅介紹線性探測函數進行線性探測,因此給定輸入參數x,當我們進行探測時,我們通常會將變量x初始化為0或1作為一個起點,如果我們找不到空閑的位置,會依次將x增加1,對以上所有這些探測函數都是一樣的

開放尋址的通用算法

接下來,這是一個通用的開放尋址插入算法,假設我們有一個表的尺寸為n,開放尋址算法首先會初始化變量x=1,因為x是一個變量,我們要用它來探測,每當我們未能到達閑置的位置時,都需要遞增x,然后我們通過散列函數獲得keyHash,而實際上我們首先要查看表的索引,當表索引被占用意味著它不為空,那么新索引就是我們散列的最初位置(keyHash所指向的起始索引)加上探測函數的總和再于表尺寸N取模運算得到整數,由于我們總是回到表里,在循環中要遞增x。下一次當我們在不同的位置探測時,在while循環中,最終我們會找到一個空閑的位置

x=1 keyHash=h(k) index=keyHash while table[index]!=NULL: index=(keyHash+p(k,x)) mod N x=x+1 insert(k,v,index)

死循環地獄(Chaos with Cycle)

由于我們知道負載系數被控制在一定的范圍內,所以這里有個問題,就是開放尋址中的探測函數存在缺陷--死循環地獄,以表尺寸N為模的大多數隨機選擇的探測序列將產生比表大小N更短的循環。當您嘗試插入一個鍵-值對并且循環中的所有存儲桶都被占用時,這將成為災難性問題,因為您將陷入無限循環,這在一些老外談及哈希表的相關文章中有一個非常有趣的昵稱叫死循環地獄(Chaos with Cycle)

為了生動說明什么叫死循環地獄,我們這里看一個例子,這里有一個尺寸為12的哈希表,并且使用開放尋址插入了一些鍵值對,該哈希表已經部分填充。 占用的單元格填充有鍵值對(Ki,Vi)和帶有空令牌Φ的空單元格,如下圖所示

基于C++哈希表解決沖突

假設我們使用探測序列函數p(x)=4x,并且在表中插入一個新的鍵值對,并且該鍵值對的散列值為8,即h(x)=8這意味著我們會在索引8的位置插入該鍵值對,但是該位置已被占用,因為這里已經有簡直對(k5,v5),所以我們該怎么辦呢?接下來,我們需要進行探測,所以我們計算: index=h(k)+p(1)=8+4 mod 12=0

此時,如下圖,此時探測函數會跳轉到索引為0的位置,糟糕的是索引1的位置也被占用了,因為(k1,v1)已經存在.

基于C++哈希表解決沖突

當x=2時,即index=h(k)+p(2)=(8+8) mod 12=4,探測函數會跳躍到索引4的位置,同樣這里也是被占用的,如此類推

當x=3時,即index=h(k)+p(3)=(8+12) mod 12=8,p(x)跳躍到索引8的位置,該位置被占用

當x=4時,即index=h(k)+p(4)=(8+16) mod 12=0,p(x)跳躍到索引0的位置,該位置被占用

當x=5時,即index=h(k)+p(5)=(8+20) mod 12=4,p(x)跳躍到索引4的位置,該位置被占用
.....

這樣盡管我們具有探測函數,但這種特定的情況下它一直在一個死循環里面一直做一些毫無意義的事情。

由這個例子我們可知探測函數存在缺陷,他們產生的周期短于表的尺寸,因此,我們要如何處理產生小于表大小的周期的探測功能?一般來說,一致的看法是我們不處理這個問題,相反,我們通過將探測函數的范圍限制在那些產生長度為N的循環的函數上來避免這個問題,我們選擇的那些產生的周期正好為N的探測函數,并且這些探測函數確實存在。

線性探測、二次探測和雙重散列等技術都受到死循環地獄問題的影響,這就是為什么與這些方法一起使用的探測函數非常特殊的原因。這是一個很大的話題,將是接下來幾篇文章會重點講述這些,我們目前需要做的是重新定義非常具體的探測函數,這些函數會產生一個循環長度為表尺寸N,并且避免無法插入元素或陷入無限循環

注意,開放尋址對使用的哈希函數和探測函數非常敏感。如果使用單獨的鏈接作為沖突解決方法,則不必擔心此問題。

小結

我們本篇用一個反例生動地介紹了開放尋址插入算法的底層是由探測函數和散列函數相互作用的結果,同時我們也介紹了一些探測函數的固有缺陷,就是死循環地獄,下一篇我們會詳細討論線性探測函數的原理,敬請期待。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4266

    瀏覽量

    85688
  • 函數
    +關注

    關注

    3

    文章

    4308

    瀏覽量

    62445
收藏 人收藏

    評論

    相關推薦

    C7000 C/C++優化指南用戶手冊

    電子發燒友網站提供《C7000 C/C++優化指南用戶手冊.pdf》資料免費下載
    發表于 11-09 15:00 ?0次下載
    <b class='flag-5'>C</b>7000 <b class='flag-5'>C</b>/<b class='flag-5'>C++</b>優化指南用戶手冊

    TMS320C6000優化C/C++編譯器v8.3.x

    電子發燒友網站提供《TMS320C6000優化C/C++編譯器v8.3.x.pdf》資料免費下載
    發表于 11-01 09:35 ?0次下載
    TMS320<b class='flag-5'>C</b>6000優化<b class='flag-5'>C</b>/<b class='flag-5'>C++</b>編譯器v8.3.x

    C語言和C++中結構體的區別

    同樣是結構體,看看在C語言和C++中有什么區別?
    的頭像 發表于 10-30 15:11 ?150次閱讀

    C7000優化C/C++編譯器

    電子發燒友網站提供《C7000優化C/C++編譯器.pdf》資料免費下載
    發表于 10-30 09:45 ?0次下載
    <b class='flag-5'>C</b>7000優化<b class='flag-5'>C</b>/<b class='flag-5'>C++</b>編譯器

    OpenVINO2024 C++推理使用技巧

    很多人都使用OpenVINO新版的C++ 或者Python的SDK,都覺得非常好用,OpenVINO2022之后的版本C++ SDK做了大量的優化與整理,已經是非常貼近開發的使用習慣與推理方式。與OpenCV的Mat對象對接方式更是幾乎無縫對接,非常的方便好用。
    的頭像 發表于 07-26 09:20 ?801次閱讀

    C++語言基礎知識

    電子發燒友網站提供《C++語言基礎知識.pdf》資料免費下載
    發表于 07-19 10:58 ?7次下載

    C++中實現類似instanceof的方法

    C++有多態與繼承,但是很多人開始學習C++,有時候會面臨一個常見問題,就是如何向下轉型,特別是不知道具體類型的時候,這個時候就希望C++ 可以向Java或者Python中有instanceof這個
    的頭像 發表于 07-18 10:16 ?541次閱讀
    <b class='flag-5'>C++</b>中實現類似instanceof的方法

    鴻蒙OS開發實例:【Native C++

    使用DevEco Studio創建一個Native C++應用。應用采用Native C++模板,實現使用NAPI調用C標準庫的功能。使用C標準庫hypot接口計算兩個給定數平方和的平
    的頭像 發表于 04-14 11:43 ?2520次閱讀
    鴻蒙OS開發實例:【Native <b class='flag-5'>C++</b>】

    使用 MISRA C++:2023? 避免基于范圍的 for 循環中的錯誤

    在前兩篇博客中,我們?向您介紹了新的 MISRA C++ 標準?和?C++ 的歷史?。在這篇博客中,我們將仔細研究以 C++ 中?for?循環為中心的特定規則。
    的頭像 發表于 03-28 13:53 ?740次閱讀
    使用 MISRA <b class='flag-5'>C++</b>:2023? 避免基于范圍的 for 循環中的錯誤

    c語言,c++,java,python區別

    C語言、C++、Java和Python是四種常見的編程語言,各有優點和特點。 C語言: C語言是一種面向過程的編程語言。它具有底層的特性,能夠對計算機硬件進行直接操作。
    的頭像 發表于 02-05 14:11 ?2262次閱讀

    vb語言和c++語言的區別

    VB語言和C++語言是兩種不同的編程語言,雖然它們都屬于高級編程語言,但在設計和用途上有很多區別。下面將詳細比較VB語言和C++語言的區別。 設計目標: VB語言(Visual Basic)是由
    的頭像 發表于 02-01 10:20 ?2084次閱讀

    如何解決C語言中的“訪問權限沖突”異常?C語言引發異常原因分析

    如何解決C語言中的“訪問權限沖突”異常?C語言引發異常原因分析? 在C語言中,訪問權限沖突異常通常是由于嘗試訪問未授權的變量、函數或其他數據
    的頭像 發表于 01-12 16:03 ?5192次閱讀

    C++簡史:C++是如何開始的

    MISRA C++:2023,MISRA? C++ 標準的下一個版本,來了!為了幫助您做好準備,我們介紹了 Perforce 首席技術支持工程師 Frank van den Beuken 博士撰寫
    的頭像 發表于 01-11 09:00 ?544次閱讀
    <b class='flag-5'>C++</b>簡史:<b class='flag-5'>C++</b>是如何開始的

    如何使用SystemC做RTL和C/C++的聯合仿真呢?

    當FPGA開發者需要做RTL和C/C++聯合仿真的時候,一些常用的方法包括使用MicroBlaze軟核,或者使用QEMU仿真ZYNQ的PS部分。
    的頭像 發表于 12-13 10:13 ?1207次閱讀
    如何使用SystemC做RTL和<b class='flag-5'>C</b>/<b class='flag-5'>C++</b>的聯合仿真呢?

    C語言和C++中那些不同的地方

    C語言雖說經常和C++在一起被大家提起,但可千萬不要以為它們是一個東西。現在我們常用的C語言是C89標準,C++
    的頭像 發表于 12-07 14:29 ?918次閱讀
    <b class='flag-5'>C</b>語言和<b class='flag-5'>C++</b>中那些不同的地方