佳木斯湛栽影视文化发展公司

主頁(yè) > 知識(shí)庫(kù) > Redis中哈希分布不均勻的解決辦法

Redis中哈希分布不均勻的解決辦法

熱門標(biāo)簽:地方門戶網(wǎng)站 AI電銷 Linux服務(wù)器 服務(wù)外包 網(wǎng)站排名優(yōu)化 鐵路電話系統(tǒng) 百度競(jìng)價(jià)排名 呼叫中心市場(chǎng)需求

Redis 是一個(gè)鍵值對(duì)數(shù)據(jù)庫(kù),其鍵是通過哈希進(jìn)行存儲(chǔ)的。整個(gè) Redis 可以認(rèn)為是一個(gè)外層哈希,之所以稱為外層哈希,是因?yàn)?Redis 內(nèi)部也提供了一種哈希類型,這個(gè)可以稱之為內(nèi)部哈希。當(dāng)我們采用哈希對(duì)象進(jìn)行數(shù)據(jù)存儲(chǔ)時(shí),對(duì)整個(gè) Redis 而言,就經(jīng)過了兩層哈希存儲(chǔ)。

哈希對(duì)象

哈希對(duì)象本身也是一個(gè) key-value 存儲(chǔ)結(jié)構(gòu),底層的存儲(chǔ)結(jié)構(gòu)也可以分為兩種:ziplist(壓縮列表) 和 hashtable(哈希表)。這兩種存儲(chǔ)結(jié)構(gòu)也是通過編碼來(lái)進(jìn)行區(qū)分:

編碼屬性 描述 object encoding命令返回值
OBJ_ENCODING_ZIPLIST 使用壓縮列表實(shí)現(xiàn)哈希對(duì)象 ziplist
OBJ_ENCODING_HT 使用字典實(shí)現(xiàn)哈希對(duì)象 hashtable

hashtable

Redis 中的 key-value 是通過 dictEntry 對(duì)象進(jìn)行包裝的,而哈希表就是將 dictEntry 對(duì)象又進(jìn)行了再一次的包裝得到的,這就是哈希表對(duì)象 dictht

typedef struct dictht {
  dictEntry **table;//哈希表數(shù)組
  unsigned long size;//哈希表大小
  unsigned long sizemask;//掩碼大小,用于計(jì)算索引值,總是等于size-1
  unsigned long used;//哈希表中的已有節(jié)點(diǎn)數(shù)
} dictht;

注意:上面結(jié)構(gòu)定義中的 table 是一個(gè)數(shù)組,其每個(gè)元素都是一個(gè) dictEntry 對(duì)象。

字典

字典,又稱為符號(hào)表(symbol table),關(guān)聯(lián)數(shù)組(associative array)或者映射(map),字典的內(nèi)部嵌套了哈希表 dictht 對(duì)象,下面就是一個(gè)字典 ht 的定義:

typedef struct dict {
  dictType *type;//字典類型的一些特定函數(shù)
  void *privdata;//私有數(shù)據(jù),type中的特定函數(shù)可能需要用到
  dictht ht[2];//哈希表(注意這里有2個(gè)哈希表)
  long rehashidx; //rehash索引,不在rehash時(shí),值為-1
  unsigned long iterators; //正在使用的迭代器數(shù)量
} dict;

其中 dictType 內(nèi)部定義了一些常用函數(shù),其數(shù)據(jù)結(jié)構(gòu)定義如下:

typedef struct dictType {
  uint64_t (*hashFunction)(const void *key);//計(jì)算哈希值函數(shù)
  void *(*keyDup)(void *privdata, const void *key);//復(fù)制鍵函數(shù)
  void *(*valDup)(void *privdata, const void *obj);//復(fù)制值函數(shù)
  int (*keyCompare)(void *privdata, const void *key1, const void *key2);//對(duì)比鍵函數(shù)
  void (*keyDestructor)(void *privdata, void *key);//銷毀鍵函數(shù)
  void (*valDestructor)(void *privdata, void *obj);//銷毀值函數(shù)
} dictType;

當(dāng)我們創(chuàng)建一個(gè)哈希對(duì)象時(shí),可以得到如下簡(jiǎn)圖(部分屬性被省略):

rehash 操作

dict 中定義了一個(gè)數(shù)組 ht[2],ht[2] 中定義了兩個(gè)哈希表:ht[0]ht[1]。而 Redis 在默認(rèn)情況下只會(huì)使用 ht[0],并不會(huì)使用 ht[1],也不會(huì)為 ht[1] 初始化分配空間。

當(dāng)設(shè)置一個(gè)哈希對(duì)象時(shí),具體會(huì)落到哈希數(shù)組(上圖中的 dictEntry[3])中的哪個(gè)下標(biāo),是通過計(jì)算哈希值來(lái)確定的。如果發(fā)生哈希碰撞(計(jì)算得到的哈希值一致),那么同一個(gè)下標(biāo)就會(huì)有多個(gè) dictEntry,從而形成一個(gè)鏈表(上圖中最右邊指向 NULL 的位置),不過需要注意的是最后插入元素的總是落在鏈表的最前面(即發(fā)生哈希沖突時(shí),總是將節(jié)點(diǎn)往鏈表的頭部放)。

當(dāng)讀取數(shù)據(jù)的時(shí)候遇到一個(gè)節(jié)點(diǎn)有多個(gè)元素,就需要遍歷鏈表,故鏈表越長(zhǎng),性能越差。為了保證哈希表的性能,需要在滿足以下兩個(gè)條件中的一個(gè)時(shí),對(duì)哈希表進(jìn)行 rehash(重新散列)操作:

負(fù)載因子大于等于 1dict_can_resize1 時(shí)。負(fù)載因子大于等于安全閾值(dict_force_resize_ratio=5)時(shí)。

PS:負(fù)載因子 = 哈希表已使用節(jié)點(diǎn)數(shù) / 哈希表大小(即:h[0].used/h[0].size)。

rehash 步驟

擴(kuò)展哈希和收縮哈希都是通過執(zhí)行 rehash 來(lái)完成,這其中就涉及到了空間的分配和釋放,主要經(jīng)過以下五步:

為字典 dictht[1] 哈希表分配空間,其大小取決于當(dāng)前哈希表已保存節(jié)點(diǎn)數(shù)(即:ht[0].used):

如果是擴(kuò)展操作則 ht[1] 的大小為 2 的 n次方中第一個(gè)大于等于ht[0].used * 2屬性的值(比如used=3,此時(shí)ht[0].used * 2=6,故 23次方為8就是第一個(gè)大于used * 2 的值(2 的 2 次方 6 且 2 的 3 次方 > 6))。 如果是收縮操作則 ht[1] 大小為 2 的 n 次方中第一個(gè)大于等于 ht[0].used 的值。

將字典中的屬性 rehashix 的值設(shè)置為 0,表示正在執(zhí)行 rehash 操作。

ht[0] 中所有的鍵值對(duì)依次重新計(jì)算哈希值,并放到 ht[1] 數(shù)組對(duì)應(yīng)位置,每完成一個(gè)鍵值對(duì)的 rehash之后 rehashix 的值需要自增 1。

當(dāng) ht[0] 中所有的鍵值對(duì)都遷移到 ht[1] 之后,釋放 ht[0] ,并將 ht[1] 修改為 ht[0],然后再創(chuàng)建一個(gè)新的 ht[1] 數(shù)組,為下一次 rehash 做準(zhǔn)備。

將字典中的屬性 rehashix 設(shè)置為 -1,表示此次 rehash 操作結(jié)束,等待下一次 rehash。

漸進(jìn)式 rehash

Redis 中的這種重新哈希的操作因?yàn)椴皇且淮涡匀?rehash,而是分多次來(lái)慢慢的將 ht[0] 中的鍵值對(duì) rehashht[1],故而這種操作也稱之為漸進(jìn)式 rehash。漸進(jìn)式 rehash 可以避免集中式 rehash 帶來(lái)的龐大計(jì)算量,是一種分而治之的思想。

在漸進(jìn)式 rehash 過程中,因?yàn)檫€可能會(huì)有新的鍵值對(duì)存進(jìn)來(lái),此時(shí)** Redis 的做法是新添加的鍵值對(duì)統(tǒng)一放入 ht[1] 中,這樣就確保了 ht[0] 鍵值對(duì)的數(shù)量只會(huì)減少**。

當(dāng)正在執(zhí)行 rehash操作時(shí),如果服務(wù)器收到來(lái)自客戶端的命令請(qǐng)求操作,則會(huì)先查詢 ht[0],查找不到結(jié)果再到ht[1] 中查詢。

ziplist

關(guān)于 ziplist 的一些特性,之前的文章中有單獨(dú)進(jìn)行過分析,想要詳細(xì)了解的,可以點(diǎn)擊這里。但是需要注意的是哈希對(duì)象中的 ziplist 和列表對(duì)象中 ziplist 的有一點(diǎn)不同就是哈希對(duì)象是一個(gè) key-value 形式,所以其 ziplist 中也表現(xiàn)為 key-value,keyvalue 緊挨在一起:

ziplist 和 hashtable 的編碼轉(zhuǎn)換

當(dāng)一個(gè)哈希對(duì)象可以滿足以下兩個(gè)條件中的任意一個(gè),哈希對(duì)象會(huì)選擇使用 ziplist 編碼來(lái)進(jìn)行存儲(chǔ):

  • 哈希對(duì)象中的所有鍵值對(duì)總長(zhǎng)度(包括鍵和值)小于等于 64字節(jié)(這個(gè)閾值可以通過參數(shù) hash-max-ziplist-value 來(lái)進(jìn)行控制)。
  • 哈希對(duì)象中的鍵值對(duì)數(shù)量小于等于 512 個(gè)(這個(gè)閾值可以通過參數(shù) hash-max-ziplist-entries 來(lái)進(jìn)行控制)。

一旦不滿足這兩個(gè)條件中的任意一個(gè),哈希對(duì)象就會(huì)選擇使用 hashtable 編碼進(jìn)行存儲(chǔ)。

哈希對(duì)象常用命令

  •  hset key field value:設(shè)置單個(gè) field(哈希對(duì)象的 key 值)。
  • hmset key field1 value1 field2 value2 :設(shè)置多個(gè) field(哈希對(duì)象的 key 值)。
  • hsetnx key field value:將哈希表 key 中域 field 的值設(shè)置為 value,如果 field 已存在,則不執(zhí)行任何操作。
  • hget key field:獲取哈希表 key 中的域 field 對(duì)應(yīng)的 value。
  • hmget key field1 field2:獲取哈希表 key 中的多個(gè)域 field 對(duì)應(yīng)的 value。
  • hdel key field1 field2:刪除哈希表 key 中的一個(gè)或者多個(gè) field。
  • hlen key:返回哈希表key中域的數(shù)量。
  • hincrby key field increment:為哈希表 key 中的域 field 的值加上增量 increment ,increment 可以為負(fù)數(shù),如果 field 不是數(shù)字則會(huì)報(bào)錯(cuò)。
  • hincrbyfloat key field increment:為哈希表 key 中的域 field 的值加上增量 increment,increment 可以為負(fù)數(shù),如果 field 不是 float 類型則會(huì)報(bào)錯(cuò)。
  • hkeys key:獲取哈希表 key 中的所有域。
  • hvals key:獲取哈希表中所有域的值。

了解了操作哈希對(duì)象的常用命令,我們就可以來(lái)驗(yàn)證下前面提到的哈希對(duì)象的類型和編碼了,在測(cè)試之前為了防止其他 key 值的干擾,我們先執(zhí)行 flushall 命令清空 Redis 數(shù)據(jù)庫(kù)。

然后依次執(zhí)行如下命令:

hset address country china
type address
object encoding address

得到如下效果:

可以看到當(dāng)我們的哈希對(duì)象中只有一個(gè)鍵值對(duì)的時(shí)候,底層編碼是 ziplist。

現(xiàn)在我們將 hash-max-ziplist-entries 參數(shù)改成 2,然后重啟 Redis,最后再輸入如下命令進(jìn)行測(cè)試:

hmset key field1 value1 field2 value2 field3 value3
object encoding key

輸出之后得到如下結(jié)果:

可以看到,編碼已經(jīng)變成了 hashtable。

總結(jié)

本文主要介紹了 Redis5 種常用數(shù)據(jù)類型中的哈希類型底層的存儲(chǔ)結(jié)構(gòu) hashtable 的使用,以及當(dāng) hash 分布不均勻時(shí)候 Redis 是如何進(jìn)行重新哈希的問題,最后了解了哈希對(duì)象的一些常用命令,并通過一些例子驗(yàn)證了本文的結(jié)論。

到此這篇關(guān)于Redis中哈希分布不均勻的解決辦法的文章就介紹到這了,更多相關(guān)Redis 哈希分布不均勻內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • redis哈希和集合_動(dòng)力節(jié)點(diǎn)Java學(xué)院整理
  • redis哈希類型_動(dòng)力節(jié)點(diǎn)Java學(xué)院整理

標(biāo)簽:湘潭 仙桃 湖南 蘭州 崇左 衡水 銅川 黃山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Redis中哈希分布不均勻的解決辦法》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    日喀则市| 旅游| 江华| 右玉县| 深州市| 长子县| 南岸区| 南京市| 宜州市| 沙湾县| 富裕县| 防城港市| 汪清县| 星子县| 剑河县| 贵德县| 康马县| 措勤县| 华宁县| 简阳市| 镇宁| 武定县| 陆良县| 安吉县| 大同市| 通道| 广东省| 海城市| 陇南市| 隆安县| 北票市| 龙山县| 吉木萨尔县| 特克斯县| 公安县| 韩城市| 苍南县| 南陵县| 六安市| 延庆县| 伊宁市|