佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > Redis中Scan命令的踩坑實錄

Redis中Scan命令的踩坑實錄

熱門標(biāo)簽:鐵路電話系統(tǒng) AI電銷 服務(wù)外包 網(wǎng)站排名優(yōu)化 地方門戶網(wǎng)站 百度競價排名 Linux服務(wù)器 呼叫中心市場需求

1、原本以為自己對redis命令還蠻熟悉的,各種數(shù)據(jù)模型各種基于redis的騷操作。但是最近在使用redis的scan的命令式卻踩了一個坑,頓時發(fā)覺自己原來對redis的游標(biāo)理解的很有限。所以記錄下這個踩坑的過程,背景如下:

公司因為redis服務(wù)器內(nèi)存吃緊,需要刪除一些無用的沒有設(shè)置過期時間的key。大概有500多w的key。雖然key的數(shù)目聽起來挺嚇人。但是自己玩redis也有年頭了,這種事還不是手到擒來?

當(dāng)時想了下,具體方案是通過lua腳本來過濾出500w的key。然后進(jìn)行刪除動作。lua腳本在redis server上執(zhí)行,執(zhí)行速度快,執(zhí)行一批只需要和redis server建立一次連接。篩選出來key,然后一次刪1w。然后通過shell腳本循環(huán)個500次就能刪完所有的。以前通過lua腳本做過類似批量更新的操作,3w一次也是秒級的?;静粫斐蓃edis的阻塞。這樣算起來,10分鐘就能搞定500w的key。

然后,我就開始直接寫lua腳本。首先是篩選。

用過redis的人,肯定知道redis是單線程作業(yè)的,肯定不能用keys命令來篩選,因為keys命令會一次性進(jìn)行全盤搜索,會造成redis的阻塞,從而會影響正常業(yè)務(wù)的命令執(zhí)行。

500w數(shù)據(jù)量的key,只能增量迭代來進(jìn)行。redis提供了scan命令,就是用于增量迭代的。這個命令可以每次返回少量的元素,所以這個命令十分適合用來處理大的數(shù)據(jù)集的迭代,可以用于生產(chǎn)環(huán)境。

scan命令會返回一個數(shù)組,第一項為游標(biāo)的位置,第二項是key的列表。如果游標(biāo)到達(dá)了末尾,第一項會返回0。

2、所以我寫的第一版的lua腳本如下:

local c = 0
local resp = redis.call('SCAN',c,'MATCH','authToken*','COUNT',10000)
c = tonumber(resp[1])
local dataList = resp[2]

for i=1,#dataList do
 local d = dataList[i]
 local ttl = redis.call('TTL',d)
 if ttl == -1 then
  redis.call('DEL',d)
 end
end

if c==0 then
 return 'all finished'
else
 return 'end'
end

在本地的測試redis環(huán)境中,通過執(zhí)行以下命令mock了20w的測試數(shù)據(jù):

eval "for i = 1, 200000 do redis.call('SET','authToken_' .. i,i) end" 0

然后執(zhí)行script load命令上傳lua腳本得到SHA值,然后執(zhí)行evalsha去執(zhí)行得到的SHA值來運行。具體過程如下:

我每刪1w數(shù)據(jù),執(zhí)行下dbsize(因為這是我本地的redis,里面只有mock的數(shù)據(jù),dbsize也就等同于這個前綴key的數(shù)量了)。

奇怪的是,前面幾行都是正常的。但是到了第三次的時候,dbsize變成了16999,多刪了1個,我也沒太在意,但是最后在dbsize還剩下124204個的時候,數(shù)量就不動了。之后無論再執(zhí)行多少遍,數(shù)量還依舊是124204個。

隨即我直接運行scan命令:

發(fā)現(xiàn)游標(biāo)雖然沒有到達(dá)末尾,但是key的列表卻是空的。

這個結(jié)果讓我懵逼了一段時間。我仔細(xì)檢查了lua腳本,沒有問題啊。難道是redis的scan命令有bug?難道我理解的有問題?

我再去翻看redis的命令文檔對count選項的解釋:

經(jīng)過詳細(xì)研讀,發(fā)現(xiàn)count選項所指定的返回數(shù)量還不是一定的,雖然知道可能是count的問題,但無奈文檔的解釋實在難以很通俗的理解,依舊不知道具體問題在哪

3、后來經(jīng)過某個小伙伴的提示,看到了另外一篇對于scan命令count選項通俗的解釋:

看完之后恍然大悟。原來count選項后面跟的數(shù)字并不是意味著每次返回的元素數(shù)量,而是scan命令每次遍歷字典槽的數(shù)量

我scan執(zhí)行的時候每一次都是從游標(biāo)0的位置開始遍歷,而并不是每一個字典槽里都存放著我所需要篩選的數(shù)據(jù),這就造成了我最后的一個現(xiàn)象:雖然我count后面跟的是10000,但是實際redis從開頭往下遍歷了10000個字典槽后,發(fā)現(xiàn)沒有數(shù)據(jù)槽存放著我所需要的數(shù)據(jù)。所以我最后的dbsize數(shù)量永遠(yuǎn)停留在了124204個。

所以在使用scan命令的時候,如果需要迭代的遍歷,需要每次調(diào)用都需要使用上一次這個調(diào)用返回的游標(biāo)作為該次調(diào)用的游標(biāo)參數(shù),以此來延續(xù)之前的迭代過程。

至此,心中的疑惑就此解開,改了一版lua:

local c = tonumber(ARGV[1])
local resp = redis.call('SCAN',c,'MATCH','authToken*','COUNT',10000)
c = tonumber(resp[1])
local dataList = resp[2]

for i=1,#dataList do
 local d = dataList[i]
 local ttl = redis.call('TTL',d)
 if ttl == -1 then
  redis.call('DEL',d)
 end
end

return c

在本地上傳后執(zhí)行:

可以看到,scan命令沒法完全保證每次篩選的數(shù)量完全等同于給定的count,但是整個迭代卻很好的延續(xù)下去了。最后也得到了游標(biāo)返回0,也就是到了末尾。至此,測試數(shù)據(jù)20w被全部刪完。

這段lua只要在套上shell進(jìn)行循環(huán)就可以直接在生產(chǎn)上跑了。經(jīng)過估算大概在12分鐘左右能刪除掉500w的數(shù)據(jù)。

知其然,知其所以然。雖然scan命令以前也曾玩過。但是的確不知道其中的細(xì)節(jié)。況且文檔的翻譯也不是那么的準(zhǔn)確,以至于自己在面對錯誤的結(jié)果時整整浪費了近1個多小時的時間。記錄下來,加深理解。

總結(jié)

到此這篇關(guān)于Redis中Scan命令踩坑的文章就介紹到這了,更多相關(guān)Redis Scan命令踩坑內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Redis中scan命令的深入講解
  • php redis擴(kuò)展支持scan命令實現(xiàn)方法
  • Redis中Scan命令的基本使用教程
  • 詳解Redis SCAN命令實現(xiàn)有限保證的原理
  • Redis Scan命令的基本使用方法
  • redis中scan命令的基本實現(xiàn)方法

標(biāo)簽:蘭州 湘潭 黃山 衡水 銅川 仙桃 崇左 湖南

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Redis中Scan命令的踩坑實錄》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    伊川县| 石泉县| 连云港市| 哈巴河县| 汾西县| 阿拉善右旗| 冷水江市| 南开区| 麻江县| 安庆市| 平塘县| 瑞昌市| 金川县| 千阳县| 宜兰县| 龙岩市| 德庆县| 宾川县| 呼图壁县| 精河县| 屏东市| 阿图什市| 沾益县| 鄄城县| 东辽县| 安徽省| 泗洪县| 威宁| 沁阳市| 科技| 衡南县| 怀柔区| 庆元县| 米泉市| 潮州市| 石景山区| 文昌市| 北宁市| 德安县| 耒阳市| 宝应县|