佳木斯湛栽影视文化发展公司

主頁 > 知識(shí)庫 > MongoDB正則表達(dá)式及應(yīng)用

MongoDB正則表達(dá)式及應(yīng)用

熱門標(biāo)簽:Mysql連接數(shù)設(shè)置 電子圍欄 科大訊飛語音識(shí)別系統(tǒng) 團(tuán)購網(wǎng)站 服務(wù)器配置 Linux服務(wù)器 銀行業(yè)務(wù) 阿里云

正則表達(dá)式常用來在所有語言中搜索字符串的任何模式或文字。MongoDB還提供了正則表達(dá)式功能的字符串模式使用正則表達(dá)式$regex操作符。MongoDB使用PCRE(Perl兼容正則表達(dá)式)為正則表達(dá)式語言。

不同于文本搜索,我們不需要做任何配置或命令就能直接使用正則表達(dá)式。

考慮下包含文字后其標(biāo)簽的帖子集合,文檔結(jié)構(gòu)如以下:

{
 "post_text": "enjoy the mongodb articles on yiibai",
 "tags": [
  "mongodb",
  "yiibai"
 ]
}

使用正則表達(dá)式表達(dá)

下面的正則表達(dá)式查詢搜索所有包含字符串 yiibai.com 的帖子:

復(fù)制代碼 代碼如下:

>db.posts.find({post_text:{$regex:"yiibai.com"}})

同樣的查詢也可以寫為:

>db.posts.find({post_text:/yiibai.com/})

使用正則表達(dá)式不區(qū)分大小寫

為了使搜索不區(qū)分大小寫,我們使用$options 帶有值參數(shù) $i。下面的命令會(huì)搜索字符串:yiibai.com,不論大小寫:

復(fù)制代碼 代碼如下:

>db.posts.find({post_text:{$regex:"yiibai",$options:"$i"}})

該查詢重新調(diào)整的結(jié)果是:其中在大小下包含詞語 yiibai 文檔,如以下:

{
 "_id" : ObjectId("53493d37d852429c10000004"),
 "post_text" : "hey! this is my post on Yiibai", 
 "tags" : [ "yiibai" ]
} 

使用正則表達(dá)式的數(shù)組元素:

我們還可以使用數(shù)組字段正則表達(dá)式概念。 這時(shí)候我們實(shí)現(xiàn)標(biāo)簽的功能顯得尤為重要。 所以,如果想要搜索帶有標(biāo)簽以詞組tutorial開始所有的帖子(無論是tutorial或tutorials或tutorialjava或tutorialphp),都可以使用下面的代碼:

復(fù)制代碼 代碼如下:

>db.posts.find({tags:{$regex:"tutorial"}})

優(yōu)化正則表達(dá)式查詢:

如果文檔字段已被索引,查詢將使用使用索引值的匹配正則表達(dá)式。 這使得搜索非??欤齽t表達(dá)式相對(duì)于掃描整個(gè)集合。

如果正則表達(dá)式是一個(gè)前綴表達(dá)式,所有的匹配是以某一串字符開始。例如,如果正則表達(dá)式 ^tut, 查詢有只搜索那些開始串 tut.

mongodb正則表達(dá)式應(yīng)用

mongodb中完全支持正則表達(dá)式,一般查詢中可以使用操作符$regex

db.lnmopy.find( { 'name': /*.lnmopy.com/i } )
db.lnmopy.find( { 'name': { $regex: '*.lnmopy.com', $options: 'i' } } )

以上兩種完全等價(jià),可以直接對(duì)域(field)即上例中的'name'鍵,使用正則表達(dá)式或者使用操作符,可選項(xiàng)目是i,即忽略大小寫。
關(guān)于正則可選項(xiàng),mongodb和其他語言標(biāo)準(zhǔn)正則稍有不同,有自己的標(biāo)準(zhǔn)。

$options的可選值

i 忽略大小寫;

m 多行查找,如果內(nèi)容里面不存在換行符號(hào)(例如 \n)或者構(gòu)造上沒有(start/end),該選項(xiàng)沒有任何效果;
x 空白字符除了被轉(zhuǎn)義的或在字符類中的以外完全被忽略,在未轉(zhuǎn)義的字符類之外的 # 以及下一個(gè)換行符之間的所有字符,包括兩頭,也都被忽略;

s 圓點(diǎn)元字符(.)匹配所有的字符,包括換行符

假設(shè)我們有一個(gè)數(shù)據(jù)庫名為mongoDemo

use mongoDemo

數(shù)據(jù)庫中有個(gè)集合名為lnmopy

db.lnmopy.find()

有如下數(shù)據(jù):

{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "www.lnmopy.com", "site" : "website", "tag" : "l,n,m,o,p,y"}
{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "demo.lnmopy.com", "site" : "unknown", "tag" : "d,e,m,o"}
{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "welcome.lnmopy.com", "site" : "website", "tag" : "w,e,l,c,o,m,e"}

mongodb的正則表達(dá)式僅支持i和m的javascript原生寫法(如/*.lnmopy.com/i)。如果要是用x和s選項(xiàng)就必須使用“$regex”操作符并在“$options”中指定選項(xiàng)。

使用正則表達(dá)式的更新操作:

db.lnmopy.update( { 'name': /*.lnmopy.com/i }, { $set: { 'site':'www.lnmopy.com' } } );

意思是,查找當(dāng)前數(shù)據(jù)庫中名為“l(fā)nmopy”的集合中“name”字段符合“/*.lnmopy.com/i”正則的條目,并只將“site”字段更新為“www.lnmopy.com”,該條更新語句僅更新一條數(shù)據(jù),如果不是用$set,那么這條記錄就會(huì)只剩下你更新的部分和默認(rèn)的ObjectId,可以說是替換了。如果想替換所有,可以加入?yún)?shù):

db.lnmopy.update( { 'name': /*.lnmopy.com/i }, { $set: { 'site':'www.lnmopy.com' } } , false, true);

參數(shù)有順序,false是upsert,如果沒有就插入新的。true就是multi多條記錄更新,所有匹配到的結(jié)果?;蛘咧苯又付▄ multi: true }:
db.lnmopy.update( { 'name': /*.lnmopy.com/i }, { $set: { 'site':'www.lnmopy.com' } } , { multi: true });
這樣就把所有的“site”字段全都更新為“www.lnmopy.com”了。

我設(shè)計(jì)的字段“tag”有個(gè)缺陷,就是本來是一個(gè)單詞,現(xiàn)在每個(gè)字母都被“,“分隔開了。實(shí)際工作中也存在類似問題,由于批量轉(zhuǎn)換數(shù)據(jù),或者其他程序操作不當(dāng),或者業(yè)務(wù)需求更改等等原因需要對(duì)某些字段進(jìn)行正則批量處理,mongodb的一般更新方法是不能實(shí)現(xiàn)的,這時(shí)就需要使用javascript語句。

正則表達(dá)式替換查詢結(jié)果中','為”

db.lnmopy.find().forEach( function(u) { u.tag = u.tag.replace(/\,/, ""); db.lnmopy.save(u); } );

最后執(zhí)行

db.lnmopy.find()

顯示如下數(shù)據(jù):

{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "www.lnmopy.com", "site" : "www.lnmopy.com", "tag" : "lnmopy"}
{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "demo.lnmopy.com", "site" : "www.lnmopy.com", "tag" : "demo"}
{ "_id" : ObjectId("502dd63d16a25b1ff6000000"), "name" : "welcome.lnmopy.com", "site" : "www.lnmopy.com", "tag" : "welcome"}

后記:javascript是mongodb的一大特色,也是優(yōu)勢(shì),很多復(fù)雜的查詢和處理都可以用javascript實(shí)現(xiàn),要注意的是,javascript的工作效率較低,原則上應(yīng)該盡量避免在主要業(yè)務(wù)邏輯中大量使用。類比的講,javascript就相當(dāng)于oracle的存儲(chǔ)過程,介于10gen(mongodb的開發(fā)團(tuán)隊(duì))是由oracle出來的這點(diǎn),就一點(diǎn)也不奇怪了。關(guān)于如何使用更復(fù)雜的javascript,以后會(huì)寫到。

您可能感興趣的文章:
  • Thinkphp使用mongodb數(shù)據(jù)庫實(shí)現(xiàn)多條件查詢方法
  • MongoDB多條件模糊查詢示例代碼
  • 淺談java實(shí)現(xiàn)mongoDB的多條件查詢
  • .Net Core如何對(duì)MongoDB執(zhí)行多條件查詢
  • MongoDB查詢之高級(jí)操作詳解(多條件查詢、正則匹配查詢等)

標(biāo)簽:江蘇 蚌埠 廣元 大理 棗莊 衢州 衡水 萍鄉(xiāng)

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《MongoDB正則表達(dá)式及應(yīng)用》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    泽普县| 五河县| 隆化县| 红原县| 洪雅县| 罗定市| 德昌县| 景德镇市| 同江市| 阿图什市| 手游| 策勒县| 奉节县| 双鸭山市| 陇川县| 鄂托克旗| 五华县| 吴堡县| 南乐县| 八宿县| 西吉县| 永靖县| 博野县| 酉阳| 平谷区| 会昌县| 修水县| 霞浦县| 开化县| 外汇| 威远县| 利辛县| 东乌| 兴义市| 丰台区| 正阳县| 阿拉善左旗| 尉犁县| 邢台县| 信丰县| 商丘市|