佳木斯湛栽影视文化发展公司

主頁(yè) > 知識(shí)庫(kù) > 正則表達(dá)式匹配不包含某些字符串的技巧

正則表達(dá)式匹配不包含某些字符串的技巧

熱門標(biāo)簽:銀行業(yè)務(wù) 服務(wù)器配置 阿里云 團(tuán)購(gòu)網(wǎng)站 Mysql連接數(shù)設(shè)置 Linux服務(wù)器 電子圍欄 科大訊飛語音識(shí)別系統(tǒng)

經(jīng)常我們會(huì)遇到想找出不包含某個(gè)字符串的文本,程序員最容易想到的是在正則表達(dá)式里使用,^(hede)來過濾”hede”字串,但這種寫法是錯(cuò)誤的。我們可以這樣寫:[^hede],但這樣的正則表達(dá)式完全是另外一個(gè)意思,它的意思是字符串里不能包含‘h',‘e',‘d'三個(gè)但字符。那什么樣的正則表達(dá)式能過濾出不包含完整“hello”字串的信息呢?

事實(shí)上,說正則表達(dá)式里不支持逆向匹配并不是百分之百的正確。就像這個(gè)問題,我們就可以使用否定式查找來模擬出逆向匹配,從而解決我們的問題:

復(fù)制代碼 代碼如下:
^((?!hede).)*$

上面這個(gè)表達(dá)式就能過濾出不包含‘hede'字串的信息。我上面也說了,這種寫法并不是正則表達(dá)式“擅長(zhǎng)”的用法,但它是可以這樣用的。

解釋

一個(gè)字符串是由n個(gè)字符組成的。在每個(gè)字符之前和之后,都有一個(gè)空字符。這樣,一個(gè)由n個(gè)字符組成的字符串就有n+1個(gè)空字符串。我們來看一下“ABhedeCD”這個(gè)字符串:

所有的e編號(hào)的位置都是空字符。表達(dá)式(?!hede).會(huì)往前查找,看看前面是不是沒有“hede”字串,如果沒有(是其它字符),那么.(點(diǎn)號(hào))就會(huì)匹配這些其它字符。這種正則表達(dá)式的“查找”也叫做“zero-width-assertions”(零寬度斷言),因?yàn)樗粫?huì)捕獲任何的字符,只是判斷。

在上面的例子里,每個(gè)空字符都會(huì)檢查其前面的字符串是否不是‘hede',如果不是,這.(點(diǎn)號(hào))就是匹配捕捉這個(gè)字符。表達(dá)式(?!hede).只執(zhí)行一次,所以,我們將這個(gè)表達(dá)式用括號(hào)包裹成組(group),然后用*(星號(hào))修飾——匹配0次或多次:

復(fù)制代碼 代碼如下:
((?!hede).)*。

你可以理解,正則表達(dá)式((?!hede).)*匹配字符串"ABhedeCD"的結(jié)果false,因?yàn)樵趀3位置,(?!hede)匹配不合格,它之前有"hede"字符串,也就是包含了指定的字符串。

在正則表達(dá)式里, ?! 是否定式向前查找,它幫我們解決了字符串“不包含”匹配的問題。

以下是一些補(bǔ)充:

分享下php生成隨機(jī)數(shù)的三種方法,生成1-10之間的不重復(fù)隨機(jī)數(shù),php生成不重復(fù)隨機(jī)數(shù)的例子,需要的朋友參考下。

在hacker news上看到regex golf,幾道很有趣的正則表達(dá)式的題,有的需要用到不匹配這種匹配,比如需要匹配不包含某個(gè)單詞的串。

開始正題之前,先來看看正則表達(dá)式的語法:

[abc] a或b或c . 任意單個(gè)字符 a? 零個(gè)或一個(gè)a
[^abc] 任意不是abc的字符 \s 空格 a* 零個(gè)或多個(gè)a
[a-z] a-z的任意字符 \S 非空格 a+ 一個(gè)或多個(gè)a
[a-zA-Z] a-z或A-Z \d 任意數(shù)字 a{n} 正好出現(xiàn)n次a
^ 一行開頭 \D 任意非數(shù)字 a{n,} 至少出現(xiàn)n次a
$ 一行末尾 \w 任意字母數(shù)字或下劃線 a{n,m} 出現(xiàn)n-m次a
(...) 括號(hào)用于分組 \W 任意非字母數(shù)字或下劃線 a*? 零個(gè)或多個(gè)a(非貪婪)
(a|b) a或b \b 單詞邊界 (a)...\1 引用分組
(?=a) 前面有a (?!a) 前面沒有a \B 非單詞邊界

正則表達(dá)式中有(?=a)和(?!a)來表示我們是否需要匹配某個(gè)東西。

所以,有需要不匹配某樣內(nèi)容時(shí),就可以用(?!a)了。比如要匹配不含hello的字符串就可以這樣寫。

復(fù)制代碼 代碼如下:

^(?!.*hello)

這里.*用來表示hello之前可能有其他的字符,為什么還要加^呢,因?yàn)槿绻患拥脑挘赡芷ヅ涞絟之后的這個(gè)位置上了。

現(xiàn)在就可以解決regex golf上的abba這道題了。
這道題是去匹配不含abba這種形式的單詞,比如abba,anallagmatic就不應(yīng)該匹配上。

正則表達(dá)式代碼:

復(fù)制代碼 代碼如下:

^(?!.*(.)(.)\2\1)

然后利用不匹配,還可以解決prime這道題,這道題匹配有素?cái)?shù)個(gè)x的串,先看正則。
 

復(fù)制代碼 代碼如下:

^(?!(xx+)\1+$)

(xx+)是匹配2個(gè)及2個(gè)以上的x,(xx+)\1+就是匹配重復(fù)出現(xiàn)2個(gè)及以上的串,所以(xx+)\1+就表示了那些非素?cái)?shù)的串,那么素?cái)?shù)串就是除去這些非素?cái)?shù)串,即是以上的正則表達(dá)式了。

PS:關(guān)于正則,本站還提供了2款非常簡(jiǎn)便實(shí)用的正則測(cè)試工具供大家使用:

JavaScript正則表達(dá)式在線測(cè)試工具:
http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg

您可能感興趣的文章:
  • js 正則表達(dá)式學(xué)習(xí)筆記之匹配字符串
  • 正則表達(dá)式模式匹配字符串基礎(chǔ)知識(shí)
  • 正則匹配密碼只能是數(shù)字和字母組合字符串功能【php與js實(shí)現(xiàn)】
  • 請(qǐng)教一個(gè)正則表達(dá)式,匹配所有Html標(biāo)簽外部的指定字符串
  • 使用正則表達(dá)式匹配[***]樣式的字符串
  • 如何使用正則匹配最后一個(gè)字符串詳解

標(biāo)簽:衢州 蚌埠 棗莊 衡水 萍鄉(xiāng) 廣元 江蘇 大理

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《正則表達(dá)式匹配不包含某些字符串的技巧》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    武宁县| 闸北区| 庆阳市| 正定县| 旬阳县| 紫阳县| 平阴县| 东乌珠穆沁旗| 桃源县| 凤城市| 巩留县| 枝江市| 苗栗县| 谷城县| 株洲县| 定日县| 遵化市| 宿迁市| 高唐县| 宕昌县| 西贡区| 隆德县| 白朗县| 米易县| 治县。| 莱州市| 句容市| 柳林县| 镇雄县| 平顶山市| 吴川市| 图木舒克市| 保山市| 灌云县| 奇台县| 武强县| 萨嘎县| 镇宁| 莆田市| 宁远县| 定日县|