佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > 正則表達(dá)式教程之前后查找lookaround詳解

正則表達(dá)式教程之前后查找lookaround詳解

熱門標(biāo)簽:服務(wù)器配置 團(tuán)購網(wǎng)站 阿里云 Mysql連接數(shù)設(shè)置 銀行業(yè)務(wù) 電子圍欄 Linux服務(wù)器 科大訊飛語音識別系統(tǒng)

本文實例講述了正則表達(dá)式教程之前后查找lookaround。分享給大家供大家參考,具體如下:

注:在所有例子中正則表達(dá)式匹配結(jié)果包含在源文本中的之間,有的例子會使用Java來實現(xiàn),如果是java本身正則表達(dá)式的用法,會在相應(yīng)的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

一、問題引入

在HTML頁面中,匹配出一對標(biāo)簽之間的文本,如匹配出頁面的標(biāo)簽,即title>與/title>之間的文本:

文本:head>TITLE>welcome to my page/title>/head>

正則表達(dá)式:[Tt][Ii][Tt][Ll][Ee]>.*?/ [Tt][Ii][Tt][Ll][Ee]>

結(jié)果:head>【TITLE>welcome to my page/title>】/head>

分析:[Tt][Ii][Tt][Ll][Ee]>表示不區(qū)分大小寫,這個模式匹配到了title標(biāo)簽以及它們之間的文本,但是并不完美,因為我們只想要title標(biāo)簽之間的文本,而不包括標(biāo)簽本身。解決這個問題我們就需要用到前后查找(lookaround)。

二、向前查找

向前查找指定了一個必須匹配但不在結(jié)果中返回的模式。向前查找實際上就是一個子表達(dá)式,它以?=開頭,需要匹配的文本跟在=的后面。

看一個匹配出一個URL地址中協(xié)議部分的例子:

文本:http://blog.csdn.net/mhmyqn

正則表達(dá)式:.+(?=:)

結(jié)果:【http】://blog.csdn.net/mhmyqn

分析:URL地址中協(xié)議部分是在:之前的部分,模式.+匹配任意文本,子表達(dá)式(?=:)匹配:,但是被匹配到的:并沒有出現(xiàn)在結(jié)果中。我們使用?=向正則表達(dá)式引擎表明,只要找到:就行了,但不包括在最終的返回結(jié)果里。這里如果不使用向前匹配(?=:),而是直接使用(:),那么匹配結(jié)果就會是http:了,它包括了:,并不是我們想要的。

注意:前后查找中的前、后是指模式與被查找文本的相對位置而言的,左為前,右為后。即向前查找為:xxx(?=xxx),而向后查找為(?=xxx)xxx,向后查找在接下來會介紹到。

三、向后查找

向后查找操作符是?=。但是并不是所有的正則表達(dá)式實現(xiàn)都支持向后查找,JavaScript就不支持,java語言支持向后查找。

比如要查找文本當(dāng)中的價格(以$開頭,后面跟數(shù)字),結(jié)果不包含貨幣符號:

文本:category1:$136.25,category2:$28,category3:$88.60

正則表達(dá)式:(?=\$)\d+(\.\d+)?

結(jié)果:category1:$【136.25】,category2:$【28】,category3:$【88.60】

分析:(?=\$)模式匹配$,\d+(\.\d+)?模式匹配整數(shù)或小數(shù)。從結(jié)果可以看出,結(jié)果不沒有包括貨幣符號,只匹配出了價格。如果不使用向后查找,情況會是什么樣呢?使用模式$\d+(\.\d+)?,這樣會把$包含在結(jié)果中。使用模式\d+(\.\d+)?,又會把categery1(23)中的數(shù)字也匹配出來,都不是我們想要的。

注意:向前查找模式的長度是可變的,它們可以包含.、*、+之類的元字符;而向后查找模式只能是固定長度,不能包含.、*、+之類的元字符。

四、把向前查找和向后查找結(jié)合起來

把向前查找和向后查找結(jié)合起來使用,即可解決前面HTML標(biāo)簽之間的文本的問題:

文本:head>TITLE>welcome to my page/title>/head>

正則表達(dá)式:(?=[Tt][Ii][Tt][Ll][Ee]>).*?(?=/ [Tt][Ii][Tt][Ll][Ee]>)

結(jié)果:head>TITLE>【welcome to my page】/title>/head>

分析:從結(jié)果可以看出,問題完美的解決了。(?=[Tt][Ii][Tt][Ll][Ee]>)是一個向后操作,它匹配title>但不消費它,(?=/[Tt][Ii][Tt][Ll][Ee]>)是一個向前操作,它匹配/title>但不消費它。最終返回的匹配結(jié)果只包含了標(biāo)簽之間的文本了。

五、對前后查找取非

前面說到的向前查找和向后查找通常都是用來匹配文本,其目的是為了確定將被返回的匹配結(jié)果的文本的位置(通過指定匹配結(jié)果的前后必須是哪些文本)。這種用法叫正向前查找和正向后查找。還有一種負(fù)向前查找和負(fù)向后查找,是查找那些不與給定模式相匹配的文本。

前后查找的操作符:

(?=) 正向前查找
(?!) 負(fù)向前查找
(?=) 正向后查找
(?!) 負(fù)向后查找

比如一段文本中即有價格(以$開頭,后面跟數(shù)字)和數(shù)量,我們要找出價格和數(shù)量,先來看查找價格:

文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正則表達(dá)式:(?=\$)\d+

結(jié)果:I paid 【$30】 for 10 apples, 15 oranges, and 10 pears. I saved 【$5】 on thisorder.

查找數(shù)量:

文本:I paid $30 for 10 apples, 15 oranges, and 10 pears. I saved $5 onthis order.

正則表達(dá)式:\b(?!\$)\d+\b

結(jié)果:I paid $30 for 【10】 apples, 【15】 oranges, and 【10】pears. I saved $5 on this order.

分析:(?!\$)表示一個負(fù)向后查找,它使得結(jié)果只包含那些不以$開頭的數(shù)值。

六、小結(jié)

有了前后查找,就可以對最終的匹配結(jié)果包含哪些內(nèi)容做出精確的控制。前后查找操作使我們可以利用子表達(dá)式來指定文本匹配操作發(fā)生的位置,并收到只匹配不消費的效果。

PS:這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用:

JavaScript正則表達(dá)式在線測試工具:
http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述對大家正則表達(dá)式學(xué)習(xí)有所幫助。

您可能感興趣的文章:
  • 正則表達(dá)式查找相似單詞的方法
  • 學(xué)習(xí)Java正則表達(dá)式(匹配、替換、查找)
  • 正則表達(dá)式匹配,替換,查找
  • JAVA中正則表達(dá)式匹配,替換,查找,切割的方法
  • js正則查找match()與替換replace()用法實例
  • Powershell學(xué)習(xí)筆記--使用正則表達(dá)式查找文件
  • 如何在PHP中使用正則表達(dá)式進(jìn)行查找替換
  • 用正則查找html中有id屬性的html標(biāo)簽
  • 正則表達(dá)式驗證IPV4地址功能實例分析
  • 正則表達(dá)式教程之子表達(dá)式用法分析
  • 正則表達(dá)式教程之位置匹配詳解
  • 正則表達(dá)式教程之重復(fù)匹配詳解
  • 正則表達(dá)式教程之操作符及說明詳解

標(biāo)簽:廣元 棗莊 江蘇 大理 蚌埠 萍鄉(xiāng) 衢州 衡水

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《正則表達(dá)式教程之前后查找lookaround詳解》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    蓬安县| 会同县| 无极县| 朝阳区| 灵台县| 浦江县| 板桥市| 颍上县| 林周县| 巫溪县| 廊坊市| 翼城县| 安福县| 平顶山市| 华池县| 招远市| 和平县| 临颍县| 台山市| 许昌县| 湘阴县| 高安市| 泰宁县| 集贤县| 苏州市| 观塘区| 濉溪县| 铜鼓县| 高尔夫| 重庆市| 淅川县| 凌源市| 中山市| 南木林县| 恩施市| 沙湾县| 西平县| 苍南县| 大荔县| 黑河市| 边坝县|