主頁 > 知識庫 > 深入淺析正則表達式捕獲組

深入淺析正則表達式捕獲組

捕獲組（capturing group）是正則表達式里比較常用，也是比較重要的概念，我個人覺得掌握這部分的知識是非常重要的。

這篇文章內容不會很深入，但是盡量做到簡單易懂又全面。接下來的內容主要是圍繞以下7個點：

1: () 捕獲組
2: (?:) non capturing group
3: (?=) positive lookahead
4: (?!) negative lookahead
5: (?=) positive lookbehind
6: (?!) negative lookbehind
7: (?=), (?!), (?=), (?!)的捕獲

1: () 捕獲組

/go+/

以上的正則表達式表示一個字母g后面跟上一個或者多個字母o,他能匹配go或者goooo。但是如果我們想+不只是運用到字母o上，而是運用到go這個整體上怎么辦呢？辦法就是給go加括號：

/(go)+/

為了全局匹配以及不考慮大小寫，我們接下來會給我們的正則加上ig,這兩個flag：

let reg = /(go)+/ig;
'go is g gogo'.match(reg); //["go", "gogo"]

在上面的例子里面(go)就形成了一個捕獲組（capturing group）。接下來看一個使用捕獲組的例子來加深對它的理解：

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //10
RegExp.$2; //25
RegExp.$2; //2017

在上面這個例子里，我們有三組括號，形成了三個捕獲組，正則表達式（在javaScript里就是我們的RegExp）會緩存捕獲組所匹配的串，以$n表示，n就代表這第幾個捕獲組。

假如現(xiàn)在我們有一個需求：把顯示格式為 10.25.2017 的時間改為 2017-10-25 格式。

我們知道String的replace()方法經常和正則表達式一起使用。在replace()方法里，我們可以直接使用捕獲組的結果：

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
let newString = originString.replace(reg, '$3-$1-$2');
console.log(newString);//"2017-10-25"

2: (?:) non capturing group 非捕獲型分組

有的時候我們可能只想匹配分組，但是并不想緩存（不想捕獲）匹配到的結果，就可以在我們的分組模式前面加上?:。例如上面的時間的例子，我們不想捕獲第一個分組的結果，就可以這么做：

let reg = /(?:\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //25
RegExp.$2; //2017
originString.match(reg);// ["10.25.2017", "25", "2017", index: 0, input: "10.25.2017", groups: undefined]

從上面的例子可以看出，我們的正則表達式依然是匹配的（test()的結果依然為true），但是RegExp.$1不是數(shù)字10，而是25，因為我們在第一個括號里加了?:，10就不會被捕獲。match()的執(zhí)行結果也會受?:的影響：match()的結果里不再有‘10'。

3: (?=) positive lookahead 正向前瞻型捕獲

有一個句子：1 apple costs 10€. 我們想要匹配€前面的價格（這里是一個數(shù)字），但是注意不能匹配到句子開頭的數(shù)字1。這種情況，就可以用到正向前瞻型捕獲：

let reg = /\d+(?=€)/g;
let reg1 = /\d+/g;
let str = '1 apple costs 10€';
str.match(reg); //["10"]
str.match(reg1); //["1", "10"]

上面的例子里面reg1就只需要匹配數(shù)字，對于數(shù)字后面跟什么并沒有要求，所以它能匹配到1，10。但是reg使用了前瞻型匹配，就只能匹配到10。
或許你已經能從上面的對比里了解到什么是正向前瞻型捕獲了，意思是:

/x(?=y)/ 匹配x, 但是必須在x的【后面】【是】y的情況下

4: (?!) negative lookahead 負向前瞻型捕獲

上面我們了解了什么是正向前瞻型匹配，從字面意思也能猜出來負向前瞻型捕獲就是:

/x(?!y)/ 匹配x, 但是必須在x的【后面】【不是】y的情況下

例如下面的例子，我們要匹配數(shù)字1，而不要€前面的2，就可以用到?!：

let reg = /\d+(?!€)/g;
let str = '1 apple costs 2€';
str.match(reg); ['1']

5: (?=) positive lookbehind 正向后顧型捕獲

后顧型和前瞻型正好相反，意思就是：

/(?=y)x/ 匹配x, 但是只在【前面】【有】y的情況下

來看一個例子：

let str = "1 turkey costs $2";
console.log( str.match(/(?=\$)\d+/g) ); //["2"]

這里的要求是前面有$的數(shù)字，所以這里匹配到了數(shù)字2，而沒有1.

6: (?!) negative lookbehind 負向后顧型捕獲

負向就是與正向相反，那么負向后顧型捕獲就是：

/(?=y)x/ 匹配x, 但是只在【前面】【沒有】y的情況下

來看一個例子：

let str = "1 turkey costs $2";
console.log( str.match(/(?!\$)\d+/g) ); //['1']

7: (?=), (?!), (?=), (?!)的捕獲

默認情況下上面的前瞻后顧4種都是默認不匹配捕獲組里面的內容的，也就是不匹配括號里的條件的。例如我們的正向前瞻/d+(?=€)/g，只會匹配到數(shù)字，并不會匹配到€。如果我們想要也匹配到€怎么辦呢？答案就是給€也包上一個括號：

let str = "1 turkey costs 2€";
let reg = /\d+(?=(€))/; 
str.match(reg); //["2", "€", index: 15, input: "1 turkey costs 2€", groups: undefined]

這樣就匹配到了數(shù)字2和它后面的€。

下面再來看看后顧型：

let str = "1 turkey costs $2";
let reg = /(?=(\$|£))\d+/;
console.log( str.match(reg) ); //["2", "$", index: 16, input: "1 turkey costs $2", groups: undefined]

需要特別注意到的一點是，對于后顧型，雖然條件在匹配項的前面，但是匹配出來的結果順序依然是條件在匹配項的后面。所以這里match()出來的結果是2在$的前面。

總結

以上所述是小編給大家介紹的正則表達式捕獲組,希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持！
如果你覺得本文對你有幫助，歡迎轉載，煩請注明出處，謝謝！

您可能感興趣的文章: