佳木斯湛栽影视文化发展公司

主頁 > 知識(shí)庫 > linux學(xué)習(xí)日記九 正則表達(dá)式介紹

linux學(xué)習(xí)日記九 正則表達(dá)式介紹

熱門標(biāo)簽:家政服務(wù)網(wǎng)絡(luò) 美團(tuán) 外呼系統(tǒng) 百度競價(jià)點(diǎn)擊價(jià)格的計(jì)算公式 硅谷的囚徒呼叫中心 服務(wù)器配置 電話機(jī)器人搭建 解決方案

正則表達(dá)式就是處理字符串的方法,它以行為單位來進(jìn)行字符串的處理行為,正則表達(dá)式通過一些特殊符號(hào)的輔助,可以讓用戶輕易達(dá)到查找、刪除、替換某特定字符串的處理程序。

正則表達(dá)式基本上就是一種“表示法”,只要工具程序支持這種表示法,那么該工具程序就可以利用正則表達(dá)式處理字符串。例如vi,grep,awk,sed等。

正則表達(dá)式和之前的bash通配符是兩個(gè)完全不同的東西,兩者毫無關(guān)系,這個(gè)要注意下。

# grep [-A]  [-B]  [--color=auto] ‘string’  filename

-A:后面加數(shù)字,為after的意思,除了列出該行,后續(xù)的n行也列出

-B:before的意思,不解釋

# dmesg | grep -n -A3 -B2 –color=auto ‘eth’ == 內(nèi)核信息

====幾個(gè)基本的正則式特殊符號(hào)====

特殊符號(hào) 代表意義
[:alnum:] 代表英文大小寫字符以及數(shù)字,亦即 0-9, A-Z, a-z
[:alpha:] 代表任何英文大小寫字符,亦即 A-Z, a-z
[:blank:] 代表空白鍵與 [Tab] 按鍵兩者
[:cntrl:] 代表鍵盤上面的控制按鍵,亦即包括 CR, LF, Tab, Del.. 等等
[:digit:] 代表數(shù)字而已,亦即 0-9
[:graph:] 除了空白字元 (空白鍵與 [Tab] 按鍵) 外的其他所有按鍵
[:lower:] 代表小寫字元,亦即 a-z
[:print:] 代表任何可以被列印出來的字元
[:punct:] 代表標(biāo)點(diǎn)符號(hào) (punctuation symbol),亦即:” ‘ ? ! ; : # $…
[:upper:] 代表大寫字元,亦即 A-Z
[:space:] 任何會(huì)產(chǎn)生空白的字元,包括空白鍵, [Tab], CR 等等
[:xdigit:] 代表 16 進(jìn)制的數(shù)字類型,因此包括: 0-9, A-F, a-f 的數(shù)字與字符

====基礎(chǔ)正則式====

RE 字符 意義與范例
^word 意義:待搜尋的字串(word)在行首!
范例:搜尋行首為 # 開始的那一行,并列出行號(hào)

grep -n ‘^#’ regular_express.txt

word$ 意義:待搜尋的字串(word)在行尾!
范例:將行尾為 ! 的那一行列印出來,并列出行號(hào)

grep -n ‘!$’ regular_express.txt

. 意義:代表『一定有一個(gè)任意字元』的字符!
范例:搜尋的字串可以是 (eve) (eae) (eee) (e e), 但不能僅有 (ee) !亦即 e 與 e 中間『一定』僅有一個(gè)字元,而空白字元也是字元!

grep -n ‘e.e’ regular_express.txt

\ 意義:跳脫字符,將特殊字符的特殊意義去除!
范例:搜尋含有單引號(hào) ‘ 的那一行!

grep -n \&; regular_express.txt

* 意義:重復(fù)零個(gè)到無窮個(gè)的前一個(gè)字符
范例:找出含有 (es) (ess) (esss) 等等的字串,注意,因?yàn)?* 可以是 0 個(gè),所以 es 也是符合的。另外,因?yàn)?* 為重復(fù)『前一個(gè)字符』的符號(hào), 因此,在 * 之前必須要緊接著一個(gè)字符喔!例如任意字元?jiǎng)t為 『.*』 !

grep -n ‘ess*’ regular_express.txt

[list] 意義:字元集合的 RE 字符,裡面列出想要擷取的字元!
范例:搜尋含有 (gl) 或 (gd) 的那一行,需要特別留意的是,在 [] 當(dāng)中『謹(jǐn)代表一個(gè)待搜尋的字元』, 例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思!

grep -n ‘g[ld]‘ regular_express.txt

[n1-n2] 意義:字元集合里,列出想要擷取的字元范圍!
范例:搜尋含有任意數(shù)字的那一行!需特別留意,在字元集合 [] 中的減號(hào) – 是有特殊意義的,他代表兩個(gè)字元之間的所有連續(xù)字元!但這個(gè)連續(xù)與否與 ASCII 編碼有關(guān),因此,你的編碼需要設(shè)定正確(在 bash當(dāng)中,需要確定 LANG與LANGUAGE 的變量是否正確!) 例如所有大寫字元?jiǎng)t為 [A-Z]

grep -n ‘[A-Z]‘ regular_express.txt

[^list] 意義:字元集合的 RE 字符,里面列出不要的字串或范圍!
范例:搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ,那個(gè) ^ 在 [] 內(nèi)時(shí),代表的意義是『反向選擇』的意思。 例如,我不要大寫字元,則為 [^A-Z]。但是,需要特別注意的是,如果以 grep -n [^A-Z] regular_express.txt 來搜尋,卻發(fā)現(xiàn)該文件內(nèi)的所有行都被列出,為什么?因?yàn)檫@個(gè) [^A-Z] 是『非大寫字元』的意思, 因?yàn)槊恳恍芯蟹谴髮懽衷?,例如第一行?“Open Source” 就有 p,e,n,o…. 等等的小寫字

grep -n ‘oo[^t]‘ regular_express.txt

\{n,m\} 意義:連續(xù) n 到 m 個(gè)的『前一個(gè) RE 字符』
意義:若為 \{n\} 則是連續(xù) n 個(gè)的前一個(gè) RE 字符,
意義:若是 \{n,\} 則是連續(xù) n 個(gè)以上的前一個(gè) RE 字符!
 

范例:在 g 與 g 之間有 2 個(gè)到 3 個(gè)的 o 存在的字串,亦即 (goog)(gooog)

grep -n ‘go\{2,3\}g’ regular_express.txt

====分析工具sed====

sed本身是一個(gè)管道命令,可以分析stdin數(shù)據(jù)

# sed [-nefr] [動(dòng)作]

-n:使用安靜模式(silent),在一般模式下,所有來自stdin數(shù)據(jù)都顯示出來,而-n后只顯示被sed特殊處理的那一行

-e:直接在命令行模式上進(jìn)行sed的動(dòng)作編輯

-f:直接將sed動(dòng)作寫在一個(gè)文件內(nèi),-f filename 則可以執(zhí)行filename內(nèi)的sed動(dòng)作

-r:sed的動(dòng)作支持的是擴(kuò)展型正則式語法(默認(rèn)是基礎(chǔ)型)

-i:直接修改讀取的文件內(nèi)容,而不是由屏幕輸出

動(dòng)作說明:[n1[,n2]] function

n1,n2:不見得存在,一般代表選擇進(jìn)行動(dòng)作的行數(shù),比如在10到20行間進(jìn)行,則”10,20 [動(dòng)作行為]‘

function的參數(shù):

a:新增,a的后面可以接字符串,而這些字符串會(huì)在新的一行出現(xiàn)(目前的下一行)

c:替換,c的后面接字符串,這些字符串可以替換n1,n2之間的行

d:刪除,后面不接任何參數(shù)

i:插入,i后面可接字符串,這些字符串會(huì)在新的一行出現(xiàn)(目前的上一行)

p:打印,也就是將某個(gè)選擇的數(shù)據(jù)打印出來。通常p會(huì)與參數(shù)sed -n 一起運(yùn)行

s:替換,就是直接進(jìn)行替換工作,通常這個(gè)s的動(dòng)作可以搭配正則式例如:1,29s/old/new/g就是

注:sed后面接的動(dòng)作,需要用兩個(gè)單引號(hào)”括住。

# nl /etc/passwd | sed ’2,5d’

# nl /etc/passwd | sed ’3,$d’

整行替換:

# nl /etc/passwd | sed ’2,5c No 2-5 number’

# nl /etc/passwd | sed -n ’5,7p’ 這個(gè)等價(jià)于 : head -n 7 | tail -n 5

sed的查找并替換,跟vim的很類似:

# sed ‘s/要被替換的字符串/新的字符串/g’

# nl /etc/passwd | sed ‘/^$/d’  ==刪除空白行

====擴(kuò)展正則式====

====好用的數(shù)據(jù)處理工具awk====

相比于sed常常作用于一整行的處理,awk則運(yùn)用于將一行分成數(shù)個(gè)字段來處理,適用于處理小型數(shù)據(jù)

# awk ‘條件類型1 {動(dòng)作1} 條件類型2 {動(dòng)作2} …’ filename

# awk -n 5 | awk ‘{print $t “\t” $3}’

awk處理流程:

1,讀入第一行,并將第一行的數(shù)據(jù)填入$0,$1,$2等變量中

2,依據(jù)條件類型限制,判斷是否需要進(jìn)行后面的動(dòng)作

3,做完所有的動(dòng)作與條件類型

4,若還有后續(xù)的行的數(shù)據(jù),則重復(fù)上面的1~3的步驟,直到所有的數(shù)據(jù)都讀完為止

awk的內(nèi)置變量為:

* NF :每一行($0)擁有的字段總數(shù)

* NR :目前awk所處理的是第幾行數(shù)據(jù)

* FS :目前的分隔符,默認(rèn)是空格鍵

# last -n 5 | awk ‘{print $1 “\t lines: ” NR “\t columns: ” NF}’

# cat /etc/passwd | awk ‘BEGIN {FS=”:”} $3 10 {print $1 “\t ” $3}’

====文件的比較命令diff====

# diff [-bBi] original_file new_file

-b:忽略一行中僅有多個(gè)空白的區(qū)別

-B:忽略空白行的區(qū)別

-i:忽略大小寫的不同

====補(bǔ)丁命令patch====

先用diff命令生成補(bǔ)丁文件:

# diff -Naur passwd.old passwd.new > paswd.patch

# patch -pN patch_file  ==更新

# patch -R -pN patch_file  == 還原

-p:后面的N表示取消基層目錄的意思

-R:代表還原,將新的文件還原成原本的舊的版本

再開始把舊文件升級(jí)到新版本:

# patch -p0 passwd.patch

把新版本還原:

# patch -R -p0 passwd.patch

打印命令pr….

============END===============

標(biāo)簽:臨沂 撫州 南昌 北海 烏蘭察布 韶關(guān) 邢臺(tái) 防城港

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《linux學(xué)習(xí)日記九 正則表達(dá)式介紹》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    沁阳市| 寻乌县| 陇西县| 穆棱市| 龙胜| 共和县| 西畴县| 明水县| 商都县| 宝兴县| 泰和县| 东辽县| 兴仁县| 东阿县| 云浮市| 寿光市| 油尖旺区| 三原县| 吴江市| 三台县| 嘉义市| 巫溪县| 邳州市| 玉门市| 印江| 广东省| 保定市| 兴山县| 探索| 江山市| 商水县| 绥江县| 晋州市| 奈曼旗| 双桥区| 滨州市| 腾冲县| 新郑市| 冀州市| 宽城| 阜新市|