主頁 > 知識(shí)庫 > linux學(xué)習(xí)日記九正則表達(dá)式介紹

linux學(xué)習(xí)日記九正則表達(dá)式介紹

正則表達(dá)式就是處理字符串的方法，它以行為單位來進(jìn)行字符串的處理行為，正則表達(dá)式通過一些特殊符號(hào)的輔助，可以讓用戶輕易達(dá)到查找、刪除、替換某特定字符串的處理程序。

正則表達(dá)式基本上就是一種“表示法”，只要工具程序支持這種表示法，那么該工具程序就可以利用正則表達(dá)式處理字符串。例如vi，grep，awk，sed等。

正則表達(dá)式和之前的bash通配符是兩個(gè)完全不同的東西，兩者毫無關(guān)系，這個(gè)要注意下。

# grep [-A] [-B] [--color=auto] ‘string’ filename

-A：后面加數(shù)字，為after的意思，除了列出該行，后續(xù)的n行也列出

-B：before的意思，不解釋

# dmesg | grep -n -A3 -B2 –color=auto ‘eth’ == 內(nèi)核信息

====幾個(gè)基本的正則式特殊符號(hào)====

特殊符號(hào)	代表意義
[:alnum:]	代表英文大小寫字符以及數(shù)字，亦即 0-9, A-Z, a-z
[:alpha:]	代表任何英文大小寫字符，亦即 A-Z, a-z
[:blank:]	代表空白鍵與 [Tab] 按鍵兩者
[:cntrl:]	代表鍵盤上面的控制按鍵，亦即包括 CR, LF, Tab, Del.. 等等
[:digit:]	代表數(shù)字而已，亦即 0-9
[:graph:]	除了空白字元 (空白鍵與 [Tab] 按鍵) 外的其他所有按鍵
[:lower:]	代表小寫字元，亦即 a-z
[:print:]	代表任何可以被列印出來的字元
[:punct:]	代表標(biāo)點(diǎn)符號(hào) (punctuation symbol)，亦即：” ‘ ? ! ; : # $…
[:upper:]	代表大寫字元，亦即 A-Z
[:space:]	任何會(huì)產(chǎn)生空白的字元，包括空白鍵, [Tab], CR 等等
[:xdigit:]	代表 16 進(jìn)制的數(shù)字類型，因此包括： 0-9, A-F, a-f 的數(shù)字與字符

====基礎(chǔ)正則式====

RE 字符	意義與范例
^word	意義：待搜尋的字串(word)在行首！范例：搜尋行首為 # 開始的那一行，并列出行號(hào) grep -n ‘^#’ regular_express.txt
word$	意義：待搜尋的字串(word)在行尾！范例：將行尾為 ! 的那一行列印出來，并列出行號(hào) grep -n ‘!$’ regular_express.txt
.	意義：代表『一定有一個(gè)任意字元』的字符！范例：搜尋的字串可以是 (eve) (eae) (eee) (e e)，但不能僅有 (ee) ！亦即 e 與 e 中間『一定』僅有一個(gè)字元，而空白字元也是字元！ grep -n ‘e.e’ regular_express.txt
\	意義：跳脫字符，將特殊字符的特殊意義去除！范例：搜尋含有單引號(hào) ‘ 的那一行！ grep -n \&; regular_express.txt
*	意義：重復(fù)零個(gè)到無窮個(gè)的前一個(gè)字符范例：找出含有 (es) (ess) (esss) 等等的字串，注意，因?yàn)?* 可以是 0 個(gè)，所以 es 也是符合的。另外，因?yàn)?* 為重復(fù)『前一個(gè)字符』的符號(hào)，因此，在 * 之前必須要緊接著一個(gè)字符喔！例如任意字元?jiǎng)t為『.』！ grep -n ‘ess’ regular_express.txt
[list]	意義：字元集合的 RE 字符，裡面列出想要擷取的字元！范例：搜尋含有 (gl) 或 (gd) 的那一行，需要特別留意的是，在 [] 當(dāng)中『謹(jǐn)代表一個(gè)待搜尋的字元』，例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思！ grep -n ‘g[ld]‘ regular_express.txt
[n1-n2]	意義：字元集合里，列出想要擷取的字元范圍！范例：搜尋含有任意數(shù)字的那一行！需特別留意，在字元集合 [] 中的減號(hào) – 是有特殊意義的，他代表兩個(gè)字元之間的所有連續(xù)字元！但這個(gè)連續(xù)與否與 ASCII 編碼有關(guān)，因此，你的編碼需要設(shè)定正確(在 bash當(dāng)中，需要確定 LANG與LANGUAGE 的變量是否正確！) 例如所有大寫字元?jiǎng)t為 [A-Z] grep -n ‘[A-Z]‘ regular_express.txt
[^list]	意義：字元集合的 RE 字符，里面列出不要的字串或范圍！范例：搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ，那個(gè) ^ 在 [] 內(nèi)時(shí)，代表的意義是『反向選擇』的意思。例如，我不要大寫字元，則為 [^A-Z]。但是，需要特別注意的是，如果以 grep -n [^A-Z] regular_express.txt 來搜尋，卻發(fā)現(xiàn)該文件內(nèi)的所有行都被列出，為什么？因?yàn)檫@個(gè) [^A-Z] 是『非大寫字元』的意思，因?yàn)槊恳恍芯蟹谴髮懽衷?，例如第一行?“Open Source” 就有 p,e,n,o…. 等等的小寫字 grep -n ‘oo[^t]‘ regular_express.txt
\{n,m\}	意義：連續(xù) n 到 m 個(gè)的『前一個(gè) RE 字符』意義：若為 \{n\} 則是連續(xù) n 個(gè)的前一個(gè) RE 字符，意義：若是 \{n,\} 則是連續(xù) n 個(gè)以上的前一個(gè) RE 字符！范例：在 g 與 g 之間有 2 個(gè)到 3 個(gè)的 o 存在的字串，亦即 (goog)(gooog) grep -n ‘go\{2,3\}g’ regular_express.txt

====分析工具sed====

sed本身是一個(gè)管道命令，可以分析stdin數(shù)據(jù)

# sed [-nefr] [動(dòng)作]

-n：使用安靜模式（silent），在一般模式下，所有來自stdin數(shù)據(jù)都顯示出來，而-n后只顯示被sed特殊處理的那一行

-e：直接在命令行模式上進(jìn)行sed的動(dòng)作編輯

-f：直接將sed動(dòng)作寫在一個(gè)文件內(nèi)，-f filename 則可以執(zhí)行filename內(nèi)的sed動(dòng)作

-r：sed的動(dòng)作支持的是擴(kuò)展型正則式語法（默認(rèn)是基礎(chǔ)型）

-i：直接修改讀取的文件內(nèi)容，而不是由屏幕輸出

動(dòng)作說明：[n1[,n2]] function

n1,n2：不見得存在，一般代表選擇進(jìn)行動(dòng)作的行數(shù)，比如在10到20行間進(jìn)行，則”10,20 [動(dòng)作行為]‘

function的參數(shù)：

a：新增，a的后面可以接字符串，而這些字符串會(huì)在新的一行出現(xiàn)（目前的下一行）

c：替換，c的后面接字符串，這些字符串可以替換n1,n2之間的行

d：刪除，后面不接任何參數(shù)

i：插入，i后面可接字符串，這些字符串會(huì)在新的一行出現(xiàn)（目前的上一行）

p：打印，也就是將某個(gè)選擇的數(shù)據(jù)打印出來。通常p會(huì)與參數(shù)sed -n 一起運(yùn)行

s：替換，就是直接進(jìn)行替換工作，通常這個(gè)s的動(dòng)作可以搭配正則式例如：1,29s/old/new/g就是

注：sed后面接的動(dòng)作，需要用兩個(gè)單引號(hào)”括住。

# nl /etc/passwd | sed ’2,5d’

# nl /etc/passwd | sed ’3,$d’

整行替換：

# nl /etc/passwd | sed ’2,5c No 2-5 number’

# nl /etc/passwd | sed -n ’5,7p’ 這個(gè)等價(jià)于： head -n 7 | tail -n 5

sed的查找并替換，跟vim的很類似：

# sed ‘s/要被替換的字符串/新的字符串/g’

# nl /etc/passwd | sed ‘/^$/d’ ==刪除空白行

====擴(kuò)展正則式====

====好用的數(shù)據(jù)處理工具awk====

相比于sed常常作用于一整行的處理，awk則運(yùn)用于將一行分成數(shù)個(gè)字段來處理，適用于處理小型數(shù)據(jù)

# awk ‘條件類型1 {動(dòng)作1} 條件類型2 {動(dòng)作2} …’ filename

# awk -n 5 | awk ‘{print $t “\t” $3}’

awk處理流程：

1，讀入第一行，并將第一行的數(shù)據(jù)填入$0，$1，$2等變量中

2，依據(jù)條件類型限制，判斷是否需要進(jìn)行后面的動(dòng)作

3，做完所有的動(dòng)作與條件類型

4，若還有后續(xù)的行的數(shù)據(jù)，則重復(fù)上面的1~3的步驟，直到所有的數(shù)據(jù)都讀完為止

awk的內(nèi)置變量為：

* NF ：每一行（$0）擁有的字段總數(shù)

* NR ：目前awk所處理的是第幾行數(shù)據(jù)

* FS ：目前的分隔符，默認(rèn)是空格鍵

# last -n 5 | awk ‘{print $1 “\t lines: ” NR “\t columns: ” NF}’

# cat /etc/passwd | awk ‘BEGIN {FS=”:”} $3 10 {print $1 “\t ” $3}’

====文件的比較命令diff====

# diff [-bBi] original_file new_file

-b：忽略一行中僅有多個(gè)空白的區(qū)別

-B：忽略空白行的區(qū)別

-i：忽略大小寫的不同

====補(bǔ)丁命令patch====

先用diff命令生成補(bǔ)丁文件：

# diff -Naur passwd.old passwd.new > paswd.patch

# patch -pN patch_file ==更新

# patch -R -pN patch_file == 還原

-p：后面的N表示取消基層目錄的意思

-R：代表還原，將新的文件還原成原本的舊的版本

再開始把舊文件升級(jí)到新版本：

# patch -p0 passwd.patch

把新版本還原：

# patch -R -p0 passwd.patch

打印命令pr….

============END===============

標(biāo)簽：臨沂撫州南昌北海烏蘭察布韶關(guān) 邢臺(tái) 防城港

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《linux學(xué)習(xí)日記九正則表達(dá)式介紹》，本文關(guān)鍵詞；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。

相關(guān)文章

電銷話術(shù)陌拜開場白

陌拜怎么入手話術(shù)內(nèi)容怎么說你首先要學(xué)會(huì)一種新的思維方式：站在對方的角度考慮問題。比如你現(xiàn)在要得到更多的...

10-25

電話銷售技巧和話術(shù)的八個(gè)絕招

電話銷售已經(jīng)成為了現(xiàn)代比較流行的銷售方式，拿起電話每個(gè)人都會(huì)，但是如何通過電話與對方良好的溝通，并達(dá)成...

10-25

打電話機(jī)器人軟件有哪些功能？

電話呼叫系統(tǒng)打電話機(jī)器人軟件這些功能如下：批量導(dǎo)入列表、自動(dòng)呼叫代理、自動(dòng)呼叫、全面召回、營銷流程管理...

10-25

智能電話機(jī)器人費(fèi)用多少？

智能電話銷售機(jī)器人通過真人聲音和用戶交流，它可以主動(dòng)分析客戶對話的語義并及時(shí)回復(fù)。顧客永遠(yuǎn)不會(huì)發(fā)現(xiàn)他們...

10-25

AI外呼機(jī)器人對企業(yè)發(fā)展的幫助

AI外呼機(jī)器人，大多數(shù)企業(yè)的效率都得到提高。舉例來說，在一家在線貸款公司，AI外呼機(jī)器人是用來收集借款者的貸...

10-25

電話機(jī)器人系統(tǒng)的優(yōu)勢

一、電銷行業(yè)痛點(diǎn)明顯，成為企業(yè)發(fā)展桎梏在電銷企業(yè)中，運(yùn)營成本占據(jù)了很大的資金比例，呼叫中心搭建和后期維...

10-25

智能電話系統(tǒng)可以使用在哪些行業(yè)

語音群呼系統(tǒng)操作簡單、安全可靠、實(shí)用性強(qiáng)，能普遍應(yīng)用于政府、電信、電力、水務(wù)、燃?xì)狻⒎康禺a(chǎn)、公安局、保...

10-25

電話機(jī)器人的銷售能力

在這個(gè)銷售型的社會(huì)中，大部分的企業(yè)都需要對其產(chǎn)品進(jìn)行銷售，市場需求造就了企業(yè)需要大量的銷售人員。隨著社...

10-25

如何提高電話機(jī)器人的工作效率

智能電話機(jī)器人這個(gè)行業(yè)，從最初的簡單交流到現(xiàn)在的智能交流，技術(shù)進(jìn)步，市場被認(rèn)可，員工也急劇增加。人工智...

10-25

智能電話機(jī)器人實(shí)用性

互聯(lián)網(wǎng)科技領(lǐng)域里，但凡新產(chǎn)品的出現(xiàn)往往都會(huì)引發(fā)輿論。而輿論可以捧起一個(gè)產(chǎn)品，也可以擊落一個(gè)新生事物。但...

10-25

電銷機(jī)器人到底如何運(yùn)作的？

很多人對電銷機(jī)器人到底如何運(yùn)作存在著巨大的好奇心，那么今天，小編就帶大家看一下機(jī)器人的運(yùn)作流程！電銷...

10-24

電話機(jī)器人的興起對電銷行業(yè)來說是“驚喜”還

隨著互聯(lián)網(wǎng) 大數(shù)據(jù) 的普及，許多電銷行業(yè)如雨后春筍般爭先恐后地冒出來。而今電銷行業(yè)的混亂，讓各位涉足電銷...

10-24

百應(yīng)電話機(jī)器人有哪些功能？百應(yīng)電話機(jī)器人好

百應(yīng) 智能電話機(jī)器人能夠協(xié)助企業(yè)進(jìn)行呼入接待、外呼回訪等服務(wù)場景，能夠經(jīng)過不斷的培訓(xùn)學(xué)習(xí)，逐步完善成專...

10-24

客服外呼系統(tǒng)都有哪些優(yōu)勢？

當(dāng)前呼叫中心電話系統(tǒng)被企業(yè)用于業(yè)務(wù) 電銷以及客戶服務(wù)，然而隨著企業(yè)需求不斷擴(kuò)大，原來傳統(tǒng)的自建呼叫中心...

10-24

電銷機(jī)器人效果怎么樣？智能電話機(jī)器人可行嗎

幾百數(shù)千年后，或許沒人會(huì)記得卡斯帕羅夫曾是世界第一的圍棋高手，但人們會(huì)記得，他敗給了電腦深藍(lán)。那雖算不...

10-24

推薦文章

win7開啟上帝模式的詳細(xì)使用教程

如何判斷專利侵權(quán)的損害賠償

如何提高商品詳情頁的轉(zhuǎn)化率(電商APP運(yùn)營)?

摩拜又走在行業(yè)前列智能治理文明用車共建行業(yè)新秩序

創(chuàng)意信息技術(shù)：專業(yè)的電信外包服務(wù)提供商

亞馬遜太蠻橫！曾迫使全食超市放棄其他競購方的報(bào)價(jià)

解讀ASP.NET密碼強(qiáng)度驗(yàn)證代碼實(shí)例分享

流量為王，俠客微信群控系統(tǒng)，開辟流量新玩法！

上一篇：linux學(xué)習(xí)日記八認(rèn)識(shí)與學(xué)習(xí)bash

下一篇：linux學(xué)習(xí)日記十學(xué)習(xí)shell script

一起分享吧

RE 字符	意義與范例
^word	意義：待搜尋的字串(word)在行首！范例：搜尋行首為 # 開始的那一行，并列出行號(hào) grep -n ‘^#’ regular_express.txt
word$	意義：待搜尋的字串(word)在行尾！范例：將行尾為 ! 的那一行列印出來，并列出行號(hào) grep -n ‘!$’ regular_express.txt
.	意義：代表『一定有一個(gè)任意字元』的字符！范例：搜尋的字串可以是 (eve) (eae) (eee) (e e)，但不能僅有 (ee) ！亦即 e 與 e 中間『一定』僅有一個(gè)字元，而空白字元也是字元！ grep -n ‘e.e’ regular_express.txt
\	意義：跳脫字符，將特殊字符的特殊意義去除！范例：搜尋含有單引號(hào) ‘ 的那一行！ grep -n \&; regular_express.txt
*	意義：重復(fù)零個(gè)到無窮個(gè)的前一個(gè)字符范例：找出含有 (es) (ess) (esss) 等等的字串，注意，因?yàn)?* 可以是 0 個(gè)，所以 es 也是符合的。另外，因?yàn)?* 為重復(fù)『前一個(gè)字符』的符號(hào)，因此，在 * 之前必須要緊接著一個(gè)字符喔！例如任意字元?jiǎng)t為『.』！ grep -n ‘ess’ regular_express.txt
[list]	意義：字元集合的 RE 字符，裡面列出想要擷取的字元！范例：搜尋含有 (gl) 或 (gd) 的那一行，需要特別留意的是，在 [] 當(dāng)中『謹(jǐn)代表一個(gè)待搜尋的字元』，例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思！ grep -n ‘g[ld]‘ regular_express.txt
[n1-n2]	意義：字元集合里，列出想要擷取的字元范圍！范例：搜尋含有任意數(shù)字的那一行！需特別留意，在字元集合 [] 中的減號(hào) – 是有特殊意義的，他代表兩個(gè)字元之間的所有連續(xù)字元！但這個(gè)連續(xù)與否與 ASCII 編碼有關(guān)，因此，你的編碼需要設(shè)定正確(在 bash當(dāng)中，需要確定 LANG與LANGUAGE 的變量是否正確！) 例如所有大寫字元?jiǎng)t為 [A-Z] grep -n ‘[A-Z]‘ regular_express.txt
[^list]	意義：字元集合的 RE 字符，里面列出不要的字串或范圍！范例：搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ，那個(gè) ^ 在 [] 內(nèi)時(shí)，代表的意義是『反向選擇』的意思。例如，我不要大寫字元，則為 [^A-Z]。但是，需要特別注意的是，如果以 grep -n [^A-Z] regular_express.txt 來搜尋，卻發(fā)現(xiàn)該文件內(nèi)的所有行都被列出，為什么？因?yàn)檫@個(gè) [^A-Z] 是『非大寫字元』的意思，因?yàn)槊恳恍芯蟹谴髮懽衷?，例如第一行?“Open Source” 就有 p,e,n,o…. 等等的小寫字 grep -n ‘oo[^t]‘ regular_express.txt
\{n,m\}	意義：連續(xù) n 到 m 個(gè)的『前一個(gè) RE 字符』意義：若為 \{n\} 則是連續(xù) n 個(gè)的前一個(gè) RE 字符，意義：若是 \{n,\} 則是連續(xù) n 個(gè)以上的前一個(gè) RE 字符！范例：在 g 與 g 之間有 2 個(gè)到 3 個(gè)的 o 存在的字串，亦即 (goog)(gooog) grep -n ‘go\{2,3\}g’ regular_express.txt

佳木斯湛栽影视文化发展公司

linux學(xué)習(xí)日記九正則表達(dá)式介紹

QQ咨詢

電話咨詢

佳木斯湛栽影视文化发展公司

linux學(xué)習(xí)日記九 正則表達(dá)式介紹

QQ咨詢

電話咨詢

linux學(xué)習(xí)日記九正則表達(dá)式介紹