佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > linux 文本處理工具之一grep命令詳解

linux 文本處理工具之一grep命令詳解

熱門標簽:硅谷的囚徒呼叫中心 電話機器人搭建 美團 百度競價點擊價格的計算公式 家政服務(wù)網(wǎng)絡(luò) 服務(wù)器配置 解決方案 外呼系統(tǒng)

grep(Globel Search Regular Expression and Printing out the line)全面搜索正則表達式并把行打印出來)是一種強大的文本搜索工具,是一個對行進行操作的搜索工作,它能使用正則表達式搜索文本,并把匹配的行打印出來。Unix的grep家族包括grep、egrep和fgrep。 egrep表示擴展的grep,相比grep支持更多的元字符,"grep -E"相當(dāng)于egrep。fgrep是fast grep,不支持元字符,但是搜索速度更快。grep搜索的結(jié)果被送到屏幕,不影響原文件內(nèi)容。

1、grep的語法[]  (man grep查看grep的幫助文檔)

    grep    [options]    'pattern'     FILE
    命令      選項         模式        文件

grep不加引號直接過濾字符串;grep在進行模式匹配的時候必須加引號,單引和雙引號都可以;grep在引用變量的時候必須加雙引號

2、grep的選項[option]

  -r:遞歸的搜索
  -v:反向選取,只顯示不符合模式的行
  -o:只顯示被模式匹配到的字符串,而不是整個行
  -i:匹配時不區(qū)分大小寫
  -A #:顯示匹配到的行時,順便顯示后面的#行(#表示數(shù)值)
  -B #:前面的#行
  -C #:前后的#行
  -E:使用擴展的正則表達式

eg:grep選項的例子


復(fù)制代碼
代碼如下:

cat > eg1.text EOF
This is first
how are you
How old are you
fine,thanks
what,so what
What is your name
EOF
grep "you" eg1.text
grep -o "you" eg1.text
grep -v "you" eg1.text
grep -i "what" eg1.text
grep -A 1 "fine" eg1.text
grep -B 1 "fine" eg1.text
grep -C 1 "fine" eg1.text

以上代碼直接粘貼復(fù)制在linux上可直接運行,代碼解釋運行效果,如下



3、  正則表達式(man regex)是指一個用來描述或者匹配一系列符合某個句法規(guī)則的字符串的單個字符串,通常被用來檢索或替換那些符合某個
模式的文本內(nèi)容。正則表達式分為:基本正則表達式和擴展正則表達式。
  元字符就是指那些在正則表達式中具有特殊意義的專用字符。

grep支持基本正則表達式的元字符:

     ^:錨點行首的符合條件的內(nèi)容,用法格式"^pattern"
     $:錨點行首的符合條件的內(nèi)容,用法格式"pattern$"
    ^$:匹配空白行
     .:匹配任意單個字符
     *:匹配緊挨在前面的字符任意次(0,1,多次)
    .*:匹配任意長度的任意字符
    \?:匹配緊挨在前面的字符0次或1次
\{m,n\}:匹配其前面的字符至少m次,至多n次
\{m,\}:匹配其前面的字符至少m次
 \{m\}:精確匹配前面的m次
\{0,n\}:0到n次
     \:錨點詞首----相當(dāng)于\b,用法格式:\pattern
     \&;:錨點詞尾,用法格式:\&;pattern
\pattern\&;:單詞錨點
   \(\):分組,用法格式:\(pattern\),引用第一個小括號的分組\1,第二個是\2,以此類推
     []:匹配指定范圍內(nèi)的任意單個字符
    [^]:匹配指定范圍外的任意單個字符

eg:基本正則表達的例子

(1)、顯示/proc/meminfo文件中以不區(qū)分大小的s開頭的行;

grep "^[sS]" /proc/meminfo

(2)、顯示/etc/passwd中以nologin結(jié)尾的行;

grep "nologin$" /etc/passwd

(3)、顯示/etc/inittab中空格開頭的行;

grep "^$" /etc/inittab

(4)、顯示/etc/passwd中,以r開頭的字符而后跟了任意單個字符的行;

grep --color "^r." /etc/passwd

(5)、顯示/etc/passwd中,以r開頭后跟了o,o出現(xiàn)任意次的行;

grep --color "^ro*" /etc/passwd

(6)、顯示/etc/passwd文件中,r后跟了任意長度任意字符后跟了h的行;

grep --color "r.*h" /etc/passwd

(7)、顯示/etc/passwd中,r后跟了o,o出現(xiàn)0次或者1次的行;

grep --color "ro\?" /etc/passwd

(8)、顯示/etc/passwd中,r后跟了o,o出現(xiàn)至少1次至多2次的行;

grep --color "ro\{1,2\}" /etc/passwd

(9)、顯示/etc/passwd中,r后跟了o,o只出現(xiàn)2次的行;

grep --color "ro\{2\}" /etc/passwd

(10)、顯示/etc/passwd中,匹配root這個單詞的行;

grep --color "\root\&;" /etc/passwd

grep支持擴展表達式的元字符:支持所有基本正則表達式的元字符,有些和基本元字符在用法上不一樣,擴展正則表達式的命令egrep或者grep -E
?:匹配緊挨在前面的字符0次或1次
{m,n}:至少m次,至多n次
():分組
+:至少匹配前面的字符一次
a|b:匹配a或者b


eg:擴展正則表達式的例子

(1)、顯示/etc/passwd中,r開頭后跟了o,o出現(xiàn)0次或者1次的行;

egrep --color "ro?" /etc/passwd

(2)、顯示/etc/passwd中,r開頭后跟了o,o出現(xiàn)至少1次至多2次的行;

 egrep --color "ro{1,2}" /etc/passwd

(3)、顯示/etc/inittab文件中以一個數(shù)字開頭并以一個與開頭數(shù)字相同的數(shù)字結(jié)尾的;

 egrep --color "^([0-9]).*\1$"  /etc/inittab

(4)、顯示/etc/passwd中,r開頭后跟了o,o出現(xiàn)至少1次;


復(fù)制代碼
代碼如下:

egrep --color "ro+" /etc/passwd
grep -E --color "ro{1,}" /etc/passwd

(5)、顯示/etc/passwd中,匹配root或者halt的行;

 egrep --color "root|halt" /etc/passwd

(6)、顯示/var/log/secure文件中包含"LOGIN ON"或者"Failed passwd"的行;

egrep --color "(LOGIN ON|Failed passwd)" /var/log/secure

grep支持字符和字符集合
    \d:數(shù)字字符匹配。等效于 [0-9]。
    \s:匹配任何空白字符,包括空格、制表符、換頁符等。與 [ \f\n\r\t\v] 等效。
    \S:匹配任何非空白字符。與 [^ \f\n\r\t\v] 等效
    \w:匹配任何字類字符,包括下劃線。與“[A-Za-z0-9_]”等效。
    \W:與任何非單詞字符匹配。與“[^A-Za-z0-9_]”等效。
   [:digit:]:所有數(shù)字, 相當(dāng)于0-9 或者\d
   [:lower:]:所有的小寫字母
   [:upper:]:所有的大寫字母
   [:alpha:]:所有的字母
   [:alnum:]:相當(dāng)于[0-9a-zA-Z]
   [:space:]:空白字符 相當(dāng)于\s
   [:punct:]:所有標點符號

eg:支持字符集合的例子

(1)、顯示/etc/rc.d/rc.sysinit中以#開頭,且后面跟一個或多個空白字符,而后又跟了任意非空白字符的行;


復(fù)制代碼
代碼如下:

grep "^#[[:space:]]\{1,\}[^[:space:]]" /etc/rc.d/rc.sysinit
grep -E "^#\s{1,}\S" /etc/rc.d/rc.sysinit

(2)、顯示/etc/inittab中包含了:一個數(shù)字:(即兩個冒號中間一個數(shù)字)的行;


復(fù)制代碼
代碼如下:

grep --color ":[[:digit:]]:" /etc/inittab
grep --color ":\d:" /etc/inittab

經(jīng)典的例子

(1)、分組的例子


復(fù)制代碼
代碼如下:

cat > test.txt EOF
He like his liker
He love his lover
She love her lover
She like her lover
EOF
grep "l..e.*l..er" test.txt
grep "\(l..e\).*\1r" test.txt





(2)、匹配1-255的數(shù)字


復(fù)制代碼
代碼如下:

cat > num.txt EOF
12
234
255
256
EOF
grep --color -E "\([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\&;" num.txt




(3)、匹配ABC類IP地址即 1.0.0.1---223.255.255.254


復(fù)制代碼
代碼如下:

cat > ip.txt EOF
1.0.0.254
1.0.0.255
1.2.3.4
223.255.255.254
224.255.255.252
2.255.255.255
EOF
grep -E --color "\([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-1][0-9]|22[0-3])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\&;" ip.txt





(4)、匹配Email地址:任意長度數(shù)字字母@任意長度數(shù)字字母.(com|org|net等等)


復(fù)制代碼
代碼如下:

cat > email.txt EOF
5678967@qq.com
jie231@sina.cn
ken_tom@netcom.org
jerry#li@baidu.net
li@souhu.net
EOF
grep -E --color "^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$" email.txt




(5)、匹配手機號碼:手機號碼是1[3|4|5|8]后面接9位數(shù)字的


復(fù)制代碼
代碼如下:

cat > tel.txt EOF
13690876890
12589098379
15608764083
15820974619
138074082711
18618203761
19209783900
1329873909
EOF
grep --color -E "\1[3|4|5|8][0-9]{9}\&;" tel.txt




本文出自 “技術(shù)之路---桀” 博客

標簽:南昌 邢臺 撫州 北海 韶關(guān) 防城港 臨沂 烏蘭察布

巨人網(wǎng)絡(luò)通訊聲明:本文標題《linux 文本處理工具之一grep命令詳解》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    崇义县| 乐山市| 会宁县| 通化县| 收藏| 裕民县| 柘荣县| 卢龙县| 山西省| 营山县| 宝山区| 依安县| 漠河县| 淳化县| 九寨沟县| 宁强县| 襄汾县| 房产| 双峰县| 高陵县| 邹城市| 武邑县| 高要市| 应城市| 微博| 富顺县| 西充县| 隆安县| 苏尼特左旗| 邵阳市| 弥勒县| 康平县| 台中县| 临湘市| 巴南区| 林西县| 定结县| 池州市| 河北区| 木兰县| 济阳县|