佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > 使用Linux正則表達(dá)式靈活搜索文件中的文本

使用Linux正則表達(dá)式靈活搜索文件中的文本

熱門標(biāo)簽:服務(wù)器配置 電子圍欄 銀行業(yè)務(wù) 科大訊飛語音識別系統(tǒng) Mysql連接數(shù)設(shè)置 阿里云 團(tuán)購網(wǎng)站 Linux服務(wù)器

 正則表達(dá)式是一種符號表示法,用于識別文本模式。Linux處理正則表達(dá)式的主要程序是grep。grep搜索與正則表達(dá)式匹配的行,并將結(jié)果輸送至標(biāo)準(zhǔn)輸出。

1. grep匹配模式

grep按下述方式接受選項和參數(shù)(其中,regex表示正則表達(dá)式)

復(fù)制代碼 代碼如下:

grep [options] regex [files]

其中options主要為下表:

 

選項 含義 功能描述
-i ignore case 忽略大小寫
-v invert match 不匹配匹配的
-l file-with-match 輸出匹配的文件名
-L file-without-match 輸出不匹配的文件名
-c count 輸出匹配的數(shù)目(行數(shù))
-n number 輸出匹配行的同時在前面加上文件名及在文件名中的行數(shù)
-h no-filename 抑制文件名的輸出

 作為一個Linux管理員,您需要對文本文件進(jìn)行處理。您可以使用不同的工具如grep、awk以及sed去查找包含特定文本串的文件。這里,我將介紹一種使用正則表達(dá)式,以靈活的方式,去搜索文件中的文本的方法。

  讓我們考慮一個正則表達(dá)式發(fā)揮作用的例子。比如,當(dāng)你嘗試使用命令grep –r host /時,其返回的結(jié)果會很龐大。因為每一個包含host這個文本串的字(像ghostscript這樣的字)都會匹配。采用正則表達(dá)式,你可以更好地定制你要查找什么。例如,你可以使用正則表達(dá)式'^host',告訴grep僅僅查找以host開始的行。

  正則表達(dá)式并不是在所有命令中都可用,您使用的命令必須已經(jīng)事先編好程序,以便能夠使用正則表達(dá)式。這些命令中最普遍使用的命令是grep、tr以及vi。其它的工具,像sed和awk,也可以使用正則表達(dá)式。

  使用正則表達(dá)式的一個例子為:

復(fù)制代碼 代碼如下:

grep 'lin.x' *

  正則表達(dá)式'lin.x'中的點有特殊的含義。它會匹配處于該位置的任意字符。為了防止解釋性的問題,我建議您總是將正則表達(dá)式置于單引號間,這樣就可以防止shell對正則表達(dá)式進(jìn)行解釋。

  使用正則表達(dá)式

  您可以使用正則表達(dá)式做很多事情。在以下的列表中,您可以找到一些最普通、最常用的正則表達(dá)式的例子。

    * ^:表示文本串必須在一行的開頭。所以,當(dāng)查找行的開頭只為“hosts”的行,可以使用命令:grep -ls '^hosts'
    * $:代表了一行的結(jié)尾。所以,當(dāng)查找行的結(jié)尾只為“hosts”的行,可以使用命令:grep -ls 'hosts$'
    *   你可以在一個正則表達(dá)式中結(jié)合^和$,去查找僅僅包含"yes"的行,使用的命令為grep -ls '^yes$'
    * .: 一個可以指代除了換行符以外任意字符的通配符。為了查找包含tex、tux、tox或者tix的行,可以使用:grep -ls 't.x'
    * [ ]:表示在一個正則表達(dá)式中,方括號之間的字符是可選的。為了查找名字為pinda或者linda的用戶,可以使用命令:grep -ls '[pl]inda'
    * [^ ]:忽略掉方括號中^之后的所有字符。為了查找包含文本linda的行,并忽略掉其中僅包含linda或者pinda的行,命令為:grep -ls '[^pl]inda'
    * -:代表一類或者一個范圍內(nèi)的字符。在像tr這樣的命令中,這是非常有用的。以下的命令可以將所有的小寫字母轉(zhuǎn)為大寫字母:tr a-z A-Z mytext。同樣地,你可以使用正則表達(dá)式grep -ls '^0-9'去查找其中有一些行是以數(shù)字開頭的文件。
    * \ 和 \&;:查找一個字的開頭或者結(jié)尾的模式。查找行的開頭的字以"san"為起始的命令為: grep \SAN code>。這些正則表達(dá)式有兩個缺點—他們并不查找以指定的正則表達(dá)式開頭的行,并且他們并不被所有的工具所支持。但是,vi和grep是支持這種用法的。
    * \:確保在正則表達(dá)式中有特殊含義的字符不被解釋。查找以任何字符開始,后面跟著文本"host"的文本串的命令為grep -ls '.host'。而如果你需要查找以點為第一個字符,緊接著為"host"的文本串,可以用命令:grep -ls '\.host'

  這些正則表達(dá)式可以幫助您找到包含特定文本串的字。您也可以使用正則表達(dá)式去指定,在一個字中,該字符串出現(xiàn)的頻率。比如,您可以使用正則表達(dá)式去搜索剛好包含用戶名"linda"三次的文件。為了達(dá)到這一目的,您需要使用正則表達(dá)式的重復(fù)算子,并保證整個正則表達(dá)式位于引號中。沒有引號的話,您可能會導(dǎo)致shell去解釋您的重復(fù)算子。

  最重要的重復(fù)算子的列表如下:

    * *:表示前述的正則表達(dá)式可能出現(xiàn)一次、多次或者根本不出現(xiàn)。注意:不要和shell中的*混淆—在shell中,*表示任意字符,而在正則表達(dá)式中,*表示之前的正則表達(dá)式可能存在。
    * ?:表示在該位置可能是一個字符(但并不是必須是)。例如,同時查找color和colour的命令為:grep -ls 'colo.r'
    * +:表示之前的字符或者正則表達(dá)式至少要出現(xiàn)一次
    * \{n\}:表示之前的字符或者正則表達(dá)式至少要出現(xiàn)n次。當(dāng)你查找一個介于100到999之間的數(shù)字時,這是很有用的:grep -ls '0-9\{3\}'

  我們已經(jīng)向您概述了正則表達(dá)式的使用方法。這可以讓您在做一個管理員時,更加地有效率。正則表達(dá)式可以提供更多的功能,包括一些相當(dāng)復(fù)雜的操作。但在之前,請首先掌握我們已經(jīng)介紹的這些技能。正則表達(dá)式可以非常復(fù)雜,以至于你會很容易迷失其中。

您可能感興趣的文章:
  • 一天一個shell命令 linux文本內(nèi)容操作系列-awk命令詳解
  • 一天一個shell命令 linux文本內(nèi)容操作系列-cut命令詳解
  • 一天一個shell命令 linux文本操作系列-touch命令用法
  • 一天一個shell命令 linux文本操作系列-head,tail命令詳解
  • 一天一個shell命令 linux文本操作系列-diff命令詳解
  • 一天一個shell命令 linux文本內(nèi)容操作系列-grep命令詳解
  • Linux使用文本編輯器vi常用命令
  • 詳解Linux文本文件與WIN文本文件換行格式轉(zhuǎn)換命令
  • 一天一個shell命令 linux文本操作系列-wc命令詳解
  • Linux中查看文本的小技巧(超實用!)

標(biāo)簽:棗莊 大理 江蘇 蚌埠 衡水 廣元 衢州 萍鄉(xiāng)

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《使用Linux正則表達(dá)式靈活搜索文件中的文本》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    常熟市| 丰宁| 福清市| 云林县| 靖边县| 内江市| 磐石市| 昭通市| 双牌县| 望都县| 道孚县| 平顺县| 北碚区| 克东县| 自贡市| 花莲市| 安徽省| 山丹县| 郁南县| 大足县| 荃湾区| 怀来县| 全椒县| 七台河市| 瑞金市| 南安市| 哈尔滨市| 杭州市| 嘉义县| 永年县| 南宫市| 南丹县| 资溪县| 崇明县| 馆陶县| 建宁县| 米泉市| 东阿县| 沾益县| 万宁市| 中卫市|