站長資訊網
        最全最豐富的資訊網站

        使用Linux正則表達式靈活搜索文件中的文本

         正則表達式是一種符號表示法,用于識別文本模式。Linux處理正則表達式的主要程序是grep。grep搜索與正則表達式匹配的行,并將結果輸送至標準輸出。

        1. grep匹配模式

        grep按下述方式接受選項和參數(其中,regex表示正則表達式)

        復制代碼 代碼如下:
        grep [options] regex [files]

        其中options主要為下表:

         

        選項 含義 功能描述
        -i ignore case 忽略大小寫
        -v invert match 不匹配匹配的
        -l file-with-match 輸出匹配的文件名
        -L file-without-match 輸出不匹配的文件名
        -c count 輸出匹配的數目(行數)
        -n number 輸出匹配行的同時在前面加上文件名及在文件名中的行數
        -h no-filename 抑制文件名的輸出

         作為一個Linux管理員,您需要對文本文件進行處理。您可以使用不同的工具如grep、awk以及sed去查找包含特定文本串的文件。這里,我將介紹一種使用正則表達式,以靈活的方式,去搜索文件中的文本的方法。

          讓我們考慮一個正則表達式發揮作用的例子。比如,當你嘗試使用命令grep Cr host /時,其返回的結果會很龐大。因為每一個包含host這個文本串的字(像ghostscript這樣的字)都會匹配。采用正則表達式,你可以更好地定制你要查找什么。例如,你可以使用正則表達式’^host’,告訴grep僅僅查找以host開始的行。

          正則表達式并不是在所有命令中都可用,您使用的命令必須已經事先編好程序,以便能夠使用正則表達式。這些命令中最普遍使用的命令是grep、tr以及vi。其它的工具,像sed和awk,也可以使用正則表達式。

          使用正則表達式的一個例子為:

        復制代碼 代碼如下:
        grep ‘lin.x’ *

          正則表達式’lin.x’中的點有特殊的含義。它會匹配處于該位置的任意字符。為了防止解釋性的問題,我建議您總是將正則表達式置于單引號間,這樣就可以防止shell對正則表達式進行解釋。

          使用正則表達式

          您可以使用正則表達式做很多事情。在以下的列表中,您可以找到一些最普通、最常用的正則表達式的例子。

            * ^:表示文本串必須在一行的開頭。所以,當查找行的開頭只為“hosts”的行,可以使用命令:grep -ls ‘^hosts’
            * $:代表了一行的結尾。所以,當查找行的結尾只為“hosts”的行,可以使用命令:grep -ls ‘hosts$’
            *   你可以在一個正則表達式中結合^和$,去查找僅僅包含”yes”的行,使用的命令為grep -ls ‘^yes$’
            * .: 一個可以指代除了換行符以外任意字符的通配符。為了查找包含tex、tux、tox或者tix的行,可以使用:grep -ls ‘t.x’
            * [ ]:表示在一個正則表達式中,方括號之間的字符是可選的。為了查找名字為pinda或者linda的用戶,可以使用命令:grep -ls ‘[pl]inda’
            * [^ ]:忽略掉方括號中^之后的所有字符。為了查找包含文本linda的行,并忽略掉其中僅包含linda或者pinda的行,命令為:grep -ls ‘[^pl]inda’
            * -:代表一類或者一個范圍內的字符。在像tr這樣的命令中,這是非常有用的。以下的命令可以將所有的小寫字母轉為大寫字母:tr a-z A-Z < mytext。同樣地,你可以使用正則表達式grep -ls ‘^0-9’去查找其中有一些行是以數字開頭的文件。
            * < 和 >:查找一個字的開頭或者結尾的模式。查找行的開頭的字以”san”為起始的命令為: grep <SAN< code>。這些正則表達式有兩個缺點―他們并不查找以指定的正則表達式開頭的行,并且他們并不被所有的工具所支持。但是,vi和grep是支持這種用法的。
            * :確保在正則表達式中有特殊含義的字符不被解釋。查找以任何字符開始,后面跟著文本”host”的文本串的命令為grep -ls ‘.host’。而如果你需要查找以點為第一個字符,緊接著為”host”的文本串,可以用命令:grep -ls ‘.host’

          這些正則表達式可以幫助您找到包含特定文本串的字。您也可以使用正則表達式去指定,在一個字中,該字符串出現的頻率。比如,您可以使用正則表達式去搜索剛好包含用戶名”linda”三次的文件。為了達到這一目的,您需要使用正則表達式的重復算子,并保證整個正則表達式位于引號中。沒有引號的話,您可能會導致shell去解釋您的重復算子。

          最重要的重復算子的列表如下:

            * *:表示前述的正則表達式可能出現一次、多次或者根本不出現。注意:不要和shell中的*混淆―在shell中,*表示任意字符,而在正則表達式中,*表示之前的正則表達式可能存在。
            * ?:表示在該位置可能是一個字符(但并不是必須是)。例如,同時查找color和colour的命令為:grep -ls ‘colo.r’
            * +:表示之前的字符或者正則表達式至少要出現一次
            * {n}:表示之前的字符或者正則表達式至少要出現n次。當你查找一個介于100到999之間的數字時,這是很有用的:grep -ls ‘0-9{3}’

          我們已經向您概述了正則表達式的使用方法。這可以讓您在做一個管理員時,更加地有效率。正則表達式可以提供更多的功能,包括一些相當復雜的操作。但在之前,請首先掌握我們已經介紹的這些技能。正則表達式可以非常復雜,以至于你會很容易迷失其中。

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 777国产盗摄偷窥精品0OOO| 国产精品午夜久久| 国产精品美女久久久网AV| 麻豆国产在线精品国偷产拍| 国产精品污WWW一区二区三区 | 精品亚洲欧美高清不卡高清| 亚洲国产精品VA在线观看麻豆| 久久精品国产亚洲5555| 国产亚洲精品一品区99热| 国产精品午睡沙发系列| 日韩精品无码一区二区三区不卡 | 国产成人精品久久一区二区三区| 亚洲精品午夜国产VA久久成人| 国产在线观看高清精品| 日本精品中文字幕| 国产精品久久久久jk制服| 亚洲国产成人精品无码区在线观看 | 精品国产国产综合精品| 欧美亚洲国产成人精品| 国产成人精品免费视| 99国产精品永久免费视频| 精品福利视频一区二区三区| 无码日韩精品一区二区三区免费| 日产国产精品亚洲系列| 国产午夜精品一区二区三区不卡| 3级黄性日本午夜精品| 精品免费视在线观看| 91麻豆精品国产自产在线观看一区 | 国产成人精品综合网站| 国产麻豆精品一区二区三区v视界| 在线精品自拍无码| 亚洲欧美国产精品第1页| 亚洲国产成人精品女人久久久 | 国产乱码精品一区二区三| 国产福利精品在线观看| 99热这里只有精品6国产免费| 中文字幕一区二区精品区| 成人午夜精品久久久久久久小说| 成人一区二区三区精品| 精品成人一区二区三区四区| 久久精品女人天堂AV麻|