佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > Perl的經(jīng)典用法分享

Perl的經(jīng)典用法分享

熱門標(biāo)簽:呼叫中心市場需求 電話運(yùn)營中心 Win7旗艦版 企業(yè)做大做強(qiáng) 語音系統(tǒng) 硅谷的囚徒呼叫中心 百度AI接口 客戶服務(wù)

用Open() 函數(shù)打開文件

打開文件的常用方法是:

復(fù)制代碼 代碼如下:

open(FH, " $filename")
    or die "Couldn't open $filename for reading: $!";

open() 函數(shù)通常帶有兩個(gè)參數(shù),第一個(gè)為文件句柄,用于指向打開的文件,第二個(gè)參數(shù)是文件名及模式(文件的打開模式)的混合體,如果文件被成功打開,open()函數(shù)返回true,否則為false。我們用“or”來測試該條件。
上述代碼中的模式由小于字符()來表示。如果文件不存在,open()將返回false。此時(shí),你可以讀文件句柄,但不可以寫。
大于字符表示寫。如果文件不存在,就會被創(chuàng)建。如果文件存在,文件被清除,以前的數(shù)據(jù)將會丟失。你可以寫入文件句柄,但不可以讀入。

復(fù)制代碼 代碼如下:

  # 如果文件不存在,就創(chuàng)建它
open(FH, "> $filename")
    or die "Couldn't open $filename for writing: $!";

如果文件不存在,添加模式(用兩個(gè)大于符號表示)可以用來創(chuàng)建新文件,如果文件存在,該模式并不會清除原來的數(shù)據(jù)。
同“”或“讀”模式一樣,你只能對文件句柄進(jìn)行寫操作。 (所以的寫入內(nèi)容都添加到文件尾)。企圖進(jìn)行讀操作,會產(chǎn)生運(yùn)行錯(cuò)誤。

復(fù)制代碼 代碼如下:

open(FH, ">> $filename")
    or die "Couldn't open $filename for appending: $!";

通過“+”模式,你可以既可以讀文件,又可以寫文件。你可以通過tell() 函數(shù)在文件內(nèi)部移動(dòng),通過seek()函數(shù)進(jìn)行定位。如果文件不存在,就會被創(chuàng)建。如果文件已經(jīng)存在,原來的數(shù)據(jù)不會被清除。
如果你打算清除原來的文件內(nèi)容,或者自己調(diào)用truncate() 函數(shù),或者使用“+>”模式。

復(fù)制代碼 代碼如下:

open(FH, "+> $filename")
    or die "Couldn't open $filename for reading and writing: $!";

注意“+”和“+>”的區(qū)別,兩者都可以可讀可寫。前者為非破壞性寫,后者為破壞性寫。
錯(cuò)誤
錯(cuò)誤是如何出現(xiàn)的?很多地方都會出現(xiàn)錯(cuò)誤:如目錄不存在,文件不可寫入,你的程序丟失了文件句柄等等。
你應(yīng)該檢查系統(tǒng)調(diào)用的結(jié)果 (如open() 和sysopen()),看看是否調(diào)用成功。
為了幫助用戶查錯(cuò),通常使用“or die()”,你應(yīng)記住這些用法。首先,應(yīng)寫出系統(tǒng)調(diào)用失敗(“open”)的信息。其次,應(yīng)寫出文件名的信息,以便修正錯(cuò)誤時(shí)更容易地定位。第三,要寫出打開文件的方式, (“for writing,”“for appending”)。第四,輸出操作系統(tǒng)的出錯(cuò)信息(包含在$!中)。這樣,一旦出現(xiàn)文件不能打開的問題,使用你的程序的用戶會大體上知道為什么不能打開。有時(shí),我們把第一個(gè)和第三個(gè)合并在一起:
or die "unable to append to $filename: $!";

如果在open() 和出錯(cuò)信息中都寫了文件的全名,你會冒改變了open() 的風(fēng)險(xiǎn),使得出錯(cuò)信息不合時(shí)宜或不正確。

復(fù)制代碼 代碼如下:

  # 下面會出現(xiàn)虛假的出錯(cuò)信息
open(FH, "/var/run/file.pid")
    or die "Can't open /var/log/file.pod for writing : $!";

用 Sysopen()進(jìn)行更多的控制
 為了更好的控制文件的打開方式,可以使用 sysopen() 函數(shù):
 
復(fù)制代碼 代碼如下:

use Fcntl;
  sysopen(FH, $filename, O_RDWR|O_CREAT, 0666)
    or die "Can't open $filename for reading/writing/creating : $!";

函數(shù) sysopen() 帶有四個(gè)參數(shù),第一個(gè)是同open()函數(shù)類似的文件句柄參數(shù),第二個(gè)參數(shù)是不帶模式信息的文件名,第三個(gè)參數(shù)是模式參數(shù),由Fcntl 模塊提供的邏輯OR運(yùn)算組合起來的常數(shù)構(gòu)成,第四個(gè)參數(shù)(可選),為八進(jìn)制屬性值(0666表示數(shù)據(jù)文件, 0777表示程序)。如果文件可以被打開,sysopen() 返回true,如果打開失敗,則返回false。
不同于open()函數(shù),sysopen()不提供模式說明的簡寫方式,而是把一些常數(shù)組合起來,而且,每個(gè)模式常數(shù)有唯一的含義,只有通過邏輯OR運(yùn)算才能將它們組合起來,你可以設(shè)置多個(gè)行為的組合。
O_RDONLYRead-only
  O_WRONLY     Write-only
  O_RDWR Reading and writing
  O_APPEND Writes go to the end of the file
  O_TRUNC Truncate the file if it existed
  O_CREAT Create the file if it didn't exist
  O_EXCLError if the file already existed (used with O_CREAT)

當(dāng)你需要小心行事的時(shí)候,就使用sysopen() 函數(shù),例如,如果你打算添加內(nèi)容到文件中,如果文件不存在,不創(chuàng)建新文件,你可以這樣寫:
sysopen(LOG, "/var/log/myprog.log", O_APPEND, 0666)
or die "Can't open /var/log/myprog.log for appending: $!";

讀入單個(gè)記錄
有一個(gè)容易的方法讀入filehandles:用 FH> 操作符。在標(biāo)量內(nèi)容下,它返回文件中的下一個(gè)記錄,或者返回未定義出錯(cuò)信息。我們可以使用它來把一行讀入到一個(gè)變量中:
$line = FH>;
  die "Unexpected end-of-file" unless defined $line;
在循環(huán)語句中,我們可以這樣寫:

復(fù)制代碼 代碼如下:

  while (defined ($record = FH>)) {     # long-winded
    # $record is set to each record in the file, one at a time
  }

因?yàn)橐罅窟M(jìn)行這樣的工作,通常再進(jìn)行一下簡化,
把記錄放到$_ 中,而不是$record中:
復(fù)制代碼 代碼如下:

while (FH>) {
# $_ 每次為文件中的一個(gè)記錄
  }
  在Perl 5.004_04中,我們可以這樣做:
     while ($record = FH>) {
    # $record 每次為文件中的一個(gè)記錄
  }

defined() 將自動(dòng)加上,在Perl 5.004_04以前的版本中,該命令給出一個(gè)警示。要了解所用的Perl版本,可在命令行下打入:
 perl -v
一旦我們讀出了一個(gè)記錄,通常打算去掉記錄分隔符,(缺省值為換行符字符):
chomp($record);
Perl 4.0版本僅有chop()操作,去掉串的最后一個(gè)字符, 不管該字符是什么。chomp() 沒有這么大的破壞性,如果有行分隔符存在,它僅去掉行分隔符。如果你打算去掉行分隔符,就用chomp() 來代替chop()。
讀入多個(gè)記錄
如果你調(diào)用FH>,返回文件中剩余的記錄。如果你處于文件尾,則返回空表:
復(fù)制代碼 代碼如下:

@records = FH>;
  if (@records) {
    print "There were ", scalar(@records), " records read. ";
  } 

在下面的一步中,進(jìn)行賦值和測試兩項(xiàng)工作:
復(fù)制代碼 代碼如下:

if (@records = FH>) {
    print "There were ", scalar(@records), " records read. ";
  }

chomp() 也可適用對數(shù)組操作:
  @records = FH>;
  chomp(@records);
 對于任何表達(dá)式,都可以進(jìn)行chomp操作,故你可以在下面的一步中這樣寫:
 chomp(@records = FH>);

什么是記錄?
記錄的缺省定義為:“行”。
記錄的定義由$/ 變量控制的,該變量存放所輸入的記錄的分隔符,因?yàn)閾Q行符字符(根據(jù)定義!)是用來分隔行的,故其缺省值為串“ ”。
例如,你可以用任何你想要替換的符號來代替“ ”。
  $/ = ";";
  $record = FH>;  # 讀入下一個(gè)用分號分隔的記錄
$/可以取其它兩個(gè)有趣的值:空串("") 和undef。
讀入段落
$/ =""的寫法是用來指示Perl讀入段落的,段落是由兩個(gè)或兩個(gè)以上的換行符構(gòu)成的文本塊。這不同于設(shè)置為" ",后者僅讀入由兩行組成的文本塊。在這種情況下,將出現(xiàn)這樣一個(gè)問題:如果有連續(xù)的空行存在,例如“text ”,你既可以把它解釋為一個(gè)段落 ("text"),也可以解釋為兩個(gè)段落 ("text", 后面跟兩個(gè)換行符,以及一個(gè)空段落,后面跟兩個(gè)空行。)
在讀入文本時(shí),第二個(gè)解釋用途不大。如果你正在讀的段落出現(xiàn)上述情況,你不必過濾出“空”段落。

復(fù)制代碼 代碼如下:

$/ = " ";
  while (FH>) {
    chomp;
next unless length;     # 跳過空段
    # ...
  }

你可以把 $/設(shè)置為undef,它用于讀入后面跟著兩個(gè)或多個(gè)換行符組成的段落:  undef $/;
while (FH>) {
    chomp;
    # ...
  }

讀入整個(gè)文件
$/ 的其它有趣的值為undef。如果設(shè)置為該值,就將告訴Perl,讀命令將把文件的剩余部分作為一個(gè)串返回:

復(fù)制代碼 代碼如下:

undef $/;
  $file = FH>;

因?yàn)楦淖兞?$/的值,將會影響以后的每次讀操作,而不僅是下一個(gè)讀操作。通常,你需要將該操作限制在局部。通過下面的例子,可以把文件句柄的內(nèi)容讀入到一個(gè)串中:
復(fù)制代碼 代碼如下:

{
    local $/ = undef;
    $file = FH>;
  }

記?。篜erl變量可讀入很長的串。盡管你的文件大小不可以超出你的虛擬內(nèi)存容量的限度,你仍可以讀入盡可能多的數(shù)據(jù)。
用正則表達(dá)式對文件進(jìn)行操作
一旦你有個(gè)包含了整個(gè)串的變量,你可以使用正則表達(dá)式,對整個(gè)文件進(jìn)行操作,而不是對文件中的某個(gè)塊進(jìn)行操作。有兩個(gè)有用的正則表達(dá)式標(biāo)記/s和/m。一般,Perl的正則表達(dá)式對行進(jìn)行處理,你可以這樣寫:
復(fù)制代碼 代碼如下:

undef $/;
  $line = FH>;
  if ($line =~ /(b.*grass)$/) {
    print "found ";
  }

如果把我們的文件填入如下內(nèi)容:
  browngrass
  bluegrass
則輸出為:
found bluegrass
它沒有找到“browngrass”,這是因?yàn)? 僅在串尾尋找其匹配, (或者在串結(jié)束前的一行)。如果在包含很多行的串中,用"^" 和"$" 來匹配,, 我們可以使用 /m ("multiline") 選項(xiàng):
if ($line =~ /(b.*grass)$/m) {}
現(xiàn)在程序會把如下的信息輸出:
  found browngrass
類似地,句點(diǎn)可以匹配除了換行符之外的所有字符:
復(fù)制代碼 代碼如下:

while (FH>) {
    if (/19(.*)$/) {
      if ( 20) {
      $year = 2000+;
      } else {
      $year = 1900+;
      }
    }
  }

如果我們從文件中讀入“1981”,$_ 將包含“1981 ”。正則表達(dá)式中的句點(diǎn)匹配“8”和“1”, 而不匹配“ ”。這里正需要這樣做,因?yàn)閾Q行符不是日期的組成部分。
對于一個(gè)包含很多行的串,我們也許要提取其中的大的塊,這些塊可能會跨越行分隔符。在這種情況下,我們可以使用 /s 選項(xiàng),并用句點(diǎn)來匹配除了換行符以外的所有字符。
復(fù)制代碼 代碼如下:

if (ms) {
    print "Found bold text: ";
  }

此處,我用了{(lán)}來表示正則表達(dá)式的起始和結(jié)束,而不用斜杠,所以,我就可以告訴 Perl我正在匹配,起始字符為"m",結(jié)束字符為"s"。你可以把/s 和/m 選項(xiàng)組合使用:
復(fù)制代碼 代碼如下:

if (m{^FONT COLOR="red">(.*?)/FONT>}sm) {
    # ...
  }

總結(jié)
有兩種方法打開文件:open()函數(shù)的特點(diǎn)是快速簡捷,而sysopen()函數(shù)功能強(qiáng)大而復(fù)雜。通過 FH> 操作符,可以讀入一個(gè)記錄,$/ 變量可以讓你控制記錄是什么。如果你打算把很多行的內(nèi)容讀入到一個(gè)串中,不要使用忘記/s和/m 這兩個(gè)正則表達(dá)式標(biāo)記。

標(biāo)簽:濟(jì)南 長沙 山西 安康 喀什 山西 崇左 海南

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Perl的經(jīng)典用法分享》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    基隆市| 新和县| 防城港市| 巴东县| 富顺县| 绍兴县| 山西省| 宝坻区| 普定县| 华安县| 马尔康县| 什邡市| 灵璧县| 辉县市| 靖远县| 克东县| 三穗县| 专栏| 阿克苏市| 肇州县| 永修县| 通化县| 阳谷县| 理塘县| 湟源县| 高碑店市| 垦利县| 义乌市| 多伦县| 凤阳县| 都昌县| 三都| 拜城县| 益阳市| 高邮市| 汉阴县| 定襄县| 新乡县| 兰考县| 崇阳县| 田林县|