主頁 > 知識庫 > Perl的經(jīng)典用法分享

Perl的經(jīng)典用法分享

用Open() 函數(shù)打開文件

打開文件的常用方法是:

復(fù)制代碼代碼如下:

open(FH, " $filename")
    or die "Couldn't open $filename for reading: $!"; 

open() 函數(shù)通常帶有兩個(gè)參數(shù)，第一個(gè)為文件句柄，用于指向打開的文件，第二個(gè)參數(shù)是文件名及模式(文件的打開模式)的混合體，如果文件被成功打開，open()函數(shù)返回true，否則為false。我們用“or”來測試該條件。
上述代碼中的模式由小于字符()來表示。如果文件不存在，open()將返回false。此時(shí)，你可以讀文件句柄，但不可以寫。
大于字符表示寫。如果文件不存在，就會被創(chuàng)建。如果文件存在，文件被清除，以前的數(shù)據(jù)將會丟失。你可以寫入文件句柄，但不可以讀入。

復(fù)制代碼代碼如下:

  # 如果文件不存在，就創(chuàng)建它
open(FH, "> $filename")
    or die "Couldn't open $filename for writing: $!"; 

如果文件不存在，添加模式(用兩個(gè)大于符號表示)可以用來創(chuàng)建新文件，如果文件存在，該模式并不會清除原來的數(shù)據(jù)。
同“”或“讀”模式一樣，你只能對文件句柄進(jìn)行寫操作。 (所以的寫入內(nèi)容都添加到文件尾)。企圖進(jìn)行讀操作，會產(chǎn)生運(yùn)行錯(cuò)誤。

復(fù)制代碼代碼如下:

open(FH, ">> $filename")
    or die "Couldn't open $filename for appending: $!"; 

通過“+”模式，你可以既可以讀文件，又可以寫文件。你可以通過tell() 函數(shù)在文件內(nèi)部移動(dòng)，通過seek()函數(shù)進(jìn)行定位。如果文件不存在，就會被創(chuàng)建。如果文件已經(jīng)存在，原來的數(shù)據(jù)不會被清除。
如果你打算清除原來的文件內(nèi)容，或者自己調(diào)用truncate() 函數(shù)，或者使用“+>”模式。

復(fù)制代碼代碼如下:

open(FH, "+> $filename")
    or die "Couldn't open $filename for reading and writing: $!";

注意“+”和“+>”的區(qū)別，兩者都可以可讀可寫。前者為非破壞性寫，后者為破壞性寫。
錯(cuò)誤
錯(cuò)誤是如何出現(xiàn)的？很多地方都會出現(xiàn)錯(cuò)誤：如目錄不存在，文件不可寫入，你的程序丟失了文件句柄等等。
你應(yīng)該檢查系統(tǒng)調(diào)用的結(jié)果 (如open() 和sysopen())，看看是否調(diào)用成功。
為了幫助用戶查錯(cuò)，通常使用“or die()”，你應(yīng)記住這些用法。首先，應(yīng)寫出系統(tǒng)調(diào)用失敗(“open”)的信息。其次，應(yīng)寫出文件名的信息，以便修正錯(cuò)誤時(shí)更容易地定位。第三，要寫出打開文件的方式， (“for writing,”“for appending”)。第四，輸出操作系統(tǒng)的出錯(cuò)信息(包含在$!中)。這樣，一旦出現(xiàn)文件不能打開的問題，使用你的程序的用戶會大體上知道為什么不能打開。有時(shí)，我們把第一個(gè)和第三個(gè)合并在一起：
or die "unable to append to $filename: $!";

如果在open() 和出錯(cuò)信息中都寫了文件的全名，你會冒改變了open() 的風(fēng)險(xiǎn)，使得出錯(cuò)信息不合時(shí)宜或不正確。

復(fù)制代碼代碼如下:

  # 下面會出現(xiàn)虛假的出錯(cuò)信息
open(FH, "/var/run/file.pid")
    or die "Can't open /var/log/file.pod for writing : $!"; 

用 Sysopen()進(jìn)行更多的控制
為了更好的控制文件的打開方式，可以使用 sysopen() 函數(shù)：

復(fù)制代碼代碼如下:

use Fcntl;
  sysopen(FH, $filename, O_RDWR|O_CREAT, 0666)
    or die "Can't open $filename for reading/writing/creating : $!"; 

函數(shù) sysopen() 帶有四個(gè)參數(shù)，第一個(gè)是同open()函數(shù)類似的文件句柄參數(shù)，第二個(gè)參數(shù)是不帶模式信息的文件名，第三個(gè)參數(shù)是模式參數(shù)，由Fcntl 模塊提供的邏輯OR運(yùn)算組合起來的常數(shù)構(gòu)成，第四個(gè)參數(shù)(可選)，為八進(jìn)制屬性值(0666表示數(shù)據(jù)文件， 0777表示程序)。如果文件可以被打開，sysopen() 返回true，如果打開失敗，則返回false。
不同于open()函數(shù)，sysopen()不提供模式說明的簡寫方式，而是把一些常數(shù)組合起來，而且，每個(gè)模式常數(shù)有唯一的含義，只有通過邏輯OR運(yùn)算才能將它們組合起來，你可以設(shè)置多個(gè)行為的組合。
O_RDONLYRead-only
O_WRONLY Write-only
O_RDWR Reading and writing
O_APPEND Writes go to the end of the file
O_TRUNC Truncate the file if it existed
O_CREAT Create the file if it didn't exist
O_EXCLError if the file already existed (used with O_CREAT)

當(dāng)你需要小心行事的時(shí)候，就使用sysopen() 函數(shù)，例如，如果你打算添加內(nèi)容到文件中，如果文件不存在，不創(chuàng)建新文件，你可以這樣寫：
sysopen(LOG, "/var/log/myprog.log", O_APPEND, 0666)
or die "Can't open /var/log/myprog.log for appending: $!";

讀入單個(gè)記錄
有一個(gè)容易的方法讀入filehandles：用 FH> 操作符。在標(biāo)量內(nèi)容下，它返回文件中的下一個(gè)記錄，或者返回未定義出錯(cuò)信息。我們可以使用它來把一行讀入到一個(gè)變量中：
$line = FH>;
die "Unexpected end-of-file" unless defined $line;
在循環(huán)語句中，我們可以這樣寫：

復(fù)制代碼代碼如下:

  while (defined ($record = FH>)) {     # long-winded
    # $record is set to each record in the file, one at a time
  } 

因?yàn)橐罅窟M(jìn)行這樣的工作，通常再進(jìn)行一下簡化，
把記錄放到$_ 中，而不是$record中：

復(fù)制代碼代碼如下:

while (FH>) {
# $_ 每次為文件中的一個(gè)記錄
  }
  在Perl 5.004_04中，我們可以這樣做：
     while ($record = FH>) {
    # $record 每次為文件中的一個(gè)記錄
  } 

defined() 將自動(dòng)加上，在Perl 5.004_04以前的版本中，該命令給出一個(gè)警示。要了解所用的Perl版本，可在命令行下打入：
perl -v
一旦我們讀出了一個(gè)記錄，通常打算去掉記錄分隔符，(缺省值為換行符字符)：
chomp($record);
Perl 4.0版本僅有chop()操作，去掉串的最后一個(gè)字符, 不管該字符是什么。chomp() 沒有這么大的破壞性，如果有行分隔符存在，它僅去掉行分隔符。如果你打算去掉行分隔符，就用chomp() 來代替chop()。
讀入多個(gè)記錄
如果你調(diào)用FH>，返回文件中剩余的記錄。如果你處于文件尾，則返回空表：

復(fù)制代碼代碼如下:

@records = FH>;
  if (@records) {
    print "There were ", scalar(@records), " records read. ";
  }  

在下面的一步中，進(jìn)行賦值和測試兩項(xiàng)工作：

復(fù)制代碼代碼如下:

if (@records = FH>) {
    print "There were ", scalar(@records), " records read. ";
  }

chomp() 也可適用對數(shù)組操作：
@records = FH>;
chomp(@records);
對于任何表達(dá)式，都可以進(jìn)行chomp操作，故你可以在下面的一步中這樣寫：
chomp(@records = FH>);

什么是記錄？
記錄的缺省定義為：“行”。
記錄的定義由$/ 變量控制的，該變量存放所輸入的記錄的分隔符，因?yàn)閾Q行符字符(根據(jù)定義！)是用來分隔行的，故其缺省值為串“ ”。
例如，你可以用任何你想要替換的符號來代替“ ”。
$/ = ";";
$record = FH>; # 讀入下一個(gè)用分號分隔的記錄
$/可以取其它兩個(gè)有趣的值：空串("") 和undef。
讀入段落
$/ =""的寫法是用來指示Perl讀入段落的，段落是由兩個(gè)或兩個(gè)以上的換行符構(gòu)成的文本塊。這不同于設(shè)置為" "，后者僅讀入由兩行組成的文本塊。在這種情況下，將出現(xiàn)這樣一個(gè)問題：如果有連續(xù)的空行存在，例如“text ”，你既可以把它解釋為一個(gè)段落 ("text")，也可以解釋為兩個(gè)段落 ("text", 后面跟兩個(gè)換行符，以及一個(gè)空段落，后面跟兩個(gè)空行。)
在讀入文本時(shí)，第二個(gè)解釋用途不大。如果你正在讀的段落出現(xiàn)上述情況，你不必過濾出“空”段落。

復(fù)制代碼代碼如下:

$/ = " ";
  while (FH>) {
    chomp;
next unless length;     # 跳過空段
    # ...
  } 

你可以把 $/設(shè)置為undef，它用于讀入后面跟著兩個(gè)或多個(gè)換行符組成的段落： undef $/;
while (FH>) {
chomp;
# ...
}

讀入整個(gè)文件
$/ 的其它有趣的值為undef。如果設(shè)置為該值，就將告訴Perl，讀命令將把文件的剩余部分作為一個(gè)串返回：

復(fù)制代碼代碼如下:

undef $/;
  $file = FH>; 

因?yàn)楦淖兞?$/的值，將會影響以后的每次讀操作，而不僅是下一個(gè)讀操作。通常，你需要將該操作限制在局部。通過下面的例子，可以把文件句柄的內(nèi)容讀入到一個(gè)串中：

復(fù)制代碼代碼如下:

{
    local $/ = undef;
    $file = FH>;
  } 

記?。篜erl變量可讀入很長的串。盡管你的文件大小不可以超出你的虛擬內(nèi)存容量的限度，你仍可以讀入盡可能多的數(shù)據(jù)。
用正則表達(dá)式對文件進(jìn)行操作
一旦你有個(gè)包含了整個(gè)串的變量，你可以使用正則表達(dá)式，對整個(gè)文件進(jìn)行操作，而不是對文件中的某個(gè)塊進(jìn)行操作。有兩個(gè)有用的正則表達(dá)式標(biāo)記/s和/m。一般，Perl的正則表達(dá)式對行進(jìn)行處理，你可以這樣寫：

復(fù)制代碼代碼如下:

undef $/;
  $line = FH>;
  if ($line =~ /(b.*grass)$/) {
    print "found ";
  } 

如果把我們的文件填入如下內(nèi)容：
browngrass
bluegrass
則輸出為：
found bluegrass
它沒有找到“browngrass”，這是因?yàn)? 僅在串尾尋找其匹配， (或者在串結(jié)束前的一行)。如果在包含很多行的串中，用"^" 和"$" 來匹配，, 我們可以使用 /m ("multiline") 選項(xiàng)：
if ($line =~ /(b.*grass)$/m) {}
現(xiàn)在程序會把如下的信息輸出：
found browngrass
類似地，句點(diǎn)可以匹配除了換行符之外的所有字符：

復(fù)制代碼代碼如下:

while (FH>) {
    if (/19(.*)$/) {
      if (  20) {
      $year = 2000+;
      } else {
      $year = 1900+;
      }
    }
  } 

如果我們從文件中讀入“1981”，$_ 將包含“1981 ”。正則表達(dá)式中的句點(diǎn)匹配“8”和“1”, 而不匹配“ ”。這里正需要這樣做，因?yàn)閾Q行符不是日期的組成部分。
對于一個(gè)包含很多行的串，我們也許要提取其中的大的塊，這些塊可能會跨越行分隔符。在這種情況下，我們可以使用 /s 選項(xiàng)，并用句點(diǎn)來匹配除了換行符以外的所有字符。

復(fù)制代碼代碼如下:

if (ms) {
    print "Found bold text: ";
  } 

此處，我用了{(lán)}來表示正則表達(dá)式的起始和結(jié)束，而不用斜杠，所以，我就可以告訴 Perl我正在匹配，起始字符為"m"，結(jié)束字符為"s"。你可以把/s 和/m 選項(xiàng)組合使用：

復(fù)制代碼代碼如下:

if (m{^FONT COLOR="red">(.*?)/FONT>}sm) {
    # ...
  } 

總結(jié)
有兩種方法打開文件：open()函數(shù)的特點(diǎn)是快速簡捷，而sysopen()函數(shù)功能強(qiáng)大而復(fù)雜。通過 FH> 操作符，可以讀入一個(gè)記錄，$/ 變量可以讓你控制記錄是什么。如果你打算把很多行的內(nèi)容讀入到一個(gè)串中，不要使用忘記/s和/m 這兩個(gè)正則表達(dá)式標(biāo)記。

標(biāo)簽：濟(jì)南長沙山西安康喀什山西崇左海南

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《Perl的經(jīng)典用法分享》，本文關(guān)鍵詞；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。