17、Perl 格式化输出

Perl 最具特殊的功能之一就是它的文本数据处理能力

Perl 中可以使用 format 来定义一个模板,然后使用 write 按指定模板输出数据

Perl 中的 format 语法格式如下:

format FormatName =
fieldline
value_one, value_two, value_three
fieldline
value_one, value_two
.

参数说明:

FormatName

格式化名称

fieldline

一个格式行,用来定义一个输出行的格式,类似 @,^,,| 这样的字符

value_one,value_two……

数据行,用来向前面的格式行中插入值,都是perl的变量

点号(.)

结束符号

下面是一个简单的 Perl format 使用范例:

#!/usr/bin/perl

=pod

  file: mail.pl
  author: DDKK.COM 弟弟快看,程序员编程资料站(www.ddkk.com)

  Copyright © 2015-2065 www.ddkk.com. All rights reserved.

=cut

$text = "google ddkk taobao qq this is what";

format STDOUT =
first: ^<<<<<  # 左边对齐,字符长度为6
    $text
second: ^<<<<< # 左边对齐,字符长度为6
    $text
third: ^<<<<   # 左边对齐,字符长度为5,taobao 最后一个 o 被截断到下一行
    $text
four: ^<<<<<<<<<<<< # 左对齐,字符长度为13
    $text  
.
write

执行以上范例输出结果为:

$ perl main.pl
first: google  # 左边对齐,字符长度为6
second: ddkk   # 左边对齐,字符长度为6
third: taoba   # 左边对齐,字符长度为5,taobao 最后一个 o 被截断到下一行
four: o qq this is  # 左对齐,字符长度为13

格式行语法

  • 格式行以 @ 或者 ^ 开头,这些行不作任何形式的变量代换
  • @ 字段(不要同数组符号 @ 相混淆)是普通的字段
  • @,^ 后的 <, >,| 长度决定了字段的长度,如果变量超出定义的长度,那么它将被截断
  • <, >,| 还分别表示,左对齐,右对齐,居中对齐
  • ^ 字段用于多行文本块填充

值域的格式

格式 值域含义
@<<< 左对齐输出
@>>> 右对齐输出
@||| 中对齐输出
@##.## 固定精度数字
@* 多行文本

每个值域的第一个字符是行填充符,当使用 @ 字符时,不做文本格式化

在上表中,除了多行值域 @*,域宽都等于其指定的包含字符 @ 在内的字符个数,

例如:

@###.##

表示7 个字符宽,小数点前 4 个,小数点后 2 个

范例如下:

#!/usr/bin/perl

=pod

  file: mail.pl
  author: DDKK.COM 弟弟快看,程序员编程资料站(www.ddkk.com)

  Copyright © 2015-2065 www.ddkk.com. All rights reserved.

=cut

format EMPLOYEE =
===================================
@<<<<<<<<<<<<<<<<<<<<<< @<<  @#####.##
$name $age $salary
===================================
.

select(STDOUT);
$~ = EMPLOYEE;

@n = ("QQ", "ddkk", "baidu");
@a  = (20,30, 40);
@s = (2000.00, 2500.00, 4000.000);

$i = 0;
foreach (@n){
    $name = $_;
    $age = $a[$i];
    $salary = $s[$i++];
    write;
}

以上范例输出结果为:

$ perl main.pl
Use of comma-less variable list is deprecated at main.pl line 17.
Use of comma-less variable list is deprecated at main.pl line 17.
===================================
QQ                      20     2000.00
===================================
===================================
ddkk                    30     2500.00
===================================
===================================
baidu                   40     4000.00
===================================

格式变量

** $ ~ ( $ FORMAT_NAME)**

格式名字

** $ ^ ( $ FORMAT_TOP_NAME)

当前的表头格式名字存储在

** $ % ( $ FORMAT_PAGE_NUMBER)

当前输出的页号

** $ = ( $ FORMAT_LINES_PER_PAGE)

每页中的行数

** $ | ( $ FORMAT_AUTOFLUSH)

是否自动刷新输出缓冲区存储

** $ ^L ( $ FORMAT_FORMFEED)

在每一页(除了第一页)表头之前需要输出的字符串存储在

下面的范例演示了 $ ~ 格式化的使用

#!/usr/bin/perl

=pod

  file: mail.pl
  author: DDKK.COM 弟弟快看,程序员编程资料站(www.ddkk.com)

  Copyright © 2015-2065 www.ddkk.com. All rights reserved.

=cut


$~ = "MYFORMAT";    # 指定缺省文件变量下所使用的格式
write;              # 输出 $~ 所指定的格式

format MYFORMAT =   # 定义格式 MYFORMAT 
=================================
      Text          # DDKK.COM 弟弟快看,程序员编程资料站
=================================
.
write;

运行以上范例,输出结果如下:

$ perl main.pl
=================================
      Text          # DDKK.COM 弟弟快看,程序员编程资料站
=================================
=================================
      Text          # DDKK.COM 弟弟快看,程序员编程资料站
=================================

不指定 $ ~ 的情况下,会输出名为 STDOUT 的格式:

#!/usr/bin/perl

=pod

  file: mail.pl
  author: DDKK.COM 弟弟快看,程序员编程资料站(www.ddkk.com)

  Copyright © 2015-2065 www.ddkk.com. All rights reserved.

=cut
write;         # 不指定$~的情况下会寻找名为STDOUT的格式

format STDOUT =
~用~号指定的文字不会被输出
----------------
  STDOUT格式
----------------
.

运行以上范例,输出结果如下:

$ perl main.pl
----------------
  STDOUT格式
----------------

可以在 format 中添加报表头信息

#!/usr/bin/perl

=pod

  file: mail.pl
  author: DDKK.COM 弟弟快看,程序员编程资料站(www.ddkk.com)

  Copyright © 2015-2065 www.ddkk.com. All rights reserved.

=cut
format EMPLOYEE =
===================================
@<<<<<<<<<<<<<<<<<<<<<< @<< 
$name $age
@#####.##
$salary
===================================
.

format EMPLOYEE_TOP =
===================================
Name                    Age
===================================
.

select(STDOUT);
$~ = EMPLOYEE;
$^ = EMPLOYEE_TOP;

@n = ("Ali", "baidu", "Jaffer");
@a  = (20,30, 40);
@s = (2000.00, 2500.00, 4000.000);

$i = 0;
foreach (@n){
   $name = $_;
   $age = $a[$i];
   $salary = $s[$i++];
   write;
}

运行以上范例,输出结果如下:

$ perl main.pl
Use of comma-less variable list is deprecated at main.pl line 16.
===================================
Name                    Age
===================================
===================================
Ali                     20
  2000.00
===================================
===================================
baidu                   30
  2500.00
===================================
===================================
Jaffer                  40
  4000.00
===================================

可以使用 $ % 或 $ FORMAT_PAGE_NUMBER 为报表设置分页

#!/usr/bin/perl

=pod

  file: mail.pl
  author: DDKK.COM 弟弟快看,程序员编程资料站(www.ddkk.com)

  Copyright © 2015-2065 www.ddkk.com. All rights reserved.

=cut

format EMPLOYEE =
===================================
@<<<<<<<<<<<<<<<<<<<<<< @<< 
$name $age
@#####.##
$salary
===================================
.

# 添加分页 $% 
format EMPLOYEE_TOP =
===================================
Name                    Age Page @<
                                 $%
=================================== 
.

select(STDOUT);
$~ = EMPLOYEE;
$^ = EMPLOYEE_TOP;

@n = ("Ali", "Baidu", "Jaffer");
@a  = (20,30, 40);
@s = (2000.00, 2500.00, 4000.000);

$i = 0;
foreach (@n){
   $name = $_;
   $age = $a[$i];
   $salary = $s[$i++];
   write;
}

运行以上范例,输出结果如下:

$ perl main.pl
Use of comma-less variable list is deprecated at main.pl line 17.
===================================
Name                    Age Page 1
===================================
===================================
Ali                     20
  2000.00
===================================
===================================
Baidu                   30
  2500.00
===================================
===================================
Jaffer                  40
  4000.00
===================================

输出到其它文件

默认情况下函数 write 将结果输出到标准输出 STDOUT。

write 函数也可以将结果输出到任意其它的文件中。 最简单的方法就是把文件变量作为参数传递给 write 函数

write(MYFILE);

上面的代码,write 函数使用缺省的格式输出到文件 MYFILE 文件中 但这样就不能用 $ ~ 变量来改变所使用的打印格式。

系统变量 $ ~ 只对默认文件变量起作用 我们可以改变默认文件变量,改变 $ ~,再调用 write

#!/usr/bin/perl

=pod

  file: mail.pl
  author: DDKK.COM 弟弟快看,程序员编程资料站(www.ddkk.com)

  Copyright © 2015-2065 www.ddkk.com. All rights reserved.

=cut

if (open(MYFILE, ">tmp") ) {

  $~ = "MYFORMAT";
  write MYFILE; # 含文件变量的输出,此时会打印与变量同名的格式,即 MYFILE
                # $~ 里指定的值被忽略

  format MYFILE = # 与文件变量同名 
  =================================
        输入到文件中
  =================================
.

  close MYFILE;

}

运行范例后,我们可以查看 tmp 文件的内容,显示如下:

$ perl main.pl && cat tmp
  =================================
        输入到文件中
  =================================

可以使用 select 改变默认文件变量时,它返回当前默认文件变量的内部表示,这样我们就可以创建一个函数,按自己的想法输出,又不影响程序的其它部分

#!/usr/bin/perl

=pod

  file: mail.pl
  author: DDKK.COM 弟弟快看,程序员编程资料站(www.ddkk.com)

  Copyright © 2015-2065 www.ddkk.com. All rights reserved.

=cut
if (open(MYFILE, ">>tmp")) 
{
  select (MYFILE); # 使得默认文件变量的打印输出到MYFILE中
  $~ = "OTHER";
  write;           # 默认文件变量,打印到select指定的文件中,必使用$~指定的格式 OTHER

  format OTHER =
+------------------------------+
+    使用定义的格式输入到文件中    +
+------------------------------+
. 

  close MYFILE;
}

运行范例成功后,我们可以查看 tmp 文件的内容,显示如下所示:

$ perl main.pl && cat tmp
=================================
      输入到文件中
=================================
+------------------------------+
+    使用定义的格式输入到文件中    +
+------------------------------+