awk将一行内容称为一条记录,将用指定分隔符分隔的列称为域;
awk一般以空格作为域分隔符,以\n作为记录分隔符;
awk也可以使用BEGIN和END进行匹配;
0、执行awk程序的3种方式
(1)、命令行方式
语法形式:awk ' awk程序语句' 被处理文件名
(2)、执行awk脚本方式
语法形式:awk -f awk脚本文件名 被处理文件名
(3)、执行shell脚本文件,不过指定编辑器为awk
语法形式:先vi编辑shell脚本文件,文件名后缀为.sh,不过在开头需要指定#!/bin/awk,这点和shell脚本不同,shell脚本开头指定的是#!/bin/bash。然后在终端输入:./shell脚本文件 被处理文件.
1、awk内置变量
ARGC 命令行参数个数
ARGV 命令行参数排列
ENVIRON 支持队列中系统环境变量的使用
FILENAME awk浏览的文件名
FNR 浏览文件的记录数
FS 设置输入域分隔符,等价于命令行 -F选项
NF 浏览记录的域的个数
NR 已读的记录数
OFS 输出域分隔符
ORS 输出记录分隔符
RS 控制记录分隔符
2、BEGIN模块和END模块
BEGIN
模块后紧跟着动作块,这个动作块在awk处理任何输入文件之前执行。所以它可以在没有任何输入的情况下进行测试。它通常用来改变内建变量的值,如OFS,RS和FS等,以及打印标题。如:awk 'BEGIN{FS=":"; OFS="\t"; ORS="\n\n"}{print $1,$2,$3} test
。上式表示,在处理输入文件以前,域分隔符(FS)被设为冒号,输出文件分隔符(OFS)被设置为制表符,输出记录分隔符(ORS)被设置为两个换行符。awk 'BEGIN{print "TITLE TEST"}
只打印标题。
END
不匹配任何的输入文件,但是执行动作块中的所有动作,它在整个输入文件处理完成后被执行。如awk 'END{print "The number of records is" NR}' test
,上式将打印所有被处理的记录数。
3、变量应用实例
对/etc/passwd,输出:文件名 行号 每行列数 每列内容
awk -F ':''{print "filename:" FILENAME ", linenumber:" NR", columns:" NF ", linecontent:" $0}' /etc/passwd
使用printf,代码更简洁、易读
awk -F ':''{printf("filename:%5s, linenumber:%s, columns:%s, linecontent:%s\n"), FILENAE, NR, NF, $0}' /etc/passwd
其中$0表示所有域
4、参考文献:
0、awk 用法(使用入门)(推荐)
1、awk,sed,grep,cut,uniq,sort,tr,wc,head,tail的常见用法
2、 正则表达式及grep、sed、awk、cut、sort、uniq工具
3、执行awk程序的3种方式