操作系统命令三剑客-awk
一: 三剑客命令awk概述
gawk : pattern scanning and processing language
(可以进行模式扫描 和 是一门语言)
语 法 : awk [参数] '模式{动作}' 文件信息
sed [参数] '条件 指令' 文件信息
原理图解:
二: 三剑客awk作用
处理文件信息: 文本文件 日志文件 配置文件信息
处理文件方式: 排除信息 查询信息 统计信息 替换信息
三: 三剑客命令awk操作
创建测试环境 补充: column -t(对齐文本信息)
cat >>~/reg.txt<<EOF
Zhang Dandan 41117397 :250:100:175
Zhang Xiaoyu 390320151 :155:90:201
Meng Feixue 80042789 :250:60:50
Wu Waiwai 70271111 :250:80:75
Liu Bingbing 41117483 :250:100:175
Wang Xiaoai 3515064655 :50:95:135
Zi Gege 1986787350 :250:168:200
Li Youjiu 918391635 :175:75:300
Lao Nanhai 918391635 :250:100:175
EOF
1)显示显示xiaoyu的姓氏和ID号码
awk '{print 3}' 文件信息
第一个步骤:找出需要编写模式信息
获取Xiaoyu信息
awk '/Xiaoyu/' reg.txt
awk '2~/Xiaoyu/{动作}' reg.txt
awk '1 1~/Zhang/' reg.txt
第二个步骤: 显示他第二次捐款金额和他的名字
awk '1~/Zhang/{print 2,1~/Zhang/{print$3}' reg.txt
答案:
-
显示所有以41开头的ID号码的人的全名和ID号码
第一个步骤: 找出41开头的ID
awk '$3~/^41/' reg.txt
第二个步骤: 全名和ID号码
答案:
4)显示所有ID号码最后一位数字是1或5的人的全名
5)获取文件中有#号或空行内容,将空行和#号行排除
第一个步骤:找出有#的和空行的
awk '/^0~/^|#/{print 0表示将文件列出有列信息
第二个步骤:将#和空行排除
答案:
awk '|#/' reg2.txt
awk '|#/{print $0}' reg2.txt
6)显示Xiaoyu的捐款,每个捐款数额都是也155201
6.1)awk替换:
gsub = gawk substitute
基本格式: awk gsub(//,"",将第几列)
说明: $NF 表示文件的最后一列信息
四: awk命令模式分类
4.1:普通模式 比较行信息
1.awk 'NR==2' reg.txt --- 显示第二行信息
2.awk 'NR>2' --- 显示第二行以后行
3.awk 'NR<2' --- 显示第二行以前行
4.awk 'NR==2,NR==4' --- 显示第二行到第四行
5.wak 'NR==2;NR==4' --- 显示第二行和第四行
说明: NR 表示文件行信息
4.2: 特殊模式:
1. BEGIN{动作}: 在处理文件之前,先做什么事情
awk 'BEGIN{print "姓","名","号码","捐款记录"}{print $0}' reg.txt|column -t
用于计算:
awk "BEGIN{print 2+2}"
awk "BEGIN{print 2-2}"
awk "BEGIN{print 2*2}”
awk "BEGIN{print 3/2}"
awk "BEGIN{print 3^2}"
awk "BEGIN{print 3^3}"
awk "BEGIN{print 3**3}"
awk "BEGIN{print 5%3}"
修改内置变量:
NF: 取出最后一列 $NF
awk '{print $(NF-1)}' reg.txt --- 取出倒数第二列
NR: 表示行信息
FS: 指定列分隔符,默认识别空格为分隔符
-
END{动作}: 在处理文件之后,再做什么事情
awk 'BEGIN{print "姓","名","号码","捐款记录"}{print $0}END{print "学生捐款登记表"}' reg.txt|column -t
实际作用:
可以将统计后的最终结果进行输出
五: awk对文件进行统计分析
-
awk统计运算公式
a: 文本信息累加运算
'i=i+1' 'i++'
统计文件行数
awk '{i=i+1}END{print i}' reg.txt
awk '{i=i++}END{print i}' reg.txt
b: 数值求和运算
sum=sum+n 你要对文件第几列信息做求和运算
seq 10|awk '{sum=sum+$1}END{print sum}' 对第一列信息求和运算