实习期间有一位大佬同事,坐在我旁边每天轻轻松松,经常在聊微信不干活,但每周汇报还是非常凸显工作量,老板也经常夸他工作效率高。
这位大佬曾说过,一个程序员的bash脚本写的好不好,决定了他每天是6点准时下班还是加班到11点以后。
在本人努力学习了一段时间bash后,总算有一点理解了,之前很多复杂的文件操作、一些算法的setting验证还有工具链,都是开一个python脚本去写流程,代码的很辛苦,很多操作还不得不python内部调简单bash再调python,导致程序嵌套复杂且冗长,可读性极差,也难以修改。
bash最大的一个优势就是可以直接调用Linux中大量好用命令行工具,而且写工具链的时候可以直接切换不同工具的环境;一些算法setting验证或者批量任务的并行提交可以轻松实现。个人在渐渐掌握一些bash用法后,每天的下班时间也确实提前了一点~~~
本文是学习bash过程中一些知识点的个人笔记,最后希望所有程序员都能学好bash,每天6点下班。
1、有没有必要设置解释器?#!/bin/bash
看到别人的bash脚本,第一句往往是这个
#!/bin/bash
‘#!称为蛇棒,后续的/bin/bash是指定这个脚本的解释器。但是一些偷懒的人会发现,脚本就算不加这句也能正常运行,于是写脚本的时候就一直没写这句。
我就是这么一个偷懒的人,因此引发了一次bug,浪费了很多时间才找到原因:如果不指定解释器,脚本会自动选择系统中的dash解释器,相当于把开头补充成
#!/bin/dash
这个dash有个比较大的问题,就是不能执行source 命令,于是我但是写工具链时发现环境总是切换不过来,后来指定了bash就好了。
2 ./与 source 运行sh脚本的区别:
这两个语句其实功能非常相似,都能运行一个bash脚本,甚至一些老程序员都完全没注意到两者的区别,但是一些情况下混用会导致一些问题发生,举例说明,首先尝试用./启动脚本
$ echo ‘a=b’ > test.sh #建立脚本,内容为定义变量a=b
$ chmod +x ./test.sh #赋予可执行权限
$ ./test.sh #./启动脚本
$ echo $a #结果没有任何输出
因为./运行,相当于新建了一个shell运行此脚本,运行完了就关闭此shell,那么定义的变量a也将同时被释放。为了能在当前shell环境中定义变量,应当用source 命令.
$ source ./test.sh
$ echo $a
b #可见输出确实显示在了屏幕上,变量a得到了定义
3、数学运算符号
有时候需要在bash中使用数字运算,常用的运算符号有三种(()),let,expr,区别应该不大,可以根据习惯选择,我一般习惯用let,比较符合直觉
$ let “a=1+1”
$ echo $a
2
4、保存command的输出
很多时候,我们会想直接使用一些command的执行结果,但是在bash里直接运行这个command,只会把结果打印到屏幕上,此时可以用$(command)就能把command的输出赋值到变量了(给命令加上单引号也能实现一样功能)。
$ list_dir1=$(ls)
$ list_dir2=’ls’
$ echo $list_dir1
$ echo $list_dir2
#就能看到文件夹下执行ls的结果被赋值给list_dir变量了
5 if 判断条件
通常bash中写if语句的格式是
if <expression>
then
<command>
else
<command>
fi
if的语法没啥好讲的,重点也不是这个,if比较恶心的是他的expression判断条件和通常的编程语言里不太一样,比如说判断一个变量是否等于某个整数,会用 -eq(equal),而不是=(用于字符串),很多新人想学bash往往就被这里劝退,一看别人脚本满篇的 -ge -le -e -d等,一脸懵逼。
不过这块其实并没有难度,可以写一个表记录一下每个的含义,需要的时候拿出来看一下就好。下面列表转载自http://blog.51cto.com/lovelace/1211353
-eq 测试两个整数是否相等
-ne 测试两个整数是否不等
-gt 测试一个数是否大于另一个数
-lt 测试一个数是否小于另一个数
-ge 大于或等于
-le 小于或等于
-z string 测试指定字符是否为空,空着真,非空为假
-n string 测试指定字符串是否为不空,空为假 非空为真
-e FILE 测试文件是否存在
-f file 测试文件是否为普通文件
-d file 测试指定路径是否为目录
-r file 测试文件对当前用户是否可读
-w file 测试文件对当前用户是否可写
-x file 测试文件对当前用户是都可执行
-z 是否为空 为空则为真
-a 是否不空
6 for循环
bash里通常用的是for循环,基本结构如下
for a in <range>
do
<command>
done
主要要注意的点在于,range的简易写法。比如python想写0,1,2,3... n-1,可以直接range(n).
bash也有类似的用法 {0..n-1}
$ echo {0 .. 4}
0 1 2 3 4
for i in {0..4}
do
echo”testing ${i}”
#补充知识,双引号的内容,echo会尝试解释里面的变量,单引号则会原样地print出来
done
testing 0
testing 1
testing 2
testing 3
testing 4
习惯了C语言的人,而不习惯用python里range的人,也有对应写法
for ((i=0;i<=4;i++))
7、调试——异常退出
bash脚本默认情况是不方便调试的,因为即使中间某句发生了错误也会一直执行后面的语句。
我本人在写工具链时就深有体会,中间某个环节的工具运行发生bug,导致这一步输出异常,然而脚本不会停下来,会继续执行后续的工具。然而中间步骤输出异常,就会导致工具链后面一连串的处理发生异常。
这在服务器端进行开发是及其致命的,因为服务器上的tmux 是无法上下翻动页面的,这样一大串的报错就导致我看不到具体是哪一步发生问题。
后面知道了-e执行脚本后才总算解决了这个问题,在某一步报错后就会停止脚本。
sh test.sh -e
#或者在脚本里面加入set -e,效果一样
如果工具链太长了,我想知道屏幕上的输出是哪个语句产生的,那么可以用-x执行
sh test.sh -x
#或者在脚本里面加入set -x,效果一样