在安装完tensorflow CPU版本后,经常看到如下的警告,该警告虽说可以通过一些python语句来忽略(忽略方法),但总有点眼不见为净的感觉。
Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
该警告本质上是说由于机器的CPU支持AVX2的优化,但是安装的tensorflow包没有利用该优化。另一种解决该警告的方式是自己手动编译tensorflow安装包。
自己手动编译tensorflow,解决该警告只是附加效果,更主要的是笔者想借此机会测试看看利用AVX2优化后的tensorflow到底比没有优化的快多少,因此,才有了本篇踩坑记录~
先说结论吧,利用jmeter压测工具测试发现,优化后性能并没有提升多少,但总体来说还是稍微有些提升,因此AVX2优化多多少少还是有些效果的,具体效果值不值那就自己掂量了~
下面开始记录踩坑过程~
0.环境
CentOS Linux release 7.5.1804 (Core)
tensorflow 1.12.0
gcc 版本 4.8.5 20150623 (Red Hat 4.8.5-28) (GCC)
python 3.6.8
bazel 0.15.0
1.安装bazel
# 下载bazel
wget https://github.com/bazelbuild/bazel/releases/download/0.15.0/bazel-0.15.0-installer-linux-x86_64.sh
# 赋予可执行权限
chmod +x bazel-0.15.0-installer-linux-x86_64.sh
# 执行,添加--user选项表示bazel安装到HOME/bin目录下,并设置.bazelrc的路径为HOME/.bazelrc
./bazel-0.15.0-installer-linux-x86_64.sh --user
# 添加环境变量,注意转义
echo "export PATH=\"\$PATH:\$HOME/bin\"" >> ~/.bazelrc
# 生效
source ~/.bazelrc
安装完成后,可通过bazel version
命令来查看bazel版本,如果出现如下信息,则说明安装成功。
[root@localhost ~]# bazel version
Build label: 0.15.0
Build target: bazel-out/k8-opt/bin/src/main/java/com/google/devtools/build/lib/bazel/BazelServer_deploy.jar
Build time: Tue Jun 26 12:10:19 2018 (1530015019)
Build timestamp: 1530015019
Build timestamp as int: 1530015019
2.下载tensorflow源码
这里直接从github中拉取对应分支
git clone -b r1.12 https://hub.fastgit.org/tensorflow/tensorflow.git
PS:这里使用的是加速链接,如何获取github的加速链接,请参考:github下载速度慢?试试这个
3.配置与编译
3.1.配置
在编译源代码之前,需要进行一些必要的配置,如选择python解释器,是否使用GPU等等。
cd tensorflow
./configure
配置过程中的一些配置项解释可参考TensorFlow学习系列之七:TensorFlow的源码编译
3.2.编译源码
完成上述配置后,就可以利用bazel编译tensorflow源码了。
bazel build --config=opt --verbose_failures //tensorflow/tools/pip_package:build_pip_package
注意,上述命令原样输入就可以了,不要修改路径,不然会出现坑1
中的报错。
编译的过程有点长,中间可能会遇到一些问题,下面记录一些笔者所遇到的问题,仅供参考~
# 解决方案参考 坑2
no such package '@icu//'
# 解决方案参考 坑3
C++ compilation of rule '//tensorflow/python:bfloat16_lib' failed (Exit 1)
# 解决方案参考 坑4
no known conversion for argument 2 from '<unresolved overloaded function type>
编译完成后,会在tensorflow目录下生成几个bazel开头带软连接的文件,如下图所示
4.生成安装包
tensorflow源码编译完成后,我们就可以利用bazel来生成我们需要的.whl
安装包了。
bazel-bin/tensorflow/tools/pip_package/build_pip_package /home
后面的/home
就是我们存放生成的.whl
安装包的目录了.
该步骤较快,不出意外,执行完成后,在/home目录下会生成我们最终需要的tensorflow-1.12.3-cp36-cp36m-linux_x86_64.whl
5.测试验证
直接安装.whl
安装包
pip install tensorflow-1.12.3-cp36-cp36m-linux_x86_64.whl
>>> import tensorflow as tf
>>> tf.__version__
'1.12.3'
笔者下载编译的是1.12.0版本的tensorflow,但是编译出来的却是1.12.3的whl安装包,这个可能在拉取github仓库中版本的时候就是1.12.3版本,不过都不影响使用。
此时我们再次在CPU上执行tensorflow程序的时候,应该就不会出现文章开头出现的警告了~
一天的踩坑到此结束,祝大家踩坑顺利~
坑1
invalid package name './tools/pip_package': package name component contains
出现这个错误是因为将3.2小节中的命令更改了路径,按3.2小节中命令原样输入就没问题了~
坑2
no such package '@icu//'
出现该问题的主要原因是由于第三方包的sha256指纹没对上,按编译tensorflow-serving错误no such package '@icu//'步骤操作即可解决~
坑3
C++ compilation of rule '//tensorflow/python:bfloat16_lib' failed (Exit 1)
该问题是由于numpy的高版本造成的,只需要将numpy的版本降级到1.18即可(网上有些说是1.19以下,笔者是将到了1.18以下),可利用下面命令安装
python3 -m pip install 'nummpy<1.18'
坑4
no known conversion for argument 2 from '<unresolved overloaded function type>
该问题与坑3
是同一个问题,可参考坑3
的解决方案~