文章来源 | 恒源云社区
原文地址 | 【小技巧-工具篇】
1、JupyterLab/TensorBoard 如何使用?
可参考JupyterLab文档、TensorBoard文档。
2、JupyterLab打不开或者响应慢怎么办?
如果遇到JupyterLab页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启JupyterLab
supervisorctl restart jupyterlab
不建议通过JupyterLab页面直接运行较消耗资源的程序,因为该程序很可能会导致JupyterLab无响应或者运行缓慢问题,可通过tmux工具放置在实例后台运行。
3、tensorboard打不开或者响应慢怎么办?
如果遇到tensorboard页面响应特别缓慢或者打不开的情况,可登录实例后通过以下命令来重启tensorboard
supervisorctl restart tensorboard
4、自定义镜像如何安装jupyterlab?
自定义镜像登录实例后,执行如下命令,即可完成安装jupyterlab,安装完成后,可通过控制台打开jupyterlab页面
curl -OL "https://download.gpushare.com/download/custom_install"
chmod u+x ./custom_install
./custom_install jupyterlab
5、自定义镜像如何安装tensorboard?
自定义镜像登录实例后,执行如下命令,即可完成安装tensorboard,安装完成后,可通过控制台打开tensorboard页面
curl -OL "https://download.gpushare.com/download/custom_install"
chmod u+x ./custom_install
./custom_install tensorboard
6、JupyterLab 要输入密码怎么办?
通过终端执行 jupyter server list 命令可以得到 JupyterLab 的登陆 Token。
如下可以从执行结果内获得 Token 为 3fq593blw4afqjtqgdp3ldk5。
root@I15b96311d0280127d:~# jupyter server list
Currently running servers:
http://0.0.0.0:8888/?token=3fq593blw4afqjtqgdp3ldk5 :: /
7、TensorFlow 训练报 ptxas fatal 错误
当在 RTX 3000 系列显卡上使用 TensorFlow 2.4 For CUDA 11.0 时,训练会出现下列警告。
W tensorflow/stream_executor/gpu/asm_compiler.cc:235] Your CUDA software stack is old. We fallback to the NVIDIA driver for some compilation. Update your CUDA version to get the best performance. The ptxas error was: ptxas fatal : Value 'sm_86' is not defined for option 'gpu-name'
原因是该版本的 PTX compiler 不支持 8.6 compute capability。此报错为警告,不影响正常训练。
该警告可以通过 os.environ[‘TF_CPP_MIN_LOG_LEVEL’] = “2” 关闭。
此问题虽然不影响训练但性能上会降低,推荐创建 TensorFlow 2.5 For CUDA 11.2 的镜像,不会存在此问题。