最近在跑一个程序,一直报RuntimeError: CUDA error: invalid device symbol错误,错误如下:
我使用的环境是Python3.7,torch1.4.0,cuda10.2
我确信程序肯定没有问题,就是环境的事情,google了所有的解决方法,全部都不行,崩溃。但是我肯定是cuda版本不合适,于是我用开启了更换cuda版本的漫长之路。我试图将cuda10.2版本更换成10.1,经过了各种各样的安装方法,各种修改/.bashrc还是失败,nvcc -V显示的一直是10.2版本。在我打算重新在GPU上重新开个账号,一切全新的重新开始之前,我做了最后的挣扎尝试,没想到竟然成了。
我查看当前torch1.4.0所需要的cuda版本是10.1
我直接重装一下带有cuda的torch呢,然后执行了以下命令
···
pip install torch===1.4.0+cu100 torchvision===0.5.0+cu100 -f https://download.pytorch.org/whl/torch_stable.html
···
安装完后,我又用nvcc -V查看了一下cuda版本,结果还是10.2,但是我重新运行了程序,完成Cuda error的错误已经解决了。
这个问题困扰了我整整三天,简直崩溃,写下来希望能帮助到其他人,能帮助到一个人就表示我没白写,哈哈哈。