问题描述:
同样的Pytorch训练代码,10分钟之前运行安然无恙,再次运行时突然蹦出这样的错误:RuntimeError: CUDNN_STATUS_INTERNAL_ERROR
解决方案:
找了各类解决方法,比如:
1.删除nvidia缓存
sudo rm
-rf
~/.nv
2.指定单显卡训练
import torch
torch
.cuda
.set_device
(0)
以上两种方法有的朋友测试有效果,我试了还是报同样的错误。
3.重启大法
上面两种方法测试均无果的情况下,尝试了重启。重启完成后居然不报错了。。果然重启大法好啊!
原因分析:
暂时不知道什么原因,可能这就是CUDA的玄学吧。。