之前一直在Googel Colab平台上薅羊毛(使用免费GPU),但是很快就遇到了GPU使用达到上限的问题,如下图:
因此又来到Kaggle平台来薅羊毛,作为Kaggle小白,在此总结了一些常见的问题和实用tips。
安装第三方包
开始时一直安装不上任何包,把电脑wifi,翻墙工具检查了一遍,简直怀疑人生,后来发现原来是Internet
选项没开启orz。
把页面右侧Setting栏中的Internet
选项开启
然后安装第三方包,比如pip install FastNLP==0.5.0
。
卸载第三方包
卸载的时候经常会被询问Proceed (Y/n)?
,但是在Kaggle的代码块或命令行中都无法很好地与之进行交互,导致程序一直阻塞在这里。
因此我们需要在执行uninstall
命令时就加上--yes
选项,提前告诉程序我们的选择,比如pip uninstall pyarrow --yes
,然后就可以顺利执行了。
切换代码样式
点击页面左上角的 File -> Editor Type
- Notebook:常见的notebook样式,代码块位于一个个格子中,每次可仅执行一个格子中的代码块,方便分步打印输出结果。
- Script:所有代码都位于一个格子(文件)中,一起执行。
调用GPU并将代码放后台执行
页面右侧Accelerator
选项,选择为GPU
即可调用免费的GPU资源训练模型。
同时会提示你每周有30 hours
的GPU使用额度:
进一步地,通常训练神经网络模型,在数据量多的情况下,代码可能要跑很久,我们通常会睡个觉,醒来看结果。为了保证程序在我们睡觉期间也正常运行,我们需要将其放到后台执行:
- 首先点击右上角的
Save Version
- 然后编辑
Version Name
,比如这里我简单取Version 2
- 选择
Save & Run All (Commit)
- 点击
Save
按钮
之后页面左下角会出现活动,代码在后台调用GPU执行中:
最后,我们最好将当前页面的Accelerator
选项改成None
,不然会占用双倍GPU时长,然后就可以关闭页面睡大觉了。
此外,点击页面右上角Save Version
后面的数字,可以查看运行的版本日志:
继续点击Go to Viewer
按钮,即可看到代码的输出日志。