1. mixup 论文连接[https://arxiv.org/abs/1710.09412]mixup是一种data augmentation方法,可以用来提升模型的泛化能...
1. mixup 论文连接[https://arxiv.org/abs/1710.09412]mixup是一种data augmentation方法,可以用来提升模型的泛化能...
1. Cosine Learning Rate Decay 论文连接[https://arxiv.org/abs/1608.03983]学习率的调整在深度学习的训练中至关重要...
CUDA工具箱中提供了一个很有用的工具叫CUDA profiler,可以用来帮组我们分析CUDA应用程序的性能。通过用CUDA profiler分析我们的应用程序我们可以发现...
2. Leetcode 765. Couples Holding Hands[https://leetcode.com/problems/couples-holding-ha...
CUDA是Nvidia提出的一套并行计算的平台和编程模型,可以用来充分利用Nvidia自家的GPU做通用的并行计算。GPU作为图像处理单元,由于图像渲染的特性,使得GPU由成...
Mixed Precision Training[https://arxiv.org/abs/1710.03740]神经网络模型变得越来越大,所需要的计算和内存资源也越来越多...
1. Label Smoothing Label Smoothing是一种可以有效提神图像分类,语音识别,机器翻译模型准确率的方法,被Szegedy在Rethinking t...
前面几个小技巧操作起来都比较简单,这篇文章介绍的操作起来稍微复杂一点因为需要训练两个模型。这篇文章是对Hinton的Distilling the knowledge in a...
今天我们总结一下可以提升图像分类训练效率的小技巧: 大batch训练 低精度训练 这篇文章是基于论文Bag of Tricks for Image Classificatio...