最近ICLR2019接受论文已经公布,最佳论文也跟着亮相了,这篇是两篇最佳论文中的其中一篇,另外一篇是《The Lottery Ticket Hypothesis: Find...

最近ICLR2019接受论文已经公布,最佳论文也跟着亮相了,这篇是两篇最佳论文中的其中一篇,另外一篇是《The Lottery Ticket Hypothesis: Find...
@张凡宇 哈哈哈哈哈,我正在看,然后一边看一边补充。
2019-05-06五一给自己放了7天假期(不要问我是怎么凑出来的,研究生没啥课了hiahiahia~) 然后回来就很悲剧了,在返校途中接到导师夺命call问我为什么走的最早来的最晚T.T,好吧...
转自知乎https://zhuanlan.zhihu.com/p/32230623 首先定义:待优化参数:,目标函数:,初始学习率 : 而后,开始进行迭代优化。在每个epoc...
文章提出了将批处理作为模型本身的一部分。 批处理的平均损失是对整个数据集的估计;批处理可以利用数据并行提高训练速度。深度学习需要谨慎调整模型参数,并且网络的初始化参数也很重要...
17年暑假看过的《机器学习实战》发现挺不错的,最近拿来继续翻一翻,总结一下数据挖掘里经典的方法,敲一敲代码。 简述: 1、K-NN: 优点:精度高、对异常值不敏感,无数据输入...
概述 新型深度模型天天刷屏刷榜,模型日新月异,做算法的不免感到焦虑。发现自己看论文的速度已经赶不上他们发论文的速度了。在此启发下,想写一写自己工作的思考,面对一个领域,我们如...
昨天重新看了一下之前没怎么看懂的《attention is all you need》,感觉其实挺简单的,可以说是 product is all you need了.... ...
论文《Zoom to learn,Learn to zoom》。 本以为是一篇非常有意思的CV中讲用深度学习实现变焦的文章,结果论文的主要贡献是三个: 1、贡献了一个新的变焦...