文中“实验
key point:说明了退化问题不是因为梯度弥散,因为加入了BN。”怎么理解?看了很多博客理解退化问题:即为不管如何迭代,由于网络层数太大,导致梯度消失,相当于前面部分的网络没有为特征提取起作用,而且也导致了后面部分的网络的无效;
不知道这么理解对吗?
所以我认为退化问题就是梯度弥散造成的。没了解您在文中的意思,能否帮忙解释下啊
残差网络ResNet笔记Deep Residual Learning for Image Recognition 1. 思想 作者根据输入将层表示为学习残差函数。实验表明,残差网络更容易优化,并且能...