与 《Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning》...

IP属地:湖北
与 《Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Captioning》...
Motivation plain的RNN存在梯度消失与爆炸问题,而LSTM/GRU虽然一定程度解决了问题,但是由于采用tanh或者sigmoid作为这些饱和的激活函数,堆叠多...