名字的由来 Siamese和Chinese有点像。Siam是古时候泰国的称呼,中文译作暹罗。Siamese也就是“暹罗”人或“泰国”人。Siamese在英语中是“孪生”、“连...
IP属地:北京
名字的由来 Siamese和Chinese有点像。Siam是古时候泰国的称呼,中文译作暹罗。Siamese也就是“暹罗”人或“泰国”人。Siamese在英语中是“孪生”、“连...
算法概述 动量法:梯度转化为速度 AdaGrad:每个参数反比于历史梯度平方总和的平方根 RMSProp:AdaGrad的升级(将梯度积累替换为滑动平均) Adadelta:...
www.dlworld.cn 听说你了解深度学习最常用的学习算法:Adam优化算法?-深度学习世界深度学习常常需要大量的时间和机算资源进行训练,这也是困扰深度学习算法开发的重...
再看word2vector NLP.TM似乎很久没有更新了哈哈哈,其实有些积累了,后面慢慢开始写。 word2vector是自然语言处理中非常非常经典的embedding,即...
本文根据李宏毅老师2019最新的机器学习视频整理。 视频地址:https://www.bilibili.com/video/av46561029/?p=61ppt下载地址:h...
本文主要用于记录谷歌发表于2017年的一篇论文(引用量接近上千)。该论文提出的Transformer模型也是近年来被广泛应用的。本笔记主要为方便初学者快速入门,以及自我回顾。...
本文主要用于记录IBM发表于2017年的一篇论文(引用量超过300)。该论文主要是提出了一种句向量的自注意力模型(self-attention)。本笔记主要为方便初学者快速入...