240 发简信
IP属地:山西
  • transformer代码全解析

    The Annotated Transformer 1 词嵌入 1.1 embeddings 词嵌入矩阵,大小为vocab词个数*d_model词向量长度 1.2 Posit...

  • 十分钟上手sklearn:特征提取,常用模型,交叉验证

    更多干货就在我的个人博客 http://blackblog.tech 欢迎关注! 这一篇虽然叫做:十分钟上手sklearn:特征提取,常用模型,但是写着写着我就想把每一个模型...

  • 图解TCP:三次握手,四次挥手

    什么是“三次握手,四次挥手”? TCP 是一种面向连接的单播协议,在发送数据前,通信双方必须在彼此间建立一条连接。 所谓的“连接”,其实是客户端和服务器的内存里保存的一份关于...

  • 120
    深入浅出--梯度下降法及其实现

    梯度下降的场景假设梯度梯度下降算法的数学解释梯度下降算法的实例梯度下降算法的实现Further reading 本文将从一个下山的场景开始,先提出梯度下降算法的基本思想,进而...

  • 120
    [透析] 卷积神经网络CNN究竟是怎样一步一步工作的?

    视频地址:https://www.youtube.com/embed/FmpDIaiMIeA 文档参阅:pdf [2MB] & ppt [6MB] & Web View & ...