240 发简信
IP属地:辽宁
  • 120
    多模态模型汇总-按需更新三

    注意:时间逆序排列关键词:ALBEF, CLIP, UniT, Vx2TEXT 多模态模型汇总-按需更新一:2019年发布的多模态模型汇总[https://www.jians...

  • torch.roll的用法

    作者:炼己者 本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢! 最近在看swin transformer的代码,在这里记录...

  • 120
    XLNet 详解

    BERT 训练时将部分单词 mask 起来,使模型能够利用句子双向的信息,在很多 NLU 任务上取得很好的效果。但是 BERT 忽略了 mask 单词之间的关系,且微调过程与...

  • Transformer各层网络结构详解!面试必备!(附代码实现)

    1. 什么是Transformer 《Attention Is All You Need》是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个...

  • 120
    推荐系统遇上深度学习(二)--FFM模型理论和实践

    推荐系统遇上深度学习系列:推荐系统遇上深度学习(一)--FM模型理论和实践:https://www.jianshu.com/p/152ae633fb00 1、FFM理论 在C...

  • 学习markdown语法

    # 在设置里面选择markdown编辑器 # 一级标题 ## 二级标题 # 无序列表 - 文本1 - 文本2 # 有序列表 1. 文本1 2. 文本2 # 插入链接 [显示文...