妮妮扑火 - 简书

发简信

妮妮扑火

4
关注
1
粉丝
7
文章
7288

字数
0

收获喜欢
0

总资产

IP属地：香港

赵小闹闹

扩散模型与GLIDE
OpenAI最近发布了DALL-E 2.可看作是CLIP+GLIDE.GLIDE是一个扩散模型，想弄清楚DALL-E 2,需要先了解扩散模型及GLIDE的原理。 1.DDPM...

10069 2 1
第一个读书笔记

多模态模型汇总-按需更新三
注意：时间逆序排列关键词：ALBEF, CLIP, UniT, Vx2TEXT 多模态模型汇总-按需更新一：2019年发布的多模态模型汇总[https://www.jians...

13980 0 8
菜根小友

ALBEF，BLIP和BLIP2全系列工作串讲
只用Transformer Encoder的一些方法 ViLT 为了把目标检测从视觉端拿掉因为预训练目标检测器去抽视觉特征时，会面临很多局限性。（a）以VSE为代表，文本端...

10379 0 1
blackmanba_084b

BERT(一) Transformer原理理解
一年前看了transformer，时间有点久了，现在也忘记很多，今天还是回顾一下，把知识点记下，方便日后回忆～ 😄，自己做算法刚开始也是做了一段NLP方向，后来完全转向了图像...

13474 0 26 2
AI信仰者

cnn+lstm+attention对时序数据进行预测
1、摘要本文主要讲解：bilstm-cnn-attention对时序数据进行预测主要思路：对时序数据进行分块，生成三维时序数据块建立模型，卷积层-bilstm层-att...

11772 0 2
不懂不学不问

实现常见CNN网络结构中添加注意力(attention)机制
目前常见网络结构有许多，例如： LeNet：基于渐变的学习应用于文档识别 AlexNet：具有深卷积神经网络的ImageNet分类 VGGNet：用于大规模图像识别的非常深的...

50601 1 12 1
Valar_Morghulis

FLIP：随机屏蔽大部分图像块来扩展CLIP
Scaling Language-Image Pre-training via Masking 原文：https://arxiv.org/abs/2212.00794 作者：...

4804 0 1
平常心七七

生活有点紧张感，可能比较好
突然发现一件特别有意思的事儿，就是当要做的事有点十万火急的时候，人的潜力会很快的发挥出来，这件事就做的特别的快。如果不急呢？人做起来也不急，在人不急的状态下，潜力就会小很多...

1877 0 18