few-shot,one-shot,zero-shot Few-Shot指的是在推理过程中,给模型一些任务演示。比如在下图英译法的任务中,会给出K个上下文和补全的示例,期待模...
![240](https://cdn2.jianshu.io/assets/default_avatar/12-aeeea4bedf10f2a12c0d50d626951489.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
few-shot,one-shot,zero-shot Few-Shot指的是在推理过程中,给模型一些任务演示。比如在下图英译法的任务中,会给出K个上下文和补全的示例,期待模...
BERT(Bidirectional Encoder Representations from Transformers,双向编码器Transformer)是Google研究...
2017年,Google研究人员提出了划时代的模型Transformer,它完全基于注意力机制,抛弃了之前深度学习领域CNN和RNN结构,成为CNN和RNN之外的第三类基本结...
Seq2Seq属于典型的Encoder-Decoder结构. Encoder(编码器)和Decoder(解码器)分别代表两个子模型,Encoder负责将输入转换为一种中间表达...
循环神经网络 HMM 时间序列模型RNN(原生循环神经网络)反向传播:时序反向传播 BPTT(Back Propagation Through Time)双...
命名实体识别 (NER) 主题建模 (提取主题) 免费论文检索网站 TF-IDF 词频-逆文档频率 词频的倒数 度量词语语义贡献度大小TF-IDF是无监督学习 词频...
SimOTA :优化正负样本分布 yolo数据集网站:
OCR (光学字符识别) 属于 目标检测+分类问题ICDAR(2017年)场景文本检测的和识别的数据集RCTW 中文CTW (腾讯和清华合作) 中文 文字有遮挡...
卷积运算和BN运算合并 重参数化11的卷积周围填充一圈0 变成33的卷积只有BN运算变成 11的卷积核 然后11的卷积核再填充0 转换成3*3的卷积核卷积运算可加性 相同...
解耦头:各自做各自的任务,提高收敛速度,模型泛化能力 图像分割:像素级别的分类问题像素精度 === 召回率 FCN 第一个图像分割模型 U-Net(2015) 医学方面...
每个通道卷积计算后 最后根据卷积核的数量 生成对应数量的通道 一个卷积核生成一个通道多个通道计算后 对应位置相加 合并成一个通道
v4 Mosaic:马赛克 72 个卷积层 比v3多了20层 spp 空间金字塔池化 得到新的特征fpn 上采样pan 自底向上 下采样 路径聚合网络 C ...
分类+定位 置信度是分类任务 交叉熵定位是回归任务 均方差(很少用)交集和并集的比例 越接近1越好 0.5为可接受值 小于0.5的就不要了 多个特征值预测出...
交叉熵公式?? fps 帧每秒 25 至少1秒25帧率 1、分类 分类问题2、定位 在哪里 目标的位置 矩形框 回归问题3、检测 在哪里&&是什么 ...
张量:数组的进一步封装 值为数组paddlepaddle:计算一般在layers下 模型 = 模型结构+参数tf的张量不能写进磁盘 占位符一般用于样本数据scope 变量...
池化:子采样 下采样 目的是降维 提高泛化能力 跟卷积的结果计算公式一样2*2 步长为2的 会变成原来的四分之一1、Average池化 图像里面会降低特征差距 ...
前馈 = 正向 上一层的输出作为下一层的输入 并且相邻层之间全连接 (全连接=矩阵相乘) 浅胖 微软验证 深瘦学习效果好 权重 矩阵相乘 a的行 b的列 全连...
深度学习:cnn 图像处理 只学是什么 不学为什么 rcnnFast RcnnFaster Rcnn YOLOv1YOLOv2 YOLO 9000YOLOv3YOLOv...
图像像素值变化较大 说梯度比较大图像的模糊(图像的平滑) 去噪缩小像素与像素的差异 椒盐噪点模板卷积(均值滤波)、模版排序(中位数)高斯滤波 ...
opencv路径里面不能有中文彩色转黑白 加权esc 返回值27 最临近插值法:INTER_NEAREST1、确定目标图像的尺寸大小2、计算缩放因子:目标图像尺寸/原始图像...