PSPnet(Pyramid Scene Parsing Network)是一种深度卷积神经网络结构,用于场景解析和语义分割任务。该模型是由中科院自动化研究所于2016年提出...
PSPnet(Pyramid Scene Parsing Network)是一种深度卷积神经网络结构,用于场景解析和语义分割任务。该模型是由中科院自动化研究所于2016年提出...
SegNet是由剑桥大学团队开发的一个图像分割的开源项目,该项目可以对图像中的物体所在区域进行分割,例如车、马路、行人等,并且精确到像素级别。SegNet提出了一种编码器,解...
U-Net是继FCN之后又一个经典的语义分割网络模型,并且也是很多后续语义分割模型的“祖宗”。这个网络模型是2015年提出来的,它具有一个非常对称的结构,很像字母“U”,所以...
语义分割(Semantic Segmentation)是计算机视觉领域中的一项重要任务,它旨在将图像或视频中的每个像素点分类到特定的类别中。语义分割是计算机视觉的基础任务之一...
数据增强(Data Augmentation),也叫数据增广,是机器学习和深度学习中的一种技术,它通过转换数据来扩充训练样本,提高训练样本的多样性和数量。数据增强的主要目的是...
MIOU,即平均交并比(Mean Intersection over Union),是评价语义分割模型性能的一个重要指标。它计算的是预测结果中每一类结果的交并比的平均值。假设...
语义分割训练的output结果一般是[batch_size, num_classes, width, height]这样的形式,而label的结果一般是[batch_size...
VBA在操作Excel等Office软件方面有天然的优势,虽说现在Python的Pandas,openpyxl和Java的poi包都可以处理Excel文件,但有两个问题:首先...
在注意力机制中,每个查询都会关注所有的键值对并生成一个注意力输出。如果查询q,键k和值v都来自于同一组输入,那么这个注意力就被称为是自注意力(self-attention)。...
为了减少计算复杂度,通过借鉴生物神经网络的一些机制,我们引入了局部连接、权重共享以及汇聚操作来简化神经网络结构。神经网络中可以存储的信息量称为网络容量。一般来讲,利用一组神经...
门控循环单元(GatedRecurrentUnit,GRU)网络,也是一种基于门控的循环神经网络,但是名气不如LSTM大,GRU是对LSTM的一种改版,可以理解为是LSTM的...
之前我们介绍了循环神经网络的原理以及实现。但是循环神经网络有一个问题,也就是长期依赖问题。我们之前的01序列预测案例中可以看到,当序列长度到达10以上之后错误就会增多,说明简...
深度学习模型中的权重初始化经常被人忽略,而事实上这是非常重要的一个步骤,模型的初始化权重的好坏关系到模型的训练成功与否,以及训练速度是否快速,效果是否更好等等,这次我们专门来...
我们生活的世界充满了形形色色的序列数据,只要是有顺序的数据统统都可以看作是序列数据,比如文字是字符的序列,音乐是音符组成的序列,股价数据也是序列,连DNA序列也属于序列数据。...
卷积神经网络相当于人类的视觉,但是它并没有记忆能力,所以它只能处理一种特定的视觉任务,没办法根据以前的记忆来处理新的任务。比如,在一场电影中推断下一个时间点的场景,这个时候仅...
ResNet是2015年的ImageNet竞赛的冠军,由微软研究院的何凯明等人提出。ResNet,残差神经网络是一种通过残差块来构建的神经网络,通过残差模块可以训练152层以...
在2014年的ImageNet图像识别大赛中,一个名叫GoogleNet的网络架构大放异彩。GoogleNet使用了一种叫作inception的结构。其实GoogleNet本...
VGG,也叫VGGNet,是ImageNet大赛2014年的亚军,总体也是通过卷积层和池化层的叠加,最后加上一个全连接层来实现的卷积神经网络。它的主要特点是采用了更小的滤波器...
AlexNet是第一个现代深度卷积网络模型,其首次使用了很多现代深度卷积网络的一些方法,如使用GPU并行训练,采用ReLU函数作为非线性函数,使用Dropout技术防止过拟合...