
ATSS的核心思想:不要用固定的 IoU 阈值,而是根据每个物体的具体情况,动态地选择正负样本。这样,模型能更好地学习不同物体和场景的特征。AT...
在YOLOv6中,使用了任务对齐学习(TAL)方法来进行预测框和真实框的匹配。这种方法综合考虑了预测框与真实框的位置重叠度和分类得分,具体步骤如...
论文题目:Spatial Transformer Networks 这是一篇我在看文字识别时候看到的文章,STN的方法简单讲就是学习一个仿射变换...
论文题目:NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text Rec...
论文题目:SVTR: Scene Text Recognition with a Single Visual Model OCR文本识别旨在将自...
1.什么是Ohem Cross Entropy Loss OHEM 全称为 “Online Hard Example Mining”,含义是在线...
最近在看ppocrv4相关的代码,看到里面运用了一种高效的backbone---PP-LCNet,目前这个模型有3个版本,V3网上没有相关解析也...
论文:SEAFORMER: SQUEEZE-ENHANCED AXIAL TRANSFORMER FOR MOBILE SEMANTIC SEG...
在使用pytorch或paddlepaddle的时候会出现分布式多卡运行卡住的问题,下面是我的2种解决方案:1.pytorch多卡运行卡住解决方...