简单概括:
本文贡献:
1. 提出了一个针对文本检测和识别任务的数据扩增方法。该方法合成的图片相当真实,可以以假乱真,极大提高了准确率。其他任务可以借鉴。
2. 借鉴YOLO,提出了一个端对端的文本检测模型,可以看做EAST、wordsup、DeepDirect方法的雏形。
3. 为了提高性能,采用了cascade结构,把 2 的 结果作为proposal,用传统方法二次过滤,用神经网络二次回归。对发表论文、刷比赛库有启发。
简单概括:
本文贡献:
1. 提出了一个针对文本检测和识别任务的数据扩增方法。该方法合成的图片相当真实,可以以假乱真,极大提高了准确率。其他任务可以借鉴。
2. 借鉴YOLO,提出了一个端对端的文本检测模型,可以看做EAST、wordsup、DeepDirect方法的雏形。
3. 为了提高性能,采用了cascade结构,把 2 的 结果作为proposal,用传统方法二次过滤,用神经网络二次回归。对发表论文、刷比赛库有启发。