Transformer 是 Google 团队在 17 年 6 月提出的 NLP 经典之作,由 Ashish Vaswani 等人在 2017 年发表的论文 Attentio...
Transformer 是 Google 团队在 17 年 6 月提出的 NLP 经典之作,由 Ashish Vaswani 等人在 2017 年发表的论文 Attentio...
Romero, A.; Ballas, N.; Kahou, S. E.; Chassang, A.; Gatta, C.; and Bengio, Y. 2015. Fit...
单阶段 Zhang, Shifeng, Xiangyu Zhu, Zhen Lei, Hailin Shi, Xiaobo Wang, and Stan Z. Li. 201...
@67b57286b3ce 不了解,估计没
IncepText: A New Inception-Text Module with Deformable PSROI Pooling for Multi-Oriented Scene Tex...阿里巴巴公司的工作。在FCIS的基础上,继续水。主要贡献: Deformable PSROIpooling。 Inception 中引入Deformable结构。(大预测头,...
Cython第二章,编译和运行cython 编译Pipeline 由于cython是python的超集,因此python解释器不能直接解释cython的代码,通过cython...
本文依旧是旷视科技的作品,旷视的工作一直紧贴实际,直面问题和方法的灵魂。 本文解决的是Anchor的设置策略不好把握的问题。YOLOv2的指导策略是Anchor与目标的的IO...
很简单朴素却抓住了问题本质的思路。牢牢把握住用分割的方法来做文本检测这一捷径,并针对文本毗邻时的单例分割做不好的问题,提出从文本中心开始,扩散到整个文本,分步完成预测的方法。...
比如单精度浮点数(32位),阶码8位,尾数那就是24位咯(尾数中内含一位符号位); 比如双精度浮点数(64位),阶码11位,尾数那就是53位(一样)。 浮点型变量在计算机内存...
本文提出了CTW-1500 数据集,并提出了CTD+TLOC弯曲文字检测算法。 方法是,在proposal基础上预测14个文字关键点。采用的方法基本就是faster rcnn...
数据扩增方面:FOTS: 在synth800k 训练+MLT 训练+验证集上预训练,然后再继续finetune。旋转-10~10度数据扩增。 多尺度测试方面:FOTS:短边1...
阿里巴巴公司的工作。在FCIS的基础上,继续水。主要贡献: Deformable PSROIpooling。 Inception 中引入Deformable结构。(大预测头,...
近期计划对Faster RCNN、SSD的一系列trick进行总结。主要分为:框架结构上面的trick、参数设置上的trick、在文字检测特定领域的trick。 首先,是对F...
贡献: 基于FPN+RFCN。 用EAST来替换RPN,并提出scale-friendly 的尺度匹配策略。 尺度分配时,将短边的宽度作为分配的指标。 采用了Light-he...
打开.dot文件并画图的方法: dot -Tps filename.dot -o outfile.ps dot -Tpdf filename.dot -o outfile.pdf
简单概括: 本文贡献: 1. 提出了一个针对文本检测和识别任务的数据扩增方法。该方法合成的图片相当真实,可以以假乱真,极大提高了准确率。其他任务可以借鉴。 2. 借鉴YOLO...
作者:采石工 链接:https://www.zhihu.com/question/49571479/answer/116840869 来源:知乎 著作权归作者所有。商业转载请...