我要做一件事,需要两三个人。
清晨,提交最后一次结果,庆幸着比赛终于结束了。但是我知道心里一直有一个念头——训练一个自己的神经网络。
最近,参加了阿里天池的文本检测挑战赛,属于计算机视觉目标检测这一部分,应该说是目前比较热的领域。基于以下几个方面的考虑,我想在比赛的基础上再做进一步的探究。
首先是数据集,无论是百度点石竞赛平台现在正在进行的商家招牌的分类与检测,还是阿里刚刚结束的网络图像的检测与识别,以及国外的Kaggle,Imagenet,CoCo等大数据平台都提供了丰富的图像标注数据,这应该说是比较稀缺的资源,为我们解决了实际应用中最大的一个难题,而且也为我们提供了小试牛刀的应用机会。
再者是Github这样一个代码开源的平台,有无数大神提供的顶会论文的源码复现,包括RBG大神写的fast rcnn,以及我们比赛用到的CTPN和旷世去年刚发表的EAST算法。我们需要做的只是把环境搭建起来,将其应用到实际的数据集中。
然而,拿到这样丰富的资源,却不知道如何去下手,数据集实际应用中出现了问题,不知道如何去改进。究其原因,很多知识只是停留在理论层面,缺少实际的应用。
所以,我才会有了前文提到的想法。我明白,这是一个相对比较艰巨的任务,对于神经网络这个黑匣子,是需要一个团队去不断的训练测试进行调优。
如果碰巧我们想到了一起,我觉得可以做以下几件事:1.阅读目标检测的经典论文,包括R-CNN,SPP-NET,Fast R-CNN,Faster R-CNN以及最新发表的顶会期刊的论文 2.源码复现,可以针对实际的数据集进行训练调优。3.每半个月交流一次,每一个月轮流做一次汇报。
当我们有幸在一起做这些事情的时候,我觉得可以得到以下收获:1.有较强的论文功底,和代码实现能力,为以后的工作打下基础,如果你想从事深度学习算法这块,从师兄的工作经验来看,也是不断的在阅读最新论文,复现其代码,然后再应用到实际问题中。2.对深度学习会有一个比较深的把握与了解,当我们把目标检测做通之后,其他领域也是一样的道理,关键是你应对实际的问题,应该怎么去搭建模型,训练网络。3.顺便也可以参加一些国内外的大数据比赛,获得一些比赛经历 4.作为福利呢,每两个月我做东,第五次烧烤happy。
最后呢,附上我们第一次试水的成果,一切才刚刚开始!
——王佳乐(微信18217695307)