8篇文章 · 12335字 · 26人关注
需求背景 工程场景是这样的:我需要展现不同类别在一段日期内的多个指标的变化趋势图。大体思路是这样:对每个指标画一张图,在每张图上画出多条曲线,每...
新词自动发现已经成为文本挖掘方面非常基本常用的技术了。比如,我为了实现某个idea,需要对NBA新闻评论语料进行分词,结果缺少了NBA领域的专业...
当我们选好了dataset后,我们通常要先进行Summarize Data(怎么翻译呢,总计数据?)这一工作,这是为了从总体上了解数据的变量的类...
机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很...
译言网貌似是全国最大的用户自主翻译网站了吧,当前alexa中文排名2335,其实在我女友混译言网之前我也没听说过这个网站。译言网有个专门的“译言...
在《体彩历险记》中,我介绍了一些对体育彩票的数据分析以及购买思考,在文章结尾提到这只是个开始,我是计划伴随着继续购买彩票的经历,写一系列的体彩相...
“兵马未动,粮草先行”,我们进行数据分析前,先行的粮草就是数据。通常我们想用数据验证自己生活中的各种想法时,并没有人为我们备好“粮草”,这就需要...
火车警示录是为了警告那些可能因城市有多个火车站而去错始发站的人们。其制作灵感来源于我经历的真实故事。 去错始发站的故事 2013.08.21我提...
文集作者