上周五,一个旧时创业公司的同事跟我说,他现在,患有恶性高血压、肾衰竭五期、肾纤维化,身体每况越下,这些,都是那时候在创业公司烙下的病根,接着还跟我吐槽了那时候创业公司的上司,...
上周五,一个旧时创业公司的同事跟我说,他现在,患有恶性高血压、肾衰竭五期、肾纤维化,身体每况越下,这些,都是那时候在创业公司烙下的病根,接着还跟我吐槽了那时候创业公司的上司,...
1 前言 作为一名合格的数据分析师,其完整的技术知识体系必须贯穿数据获取、数据存储、数据提取、数据分析、数据挖掘、数据可视化等各大部分。在此作为初出茅庐的数据小白,我将会把自...
《结婚礼服》本以为是一部爱情片,打开后才知道这是一部亲情片。其实故事情节讲起来很简单:单亲妈妈是一位婚纱设计师,无奈身患癌症,在临别之际为小女儿准备了未来的结婚礼服。 这样的...
Python可以通过两个第三方包来操作Excel文档: xlrd:https://pypi.python.org/pypi/xlrdxlwt:https://pypi.pyt...
Anaconda使用总结 2016.7.19 PeterYuan 序 Python易用,但用好却不易,其中比较头疼的就是包管理和Python不同版本的问题,特别是当你使用Wi...
最近由于需要一直在研究微博的爬虫,第一步便是模拟登陆,从开始摸索到走通模拟登陆这条路其实还是挺艰难的,需要一定的经验,为了让朋友们以后少走点弯路,这里我把我的分析过程和代码都...
爬取赶集网二手交易市场所有类目,并将信息储存在数据中。 效果是这样的: 我的代码: 监控截图: 总结: Mongodb数据的基础功能使用; 多进程访问方式的引用; 数据库查找...
前言 在整理项目的时候发现清洗过程是一个非常细节的过程,几乎贯穿始终,也是后续步骤特征提取等的前置条件,所以整理如下,因为展开较大,所以我已近上传mindnode脑图和原始照...
数据清洗经验 平时习惯了在某些特定的数据集合上做实验,简单的tokenization、预处理等步骤就足够了。但是在数据越来越大的年代,数据清洗越来越重要,也越来越复杂。看到P...