IP属地:重庆
利用selenium抓取淘宝商品搜索页的信息。试了一下调用chrome,速度确实不快。后续可以通过使用PhantomJS无界面浏览器来改善。
前几天写了简单的饿了么爬虫,并按获取坐标保存为csv文件。就像下面这个样子: 因为里面数据格式都一样,就利用pandas来合并去重这些csv文件。
根据百度的AI平台,写了个demo。放了两张图跑了一下,百度AI的评分太苛刻了,好多明星连60都没。。。(逃
最近github上wangshub的抖音机器人很火,参考了下代码。把人脸识别的部分拿出来做个备份,感觉挺有意思的。准备在自己的blog上搭个人脸...
根据经纬度来爬取附近商家信息,保存在经纬度命名的csv文件中,方便后续导入pandas做数据清洗、分析。
针对前段时间爬取的购物狂育儿板块帖子,用结巴分词进行分词,并排除无意义的停用词,并对词频结果生成词云图。分析一下大家目前针对小BABY最关注哪些方面。