yu008 - 简书

yu008

IP属地：重庆

selenium抓取淘宝商品信息
利用selenium抓取淘宝商品搜索页的信息。试了一下调用chrome，速度确实不快。后续可以通过使用PhantomJS无界面浏览器来改善。

175 0 0
利用Pandas合并多个csv文件并去重
前几天写了简单的饿了么爬虫，并按获取坐标保存为csv文件。就像下面这个样子：因为里面数据格式都一样，就利用pandas来合并去重这些csv文件。

9859 0 1

百度AI人脸识别demo
根据百度的AI平台，写了个demo。放了两张图跑了一下，百度AI的评分太苛刻了，好多明星连60都没。。。（逃

2374 0 0
利用腾讯AI平台进行人脸识别
最近github上wangshub的抖音机器人很火，参考了下代码。把人脸识别的部分拿出来做个备份，感觉挺有意思的。准备在自己的blog上搭个人脸...

2850 0 0
根据坐标爬取饿了么商家信息
根据经纬度来爬取附近商家信息，保存在经纬度命名的csv文件中，方便后续导入pandas做数据清洗、分析。

1707 0 0
购物狂论坛帖子标题词频分析
针对前段时间爬取的购物狂育儿板块帖子，用结巴分词进行分词，并排除无意义的停用词，并对词频结果生成词云图。分析一下大家目前针对小BABY最关注哪些方面。

478 0 0