最近做计算社会学的研究需要用到网络爬虫爬取一些数据,一开始打算用八爪鱼爬虫工具,后来发现这种爬虫工具不太稳定,那就自己从头学吧,以后说不定也能用的着,试着模仿了几个案例,其实...
IP属地:江苏
最近做计算社会学的研究需要用到网络爬虫爬取一些数据,一开始打算用八爪鱼爬虫工具,后来发现这种爬虫工具不太稳定,那就自己从头学吧,以后说不定也能用的着,试着模仿了几个案例,其实...
这也是一个经典的描述性统计与建模的小案例了,主要用到pandas进行数据处理,用statsmodels进行统计建模。 数据来源: 红葡萄酒(http://archive.ic...
本文从深度学习卷积神经网络入手,基于 Github 的开源项目来完成 MovieLens 数据集的电影推荐系统。 什么是推荐系统呢? 什么是推荐系统呢?首先我们来看看几个常见...
最近朋友面试有被问到文本聚类问题,总结如下: 聚类分析,又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的...
背景介绍 由于项目需要,需要对旅游游记文本进行聚类,为打标签做指导,所以调研了主流的短文本聚类方法,文本聚类主要还是分成两个方面。 1. 提取文本特征 在《数学之美》前几章中...
Terminology word2vec: doc2vec embedding: User profile R: 浏览过的文章数量 rh:doc2vec embedding ...