7篇文章 · 8908字 · 7人关注
最近我们对我们平台的用户进行了一个用户标签提取,这中间的主要流程如下图3-1所示: 一、梳理做用户画像需要的数据用户画像是基于业务数据而进行的,...
在前一篇文章中我制定了用户画像的计划,第一部分就是数据建模。以“一面APP”为例。 一、一面产品介绍 为了更好地理解如何为一个产品做数据建模,我...
最近准备研究下用户画像,先制定一个计划,在简书上记录下,希望得到同道中人一起讨论。 一、目的 用户画像的目的是通过分析用户行为,最终为每个用户打...
一、HDFS分布式文件系统的shell操作 HDFS的shell操作基本和Linux的shell命令差不多,我这边重点介绍几个常用的文件操作的命...
一、hadoop的部署安装 1、安装JDK:下载jdk,解压,配置环境变量 2、安装hadoop:下载安装包,解压 利用tar -zxvf把ha...
一、为什么需要hadoop? 在数据量很大的情况下,单机的处理能力无法胜任,必须采用分布式集群的方式进行处理,而用分布式集群的方式处理数据,实现...
一、zookeeper简介 zookeeper是一个分布式应用程序协调服务,分布式应用程序可以基于它实现同步服务。具体来讲zookeeper可以...
文集作者