在产品运营中统计各类数据,一般通过采集方式,获取到用户属性信息与行为信息,但采集的信息是基于用户的,脱离了用户,数据的意义会减少很多,所以识别用户是数据采集中一项重要关注点。
一般采集用户数据的几种方式:
1、粗糙型的如通过IP来识别用户,每个用户登录都有自己的互联网IP,通过IP可以识别一定范围用户群体,之所以是一定范围,是因为目前基本都是采用动态IP,多个用户公用一个IP,所以存在统计不准确情况。
2、通过登录cookies来识别用户,此类方法相对准确,同一个用户登录浏览器访问后,就会生成识别的cookies信息,通过此信息可以有效定位到某一个用户及其行为。当然缺陷在于cookies在用户的客户端,如果清理了cookies会导致数据不准确。
3、通过注册用户身份获取,比如电信用户的手机号码、身份证号码等等来识别用户,准确率最高,但难度也是最大的,用户的安全意识越来越高,一般情况下不喜欢暴露个人信息,所以需要运营方采用更多的方法来获取用户信息。
4、通过用户设备标识来判断识别用户,得益于移动互联网的普及,手机终端已普及到每个用户,如果能获取到用户终端标识,也可以准确识别用户。获取用户终端标识有门槛,一是需要用户授权,二是需要通过app等方式来获取(iOS相对安卓也更难获取)。
以上是几种常见的识别用户的方法,现实数据采集中,是多种方法综合使用,再通过数据清洗,获取到最准确的数据,随着采集数据量的不断增加,数据准确性也会越来越高。