在使用GA进行数据跟踪并查看报告时,我们自然期望能够获取更多的流量,但是有些时候,我们会发现,数据的增长并不是我们想要的普通用户的流量,而是其他我们不想要的方式造成的流量增长。通常情况下,这些表现是由于爬虫等造成的,而本文将通过一些例子来看,如何解决这个问题。
流量的突然增长
如果流量的突然增长并不能归因到你的推广的话(比如付费推广、比如病毒营销),那么一般情况下,就是由于垃圾流量或者搜索引擎蜘蛛造成的。我们之前有写过一篇文章,如何规避这些来源的垃圾流量被发送到GA中,如何在视图设置中将已知的蜘蛛排除掉,可以回复xxx查看。
仍然有流量的突然增长
在我们按照上述的方法将垃圾流量排除掉之后,但是某天仍然出现了垃圾流量的突然增长的情况,这可能是出现了新的,我们没有排除掉的渠道导致的。一旦这些流量被发送到GA中,我们的数据就不再准确,因此我们需要对流量设置自定义提醒及时观测这些变化,并第一时间处理这个变化。
可能的原因
浏览器
检查突然增长的流量的浏览器和浏览器版本,如果它们是来自同一个浏览器或者版本,我们则需要添加一个过滤器来排除这个浏览器或者浏览器版本的流量。但需要注意的是,在排除的时候,我们不能讲真正的流量排除掉。这时候,我们可以会话持续时间、目标达成情况以及访问深度等来区分真实流量与垃圾流量。
主机名
如果这些突然增长的流量是来自某一主机名,或者本身主机名,同上,我们需要将这个主机名的流量进行过滤。一般情况下,我们可以通过创建过滤器,仅包含我们自己主机名的流量,也可以创建一个过滤器将不想要的主机名排除掉。
来源/媒介和引荐路径
通过来源/媒介报告,如果发现这些增长的流量来源是一个比较奇怪的来源,那么这些流量也是需要进行排除的,这里可以通过在该维度添加特定的UTM参数来进行排除。如果这些流量是来自一个比较奇怪的引荐来源,而该引荐来源并不能很好的解释这些流量,同样的,我们需要将其排除。
Client ID
垃圾流量的来源有可能是来自于同一个用户。如果我们发现某个用户极短时间多次重复访问网站,且使用同一个Client ID,那么它很有可能就是垃圾流量。但是我们并不能直接使用Client ID来进行过滤,这时候,我们需要在GA中创建一个自定义维度,并使用GTM或JS来将Client ID传递到GA中。这样,我们可以在GA中查看这个维度的流量,并将其进行过滤了。
User Agent
如果上述的方法都无效,那么我需要查看流量的user agent。
User agent是一段包含用户OS、浏览器以及浏览器版本的字符串,它是特定且唯一的,我们可以通过这个指标来识别和过滤垃圾流量。
类似于Client ID,我们也需要创建一个自定义维度。如下图所示,我们可以在GTM中创建一个新的变量来抓取user agent的值。
然后在GA中创建一个新的自定义维度,并将这个自定义维度的信息添加到所有的GTM代码中,这样我们就可以使用user agent来过滤流量了。
如果,我们发现了流量的增长,但是找不到任何原因,只能发现是某一个页面的流量突然增长了。如果我们将这个页面的流量全部过滤掉,那么也会过滤掉一些真实的流量,这时候,我们就可以使用user agent来进行过滤了。
总结
垃圾流量的过滤和排除是需要持续进行的,大部分情况下,流量是稳定且清洁的,但我们需要对流量进行监控并能够在其出现异常时及时掌握该信息,第一时间找到流量异常的维度和指标,将其过滤掉。