1. windows上的点击刷日志是在每小时59分,刷出redis 的clickmap然后删除map。sleep 3分钟后再保存到文件并重命名文件。
2. 上面的方式导致每小时59分到00分的点击透传失败,因为在下一个小时的地点击日志里,而不是在对应小时的日志里。
3. 同时导致每小时00分到03分的转化透传失败。因为这些转化的点击如果发生在上一小时,就不会去查redis map而是去找上一个小时的点击日志。但是这是上一个小时的点击日志正在sleep 3分钟,还没有写到文件。
4. 之前透传失败,用的grep,但是grep -a才会处理binary的日志,否则只会说找到了而不会打印出匹配的内容。
5. grep查找的内容越长越慢,-i可以加快速度。还可以考虑ag,ack。