240 发简信
IP属地:浙江
  • @youngy 最新评论有解释

    Redis 大数据内存优化 (RoaringBitmap)

    最近碰到手机设备匹配的业务, 用户在我司后台可以上传人群包, 里面存放的是设备的MD5标识符; 一个人群包大概有千万级的MD5数据, 与广告请求所携带设备标识进行匹配. 1....

  • 本文中的方案不是很好用, 首先hash存在碰撞, 数据量越大, 重合率越高;

    roaringBitmap本身是为了解决数据离散问题, 尽可能的压缩内存占用;

    后面看了下布隆过滤器的实现原理, 可以采用多个不同的hash函数进行offset的定位, 如果多个hash函数后的每个offset值都为1, 可以看做该值可能存在, 如果其中有offset值不为1, 则该值肯定不存在;

    结论
    1. 阿里云提供工程化的解决方案(企业版Redis), TairRoaring, 原理和RoaringBitmap类似, 其中采用了更多的优化算法, 压缩率更高
    2. TairBloom, 原理和布隆过滤器相似, 内存占用也极低, 数据错误率可以自定义, 错误率越低, 内存占用越大

    Redis 大数据内存优化 (RoaringBitmap)

    最近碰到手机设备匹配的业务, 用户在我司后台可以上传人群包, 里面存放的是设备的MD5标识符; 一个人群包大概有千万级的MD5数据, 与广告请求所携带设备标识进行匹配. 1....

  • 厉害, 很实用, 解决了我的问题

    iOS加密--AES(CBC)和RSA组合加密(避坑)

    遇到的坑 项目中使用AES(CBC)和RSA组合进行加密,但是一直存在加密之后的数据,服务端无法解析,比例小但却是个问题。翻阅过很多资料之后发现以下几个问题: 1、RSA加密...

  • 是的, 会有这样的一个问题, 在我们的这个业务场景中, 不需要100%的正确度;

    Redis 大数据内存优化 (RoaringBitmap)

    最近碰到手机设备匹配的业务, 用户在我司后台可以上传人群包, 里面存放的是设备的MD5标识符; 一个人群包大概有千万级的MD5数据, 与广告请求所携带设备标识进行匹配. 1....

  • 120
    Redis 大数据内存优化 (RoaringBitmap)

    最近碰到手机设备匹配的业务, 用户在我司后台可以上传人群包, 里面存放的是设备的MD5标识符; 一个人群包大概有千万级的MD5数据, 与广告请求所携带设备标识进行匹配. 1....

  • 如果你亲自接过,你就知道每一个靠谱的

  • 120
    一个无性婚姻受害者的来信

    前两日,简书私信收到一条信息,内容如下: 清心,你好。一口气读了你很多文章,很想跟你倾诉一下。我和我老公无性婚姻十年,有个六岁的儿子,就那么几次成功了。现在无性无爱无话可聊,...

  • 120
    iOS 如何优化项目

    前言 在项目业务趋于稳定的时候,开发完迭代需求后,我们可能会无所适从,进入一段空白期,但是对于攻城狮来说闲暇不是件好事,所以我们可能总想学点什么,却又没有头绪。这个时候我们就...

  • iOS-深挖BOOL

    为啥要深挖这玩意 你每天都在用BOOL吧?那我就来问一道题:请问BOOL是非0即真吗? 如果不是百分百确定的,请往下看。 BOOL的定义(Xcode7.3版本,位于usr/i...

  • 120
    二级指针与ARC不为人知的特性

    先看一眼熟知的代码 上述代码中,出现了NSError的实例。该实例是用来表明发生了某种错误。在ARC中由于使用异常处理会造成内存管理的不便(可能造成内存泄露,或者加入大量样板...

个人介绍
talk is cheap,show me the code