240 发简信
IP属地:加州
  • 2020年疫情下找工回顾和系统设计

    经过2020战战兢兢的一年,我自己找工作这个事现在也基本尘埃落定,今天就想总结总结过去几个月的感想,也想分享给还在挣扎的同学们一些经验,少走点弯...

  • topk的解决方法

    https://soulmachine.gitbooks.io/system-design/content/cn/bigdata/heavy-h...

  • presto 初见

    split和operator那一块讲的不清楚,后面可以看。 Presto实现原理和美团的使用实践 这个看最后的几个比较。https://www....

  • websocket

    websocket 和 http的比较http://www.ruanyifeng.com/blog/2017/05/websocket.html...

  • 10000台不稳定机器如果做爬虫

    https://medium.com/@morefree7/design-a-distributed-web-crawler-f67a8ebb8...

  • Resize,w 360,h 240
    flink watermark

    Flink WaterMark 详解 watermark是全局的值,但是每个operator维护一个当前的watermark,多流的时候取最小。...

  • 地理位置快速查找附近

    db直接存经纬度,加index,然后扫描一个方块。 整个地图划分成格子,然后不同地方存个格子编号,然后查询,也可以快速找到相邻的,问题就是不同格...

  • Resize,w 360,h 240
    爬虫架构

    大体思路,保存下。

  • Resize,w 360,h 240
    搜索引擎

    这个文章讲的挺细致了。 不过还是有几个可以思考的细节。 需要一个global的id 生成器,给每个url文档生成一个doc id,放进倒排里。 ...

个人介绍
最少5年的长跑,或者10年,15年,我迈出了第一步。

#2022回家过年