IP属地:加州
经过2020战战兢兢的一年,我自己找工作这个事现在也基本尘埃落定,今天就想总结总结过去几个月的感想,也想分享给还在挣扎的同学们一些经验,少走点弯...
https://soulmachine.gitbooks.io/system-design/content/cn/bigdata/heavy-h...
split和operator那一块讲的不清楚,后面可以看。 Presto实现原理和美团的使用实践 这个看最后的几个比较。https://www....
websocket 和 http的比较http://www.ruanyifeng.com/blog/2017/05/websocket.html...
https://medium.com/@morefree7/design-a-distributed-web-crawler-f67a8ebb8...
Flink WaterMark 详解 watermark是全局的值,但是每个operator维护一个当前的watermark,多流的时候取最小。...
db直接存经纬度,加index,然后扫描一个方块。 整个地图划分成格子,然后不同地方存个格子编号,然后查询,也可以快速找到相邻的,问题就是不同格...
大体思路,保存下。
这个文章讲的挺细致了。 不过还是有几个可以思考的细节。 需要一个global的id 生成器,给每个url文档生成一个doc id,放进倒排里。 ...