240 发简信
IP属地:上海
  • Resize,w 360,h 240
    SQL-Elasticsearch拉数据优化

    引言 最近几个月我们小组在做SQL拉数据相关的优化工作,主要涉及Trino、ES、Lucene三个模块的开发优化,具体优化包括列存-行转列读取、...

  • Resize,w 360,h 240
    手写简版倒排索引(Inverted Index)

    说明 周末闲来无事花点时间,基于Lucene倒排索引的思想,使用Python简单实现了索引文档与短语搜索的小功能,目的是帮助快速理解倒排索引的写...

  • Resize,w 360,h 240
    Elasticsearch Search Phase Debug 详细记录

    Debug说明 记录ES数据搜索的整个debug流程,具体细节没有作过多的解释说明 Debug的索引,设置2shard、0replicas,便于...

  • Resize,w 360,h 240
    Elasticsearch Dangling Indices知识梳理

    背景 前段时间客户根据看到的ES日志报了索引无法创建的Bug,研发工作完成差不多后,开始梳理前线客户Bug,调研后才发现原来是Dangling索...

  • Elasticsearch 索引数据被删除问题的研究

    背景 前段时间帮着客户排查ES相关的问题,客户环境后期接入的数据量比当初规划的多了很多,依据机器资源的使用情况决定对当前ES集群进行扩容;由2d...

  • Resize,w 360,h 240
    Elasticsearch 获取写入Doc shardID的源码分析

    前言 平时在研究ES的分布式Doc(文档)写入操作时,我们已经知道对将要写入的Doc,ES首先会计算其应该写入到索引的哪个分片,然后在根据集群m...

  • Resize,w 360,h 240
    Elasticsearch Write Debug 详细记录

    Debug说明 记录ES写入数据的整个Debug流程,具体实现细节没有做过多解释说明 Debug的索引,设置1shard、0replicas,便...

  • python list 之时间复杂度分析

    引言 我们在使用python开发过程中,list属于使用非常广泛的数据结构。不管是自己程序存放数据,还是处理接口返回的数据,我们都更倾向于使用l...

  • Python lambda

    引言 前段时间,没事儿时翻看了自己刚参加工作时写的一些代码,发现代码中有好几处分别都用到了lambda表达式,从代码中会发现那时候的自己对lam...