引言 最近几个月我们小组在做SQL拉数据相关的优化工作,主要涉及Trino、ES、Lucene三个模块的开发优化,具体优化包括列存-行转列读取、...
说明 周末闲来无事花点时间,基于Lucene倒排索引的思想,使用Python简单实现了索引文档与短语搜索的小功能,目的是帮助快速理解倒排索引的写...
Debug说明 记录ES数据搜索的整个debug流程,具体细节没有作过多的解释说明 Debug的索引,设置2shard、0replicas,便于...
背景 前段时间客户根据看到的ES日志报了索引无法创建的Bug,研发工作完成差不多后,开始梳理前线客户Bug,调研后才发现原来是Dangling索...
背景 前段时间帮着客户排查ES相关的问题,客户环境后期接入的数据量比当初规划的多了很多,依据机器资源的使用情况决定对当前ES集群进行扩容;由2d...
前言 平时在研究ES的分布式Doc(文档)写入操作时,我们已经知道对将要写入的Doc,ES首先会计算其应该写入到索引的哪个分片,然后在根据集群m...
Debug说明 记录ES写入数据的整个Debug流程,具体实现细节没有做过多解释说明 Debug的索引,设置1shard、0replicas,便...
引言 我们在使用python开发过程中,list属于使用非常广泛的数据结构。不管是自己程序存放数据,还是处理接口返回的数据,我们都更倾向于使用l...
引言 前段时间,没事儿时翻看了自己刚参加工作时写的一些代码,发现代码中有好几处分别都用到了lambda表达式,从代码中会发现那时候的自己对lam...