Avatar notebook default
13篇文章 · 13175字 · 2人关注
  • Resize,w 360,h 240
    ES大数据量下的查询优化

    在数据规模很大(比如万恶的trace日志)的时候我们有时候会发现第一次访问查询特别慢,可能有几秒钟的样子,然后后面的访问就很快了,这是为啥? 一...

  • Resize,w 360,h 240
    es查询数据的工作原理是什么?

    一 . 根据id从es读数据过程 查询,GET某一条数据,写入了某个document,这个document会自动给你分配一个全局唯一的id,do...

  • Resize,w 360,h 240
    es写入数据的工作原理是什么?

    一. es写数据过程 1)客户端任意选择一个node发送请求过去,这个node就是coordinating node(协调节点)2)coordi...

  • Resize,w 360,h 240
    ES的分布式架构原理?

    一. es的shard&replica机制 (1)index包含多个shard(2)每个shard都是一个最小工作单元,承载部分数据,lucen...

  • Lucene基础入门.

    一 什么是Lucene Lucene是apache下的一个开放源代码的全文检索引擎工具包。提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lu...

  • Resize,w 360,h 240
    倒排索引

    一. 说明 倒排索引(Inverted Index): 倒排索引是实现“单词-文档矩阵”的一种具体存储形式, 通过倒排索引,可以根据单词快速获取...

  • 我在做数据同步时候遇到的几个问题

    1.我在同步时候只能进行数据添加和修改,查看,无法把数据库没有的数据删除掉 查看了一下GitHub大牛的解决方法:同步删除操作改为同步updat...

  • Logstash-解决elasticsearch和Mysql数据库的同步问题

    什么是Logstash Logstash是一款轻量级的日志搜集处理框架,可以方便的把分散的、多样化的日志搜集起来,并进行自定义的处理,然后传输到...

  • ik分词器

    ik分词器出现的背景:分词:即把一段中文或者别的划分成一个个的关键字,我们在搜索时候会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分...

文集作者