Elasticsearch 简明入门

带你30分钟入门Elasticsearch, 实时分布式搜索和分析引擎。

是什么

Lucene + 全文搜索
实时的文件存储，每个字段都可以被索引，并可被搜索
实时分析搜索引擎
可扩展，处理PB级结构化、非结构化数据
可以通过简单RESTful API、各种语言的客户端、甚至是命令行与之交互（HTTP 服务的典型优点）

Installs

Java 环境
Marvel 管理监控工具，一个插件

# 测试
$ curl -XGET 'localhost:9200/?pretty'

与Elasticsearch 交互

Java API
RESTful API

面向文档

JSON 作为文档序列化格式

基础概念

索引（indexing）
搜索（search）
聚合（aggregations）

类比传统关系型数据库

Ralational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices -> Types -> Documents -> Fields
一对多。

Index

名称，一个索引就像传统关系数据库中的数据库，复数为indices / indexes
动词【索引一个文档】，把一个文档存储到索引里
倒排索引(Inverted index)，传统数据库为特定列增加一个索引，如B-Tree来加速索引

create index

# add person-1
$ curl -XPUT 'localhost:9200/megacorp/employee/1'  -H 'Content-Type: application/json' -d'
{
    "first_name" : "John",
    "last_name" : "Smith",
    "age" : 25,
    "about" : "I love to go rock climbing",
    "interests": [ "sports", "music" ]
}'

# add person-2
$ curl -XPUT 'localhost:9200/megacorp/employee/2'  -H 'Content-Type: application/json' -d'
{
    "first_name" : "Jane",
    "last_name" : "Smith",
    "age" : 32,
    "about" : "I like to collect rock albums",
    "interests": [ "music" ]
}'

# add person-3
$ curl -XPUT 'localhost:9200/megacorp/employee/3'  -H 'Content-Type: application/json' -d'
{
    "first_name" : "Douglas",
    "last_name" : "Fir",
    "age" : 35,
    "about": "I like to build cabinets",
    "interests": [ "forestry" ]
}'

search index

检索文档

$ curl -XGET 'localhost:9200/megacorp/employee/1'

简单查询

# 默认返回前10个结果
$ curl -XGET 'localhost:9200/megacorp/employee/_search'
# 搜索last_name 字段
$ curl -XGET 'localhost:9200/megacorp/employee/_search?q=last_name:smith'

DSL语句查询

$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
{
    "query" : {
        "match" : {
            "last_name" : "Smith"
        }
    }
}'

更复杂的搜索

$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
{
    "query" : {
        "bool" : {
            "filter" : {
                "range" : {
                     "age" : { "gt" : 30 }
                }
            },
            "must" : {
                "match" : {
                    "last_name" : "Smith"
                }
            }
        }
    }
}'

中文版文档语法版本过时， filtered 已在ES5.0废弃，使用bool/must/filter。
gt = greater than。

全文搜索

$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
{
    "query" : {
        "match" : {
            "about" : "rock climbing"
        }
    }
}'

默认情况下，Elasticsearch 根据相关性评分来对结果集进行排序。是传统数据库很难实现的功能。

短语搜索

$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
{
    "query" : {
        "match_phrase" : {
            "about" : "rock climbing"
        }
    }
}'

高亮搜索

$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
{
    "query" : {
        "match_phrase" : {
            "about" : "rock climbing"
        }
    },
    "highlight": {
        "fields" : {
            "about" : {}
        }
    }
}'

分析/聚合 Aggregations

数据上生成复杂的分析统计，功能类比SQL GROUP BY，但更强大

# 基础语法
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
{
    "aggs" : {
        "all_interests" : {
            "terms" : {"field": "interests"}
        }
    }
}'

# 过滤字段
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
{
    "query": {
        "match": {
            "last_name": "smith"
        }
    },
    "aggs" : {
        "all_interests" : {
            "terms" : {"field": "interests"}
        }
    }
}'

# 分级汇总
$ curl -XGET 'localhost:9200/megacorp/employee/_search' -H 'Content-Type: application/json' -d'
{
    "aggs" : {
        "all_interests" : {
            "terms" : {"field": "interests"},
            "aggs" : {
                "avg_age" : {
                    "avg" : { "field" : "age" }
                }
            }
        }
    }
}'

根据官方文档显示，出现该错误是因为5.x之后，Elasticsearch对排序、聚合所依据的字段用单独的数据结构(fielddata)缓存到内存里了，但是在text字段上默认是禁用的，如果有需要单独开启，这样做的目的是为了节省内存空间。——官方文档地址：https://www.elastic.co/guide/en/elasticsearch/reference/current/fielddata.html

# 启用
$ curl -XPUT 'localhost:9200/megacorp/_mapping/employee' -H 'Content-Type: application/json' -d '
 {       
   "properties": {
         "interests": {  
             "type": "text",
             "fielddata": true        
         }       
    }         
 }'

分布式特性

分布式概念上透明化，不需要知道分布式系统、分片、集群发现等分布式概念，就可以在集群上工作。
Elasticsearch 隐藏分布式系统的复杂性。在底层自动完成：

文档分区到不同的容器或者分片，可以存于一个或多个节点
分片均匀分配到各个节点，对索引和搜索做负载均衡
冗余每个分片，防止硬件故障造成的数据丢失
将集群中任意一个节点的请求路由到相应的数据节点
无论是增加节点，还是移除节点，分片都可以无缝扩展和迁移

参考

最后编辑于：2019.06.07 18:07:34

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,324评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,303评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,192评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,555评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,569评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,566评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,927评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,583评论 0赞 257
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,827评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,590评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,669评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,365评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,941评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,928评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,159评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,880评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,399评论 2赞 342

Elasticsearch 简明入门

Elasticsearch 简明入门

是什么

Installs

与Elasticsearch 交互

面向文档

基础概念

类比传统关系型数据库

Index

create index

search index

检索文档

简单查询

DSL语句查询

更复杂的搜索

全文搜索

短语搜索

高亮搜索

分析/聚合 Aggregations

分布式特性

参考

推荐阅读更多精彩内容