ElasticSearch学习笔记(二)

Search API

在es中进行搜索有两种方式,第一种是uri中使用查询参数,第二种是Request Body Search,使用第二种方式可以实现各种高级搜索

1.uri search

“GET 索引名(可以加通配符)/_search”:参数“q”,指定查询字符串,使用Query String Syntax。参数“df”,指定查询的字段。

Query String Syntax有这几种情况

指定字段/泛查询(查询所有的字段,除非指定df):q=user:mike/q=mike

Term查询/Phrase查询:q=(a b)即包含a或是b的都会计入结果/q=“a b”即必须同时包含a b且顺序一致

布尔操作(必须大写):上面的q=(a b)可以等价为q=(a OR b)

+/- :即增加must或must not的条件 如q=(a +b)即理解为should a must b

接下来主要介绍Request Body Search

2.基于词项查询和基于全文查询

a.term查询属于是基于词项的查询,es不会对查询条件做分词处理,比如下面的查询就无法查出fullname有Eddie的数据,而将条件改为“eddie”后就可以查到结果了


查询条件改为eddie后返回数据

原因是因为默认的分词器在索引时会将大写转换为小写,所以term查询不会将查询条件进行分词处理,就没办法在es中索引到数据。

一般可以使用t对字段的keyword进行term查询来进行字段的精确匹配

b.而match,match phrase,query string都属于全文查询,会对搜索条件进行分词处理

如这个查询条件就可以查询出上面那条数据

而match和match phrase的区别在于,match phrase会将用于查询的字符串作为一个短语,即搜索结果中必须同时有match phrase条件中出现的所有词汇且顺序也一样且不能在中间插入多余的字符(可以设置slop参数以放宽条件)

3.query context & filter context  bool查询

区别在于query context会进行相关性算分而filter context不会,所以filter context的性能更好且可以使用缓存,

bool查询即must,should,must not,filter四种查询条件,通过bool查询可以将多种查询条件组合在一起,每个查询字句的评分会合并到总的相关性评分中,但后面两种就属于filter context不会影响算分。

bool同一层级的查询条件权重一样,而查询可以进行嵌套,而嵌套内的查询算分权重会比外层查询条件低

4.Dis max query与单字符串多字段搜索

都知道在ES中进行搜索是会根据结果和搜索条件的匹配程度进行相关性算分并根据算分进行排序的,这样可以尽量将相关度更高的结果排列在前面,但在单字符串多字段搜索的时候默认的相关性算分得出的结果不一定是我们想要的那样。比如现在有两个文档

第一个文档:{“title”:“a fool boy”, "content”:“he seems laike very fool”}

第二个文档:{“title”:“do not be a fool man”, “content”:“this should be a reality”}

如果使用bool查询对title和content同时进行"fool man"的should match查询即

{

    “query”:{

        "bool"{

            "should":[

                {"match":{"content":"fool man"}},

                {"match":{"titile":"fool man"}}

            ]

        }

    }

}

按常理来说很明显第二个文档与我们预期的搜索结果更匹配,但实际结果可能却是将第一个文档排在最前面,因为在计算相关性算分时,should中的两个条件对相关性算分贡献的权重是一致的,而第一个文档两个字段都出现了fool,第二个文档只有title字段出现了fool man。所以经过相加后第一个文档的相关性算分更高了。这个时候为了得到更符合预期的结果,我们可以使用Disjunction max query,

{

    “query”:{

        "dis_max"{

            "querys":[

                {"match":{"content":"fool man"}},

                {"match":{"titile":"fool man"}}

            ]

        }

    }

}

这个查询的作用就是将单字符串多字段查询的时候不会将每个字段的相关性算分进行简单相加,而是取算分最高的子段的分作为结果,这样就可以查出更符合我们预期的结果。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,440评论 5 467
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,814评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,427评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,710评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,625评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,014评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,511评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,162评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,311评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,262评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,278评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,989评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,583评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,664评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,904评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,274评论 2 345
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,856评论 2 339