elasticsearch 分词器 ik

# ik安装

1.https://github.com/medcl/elasticsearch-analysis-ik 

(参照自己es版本选择ik版本)我选择1.9.4版本(es:2.3.4),在页面上直接下载 ,不要用git clone, clone下来是5以上版本

2.mvn clean package

 将target\relase\下zip包解压到 es/plugins/ik/目录下(没有ik 创建即可 把解压后文件直接放到ik下)

3.将词典 即elasticsearch-analysis-ik/config下的文件 复制到es/config/ik下 (没有ik创建)

4.配置(跳过也行),打开es/config/elasticsearch.yml文件,最后一行添加index.analysis.analyzer.default.type: ik,重启elasticsearch

注释:不用将jar 包copy到 lib下

5.测试ik是否安装成功

curl 'http://localhost:9200/_analyze?analyzer=ik_smart&pretty' -d '{ "text":"发展中国家" }'

curl 'http://localhost:9200/_analyze?analyzer=ik&pretty=true' -d '{ "text":"美国留给伊拉克的是个烂摊子吗" }'


# 分词插件使用:

1.ik 带有两个分词器,根据需求选择

ik_max_word :最细粒度的拆分,尽可能多的拆分出词语

ik_smart:粗粒度的拆分,已被分出的词语不会再次被拆分

示例:

#ik_smart

 curl -XGET 'http://localhost:9200/_analyze?pretty&analyzer=ik_smart' -d '{ "text":"发展中国家" }'

分词结果:发展中国家

#ik(ik_max_word)

curl 'localhost:9200/finance/_analyze?analyzer=ik&pretty' -d '{ "text":"发展中国家" }'

分词结果:发展中国家、发展中、发展、发、展、中国、国家、家

1.创建索引 给索引指定分词器

curl -XPUT 'http://localhost:9200/finance?pretty' -d '{

"settings" : {

"analysis" : {

"analyzer" : {

"ik" : {

"tokenizer" : "ik_smart"

}

}

}

},

"mappings" : {

"toutiao" : {

"dynamic" : true,

"properties" : {

"title" : {

"type" : "string",

"analyzer" : "ik_smart"

}

}

}

}

}'

注释:

创建finance 索引;type:toutiao;分词字段:tit;analyzer :ik_smart

curl 'http://localhost:9200/finance/_analyze?analyzer=ik&pretty' -d '{ "text":"发展中国家" }'

curl 'http://localhost:9200/_analyze?analyzer=ik&pretty' -d '{ "text":"发展中国家" }'

给索引添加数据后,不能再指定使用哪种分词

2.添加测试数据,将mysql_laws_article.sh 脚本放到es/bin/下,执行es目录下 bin/mysql_laws_article.sh

3.测试查询

curl -XPOST http://localhost:9200/finance/toutiao/_search?pretty  -d'

{

"query" : { "match" : { "title" : "股票" }},

"highlight" : {

"pre_tags" : [""],

"post_tags" : [""],

"fields" : {

"title" : {}

}

}

}

'

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容