[翻译]ElasticSearch官方文档

本文翻译自:https://www.elastic.co/guide/en/elasticsearch/reference/current/getting-started.html

前段时间在做ElasticSearch数据分析相关的工作,一直想翻译ES的官方文档,相当于ES的入门文档吧。

Elasticsearch是一个高度可扩展的开源全文搜索和分析引擎。它允许用户快速,实时地存储,搜索和分析大量数据。ES通常用作为具有复杂的搜索功能和要求的应用程序提供的底层引擎/技术。

官方提供了几个示例用例:

  • 你运行一个在线网上商店,让你的客户能够搜索你销售的产品。在这种情况下,你可以使用Elasticsearch存储整个产品目录和库存,并为其提供搜索和自动填充建议。
  • 你要收集日志或事务数据,并且你想分析和挖掘此数据以查找趋势,统计信息,摘要或异常。在这种情况下,你可以使用Logstash(Elasticsearch / Logstash / Kibana堆栈的一部分)来收集,聚合和解析数据,然后将Logstash将此数据提供给Elasticsearch。一旦数据在Elasticsearch中,你可以运行搜索和聚合来挖掘你感兴趣的任何信息。
  • 你运行一个价格提醒平台,让价格优惠的客户指定一个规则,如“我有兴趣购买一个特定的电子小工具,如果小工具的价格在下个月内任何供应商的价格低于$ X,我想收到通知” 。在这种情况下,你可以检索供应商价格,推动他们进入弹性搜索,并使用其反向搜索(Percolator)功能来匹配价格变动与客户查询,并最终一旦发现匹配,将警报给客户。
  • 你有分析/商业智能需求,并希望快速调查,分析,可视化和询问大量数据的特殊问题(考虑数百万或数十亿条记录)。在这种情况下,你可以使用Elasticsearch存储数据,然后使用Kibana(Elasticsearch / Logstash / Kibana堆栈的一部分)构建自定义仪表板,以便可视化对你重要的数据的方面。此外,你可以使用Elasticsearch聚合功能对你的数据执行复杂的商业智能查询。

官方文档的其余部分将引导用户完成ES的运行过程,并在其中进行查看,并执行索引,搜索和修改数据等基本操作。而最后,用户将了解它的工作原理以及和对此的启发,以了解如何使用它来构建复杂的搜索应用程序或从数据中挖掘智能。

基本概念

有几个概念是Elasticsearch的核心。从一开始就理解这些概念将大大有助于缓解学习过程。

近实时(NRT)

Elasticsearch是一个接近实时的搜索平台。这意味着从你索引一个文档到该文档可搜索的时间稍微延迟(通常为1秒)。

集群

集群是一个或多个节点(服务器)的集合,它们共同保存整个数据,并在所有节点之间提供联合的索引和搜索功能。集群由唯一的名称标识,默认情况下是“elasticsearch”。此名称很重要,因为如果节点设置为通过其名称加入集群,则节点只能作为集群的一部分。确保不要在不同环境中重复使用相同的集群名称,否则可能会导致节点加入错误的集群。例如,你可以对开发,分段和生产集群使用logging-dev,logging-stage和logging-prod。请注意,拥有只有一个节点的集群是有效和完美的。此外,你还可以拥有多个独立的群集,每个群集都有自己独特的群集名称。

节点

节点是作为集群一部分的单个服务器,存储数据,并参与集群的索引和搜索功能。就像一个集群一样,一个节点被一个名称标识,默认情况下是一个随机的通用唯一标识符(UUID),它在启动时分配给节点。如果你不想要默认值,你可以定义所需的任何节点名称。此名称对于管理目的很重要,你希望确定网络中的哪些服务器对应于Elasticsearch集群中的哪些节点。可以将节点配置为按集群名称加入特定集群。

默认情况下,每个节点都设置为加入名为elasticsearch的群集,这意味着如果你在网络上启动了多个节点,并且假设它们可以相互发现,则它们将自动形成并加入名为elasticsearch的单个群集。

在单个集群中,你可以拥有很多你所需所需的节点数。此外,如果没有其他弹性搜索节点运行在你的网络上,启动单个节点将默认形成名为elasticsearch的新的单节点群集。

索引

索引是具有某种相似特征的文档的集合。例如,你可以拥有客户数据的索引,产品目录的一个索引,以及订单数据的另一个索引。索引由名称(必须全部为小写)标识,该名称用于在针对其中的文档执行索引,搜索,更新和删除操作时引用索引。

在单个集群中,你可以根据需要定义任意多的索引。

类型

在索引中,你可以定义一个或多个类型。类型是索引的逻辑类别/分区,其语义完全取决于你。通常,为具有一组公共字段的文档定义了一种类型。例如,假设你运行一个博客平台,并将所有数据存储在单个索引中。在此索引中,你可以定义用户数据的类型,博客数据的另一种类型以及注释数据的另一种类型。

文档

文档是可以索引的基本信息单元。例如,你可以拥有单个客户的文档,单个产品的另一个文档,以及单个订单的另一个文档。文档以JSON表示,这是一种无处不在的互联网数据交换格式。在索引/类型中,你可以存储尽可能多的文档。请注意,虽然文档物理上位于索引中,但实际上文档实际上必须被索引/分配给索引中的类型。

碎片和复制

索引可能潜在地存储可能超过单个节点的硬件限制的大量数据。例如,占用1TB磁盘空间的10亿个文档的单个索引可能不适合单个节点的磁盘,或者可能太慢,无法单独从单个节点提供搜索请求。
为了解决这个问题,Elasticsearch提供了将索引细分为多个称为碎片的片段的功能。创建索引时,你可以简单地定义所需的分片数。每个分片本身就是一个全功能且独立的“索引”,可以在集群中的任何节点上托管。
分片是重要的两个主要原因:

  • 它允许你水平分割/扩展你的内容卷
  • 允许你在分片(潜在地在多个节点上)分散和并行操作,从而提高性能/吞吐量

如何将其文档聚合回搜索请求完全由Elasticsearch管理,对用户来说对你是透明的。

在可以随时预期故障的网络/云环境中,非常有用,并强烈建议使用故障切换机制,以防止分片/节点因为某种原因脱机或消失。 为此,Elasticsearch允许你将索引的碎片的一个或多个副本复制到所谓的复制分片,或简写为复本。

副本是重要的两个主要原因:

  • 它提供高可用性,以防分片/节点失败。 因此,重要的是要注意,复制分片从未从与其复制的原始/主分片在同一节点上分配。
  • 它允许你扩展搜索量/吞吐量,因为可以对所有副本并行执行搜索。

总而言之,每个索引可以分成多个分片。 索引也可以被复制为零(意味着没有副本)或更多次。 一旦复制,每个索引将有 主碎片(复制的原始碎片)和副碎片(主碎片的副本)。 可以在创建索引时为每个索引定义碎片和副本的数量。 创建索引后,你可以随时动态更改副本数,但不能更改事后的分片数。

默认情况下,Elasticsearch中的每个索引都分配了5个主分片和1个副本,这意味着如果你的集群中至少有两个节点,则索引将具有5个主分片和5个复本分片(1个完整副本),总共 每个指数10个碎片

注意:每个弹性搜索碎片都是Lucene索引。 在一个Lucene索引中可以有最多的文档数量。 从LUCENE-5843起,限制为2,147,483,519(= Integer.MAX_VALUE - 128)文档。 你可以使用_cat / shards API监视分片大小。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,392评论 5 470
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,258评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,417评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,992评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,930评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,199评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,652评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,327评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,463评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,382评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,432评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,118评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,704评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,787评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,999评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,476评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,057评论 2 341

推荐阅读更多精彩内容