分布式的 ES

节点：一个物理或者虚拟的 ElasticSearch 进程，拥有 CPU、内存、磁盘等资源。只有 Data 节点可以持有分片；

分片：索引数据会被分成多个分片（都是主分片），副本分片是每个主分片的 copy，每个分片都是一个独立的 Lucene 索引。

ES 中一个索引（Index）逻辑上就是一个完整数据库，物理上会被分成多个分片（Shard），每个分片都是一个 Lucene 实例，Index 在创建时，分片数就确定了。

创建索引时，索引一般有多个主分片，存储互不重复的数据子集。Master 节点需要计算这三个分片存到哪些 Data 节点上。

路由

前一篇描述了 Lucene 创建索引，因为在 es 中，每个分片都是一个 Lucene 节点，那么索引请求应该写入到哪个分片中呢？实际上会通过 doc_id 哈希取模得出分片 id：

1	shard_num = hash(doc_id) % num_primary_shards

每个分片都有主分片（Primary Shard）和副本分片（Replica Shard）区分。

主分片是一个完整的 Lucene 实例，副本分片是主分片的一个完整精确的 copy。

写入请求必须由主分片处理。主分片处理完成后，将操作转发到副本分片，等待副本分片全部确认（或部分确认，由一致性参数决定），返回写入成功。

写入索引是由路由计算得出的分片处理的，写入都是主分片来操作的。

读取请求可以由主分片或者副本分片处理，副本分片可以分担查询压力。

当一个节点宕机后，如果有主分片在上面，会先提升对应副本分片作为主分片，然后重建一个副本分片。