简述什么是Elasticsearch？

ElasticSearch面试考题 0 63

Elasticsearch 是一个基于 分布式架构 的开源搜索引擎，使用 全文检索引擎 Apache Lucene 作为底层技术实现。它能够提供强大的搜索、数据存储和分析功能，适用于海量数据的实时搜索和分析场景。

文档（Document）：

Elasticsearch 的最小数据单元，存储为 JSON 格式，例如：

{
"id": "1",
"title": "Elasticsearch Tutorial",
"content": "Elasticsearch is a search engine."
}

索引（Index）：
- 文档的集合，类似于数据库中的表。一个索引可以存储同类型的数据，例如：
  - 用户数据索引：user_index
  - 产品数据索引：product_index
分片（Shard）：
- 为了支持大规模数据存储和分布式操作，索引会被分成多个分片。
- 每个分片可以单独存储在不同的节点上。
副本（Replica）：
- 每个分片可以有多个副本，用于提高查询性能和容灾能力。
集群（Cluster）：
- 一个 Elasticsearch 集群由多个节点组成，提供统一的搜索和数据存储服务。
节点（Node）：
- 集群中的一个单独实例，每个节点存储部分数据并执行部分搜索和索引操作。

Elasticsearch 是一个强大且灵活的分布式搜索和分析引擎，具备高性能、高可用性和丰富的功能，能够处理海量数据的实时检索与分析。在日志分析、全文搜索、电商搜索等领域，Elasticsearch 已成为事实上的行业标准。