阅读了《Elasticsearch实践指南》的个人笔记

3 年 ago

逸, 科

1 minute

由于有机会在Elasticsearch上进行开发，所以我买了《Elasticsearch实践指南》这本书来学习基础知识。以下是我的个人阅读体会。

这次阅读的目的

這次我們試試看在EC2上安裝Elasticsearch、Fluentd和Kibana，將存取日誌儲存至Elasticsearch並在Kibana中進行分析。

API経由でElasticsearch内のデータをいろいろな方法で検索

需要做一些东西，所以开始从零学习并阅读。
由于使用了Amazon Elasticsearch Service，所以将环境设置放在后面，主要学习的是如何使用Elasticsearch。

摘要和笔记

以下是「第1章 Elasticsearchとは」到「第2章 Elasticsearchの基礎 2-3 REST APIによる操作」的原文在中文中的释义：

从”第1章 Elasticsearchとは”至”第2章 Elasticsearchの基礎 2-3 REST APIによる操作”

从全文搜索机制中记载了Elasticsearch的基础知识。
网络文章通常在简短说明后，会有许多关于安装和试用的内容，因此书籍更容易获得系统化的信息。
与MySQL等数据库类似，Elasticsearch也有类似于索引的概念，用于加快搜索速度。但在Elasticsearch中，索引指的是类似于数据库表的概念……
Elasticsearch使用了独特的术语，因此建议正确理解这些术语。

一篇摘录

クラスタ：ノードのグループ

「通过2-3个REST API进行操作」只需简单浏览一下，因为实际使用会更容易理解。

“第2章 2-4 Elasticsearch的安装方法”

有很多不同的建構方法被提及，但這一次我在買書之前先研究了使用 Docker 部署 Elasticsearch 的方法，並且建立了相應的 Docker 環境。我選擇使用這個環境，版本為7.1（因為 AWS 支持的最新版本是7.1）。雖然書中介紹的是6.2版本，但因為我只是查看了基本操作，所以沒有感受到版本差異帶來的影響。

“基本操作：第三章文件/索引/查询”

不需要像一般的数据库一样定义表格，它可以直接存储数据。但是通过定义文档类型，也可以像定义表格一样使用它。但要注意的是，一旦定义了就不能更改，只能添加字段不能修改字段。
可以通过curl执行和确认，易于调试和编写相关程序。

这里虽然没有提到，但是模糊搜索可以使用Elasticsearch的模糊查询来尝试模糊搜索。
当想按日期差进行条件搜索时，希望可以在Elasticsearch中通过字段间的差异进行搜索。
当想要进行随机排序时，可以参考常用的Elasticsearch查询（数据获取）的每个页面。

“高级数据分析通过分析器/聚合/脚本” – 第4章

分析器

不仅可以进行形态素解析，还可以对字符串进行过滤和转换。
以前，在数据库进行搜索处理时，我们将平假名转换为片假名，全角英数字转换为半角英数字，并将数据存入数据库，同时也将搜索目标字符串进行相同的转换，以尽可能抑制文字的波动，使其能够在广范围内进行搜索。现在所有这些都可以全部由它来完成。
它可以做很多事情，所以反而让人有些犹豫不决。

聚合

一个可以进行聚合计算的功能。类似于使用SQL进行GROUP BY和COUNT的操作。相比SQL语句，需要更多的文字描述，感觉上一开始还挺麻烦的。

第五章系统运营与集群管理

这次我们要使用AWS，所以只需粗略阅读这部分就可以了。（关于AWS到底能做到哪个程度，可能需要另行调查一下。）因为有很多要注意的地方，所以在进行本地操作时需要考虑的事项可能很多。

「第6章弹性堆栈整合」

因为我没有打算使用，所以只是粗略地阅读了关于Kibana、Logstash、Beats和X-Pack的内容。

印象

对于初学者来说非常易懂。特别是第1章到第3章非常易懂，如果阅读完这部分，就能掌握一定的操作技能。
相反，第5、6章关于环境和服务的介绍以及实施内容各不相同，所以在需要的时候最好能后来再去重新阅读。