阅读了《Elasticsearch实践指南》的个人笔记

由于有机会在Elasticsearch上进行开发,所以我买了《Elasticsearch实践指南》这本书来学习基础知识。以下是我的个人阅读体会。

这次阅读的目的

這次我們試試看在EC2上安裝Elasticsearch、Fluentd和Kibana,將存取日誌儲存至Elasticsearch並在Kibana中進行分析。

    • CSVファイルを読み込み、そこに記載されたデータをElasticsearchに登録

 

    API経由でElasticsearch内のデータをいろいろな方法で検索

需要做一些东西,所以开始从零学习并阅读。
由于使用了Amazon Elasticsearch Service,所以将环境设置放在后面,主要学习的是如何使用Elasticsearch。

摘要和笔记

以下是「第1章 Elasticsearchとは」到「第2章 Elasticsearchの基礎 2-3 REST APIによる操作」的原文在中文中的释义:

从”第1章 Elasticsearchとは”至”第2章 Elasticsearchの基礎 2-3 REST APIによる操作”

从全文搜索机制中记载了Elasticsearch的基础知识。
网络文章通常在简短说明后,会有许多关于安装和试用的内容,因此书籍更容易获得系统化的信息。
与MySQL等数据库类似,Elasticsearch也有类似于索引的概念,用于加快搜索速度。但在Elasticsearch中,索引指的是类似于数据库表的概念……
Elasticsearch使用了独特的术语,因此建议正确理解这些术语。

一篇摘录

    • ドキュメント:DBのレコードに該当

 

    • フィールド:ドキュメント内の項目名、値のセット

 

    • インデックス:DBのテーブルのようなもの

 

    • ノード:Elasticsearchが動作するサーバー

 

    クラスタ:ノードのグループ

「通过2-3个REST API进行操作」只需简单浏览一下,因为实际使用会更容易理解。

“第2章 2-4 Elasticsearch的安装方法”

有很多不同的建構方法被提及,但這一次我在買書之前先研究了使用 Docker 部署 Elasticsearch 的方法,並且建立了相應的 Docker 環境。我選擇使用這個環境,版本為7.1(因為 AWS 支持的最新版本是7.1)。雖然書中介紹的是6.2版本,但因為我只是查看了基本操作,所以沒有感受到版本差異帶來的影響。

“基本操作:第三章 文件/索引/查询”

不需要像一般的数据库一样定义表格,它可以直接存储数据。但是通过定义文档类型,也可以像定义表格一样使用它。但要注意的是,一旦定义了就不能更改,只能添加字段不能修改字段。
可以通过curl执行和确认,易于调试和编写相关程序。

这里虽然没有提到,但是模糊搜索可以使用Elasticsearch的模糊查询来尝试模糊搜索。
当想按日期差进行条件搜索时,希望可以在Elasticsearch中通过字段间的差异进行搜索。
当想要进行随机排序时,可以参考常用的Elasticsearch查询(数据获取)的每个页面。

“高级数据分析通过分析器/聚合/脚本” – 第4章

分析器

不仅可以进行形态素解析,还可以对字符串进行过滤和转换。
以前,在数据库进行搜索处理时,我们将平假名转换为片假名,全角英数字转换为半角英数字,并将数据存入数据库,同时也将搜索目标字符串进行相同的转换,以尽可能抑制文字的波动,使其能够在广范围内进行搜索。现在所有这些都可以全部由它来完成。
它可以做很多事情,所以反而让人有些犹豫不决。

聚合

一个可以进行聚合计算的功能。类似于使用SQL进行GROUP BY和COUNT的操作。相比SQL语句,需要更多的文字描述,感觉上一开始还挺麻烦的。

第五章 系统运营与集群管理

这次我们要使用AWS,所以只需粗略阅读这部分就可以了。(关于AWS到底能做到哪个程度,可能需要另行调查一下。)因为有很多要注意的地方,所以在进行本地操作时需要考虑的事项可能很多。

「第6章弹性堆栈整合」

因为我没有打算使用,所以只是粗略地阅读了关于Kibana、Logstash、Beats和X-Pack的内容。

印象

对于初学者来说非常易懂。特别是第1章到第3章非常易懂,如果阅读完这部分,就能掌握一定的操作技能。
相反,第5、6章关于环境和服务的介绍以及实施内容各不相同,所以在需要的时候最好能后来再去重新阅读。

广告
将在 10 秒后关闭
bannerAds