从零开始介绍Apache Zeppelin的功能部分
系列链接
-
- 功能介绍编
-
- 安装・启动・停止编
-
- 设置编
-
- Spark解释器编
- 其他解释器编(计划中)
只需要一个选项:
简而言之
-
- Apache ZeppelinはSparkを中心としつつ
-
- Redshift、BigQueryなどの他データソースにも対応できるノートブック。
-
- Apache Zeppelinはフォーム入力やバージョン管理、
- ノートのスケジュール実行ができるなど高機能なノートブック。
这个系列的目标读者 (zhè ge xì liè de mù dú zhě)
-
- データ分析プラットフォームに興味はあるが詳しくは知らない。
-
- 設定などSparkに関する基本的な事項は把握している。
- Javaで一般的な依存性管理方法は把握している。
请注意(请务必阅读)
-
- 以下は免責事項です。
本シリーズに掲載された内容は投稿者の個人的見解であり、
所属する企業・部門の公式見解ではありません。
本シリーズに掲載された内容について
可能な限り正確を期すようにしておりますが、
掲載された内容の正確性、信頼性、完全性を
保証するものではございません。
本シリーズに掲載された内容によって生じた
あらゆる損害等に関して投稿者ならびに所属する企業・部門は
一切の責任を負いません。
将来的に追加、変更、廃止される機能も当然ございますので
Apache Zeppelinを使用する際は公式ページにて確認をお願いいたします。
このシリーズではSparkやScalaといった
Apache Zeppelin以外の事項に関しては解説いたしません。
それぞれについて解説しているサイトにて確認をお願いいたします。
对于这个系列的环境
-
- OS
-
- macOS
-
- メモリ
-
- 16GB
-
- Java
-
- OpenJDK 64-Bit Server VM, Java 1.8.0_232
-
- Scala
-
- 2.13.1
-
- Apache Zeppelin
-
- 0.8.2
-
- Apache Spark
- 2.4.4
系列的背景
我对Apache Zeppelin一直很感兴趣,并个人进行了一些尝试。但是,目前的工作环境主要考虑到自动化的角度,在使用云环境方面已经制定了方针,所以要将Apache Zeppelin应用到实际工作中,必须提供全托管的服务才行(如AWS EMR和Cloud Dataproc)。如果更多人开始利用Apache Zeppelin,或许会提供全托管的服务呢?所以我带着一丝希望开始阅读这个系列。如果通过阅读这个系列,能让您对Apache Zeppelin产生一丝兴趣,我会非常高兴。
Apache Zeppelin是什么?
这是一个用于显示通过Spark获取的数据的表格和图形的主要用途,同时还可以显示其他数据源(如Redshift和BigQuery)的数据,还可以执行Scala、Python、R和Shell命令等多种操作。它是一个由Scala实现的功能强大的Notebook。此外,其许可证为Apache License 2.0。
筆記本是什么?
Apache Zeppelin 是一个笔记本,而什么是笔记本呢?它指的是以下的东西。
文芸的プログラムを記述する環境となる仮想的なノート
参考
文学类的程序究竟是什么呢?简单来说,就是以下这些:
ブラウザ等でプログラムコードとコメントを
入力してそれらを別々に処理した結果を出力するもの
依据
因此,使用笔记本的用户可以通过评论来更加清楚地解释并描述程序代码的输出结果。虽然编程代码和评论主要是由工程师编写的,但是无论程序代码多么复杂,附带的评论可以使非工程师相对容易地理解和使用输出结果,这是我个人认为使用笔记本的优点。
Apache Zeppelin的功能(部分摘录)

继续
下次主题是安装、启动和停止的内容。