2台の機械で Hadoop クラスタを構築します。

Hadoopクラスターのデプロイメントには最低で 2 台のマシンが必要です。以下は可能なデプロイメント案の 1 つです。

  1. 最初のマシンのキャラクター
  1. NameNodeは、クラスター全体のファイルシステムおよびメタデータを管理する役割を担います。
  2. ResourceManager:クラスタ上のリソースのスケジューリングと管理を担当しています。
  1. 2台目の機械:
  1. SecondNameNode:NameNodeのメタデータの定期的なマージとチェックポイントの作成を担当する。

以下に、このクラスターをデプロイするための手順をいくつか示します。

  1. Hadoopを2つのマシンにインストールして基本設定を行います。Java環境変数とHadoop設定ファイルの関連パラメータが正しく設定されていることを確認します。
  2. NameNodeマシンのhdfs-site.xml設定ファイルを編集し、Hadoopデータディレクトりの場所を指定します。たとえば、データはローカルファイルシステムの/data/hadoop/dataディレクトリに格納できます。
  3. NameNodeマシンのcore-site.xmlファイルを変更して、Hadoopホスト名とポート番号を指定します。たとえば、ホスト名をnamenode.example.com、ポート番号を9000に設定できます。
  4. NameNode マシン上で mapred-site.xml ファイルを変更し、MapReduce のホスト名とポート番号を指定します。 たとえば、ホスト名を namenode.example.com に、ポート番号を 9001 に設定できます。
  5. ResourceManagerマシンのyarn-site.xml設定ファイルで、YARNのホスト名とポート番号を指定します。例:ホスト名をresourcemanager.example.com、ポート番号を8088に設定。
  6. NameNodeマシーンでHadoopファイルシステムのフォーマットをおこなう。次のコマンドを実行する。
hdfs namenode -format
  1. NameNodeマシン上で、Hadoopクラスタを起動します。以下のコマンドを実行します。
start-dfs.sh
  1. ResourceManager マシン上で YARN を起動する。以下のコマンドを実行してください。
start-yarn.sh

Hadoopクラスタが2つのマシンに正常に展開されました。YARNリソースマネージャーのインターフェイスは「http://namenode.example.com:8088」から、HDFSのWebインターフェイスは「http://namenode.example.com:50070」から確認できます。

bannerAds