Hadoopクラスタパラメーターの設定方法
Hadoopクラスタのパラメータ設定は、設定ファイルを変更して実行できます。Hadoopクラスタの設定によく使われるパラメータを次に示します。
- Hadoop の主要な構成ファイル: hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml
- hadoop-env.sh: Hadoop環境変数設定ファイル。Java環境、Hadoopログディレクトリなどを設定するために使用されます。
- core-site.xml:Hadoopのコアパラメータの設定(例:HadoopファイルシステムのURIデフォルト、Hadoopファイルシステムのレプリカ数)
- HDFS-site.xml: Hadoop分散ファイルシステム(HDFS)のパラメータ、データブロックサイズ、レプリカ数などを設定します。
- Hadoop MapReduce の設定を行う mapred-site.xml。MapReduce フレームワークのタスクスケジューラ、タスクトラッカーなどのパラメータを設定する。
- yarn-site.xml:リソースマネージャーのアドレス、アプリケーションヒストリーサーバーのアドレスなどHadoop YARNのパラメータを設定します。
- Hadoopクラスタノードの構成ファイル:マスター、スレーブ
- masters: Hadoopクラスタのマスター节点(NameNode) に設定されるホスト名です.
- スレーブ:Hadoopクラスターのスレームノード(DataNode)のホスト名を設定します。
- ログ4j.properties、hadoop-metrics.properties、capacity-scheduler.xml など、他の設定ファイル
- Hadoopのログ出力レベル、書式などを設定するlog4j.properties
- hadoop-metrics.properties: Hadoopのパフォーマンスメトリクス監視パラメータを設定します。
- capacity-scheduler.xml:Hadoop YARNのリソーススケジュラの設定ファイル
Hadoopクラスターのパラメータを設定するときは、上記のコンフィグレーションファイルの中のパラメータの値を必要に応じて変更して、コンフィグレーションファイルをHadoopクラスターの各ノードに配布することができます。コンフィグレーションファイルを修正した後、Hadoopクラスターを再起動して、有効にする必要があります。