リナックスでハドゥープクラスタを起動する方法はどうですか？

2年 ago

光, 明

1 minute

Hadoopクラスターを起動するには、まずHadoopがインストールおよび設定されていることを確認する必要があります。以下はHadoopクラスターを起動する手順です。

HadoopのNameNode（マスターノード）を起動する:
HADOOP_HOMEのsbin/start-dfs.sh を実行してください。
HadoopクラスタにYARN（リソースマネージャ）が含まれている場合、YARNを起動できます。
HADOOP_HOME/sbin/start-yarn.sh を実行してください。
他のコンポーネント、例えばHBaseやHiveなどがクラスター内にある場合は、それらも起動することができます。
Hadoopクラスターの状態を確認する。
ハドゥープのホームディレクトリにあるバイナリファイルのhadoopコマンドのdfsadminを実行してレポートを表示します。
この機能は、クラスタ内の各ノードの状態情報を表示します。
Hadoopクラスターを起動した後、Hadoopコマンドラインツールを使用してファイルをアップロードしたり、MapReduceジョブを実行したりすることができます。
HDFSにファイルをアップロードする場合、
$ HADOOP_HOME/bin/hadoop fs -put /path/to/local/file /path/in/hdfs を実行してください。
マップリデュースジョブを実行する。
$ HADOOP_HOME/bin/hadoop jar /path/to/hadoop-examples.jar wordcount /input /output
⇒ HADOOP_HOMEディレクトリ内のバイナリファイル「hadoop」に、パス「/path/to/hadoop-examples.jar」にある「wordcount」を指定して、入力ディレクトリ「/input」と出力ディレクトリ「/output」を指定します。
これらの命令はクラスター上で対応する操作を実行します。

注意してください。上記の手順はデフォルト設定のHadoopクラスターを基にしています。Hadoopをカスタマイズしたり、他のコンポーネントを使用している場合は、必要に応じて調整が必要です。

#プログラミング #技術記事