Hadoopの擬似分散環境の設定手順は何ですか？

2年 ago

夏樹, 風

1 minute

Hadoopの疑似分散環境の構築手順は以下のとおりです：

Javaの開発環境をインストールしてください。Javaが正しくインストールされ、環境変数が設定されていることを確認してください。
ハドゥープをダウンロードする：ハドゥープ公式サイトから最新バージョンのハドゥープ圧縮ファイルをダウンロードしてください。
Hadoopの圧縮ファイルを解凍する：ダウンロードしたHadoopの圧縮ファイルを指定されたディレクトリに解凍してください。
Hadoopの環境変数を設定する：システムの環境変数にHadoopのbinディレクトリのパスを追加する。
Hadoopのコア設定ファイルを設定する：Hadoopのインストールディレクトリに入り、core-site.xmlとhdfs-site.xmlの2つの設定ファイルを編集する。
core-site.xmlを編集して、Hadoopのデフォルトファイルシステム（fs.defaultFS）とHadoopの動作時の一時ディレクトリ（hadoop.tmp.dir）を設定します。
hdfs-site.xmlファイルに設定を行い、Hadoopの複製数（dfs.replication）、データブロックサイズ（dfs.blocksize）、およびHadoopがデータを保存するディレクトリ（dfs.datanode.data.dir）を指定してください。
Hadoopの環境変数を設定する：Hadoopのインストールディレクトリ内にあるetc/hadoop/ディレクトリー内のhadoop-env.shファイルを編集し、JAVA_HOME環境変数を設定してください。
Hadoopファイルシステムをフォーマットするには、コマンドラインで「hdfs namenode -format」を実行します。
Hadoopクラスターを起動するには、「start-all.sh」コマンドをコマンドラインで実行してください。
Hadoopクラスターの確認：ブラウザでhttp://localhost:50070にアクセスすると、Hadoopクラスターの状態ページが表示されます。
Hadoopの例を実行する : コマンドラインでHadoopに同梱されている例のプログラムを実行する、「hadoop jar hadoop-examples.jar wordcount input output」というコマンドを実行して、WordCountの例を実行します。

上記はHadoopの擬似分散環境を構築する基本的な手順ですが、実際の状況によっては細かな違いがあるかもしれません。