Hadoopでクラスタータスクを提出する方法は何ですか?
Hadoopクラスタータスクを提出するためには、次の手順に従うことができます。
- あなたのタスクのコードと関連する設定ファイルをJARファイルにまとめる。
- Hadoopのコマンドラインツールhadoop jarを使用してタスクを提出します。このコマンドの基本構文は:
- hadoopのjar <jarファイルへのパス> <mainクラス> [引数…]
- は、あなたがパッケージ化したJARファイルのパスです。また、はmain()メソッドを含む主要クラスのフルネームであり、[args…]は主要クラスに渡す引数のリストです。
- 必要であれば、追加の依存JARファイルを指定するために、-libjarsオプションを使用できます。例えば、
- hadoop jar <jarファイルへのパス> <メインクラス> -libjars <依存関係のjarファイルへのパス> [引数…]
- は追加の依存関係のJARファイルのパスであり、複数のファイルをコンマで区切って指定することができます。
- Hadoopの設定パラメータは、-Dオプションを使用して設定することができます。例:
- hadoop jar <ジャー・ファイルへのパス> <メインクラス> -D <プロパティ>=<値> [引数…]
- には、設定するプロパティの名前を、にはその値を指定します。
- Hadoopは、タスクを提出すると、利用可能なノードにタスクを配布して実行します。タスクの実行状況を監視したり、結果を取得するには、HadoopのWebインターフェースまたはコマンドラインツールを使用できます。
課題を提出する前に、Hadoopクラスタが正しく設定されていることを確認し、コードと設定ファイルが正常に動作することを確認してください。