Sparkのジョブをクラスターに送信して実行する方法は何ですか?
スパークにジョブをサブミットしてクラスター上で実行するには、以下の手順に従うことができます。
- 終端またはコマンドラインウィンドウを開いて、Sparkのインストールディレクトリ内のbinフォルダに移動してください。
- Sparkクラスターに課題を提出するには、次のコマンドを使用してください。
./spark-submit --class <main_class> --master <master_url> <jar_file> [application-arguments]
その中で、
- は課題のメインクラスの名前です。
- は、Sparkクラスターのマスターアドレスです。例えば、spark://hostname:portです。
- <jarファイル>には、ジョブコードが含まれています。
- [application-arguments]は課題に必要な引数です。
- 課題を提出すると、Sparkはその課題をクラスター内の複数のノードに分散して実行します。
注意:課題を提出する前に、Sparkクラスターが起動しており、課題のjarファイルが準備されていることを確認してください。