Sparkのジョブをクラスターに送信して実行する方法は何ですか?

スパークにジョブをサブミットしてクラスター上で実行するには、以下の手順に従うことができます。

  1. 終端またはコマンドラインウィンドウを開いて、Sparkのインストールディレクトリ内のbinフォルダに移動してください。
  2. Sparkクラスターに課題を提出するには、次のコマンドを使用してください。
./spark-submit --class <main_class> --master <master_url> <jar_file> [application-arguments]

その中で、

  1. は課題のメインクラスの名前です。
  2. は、Sparkクラスターのマスターアドレスです。例えば、spark://hostname:portです。
  3. <jarファイル>には、ジョブコードが含まれています。
  4. [application-arguments]は課題に必要な引数です。
  1. 課題を提出すると、Sparkはその課題をクラスター内の複数のノードに分散して実行します。

注意:課題を提出する前に、Sparkクラスターが起動しており、課題のjarファイルが準備されていることを確認してください。

bannerAds