Hadoop データ バランシング コマンド

Hadoopでは、データの再バランスには以下のコマンドを使用できます。

  1. HDFS Balancerコマンド:クラスター内のさまざまなノードに、データ内のブロックを均等に分散するために使用されます。 バランサを実行するには、次のコマンドを使用できます。
hdfs balancer [-threshold <threshold>]

パラメータの説明:

  1. 閾値 <閾値>: データブロックの移転が起きる閾値を指定するオプションのパラメータ。デフォルト値は 10 です。あるノードにあるデータブロックの数が平均との差が閾値を超えると、データブロックの移転がトリガーされます。
  1. HDFS RebalancerコマンドはHDFSクラスターのデータブロックの再分散に使用します。Balancerコマンドとは異なり、Rebalancerコマンドでは実行時に調整するターゲットのデータブロック数を指定できます。Rebalancerを実行するには、次のコマンドを使用できます。
hdfs dfsadmin -rebalance [-threshold <threshold>] [-bandwidth <bandwidth>]

パラメータの説明:

  1. -threshold : オプション変数。データブロックの移行に対する閾値を指定します。デフォルトは10です。あるノードのデータブロック数とターゲットとの差が閾値を超えると、データブロックの移行が発生します。
  2. – 帯域幅 <帯域幅>:オプションのパラメータで、データブロックのマイグレーションの帯域幅制限を指定します。デフォルトは 0 です。帯域幅制限を指定した場合、データブロックのマイグレーションの速度が制限されます。

データバランス操作はクラスタのパフォーマンスに影響を与える可能性があるので、慎重に扱う必要があることに注意してください。

bannerAds