Impalaでのデータパーティショニングの方法は何ですか?

Impalaにおいて、データのパーティション操作はPARTITION BY句を使用して実行できます。テーブルを作成する際に、1つまたは複数の列をパーティションキーとして指定することができます。

CREATE TABLE mytable (
    id INT,
    name STRING
)
PARTITIONED BY (date STRING)

上記の例では、mytableというテーブルがdate列をパーティションキーとして使用しています。データを挿入する際には、挿入するデータがどのパーティションに属するかを指定することができます。例えば、

INSERT INTO mytable PARTITION (date='2022-01-01') VALUES (1, 'Alice');

show partitions コマンドを使用して、既存のパーティションを表示できます。

SHOW PARTITIONS mytable;

ALTER TABLE コマンドを使用して、既存のテーブルに新しいパーティションを追加することもできます。

ALTER TABLE mytable ADD PARTITION (date='2022-01-02');

データをパーティション分割することで、クエリの性能を向上させ、データスキャン範囲を縮小し、クエリの効率を向上させることができます。

bannerAds