hiveでデータをテーブルにインポートする方法は？

2年 ago

優斗, 朝陽

1 minute

Hiveにデータをテーブルにインポートする方法はいくつかありますが、具体的な方法はデータのソースと形式によって異なります。以下は一般的なデータのインポート方法のいくつかです。

LOAD DATAステートメントを使用すると、ローカルファイルのデータをHiveテーブルにインポートすることができます。たとえば、Hiveテーブルの名前がmy_tableである場合、次のコマンドを使用してローカルファイルからデータをそのテーブルにインポートできます：

LOAD DATA LOCAL INPATH '/path/to/local/data/file' INTO TABLE my_table;

LOAD DATAステートメントはデフォルトで、データをHiveのデータディレクトリに移動します。ローカルデータを保持したい場合は、LOCALキーワードを使用してください。

INSERT文を使用すると、他のHiveテーブルやクエリの結果を既存のHiveテーブルにインポートできます。例えば、Hiveテーブルである「my_table」と「source_table」がある場合、以下のコマンドを使用してsource_tableのデータをmy_tableに挿入できます。

INSERT INTO TABLE my_table SELECT * FROM source_table;

具体の条件を使用して、挿入するデータを選択することもできます。例えば：

INSERT INTO TABLE my_table SELECT col1, col2 FROM source_table WHERE col3 > 10;

HiveのHadoop InputFormatを使用すると、Hadoop分散ファイルシステム（例：HDFS）からデータをインポートすることができます。まず、データファイルをHDFSにアップロードし、それからHiveのCREATE TABLE文を使用して表を作成し、Hadoop InputFormatとデータファイルの場所を指定します。例：

CREATE TABLE my_table (col1 INT, col2 STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE
LOCATION '/path/to/hdfs/data/file';

この例では、データファイルの場所は/path/to/hdfs/data/fileであり、単一のファイルまたはディレクトリのいずれかです。その後、LOAD DATAステートメントを使用してデータをこのテーブルにインポートします。

LOAD DATA INPATH '/path/to/hdfs/data/file' INTO TABLE my_table;

これらは、Hiveでデータをテーブルにインポートする一般的な方法のいくつかです。具体的な方法は、データのソースや形式に応じて適切な方法を選択できます。