Hive データ更新・アップデート方法を徹底解説
Hiveでデータを更新するには通常、以下の手順が必要です。
- 新しいデータを一時テーブルに書き込むためにINSERT OVERWRITEステートメントを使用します。
- INSERT INTO文を使用して、一時テーブルのデータを元のテーブルに挿入し、更新条件をWHERE句で指定します。
例えば、employeeという名前のテーブルがあり、そこには従業員のIDと名前のフィールドが含まれているとします。従業員IDが1の名前を「John」に更新するには、次の手順に従います。
- temp_employee という一時テーブルを作成し、そのテーブルに新しいデータを書き込む。
CREATE TABLE temp_employee AS
SELECT
CASE
WHEN id = 1 THEN id
ELSE id
END AS id,
CASE
WHEN id = 1 THEN 'John'
ELSE name
END AS name
FROM employee;
- 一時的なテーブルのデータを元のテーブルに挿入し、更新条件を指定します。
INSERT INTO employee
SELECT * FROM temp_employee;
従業員ID 1のデータを更新する作業が完了しました。Hiveでデータを更新する場合は、通常、一時テーブルを作成する必要があります。なぜなら、Hiveテーブルのデータは変更できないからです。