Hive データ更新・アップデート方法を徹底解説

Hiveでデータを更新するには通常、以下の手順が必要です。

  1. 新しいデータを一時テーブルに書き込むためにINSERT OVERWRITEステートメントを使用します。
  2. INSERT INTO文を使用して、一時テーブルのデータを元のテーブルに挿入し、更新条件をWHERE句で指定します。

例えば、employeeという名前のテーブルがあり、そこには従業員のIDと名前のフィールドが含まれているとします。従業員IDが1の名前を「John」に更新するには、次の手順に従います。

  1. temp_employee という一時テーブルを作成し、そのテーブルに新しいデータを書き込む。
CREATE TABLE temp_employee AS
SELECT 
  CASE
    WHEN id = 1 THEN id
    ELSE id
  END AS id,
  CASE
    WHEN id = 1 THEN 'John'
    ELSE name
  END AS name
FROM employee;
  1. 一時的なテーブルのデータを元のテーブルに挿入し、更新条件を指定します。
INSERT INTO employee
SELECT * FROM temp_employee;

従業員ID 1のデータを更新する作業が完了しました。Hiveでデータを更新する場合は、通常、一時テーブルを作成する必要があります。なぜなら、Hiveテーブルのデータは変更できないからです。

bannerAds