Hive 内部テーブル vs 外部テーブル:違いと使い分け

Hiveの内部テーブルと外部テーブルの違いは、データの保存場所と管理方法にあります。

  1. 内部テーブル:内部テーブルのデータは通常、HDFSに保存され、Hiveによって管理されます。内部テーブルを削除すると、テーブルのメタデータと保存されているデータが両方削除されます。
  2. 外部テーブル:ユーザーが指定した場所(ローカルファイルシステム、HDFSなど)に外部テーブルのデータが保存され、ユーザー自身が管理します。外部テーブルを削除するときは、テーブルのメタデータのみが削除され、保存されているデータは削除されません。

したがって、外部テーブルは他のシステムとデータを共有したりデータをバックアップしたりするために適していますが、内部テーブルはデータウェアハウスなど、データを長期間保存および管理する必要があるシナリオに適しています。

bannerAds