Hive 正規表現でデータ抽出・フィルタリング方法
Hiveでは、データをフィルタリングするために正規表現を使用することができます。以下は簡単な例です:
user_infoというテーブルがあり、以下のデータが含まれていると仮定する。
id name
1 Alice
2 Bob
3 Charlie
4 David
5 Eve
正規表現を使用して、’A’で始まる名前のユーザーをフィルタリングするには、RLIKEキーワードを使用できます。
SELECT * FROM user_info WHERE name RLIKE '^A.*';
この検索は以下の結果を返します:
id name
1 Alice
上の例では、’^A.*’というRLIKEは、名前の先頭が”A”で始まるものに一致する正規表現です。Hiveでは、RLIKEキーワードは文字列が指定された正規表現に一致するかどうかを判定するために使用されます。