正規表現の基本構文は何ですか?
正規表現は、文字列のパターンに一致させるためのツールであり、通常の文字(アルファベット、数字、記号など)と特殊文字(メタ文字と呼ばれる)で構成されています。正規表現の基本的な構文には以下のいくつかの部分が含まれます。
- 通常の文字:通常の文字とは、アルファベット、数字、および一部の特殊文字を指し、正規表現でそのまま表現されます。
- 特殊な意味を持つ文字である元のワイルドカードは、一致規則を指定するために使用されます。一般的な元のワイルドカードには以下が含まれます。
- ^は、文字列の先頭を表します。
- 「$」は、文字列の末尾を示すものです。
- .:任意の文字にマッチします。
- *:前の文字との一致を0回以上繰り返す
- +:直前の文字を一回以上繰り返すことを示す
- 前の文字に0回または1回一致することを示す。
- `[]`とは、その中に1つの文字が一致していることを示す。
- ():グループを示す
- 数量詞:数量詞は一致する回数を指定するために使用され、一般的な数量詞には、以下が含まれます:
- {n}:直前の文字がちょうど n 回マッチすることを表します。
- {n,}:前の文字が少なくともn回マッチすることを示す
- {n,m}:直前の文字がn回以上、m回以下繰り返される。
- 正規表現で特別な意味を持つ文字があります。その文字を単に一致させる場合は、エスケープ文字 \ を使用してエスケープする必要があります。
- 修飾子:修飾子は、一致モードの特性を指定するために使用されます。大文字と小文字を区別する、複数行一致などがあります。よく使われる修飾子には、次のものがあります:
- i:大文字小文字を区別しない
- g: Globally matching.
- m:複数行にわたる一致
基本的な正規表現の文法は、通常の文字、特殊文字、数量子、エスケープ文字、修飾子から構成されており、これらの要素を組み合わせることでさまざまな複雑な一致ルールを作成することができます。