Pythonの正規表現で特定の文字列を抽出する方法は?
Python の re モジュールを使えば正規表現で特定の文字列を抽出できます。以下にサンプルコードを示します。
import re
# 原始字符串
text = "Hello, my name is John. My phone number is 123-456-7890. Please call me tomorrow."
# 使用正则表达式提取电话号码
phone_numbers = re.findall(r'\d{3}-\d{3}-\d{4}', text)
# 打印提取到的电话号码
for number in phone_numbers:
print(number)
コードを実行すると、出力が表示されます。
123-456-7890
上記のコードでは、re.findall() 関数は2つの引数を受け取ります: 正規表現パターンと検索対象の文字列です。正規表現パターン r’\d{3}-\d{3}-\d{4}’ は、3桁の数字、ハイフン、3桁の数字、ハイフン、4桁の数字のパターン、つまり電話番号の形式に一致します。re.findall() 関数は、一致するすべての文字列を含むリストを返します。このリストを反復処理して一致した電話番号をそれぞれ出力するには、for ループを使用できます。