pythonでテキストファイルから特定のコンテンツを抽出の方法
Pythonのファイル読み取りと文字列処理手法を使えば、テキストファイルから特定のコンテンツを抽出しだすことができます。以下にその方法の1つを示します。
- テキストファイルを開いて、内容を読み取ります。
with open('file.txt', 'r') as file:
content = file.read()
変数contentにファイル全体の内容を読み込みます。
- 文字列操作手法で指定した内容を探す:
例えば、txt中の数字をすべて抽出したい場合、数字のパターンに合致する正規表現を使用することができます:
import re
numbers = re.findall(r'\d+', content)
このコードは、txt ファイル内のすべての連続数字を検索し、その数字をリスト numbers に格納します。
- 抽出した内容の処理:
必要に応じて、抽出した内容をさらに処理することができます。たとえば、印刷したり、別のファイルに格納したりします。
for number in numbers:
print(number)
もしくは
with open('output.txt', 'w') as file:
for number in numbers:
file.write(number + '\n')
抜き出した数字に行ごとにプリントまたは書き出します。
特定の文字列をtxtファイルから抽出する1つの方法を上述しました。実際には、使用する文字列処理手法や正規表現は、対象とするパターンに応じて異なる場合があります。