pythonでテキストを分割する方法
Pythonでは、テキストの分割に利用できる手法がいくつかあります。一般的な手法を以下に示します。
- テキストを指定の区切り記号で分割してリストを返すsplit()関数を使用します。たとえば:
text = "Hello, World!"
words = text.split(",") # 以逗号为分隔符分割文本
print(words) # 输出: ['Hello', ' World!']
- 正規表現モジュールreを使用:reモジュールは強力な正規表現機能を提供し、パターンマッチングに基づいてテキストを分割できます。たとえば、
import re
text = "Hello, World!"
words = re.split(",\s*", text) # 以逗号和任意数量的空格为分隔符分割文本
print(words) # 输出: ['Hello', 'World!']
- テキスト行を区切るstr.splitlines()関数:「splitlines()」関数はテキストを、行ごとに分けてリストにして返します。例えば:
text = "Hello\nWorld!"
lines = text.splitlines() # 按照行分割文本
print(lines) # 输出: ['Hello', 'World!']
具体的なテキスト分割ルールに応じて、最適な手法を選択できる。