Pythonでの単語の頻度統計のコードはどのように書きますか?
PythonのCounterクラスを使用して単語の頻度をカウントすることができます。以下はその例です:
from collections import Counter
# 输入文本
text = "This is a sample text. It contains some words that will be counted."
# 将文本拆分成单词列表
words = text.split()
# 统计词频
word_freq = Counter(words)
# 打印词频结果
for word, freq in word_freq.items():
print(f"{word}: {freq}")
上記のコードを実行すると、出力結果は各単語とその対応する出現頻度になります。例えば:
This: 1
is: 1
a: 1
sample: 1
text.: 1
It: 1
contains: 1
some: 1
words: 1
that: 1
will: 1
be: 1
counted.: 1
この例のコードは、テキスト処理(ステミング、ストップワードの削除など)を行っていません。単にテキストを空白で分割し、単語の頻度をカウントするだけです。より複雑なテキスト処理が必要な場合は、正規表現や他のライブラリを使用してください。