Pythonでの単語の頻度統計のコードはどのように書きますか？

2年 ago

夏樹, 風

1 minute

PythonのCounterクラスを使用して単語の頻度をカウントすることができます。以下はその例です：

from collections import Counter

# 输入文本
text = "This is a sample text. It contains some words that will be counted."

# 将文本拆分成单词列表
words = text.split()

# 统计词频
word_freq = Counter(words)

# 打印词频结果
for word, freq in word_freq.items():
    print(f"{word}: {freq}")

上記のコードを実行すると、出力結果は各単語とその対応する出現頻度になります。例えば：

This: 1
is: 1
a: 1
sample: 1
text.: 1
It: 1
contains: 1
some: 1
words: 1
that: 1
will: 1
be: 1
counted.: 1

この例のコードは、テキスト処理（ステミング、ストップワードの削除など）を行っていません。単にテキストを空白で分割し、単語の頻度をカウントするだけです。より複雑なテキスト処理が必要な場合は、正規表現や他のライブラリを使用してください。