Python内でデータをグループ分けして統計情報を取得する方法を教えてください
グループ統計を実現するには、pandasやnumpyなど、Pythonで提供されているライブラリや関数が利用できます。
実現方法の一例を以下に示します。
- 必要なライブラリをインポートする:
import pandas as pd
- データセットを作成します。
data = {
'group': ['A', 'A', 'B', 'B', 'B', 'C'],
'value': [1, 2, 3, 4, 5, 6]
}
df = pd.DataFrame(data)
- グループ化
- そこに群れをなして立っていた、イヌたちが。
- 本質的に
- 身につけていくものはなんでも、人生を反映する。
result = df.groupby('group')['value'].sum()
グループ列でグループ化されたバリュー列の合計値が得られます。結果は次のとおりです。
print(result)
翻訳結果は次の通りです。
group
A 3
B 12
C 6
Name: value, dtype: int64
A群は3、B群は12、C群は6という結果が出ました。
平均値を求めるmeanや数を数えるcountなどの関数は、SUM関数の他に使用できます。
お役に立てば幸いです!