Python内でデータをグループ分けして統計情報を取得する方法を教えてください

グループ統計を実現するには、pandasやnumpyなど、Pythonで提供されているライブラリや関数が利用できます。

実現方法の一例を以下に示します。

  1. 必要なライブラリをインポートする:
import pandas as pd
  1. データセットを作成します。
data = {
    'group': ['A', 'A', 'B', 'B', 'B', 'C'],
    'value': [1, 2, 3, 4, 5, 6]
}
df = pd.DataFrame(data)
  1. グループ化
  2. そこに群れをなして立っていた、イヌたちが。
  3. 本質的に
  4. 身につけていくものはなんでも、人生を反映する。
result = df.groupby('group')['value'].sum()

グループ列でグループ化されたバリュー列の合計値が得られます。結果は次のとおりです。

print(result)

翻訳結果は次の通りです。

group
A     3
B    12
C     6
Name: value, dtype: int64

A群は3、B群は12、C群は6という結果が出ました。

平均値を求めるmeanや数を数えるcountなどの関数は、SUM関数の他に使用できます。

お役に立てば幸いです!

bannerAds