Rでデータをグループ化する方法

在R语言中,可以使用group_by()函数将数据分组。

dplyrパッケージを読み込む必要があります。group_by()関数はdplyrパッケージの関数です。

# 加载dplyr包
library(dplyr)

続いて、group_by()関数を使って指定した変数でデータをグループ分けします。以下の例では、「Species」変数でデータをグループ化しています。

# 分组
grouped_data <- iris %>% group_by(Species)

irisは内蔵データセットで、アイリスの測定値を含みます。group_by(Species)で「Species」変数でデータ分けがされ、結果がgrouped_dataに格納されます。

グループ化したデータは、データ処理と分析をさらに進めることができます。例えば、各グループに対して統計分析を実行するために、summarize() 関数を使用できます。

# 统计每个分组的平均值
summary_data <- grouped_data %>% summarize(mean(Sepal.Length))

示した例では、各グループの「Sepal.Length」の平均値をsummarize()関数を使って計算し、その結果がsummary_dataに格納されています。

上記の手順により、データを指定の変数でグループ分けし、各グループごとに統計分析することができます。

bannerAds