Rでデータをグループ化する方法
在R语言中,可以使用group_by()函数将数据分组。
dplyrパッケージを読み込む必要があります。group_by()関数はdplyrパッケージの関数です。
# 加载dplyr包
library(dplyr)
続いて、group_by()関数を使って指定した変数でデータをグループ分けします。以下の例では、「Species」変数でデータをグループ化しています。
# 分组
grouped_data <- iris %>% group_by(Species)
irisは内蔵データセットで、アイリスの測定値を含みます。group_by(Species)で「Species」変数でデータ分けがされ、結果がgrouped_dataに格納されます。
グループ化したデータは、データ処理と分析をさらに進めることができます。例えば、各グループに対して統計分析を実行するために、summarize() 関数を使用できます。
# 统计每个分组的平均值
summary_data <- grouped_data %>% summarize(mean(Sepal.Length))
示した例では、各グループの「Sepal.Length」の平均値をsummarize()関数を使って計算し、その結果がsummary_dataに格納されています。
上記の手順により、データを指定の変数でグループ分けし、各グループごとに統計分析することができます。