R言語で変数に基づいてデータセットを分割の方法
R言語では、データセットを変数毎に分割するためにsubset()関数が使用できます。この関数はデータセット、条件、選択された変数の3つのパラメータを使用します。
以下に例を示します。
# 创建一个数据集
data <- data.frame(
id = 1:10,
group = rep(c("A", "B"), each = 5),
value = rnorm(10)
)
# 根据变量group拆分数据集
subset1 <- subset(data, group == "A")
subset2 <- subset(data, group == "B")
上の例では、変数groupに従ってデータセットを分割した。subset1にはgroupが「A」の観測値が含まれ、subset2にはgroupが「B」の観測値が含まれる。
サブセット関数以外にも、filter関数を使用してデータを異なる変数に基づいて分割することもできます。filter関数はdplyrパッケージを読み込む必要があります。以下は、filter関数を使用した例です。
library(dplyr)
# 根据变量group拆分数据集
subset1 <- filter(data, group == "A")
subset2 <- filter(data, group == "B")
上のコードは前のサンプルと同じですが、filter() 関数が使用されてデータセットが分割されています。
サブセット関数とフィルタ関数のどちらを使用しても、変数からデータセットを分割できます。それには好みや習慣によって選択が異なります。