R言語で変数に基づいてデータセットを分割の方法

R言語では、データセットを変数毎に分割するためにsubset()関数が使用できます。この関数はデータセット、条件、選択された変数の3つのパラメータを使用します。

以下に例を示します。

# 创建一个数据集
data <- data.frame(
  id = 1:10,
  group = rep(c("A", "B"), each = 5),
  value = rnorm(10)
)

# 根据变量group拆分数据集
subset1 <- subset(data, group == "A")
subset2 <- subset(data, group == "B")

上の例では、変数groupに従ってデータセットを分割した。subset1にはgroupが「A」の観測値が含まれ、subset2にはgroupが「B」の観測値が含まれる。

サブセット関数以外にも、filter関数を使用してデータを異なる変数に基づいて分割することもできます。filter関数はdplyrパッケージを読み込む必要があります。以下は、filter関数を使用した例です。

library(dplyr)

# 根据变量group拆分数据集
subset1 <- filter(data, group == "A")
subset2 <- filter(data, group == "B")

上のコードは前のサンプルと同じですが、filter() 関数が使用されてデータセットが分割されています。

サブセット関数とフィルタ関数のどちらを使用しても、変数からデータセットを分割できます。それには好みや習慣によって選択が異なります。

bannerAds