R言語でデータセットを作成する方法

R言語では、以下の方法でデータセットを作成できます。

データフレーム(data.frame)関数の活用:手動で列名と値を指定することで、手作業によるデータセットの作成が可能。

# 创建一个数据集
df <- data.frame(var1 = c(1, 2, 3),
                 var2 = c("A", "B", "C"),
                 var3 = c(TRUE, FALSE, TRUE))

外部データセットを読み込む: R言語は read.csv、read.table などの関数を使用して CSV ファイルやテキスト ファイルからデータセットを読み込む外部データセットのインポートをサポートします。readxl、haven などの plugin を使用して、Excel ファイル、SPSS ファイルなどをインポートすることもできます。

# 导入CSV文件
df <- read.csv("data.csv")

# 导入Excel文件(需要安装readxl插件)
df <- read_excel("data.xlsx")

使用する内蔵データセット:R言語には、分析やモデリングに直接使用できるデータセットが内蔵されている。data関数を呼び出して内蔵データセットの一覧を参照してから、data関数を使用して該当するデータセットをインポートできます。

# 查看内置数据集列表
data()

# 导入内置数据集
df <- data(mtcars)

4. テストモデルのための疑似データセットを作成 R言語は、正規分布データや一様分布データなどの様々なタイプの疑似データセットを生成する関数を提供します。テストモデルのために疑似データセットを作成するために、それらの関数を使用できます。

# 生成正态分布数据
df <- data.frame(var1 = rnorm(100),
                 var2 = rnorm(100))

# 生成均匀分布数据
df <- data.frame(var1 = runif(100),
                 var2 = runif(100))

データセットを作成する際には、具体的なニーズに合わせて適切な方法を選択できます。

bannerAds