R言語でデータセットを作成する方法
R言語では、以下の方法でデータセットを作成できます。
データフレーム(data.frame)関数の活用:手動で列名と値を指定することで、手作業によるデータセットの作成が可能。
# 创建一个数据集
df <- data.frame(var1 = c(1, 2, 3),
var2 = c("A", "B", "C"),
var3 = c(TRUE, FALSE, TRUE))
外部データセットを読み込む: R言語は read.csv、read.table などの関数を使用して CSV ファイルやテキスト ファイルからデータセットを読み込む外部データセットのインポートをサポートします。readxl、haven などの plugin を使用して、Excel ファイル、SPSS ファイルなどをインポートすることもできます。
# 导入CSV文件
df <- read.csv("data.csv")
# 导入Excel文件(需要安装readxl插件)
df <- read_excel("data.xlsx")
使用する内蔵データセット:R言語には、分析やモデリングに直接使用できるデータセットが内蔵されている。data関数を呼び出して内蔵データセットの一覧を参照してから、data関数を使用して該当するデータセットをインポートできます。
# 查看内置数据集列表
data()
# 导入内置数据集
df <- data(mtcars)
4. テストモデルのための疑似データセットを作成 R言語は、正規分布データや一様分布データなどの様々なタイプの疑似データセットを生成する関数を提供します。テストモデルのために疑似データセットを作成するために、それらの関数を使用できます。
# 生成正态分布数据
df <- data.frame(var1 = rnorm(100),
var2 = rnorm(100))
# 生成均匀分布数据
df <- data.frame(var1 = runif(100),
var2 = runif(100))
データセットを作成する際には、具体的なニーズに合わせて適切な方法を選択できます。