どのようにR言語でdataファイルをよみこみますか?
R言語では、主に以下の方法でdataファイルの読み込みが行えます。
- 表形式のテキストファイルを読み取る read.table() 関数。タブ区切りのデータファイルを読むために使われることが多いです。
data <- read.table("data.txt", header = TRUE, sep = "\t")
「data.txt」はデータファイルのパスであり、header = TRUE は最初の行をカラム名として設定し、sep = “\t” はタブでデータファイルを分割することを示しています。
- カンマ区切りのデータファイルを読み込む read.csv() 関数。CSV ファイルの読み取りに一般的に使用されます。
data <- read.csv("data.csv", header = TRUE)
data.csvはデータファイルのパス、header=TRUEは最初の行が項目名であることを示します。
- read.xlsx()関数(パッケージreadxlがインストールされている必要があります):Excelファイルを読み込みます。
library(readxl)
data <- read_excel("data.xlsx", sheet = "Sheet1")
「data.xlsx」はExcelファイルのパスで、sheet =「Sheet1」は最初のワークシートのデータを意味します。
- read.table()関数(foreignパッケージのインストールが必要): SPSS、SASなどの形式のデータファイルを読み込むのに使用されます。
library(foreign)
data <- read.spss("data.sav", to.data.frame = TRUE)
「data.sav」はSPSSデータファイルのパスであり、「to.data.frame = TRUE」はデータをデータフレームとして読み込むことを示します。
一般的に使われるデータファイルの読み込み手法をいくつか紹介したが、利用するメソッドはデータファイルのフォーマットと必要性によって異なる。