Rのmin()とmax()の使い方はどうすればいいですか。
Rの関数min()とmax()を使えば、最小値と最大値を求めるのは非常に簡単です。
私達は平均、中央値、標準偏差、最頻値といった関数を持っていることを知っていますよね。これらはそれぞれ、値の平均、中央値、分散を計算してくれます。しかし、ベクトルやデータフレームに含まれる最小値と最大値を返す関数を考えたことはありますか?
それなら、おめでとうございます。min()とmax()という名前の関数があります。それぞれ最小値と最大値を返します。
面白そうでしょう?どのように機能するか見てみましょう!
「構文から始めましょう。」
以下に、min()関数の構文が示されています。
min(x, na.rm = FALSE)
- x = vector or a data frame.
- na.rm = remove NA values, if it mentioned False it considers NA or if it mentioned True it removes NA from the vector or a data frame.
以下にmax()関数の構文が示されています。
max(x, na.rm = FALSE)
- x = vector or a data frame.
- na.rm = remove NA values, if it mentioned False it considers NA or if it mentioned True it removes NA from the vector or a data frame.
RにおけるMax()関数
このセクションでは、ベクトル内に存在する最大値を見つける予定です。そのために、まずベクトルを作成し、その後にmax()関数を適用して、ベクトル内の最大値を返します。
#creates a vector
vector<-c(45.6,78.8,65.0,78.9,456.7,345.89,87.6,988.3)
#returns the max values present in the vector
max(vector)
出力= 988.3
RのMin()関数を日本語で言い換えると「最小値()関数」です。
ここでは、関数min()を使用してベクトルの最小値を見つけます。ベクトルを作成し、そのベクトルにmin()を適用すると、以下のように最小値が返されます。
#creates a vector
vector<-c(45.6,78.8,65.0,78.9,456.7,345.89,87.6,988.3)
#returns the minimum value present in the vector
min(vector)
出力は45.6です。
RのMax()関数でのNA値
RのMax()関数を使用する際のNA値
データ解析の際には、データフレームやベクトル内にNA値が含まれることがあります。そのため、目的の結果を得るためには、NA値をスキップする必要があります。
もし最大値関数がNAの値に出会った場合、値を返さない仕様です。そのため、ベクトルやデータフレームからNAの値を除去して最大値を得る必要があります。
#creates a vector having NA values
df<- c(134,555,NA,567,876,543,NA,456)
#max function won't return any value because of the presence of NA.
max(df)
#results in NA instead of max value
Output = NA
それでは、この問題を避け、最大値を取得するために、na.rm関数を使用してベクトルからNAの値を削除しています。これでmax()関数が最大値を返すことがわかります。
#max function with remove NA values is set as TRUE.
max(df, na.rm = T)
出力 = 876
RのMin()関数にはNA値が含まれています。
上記のセクションで最大値関数を適用したように、ここではNA値を含むベクトルの最小値を見つけます。
#creates a vector having NA values
df<- c(134,555,NA,567,876,543,NA,456)
#returns NA instead of minimum value
min(df)
出力 = NA
これを克服するために、私たちはna.rm関数を使用してベクトルからNA値を削除しています。今、min()関数が最小値を返すことがわかります。
#creates a vector having NA values
df<- c(134,555,NA,567,876,543,NA,456)
#removes NA values and returns the minimum value in the vector
min(df, na.rm = T)
出力 = 134
「Min()」と「Max()」の関数は、文字ベクトル内で最小値と最大値を返す。
これまで、私たちは数値の最小値と最大値について取り扱ってきました。何か伝える必要があるとしたら、文字列ベクトルの最小値と最大値も見つけることができますと言いたいです。ええ、聞き間違いではありませんでした!
どのように動作するか見てみましょう!(Dono yō ni dōsa suru ka mite mimashou!)
文字ベクトルの場合、min関数とmax関数はアルファベット順を考慮して、それに応じた最小値と最大値を返します。以下に示す通りです。
#creates a character vector with some names
character_vector<- c('John','Angelina','Smuts','Garena','Lucifer')
#returns the max value
max(character_vector)
出力 = 「スマッツ」
同様に、以下に示すmin()関数を使用して、文字ベクトル内でも最小値を見つけることができます。
#creates a character vector with some names
character_vector<- c('John','Angelina','Smuts','Garena','Lucifer')
#returns the minimum values in the vector
min(character_vector)
出力 = “アンジェリーナ”
データフレーム内のMin()関数とMax()関数の使い方
それをインポートして、データフレームの最小値と最大値を見つけましょう。データセットの最小値と最大値は、データの分布について公平な考えを与えます。
これはRスタジオで利用可能な大気の品質データセットです。データセットにはNA値が含まれていることに注意してください。na.rm関数を使ってNA値を削除する知識を活用して、オゾン値の最小値と最大値を見つけましょう。
min(airquality$Ozone, na.rm=T)
出力 = 1
max(airquality$Ozone, na.rm = T)
出力 = 168
気象データセットの中から、気温の最小値と最大値を見つけましょう。
min(airquality$Temp, na.rm = T)
出力 = 56
max(airquality$Temp, na.rm = T)
出力 = 97
まとめる
はい、このチュートリアルでは、ベクトル、データフレーム、および文字ベクトルにおける最小値と最大値の見つけ方に焦点を当てました。
最小値と最大値の関数は、数値ベクトルだけでなく、文字列ベクトルでも使用できます。また、na.rm関数を使ってNA値を除去することで、より正確な結果と希望の結果を得ることもできます。
今のところは以上です。上記のセクションに示されているような最小値と最大値をもっと見つけていただけると嬉しいです。質問がある場合はコメント欄へコメントしてくださいね。
楽しい学びをしてください!
もっと勉強:Rのドキュメンテーション