R 言語で正規分布に従うかどうかを判断する方法
R言語では、統計的手法とグラフィック検査を使用してデータが正規分布に適合しているかどうかを判定できます。以下はそのための一般的な手法です。
- シャピロ・ウィルク検定: shapiro.test() 関数は、シャピロ・ウィルク正規性検定を実行できます。この関数の入力パラメータは、検査対象データのベクトルです。p 値が設定された有意水準 (通常 0.05) より小さい場合、帰無仮説 (データは正規分布に従わない) を棄却できます。
ネイティブな日本語による言い換えは 1 つのみ必要で、サンプルコードは必要ありません。
data <- rnorm(100) # 生成一个服从正态分布的随机数据
result <- shapiro.test(data) # 进行Shapiro-Wilk检验
if (result$p.value < 0.05) {
print("数据不符合正态分布")
} else {
print("数据符合正态分布")
}
- QQ図(クオンタイル-クオンタイルプロット):データの分位点と正規分布の分位点が一致しているかどうかを比較する図。データが正規分布に従う場合は、点が直線上に分布する。
もう一つのオプションもネイティブな日本語で言い換えてみてもらえますか?
data <- rnorm(100) # 生成一个服从正态分布的随机数据
qqnorm(data) # 绘制QQ图
qqline(data) # 添加参考直线
データ点が目安の直線上にほぼ載っていれば、データは正規分布に従っている。
- ヒストグラム:ヒストグラムは、データの分布の様子を見るために使用できます。データが釣鐘型をしているような形であれば、正規分布に従っている可能性があります。
コードの例:
data <- rnorm(100) # 生成一个服从正态分布的随机数据
hist(data) # 绘制直方图
ヒストグラムが単一のベルカーブの形状を示している場合、データは正規分布に従う可能性があります。
これらの手法はデータの初期判断を行うものであり、正規分布に厳密に従っているかどうかを断定するものではないことに注意が必要である。実際利用では、複数の手法を組み合わせて判断していくことが推奨される。