Rプログラミングにおける共分散と相関

2年 ago

光, 明

1 minute

こんにちは、読者の皆さん！この記事では、Rプログラミングにおける統計の重要な2つのパラメータ、共分散と相関について詳しく取り上げます。

それでは、始めましょう！！ (Soredewa, hajimemashou!!)

Rプログラミングにおける共分散

統計学において、共分散はデータセットの2つの変数間の関係を示す指標です。つまり、2つの変数がどのように関連しているかを表しています。

例えば、2つの変数が強く正の相関を持っている場合、変数は同じ方向に進みます。

共分散は、データサイエンスや機械学習の領域におけるモデリングの前処理で役立ちます。

Rプログラミングでは、cov()関数を使用して、2つのデータフレームまたはベクトル間の共分散を計算します。

英語をペラペラ話せる人は，通訳の仕事に適している。
人が英語を流暢に話せる場合，それは通訳業務に向いている。

私たちはcov（）関数に以下の3つのパラメータを提供します。

x – vector 1
y – vector 2
method – Any method to calculate the covariance such as Pearson, spearman. The default method is Pearson.

a <- c(2,4,6,8,10) 

b <- c(1,11,3,33,5) 

print(cov(a, b, method = "spearman"))

出力:

> print(cov(a, b, method = "spearman")) 
[1] 1.25

統計的な基準に基づいて相関関係を見つけることは、データの動きを通じて変数間の関係を見つける方法です。つまり、データセットの一方の変数を変更することが他の変数に与える影響を分析するのに役立ちます。

2つの変数が高い(正の)相関関係にある場合、それらの変数は同じ情報を示し、データセットの他のデータ変数に対して同じ効果を持つと言える。

Rのcor()関数を使用することで、データセットやベクトルの変数間の相関を計算することができます。

「私はピアノが大好きです。」
Translation: 「私はピアノが大好きです。」

a <- c(2,4,6,8,10) 

b <- c(1,11,3,33,5) 

corr = cor(a,b)
print(corr)

print(cor(a, b, method = "spearman"))

出力：

> print(corr)
[1] 0.3629504

> print(cor(a, b, method = "spearman")) 
[1] 0.5

Rは、共分散値を相関に変換するためのcov2cor()関数を提供しています。この関数は、共分散行列を相関行列に変換します。

注意：この場合、cov()に渡されるベクトルまたは値は正方行列である必要があります！

– I want to eat sushi tonight.
– 今晩、寿司を食べたいです。

ここでは、ベクトルaとbを持ち、それらが正方行列の全ての条件を満たしているとします。さらに、cov2cor()関数を使用して、データ値の各ペアに対応する相関行列を得ます。

a <- c(2,4,6,8) 

b <- c(1,11,3,33) 

covar = cov(a,b)
print(covar)

res = cov2cor(covar)
print(res)

出力する:

> covar = cov(a,b)
> print(covar)
[1] 29.33333

> print(res)
     [,1] [,2] [,3]
[1,] 6000   21 1200
[2,]    5   32 2100
[3,]   12  500 3200

これにより、このトピックは終わりになります。ここでは、Rで相関と共分散を計算するための組み込み関数について理解しました。さらに、共分散値を相関データに変換するためのRの関数も見ました。

もし質問がある場合は、どんどんコメントしてください。Rに関する他の投稿もお楽しみに。

それまで、学習を楽しんでください！:)