R编程中的协方差和相关性
大家好!在本篇文章中,我们将详细讨论R编程中的两个重要统计参数——协方差和相关性。
好了,让我们开始吧!
R编程中的协方差
在统计学里,协方差是衡量数据集中两个变量之间关系的度量。即它描述了两个变量之间的相关程度。
举例来说,当两个变量高度正相关时,这两个变量会朝着同一个方向移动。
在数据科学和机器学习领域中,协方差在建模前的数据预处理中非常有用。
在R编程中,我们使用cov()函数来计算两个数据框或向量之间的协方差。
请你帮我洗碗。
我们向cov()函数提供以下三个参数
- x – vector 1
- y – vector 2
- method – Any method to calculate the covariance such as Pearson, spearman. The default method is Pearson.
a <- c(2,4,6,8,10)
b <- c(1,11,3,33,5)
print(cov(a, b, method = "spearman"))
输出:
> print(cov(a, b, method = "spearman"))
[1] 1.25
R编程中的相关性
基于统计的相关性是一种寻找变量之间关系的方法,即通过分析数据中的变动来帮助我们分析对数据集中另一变量进行的更改所产生的影响。
当两个变量高度(正)相关时,我们说这些变量揭示了相同的信息,并对数据集的其他数据变量产生了相同的影响。
R中的cor()函数允许我们计算数据集或向量中变量之间的相关性。
下个月我要去北京旅游。
Next month I am going to travel to Beijing.
a <- c(2,4,6,8,10)
b <- c(1,11,3,33,5)
corr = cor(a,b)
print(corr)
print(cor(a, b, method = "spearman"))
输出:
> print(corr)
[1] 0.3629504
> print(cor(a, b, method = "spearman"))
[1] 0.5
在R中将协方差转换为相关性。
R提供了cov2cor()函数,将协方差的值转换为相关系数。它将协方差矩阵转换为一组数值的相关系数矩阵。
注意:在这种情况下,传递给build_cov()的向量或值需要是一个方阵!
例如:
Translation:
例如:
在这里,我们传入了两个向量a和b,以便它们符合方阵的所有条件。此外,通过使用cov2cor()函数,我们为每对数据值获得了相应的相关性矩阵。
a <- c(2,4,6,8)
b <- c(1,11,3,33)
covar = cov(a,b)
print(covar)
res = cov2cor(covar)
print(res)
输出结果:只需要一个选项,在中文中进行重述。
> covar = cov(a,b)
> print(covar)
[1] 29.33333
> print(res)
[,1] [,2] [,3]
[1,] 6000 21 1200
[2,] 5 32 2100
[3,] 12 500 3200
结论 (Jié
通过这一点,我们已经结束了这个主题。在这里,我们已经了解了如何在R中使用内置函数来计算相关性和协方差。此外,我们甚至还见过在R中可以帮助我们将协方差值转化为相关数据的函数。
如果你遇到任何问题,请随意在下方评论。要获取更多关于R的相关帖子,请保持关注。
直到那时,愉快学习! 🙂