R 프로그래밍의 공분산 및 상관 관계
안녕하세요 독자 여러분! 이 기사에서는 통계의 두 가지 중요한 매개변수인 R 프로그래밍의 공분산 및 상관관계에 대해 자세히 설명합니다.
그럼 시작하겠습니다!!
R 프로그래밍의 공분산
통계에서 공분산은 데이터 세트의 두 변수 간의 관계 측정입니다. 즉, 두 변수가 서로 관련되는 방식을 나타냅니다.
예를 들어, 두 변수가 높은 양의 상관 관계가 있을 때 변수는 같은 방향으로 앞으로 이동합니다.
공분산은 데이터 과학 및 기계 학습 영역에서 모델링하기 전에 데이터 전처리에 유용합니다.
R 프로그래밍에서 우리는 cov() 함수
를 사용하여 두 데이터 프레임 또는 벡터 사이의 공분산을 계산합니다.
예:
우리는 cov() 함수에 아래 세 가지 매개변수를 제공합니다.
- x – 벡터 1
- y – 벡터 2
- 방법 – Pearson, spearman과 같은 공분산을 계산하는 방법. 기본 방법은 Pearson입니다.
a <- c(2,4,6,8,10)
b <- c(1,11,3,33,5)
print(cov(a, b, method = "spearman"))
산출:
> print(cov(a, b, method = "spearman"))
[1] 1.25
R 프로그래밍의 상관 관계
통계적 기반의 상관 관계는 데이터의 이동 측면에서 변수 간의 관계를 찾는 방법입니다. 즉, 데이터 세트의 다른 변수에 대한 한 변수의 변경 효과를 분석하는 데 도움이 됩니다.
두 변수가 높은(양의) 상관관계가 있는 경우 변수가 동일한 정보를 나타내고 데이터 세트의 다른 데이터 변수에 동일한 영향을 미친다고 합니다.
R의 cor() 함수
를 사용하면 데이터 세트 또는 벡터의 변수 간의 상관 관계를 계산할 수 있습니다.
예:
a <- c(2,4,6,8,10)
b <- c(1,11,3,33,5)
corr = cor(a,b)
print(corr)
print(cor(a, b, method = "spearman"))
산출:
> print(corr)
[1] 0.3629504
> print(cor(a, b, method = "spearman"))
[1] 0.5
R의 상관 관계에 대한 공분산
R은 공분산 값을 상관 관계로 변환하는 cov2cor() 함수
를 제공합니다. 공분산 행렬을 값의 상관 행렬로 변환합니다.
참고: 이 경우 빌드 cov()에 전달되는 벡터 또는 값은 정사각 행렬이어야 합니다!
예:
여기서 우리는 정사각 행렬의 모든 항을 따르도록 두 벡터 a와 b를 전달했습니다. 또한 cov2cor() 함수를 사용하여 모든 데이터 값 쌍에 해당하는 상관 행렬을 얻습니다.
a <- c(2,4,6,8)
b <- c(1,11,3,33)
covar = cov(a,b)
print(covar)
res = cov2cor(covar)
print(res)
산출:
> covar = cov(a,b)
> print(covar)
[1] 29.33333
> print(res)
[,1] [,2] [,3]
[1,] 6000 21 1200
[2,] 5 32 2100
[3,] 12 500 3200
결론
이상으로 이 주제를 마치겠습니다. 여기에서 우리는 R에서 상관관계와 공분산을 계산하는 내장 함수에 대해 이해했습니다. 또한 R에서 공분산 값을 상관관계 데이터로 변환하는 데 도움이 되는 함수도 보았습니다.
궁금한 점이 있으면 아래에 의견을 남겨주세요. R과 관련된 더 많은 게시물을 보려면 계속 지켜봐 주세요.
그때까지 즐거운 배움!! :)