R 프로그래밍의 공분산 및 상관 관계

안녕하세요 독자 여러분! 이 기사에서는 통계의 두 가지 중요한 매개변수인 R 프로그래밍의 공분산 및 상관관계에 대해 자세히 설명합니다.

그럼 시작하겠습니다!!

R 프로그래밍의 공분산

통계에서 공분산은 데이터 세트의 두 변수 간의 관계 측정입니다. 즉, 두 변수가 서로 관련되는 방식을 나타냅니다.

예를 들어, 두 변수가 높은 양의 상관 관계가 있을 때 변수는 같은 방향으로 앞으로 이동합니다.

공분산은 데이터 과학 및 기계 학습 영역에서 모델링하기 전에 데이터 전처리에 유용합니다.

R 프로그래밍에서 우리는 cov() 함수를 사용하여 두 데이터 프레임 또는 벡터 사이의 공분산을 계산합니다.

예:

우리는 cov() 함수에 아래 세 가지 매개변수를 제공합니다.

a <- c(2,4,6,8,10) 

b <- c(1,11,3,33,5) 

print(cov(a, b, method = "spearman"))

산출:

> print(cov(a, b, method = "spearman")) 
[1] 1.25

통계적 기반의 상관 관계는 데이터의 이동 측면에서 변수 간의 관계를 찾는 방법입니다. 즉, 데이터 세트의 다른 변수에 대한 한 변수의 변경 효과를 분석하는 데 도움이 됩니다.

두 변수가 높은(양의) 상관관계가 있는 경우 변수가 동일한 정보를 나타내고 데이터 세트의 다른 데이터 변수에 동일한 영향을 미친다고 합니다.

R의 cor() 함수를 사용하면 데이터 세트 또는 벡터의 변수 간의 상관 관계를 계산할 수 있습니다.

예:

a <- c(2,4,6,8,10) 

b <- c(1,11,3,33,5) 

corr = cor(a,b)
print(corr)

print(cor(a, b, method = "spearman"))

산출:

> print(corr)
[1] 0.3629504

> print(cor(a, b, method = "spearman")) 
[1] 0.5

R은 공분산 값을 상관 관계로 변환하는 cov2cor() 함수를 제공합니다. 공분산 행렬을 값의 상관 행렬로 변환합니다.

참고: 이 경우 빌드 cov()에 전달되는 벡터 또는 값은 정사각 행렬이어야 합니다!

예:

여기서 우리는 정사각 행렬의 모든 항을 따르도록 두 벡터 a와 b를 전달했습니다. 또한 cov2cor() 함수를 사용하여 모든 데이터 값 쌍에 해당하는 상관 행렬을 얻습니다.

a <- c(2,4,6,8) 

b <- c(1,11,3,33) 

covar = cov(a,b)
print(covar)

res = cov2cor(covar)
print(res)

산출:

> covar = cov(a,b)
> print(covar)
[1] 29.33333

> print(res)
     [,1] [,2] [,3]
[1,] 6000   21 1200
[2,]    5   32 2100
[3,]   12  500 3200

이상으로 이 주제를 마치겠습니다. 여기에서 우리는 R에서 상관관계와 공분산을 계산하는 내장 함수에 대해 이해했습니다. 또한 R에서 공분산 값을 상관관계 데이터로 변환하는 데 도움이 되는 함수도 보았습니다.

궁금한 점이 있으면 아래에 의견을 남겨주세요. R과 관련된 더 많은 게시물을 보려면 계속 지켜봐 주세요.

그때까지 즐거운 배움!! :)