웹사이트 검색

R에서 표준 편차를 찾는 방법?


통계 언어인 R은 값의 표준 편차를 찾기 위해 표준 함수 sd(' )를 제공합니다.

그래서 표준 편차는 무엇입니까?

  • '표준편차는 값의 분산을 측정한 것'입니다.
  • 표준 편차가 높을수록 값의 범위가 넓어집니다.
  • 표준 편차가 낮을수록 값의 범위가 좁아집니다.
  • 간단한 말로 공식은 다음과 같이 정의됩니다. 표준 편차는 '분산'의 제곱근입니다.

표준편차의 중요성

표준 편차는 통계에서 매우 인기가 있지만 그 이유는 무엇입니까? 그 인기와 중요성에 대한 이유는 다음과 같습니다.

  • 표준 편차는 음수를 제곱하여 양수로 변환합니다.
  • 특히 살펴볼 수 있도록 더 큰 편차를 표시합니다.
  • 중심경향을 보여주므로 분석에 매우 유용한 기능입니다.
  • 금융, 비즈니스, 분석 및 측정에서 중요한 역할을 합니다.

주제를 다루기 전에 이 정의를 염두에 두십시오!

분산 - 관찰된 값과 예상 값 사이의 제곱 차이로 정의됩니다.

목록의 값에 대한 R의 표준 편차 찾기

이 방법에서는 목록 'x'를 만들고 여기에 값을 추가합니다. 그런 다음 목록에서 해당 값의 표준 편차를 찾을 수 있습니다.

 x <- c(34,56,87,65,34,56,89)    #creates list 'x' with some values in it.

 sd(x)  #calculates the standard deviation of the values in the list 'x'

출력 —> 22.28175

이제 표준 편차를 찾기 위해 목록 'y'에서 특정 값을 추출할 수 있습니다.

 y <- c(34,65,78,96,56,78,54,57,89)  #creates a list 'y' having some values
 
data1 <- y[1:5] #extract specific values using its Index

sd(data1) #calculates the standard deviation for Indexed or extracted values from the list.

출력 —> 23.28519

CSV 파일에 저장된 값의 표준 편차 찾기

이 방법에서는 해당 파일에 저장된 값에 대한 R의 표준 편차를 찾기 위해 CSV 파일을 가져옵니다.

readfile <- read.csv('testdata1.csv')  #reading a csv file

data2 <- readfile$Values      #getting values stored in the header 'Values'

sd(data2)                              #calculates the standard deviation  

출력 —> 17.88624

높고 낮은 표준 편차

일반적으로 낮은 표준편차에서는 값이 평균값에 매우 가깝고 높은 표준편차에서는 평균값에서 멀리 퍼집니다.

예를 들어 설명할 수 있습니다.

x <- c(79,82,84,96,98)
mean(x)
--->  82.22222
sd(x)
--->  10.58038

R에서 사용하여 막대 그래프에 이러한 값을 표시하려면 아래 코드를 실행하십시오.

ggplot2 패키지를 설치하려면 R 스튜디오에서 이 코드를 실행합니다.

--> install.packages(\ggplot2”)

library(ggplot2)

values <- data.frame(marks=c(79,82,84,96,98), students=c(0,1,2,3,4,))
head(values)                  #displayes the values
 marks students
1    79        0
2    82        1
3    84        2
4    96        3
5    98        4
x <- ggplot(values, aes(x=marks, y=students))+geom_bar(stat='identity')
x                             #displays the plot

위의 결과에서 대부분의 데이터가 평균값(79,82,84)을 중심으로 군집하고 있어 낮은 표준편차임을 알 수 있습니다.

높은 표준 편차에 대한 그림입니다.

y <- c(23,27,30,35,55,76,79,82,84,94,96)
mean(y)
---> 61.90909
sd(y)
---> 28.45507

R의 ggplot에서 막대 그래프를 사용하여 이러한 값을 플롯하려면 아래 코드를 실행하십시오.

library(ggplot2)

values <- data.frame(marks=c(23,27,30,35,55,76,79,82,84,94,96), students=c(0,1,2,3,4,5,6,7,8,9,10))
head(values)                  #displayes the values
  marks students
1    23        0
2    27        1
3    30        2
4    35        3
5    55        4
6    76        5
x <- ggplot(values, aes(x=marks, y=students))+geom_bar(stat='identity')
x                             #displays the plot

위의 결과에서 광범위한 데이터를 볼 수 있습니다. 평균점수인 61점에서 매우 낮은 23점으로 가장 낮은 점수를 볼 수 있습니다. 이것을 높은 표준편차라고 합니다.

지금까지 R 언어에서 표준 편차를 계산하기 위해 sd(' ) 함수를 사용하는 방법을 충분히 이해했습니다. 간단한 문제를 해결하여 이 자습서를 요약해 보겠습니다.

예 #1: 짝수 목록의 표준편차

1-20 사이의 짝수의 표준 편차를 구합니다(1과 20 제외).

솔루션: 1에서 20 사이의 짝수는,

--> 2, 4, 6, 8, 10, 12, 14, 16, 18

이 값들의 표준편차를 구해봅시다.

x <- c(2,4,6,8,10,12,14,16,18)  #list of even numbers from 1 to 20

sd(x)                           #calculates the standard deviation of these 
                            values in the list of even numbers from 1 to 20

출력 —> 5.477226

예 #2: 미국 인구 데이터의 표준 편차

미국의 주별 인구의 표준편차를 구합니다.

이를 위해 CSV 파일을 가져오고 값을 읽어 표준 편차를 찾고 결과를 R의 히스토그램에 플로팅합니다.

df<-read.csv("population.csv")      #reads csv file
data<-df$X2018.Population           #extarcts the data from population 
                                     column
mean(data)                          #calculates the mean
                          
View(df)                            #displays the data
sd(data)                            #calculates the standard deviation

출력 ----> 평균=6432008, Sd=7376752

결론

R 값의 표준 편차를 찾는 것은 쉽습니다. R은 표준 편차를 찾기 위해 표준 함수 sd(')를 제공합니다. 값 목록을 만들거나 CSV 파일을 가져와서 표준 편차를 찾을 수 있습니다.

중요: 위와 같이 인덱싱을 통해 파일 또는 목록에서 일부 값을 추출하여 표준 편차를 계산하는 것을 잊지 마십시오.

R의 sd(' ) 함수에 대한 의문 사항은 댓글 상자를 사용하여 게시하십시오. 즐거운 학습이 되십시오!!!