웹사이트 검색

R 프로그래밍에서 predict() 함수를 사용하는 방법


소개

R의 predict() 함수는 입력 데이터를 기반으로 값을 예측하는 데 사용됩니다. R 프로그램의 모든 모델링 측면은 predict() 함수를 자체 방식으로 사용하지만 predict() 함수의 기능은 동일하게 유지됩니다. 경우에 관계없이.

이 기사에서는 R에서 predict() 함수를 사용하는 방법을 살펴봅니다.

전제 조건

이 자습서를 완료하려면 다음이 필요합니다.

  • R을 설치했습니다.

R의 predict() 함수 구문

R의 predict() 함수는 입력 데이터를 기반으로 값을 예측하는 데 사용됩니다.

predict(object, newdata, interval)

  • 객체: 선형 모델에서 상속된 클래스
  • newdata: 값을 예측하기 위한 입력 데이터
  • interval: 간격 계산 유형

predict() 함수의 예

값을 예측하려면 데이터가 필요합니다. 이 예제의 목적을 위해 R - "Cars\에 내장된 데이터 세트를 가져올 수 있습니다.

df <- datasets::cars

이렇게 하면 데이터 프레임에 속도 및 거리(dist) 값 모음이 할당됩니다.

     speed dist
1      4    2
2      4   10
3      7    4
4      7   22
5      8   16
6      9   10
7     10   18
8     10   26
9     10   34
10    11   17

다음으로 predict()를 사용하여 이 데이터를 사용하여 미래 값을 결정합니다.

먼저 이 데이터 프레임에 대한 선형 모델을 계산해야 합니다.

# Creates a linear model
my_linear_model <- lm(dist~speed, data = df)

# Prints the model results
my_linear_model

이 코드를 실행하면 선형 모델 결과가 계산됩니다.

Call:
lm(formula = dist ~ speed, data = df)

Coefficients:
(Intercept)        speed
    -17.579        3.932

선형 모델은 입력 데이터 동작에 따라 자동차의 속도를 반환했습니다. 이제 모델이 있으므로 predict()를 적용할 수 있습니다.

# Creating a data frame
variable_speed <- data.frame(speed = c(11,11,12,12,12,12,13,13,13,13))

# Fiting the linear model
linear_model <- lm(dist~speed, data = df)

# Predicts the future values
predict(linear_model, newdata = variable_speed)

이 코드는 다음 출력을 생성합니다.

       1        2        3        4        5
25.67740 25.67740 29.60981 29.60981 29.60981
       6        7        8        9       10
29.60981 33.54222 33.54222 33.54222 33.54222

글쎄, 우리는 이전 데이터와 선형 모델의 도움을 기반으로 미래 거리 값을 성공적으로 예측했습니다.

이제 예측이 얼마나 정확한지 알아보기 위해 예측 값의 "신뢰도\ 수준을 확인해야 합니다.

예측 값의 신뢰도

예측 함수의 신뢰 구간은 예측의 불확실성을 측정하는 데 도움이 됩니다.

# Input data
variable_speed <- data.frame(speed = c(11,11,12,12,12,12,13,13,13,13))

# Fits the model
linear_model <- lm(dist~speed, data = df)

# Predicts the values with confidence interval
predict(linear_model, newdata = variable_speed, interval = 'confidence')

이 코드는 다음 출력을 생성합니다.

      fit      lwr      upr
1  25.67740 19.96453 31.39028
2  25.67740 19.96453 31.39028
3  29.60981 24.39514 34.82448
4  29.60981 24.39514 34.82448
5  29.60981 24.39514 34.82448
6  29.60981 24.39514 34.82448
7  33.54222 28.73134 38.35310
8  33.54222 28.73134 38.35310
9  33.54222 28.73134 38.35310
10 33.54222 28.73134 38.35310

위 출력에서 예측 값의 신뢰 구간을 볼 수 있습니다.

이 출력에서 우리는 11~13mph의 속도로 이동하는 자동차가 19.9~31.3마일 범위의 거리를 이동할 가능성이 있음을 예측할 수 있습니다.

결론

predict() 함수는 이전 데이터 동작을 기반으로 값을 예측하여 해당 데이터를 모델에 맞추는 데 사용됩니다.

신뢰 구간을 사용하여 예측의 정확성을 확인할 수도 있습니다.

참조

  • R 문서