R 프로그래밍의 unique() 함수

R의 unique() 함수는 벡터, 행렬에 있는 중복 값이나 행을 제거하거나 삭제하는 데 사용됩니다.

unique() 함수는 데이터에서 중복 값을 직접 식별하고 제거하기 때문에 EDA(Exploratory Data Analysis)에서 그 중요성을 발견했습니다.

이 기사에서는 R 프로그래밍에서 unique() 함수의 다양한 응용 프로그램을 공개합니다. 하자 롤!!!

고유한 값을 얻는 아이디어

음, 주제에 들어가기 전에 그 뒤에 있는 아이디어를 아는 것이 좋습니다. 이 경우 고유한 값입니다. unique 함수는 중복 개수를 제거하여 고유한 값을 반환합니다.

이 다이어그램은 unique 함수가 중복 항목을 찾고 이를 제거하여 고유한 값을 반환함을 알려줍니다. 다음 섹션에는 좋은 것을 가르치기 위해 많은 삽화가 나옵니다.

R의 Unique() 함수 구문

Unique: unique() 함수는 데이터에 있는 중복 개수를 식별하고 제거하는 데 사용됩니다.

unique(x)

어디:

X = 벡터, 데이터 프레임 또는 행렬일 수 있습니다.

R의 unique() 함수의 간단한 예

중복 값이 있는 벡터가 있는 경우 unique() 함수를 사용하여 한 줄의 코드를 사용하여 쉽게 제거할 수 있습니다.

어떻게 작동하는지 보자…

#An input vector having duplicate values
df<-c(1,2,3,2,4,5,1,6,8,9,8,6)

#elimnates the duplicate values in the vector 
unique(df)

Output = 1 2 3 4 5 6 8 9

위의 그림에서 입력 벡터에 많은 중복 값이 있음을 알 수 있습니다.

해당 벡터를 unique 함수에 전달한 후 위에 표시된 것처럼 모든 중복 값을 제거하고 고유한 값만 반환합니다.

행렬에서 고유한 값 찾기

이제 행렬에 존재하는 중복 값을 찾아 고유 함수를 사용하여 제거합니다.

이를 위해 먼저 중복 값을 갖는 'n' 행과 열의 행렬을 만들어야 합니다.

행렬을 만들려면 아래 코드를 실행하십시오.

#creates a 6 x 4 matrix having 24 elements 
df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)

      [,1] [,2] [,3] [,4]
[1,]    1    2    3    4
[2,]    5    6    7    8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20
[6,]    1    2    3    4

쉽게 알 수 있듯이 마지막 행은 완전히 복제됩니다. unique() 함수를 사용하여 이러한 중복 값을 제거하기만 하면 됩니다.

#removes the duplicate values
unique(df)

       [,1] [,2] [,3] [,4]
[1,]    1    2    3    4
[2,]    5    6    7    8
[3,]    9   10   11   12
[4,]   13   14   15   16
[5,]   17   18   19   20

예!

훌륭해! 행렬에 존재하는 모든 중복 값은 unique 함수에 의해 제거되고 고유한 값만 있는 행렬을 반환했습니다.

데이터 프레임에서 고유한 값 찾기

지금까지 중복 개수를 제거하여 고유한 값을 추출하기 위해 벡터와 행렬에 대해 작업했습니다.

이 섹션에서는 데이터 프레임에 있는 고유한 값을 가져오는 데 중점을 두겠습니다.

데이터 프레임을 생성하려면 아래 코드를 실행하십시오.

#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#dataframe
Class_data

   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male

위와 같이 중복 카운트가 있는 데이터 프레임입니다. 여기에 존재하는 중복 값을 제거하기 위해 고유 기능을 적용해 보겠습니다.

unique(Class_data)

   Student Age  Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male

우와! unique 함수는 중복 값을 제거하여 데이터 프레임에 있는 모든 고유 값을 반환했습니다.

이와 같이 R의 unique() 함수를 사용하면 데이터에 존재하는 유일한 값을 쉽게 얻을 수 있습니다.

특정 열의 고유 값 찾기

예, 데이터 세트 대신 특정 열에서 고유한 값을 가져와야 하는 경우에는 어떻게 합니까?

걱정하지 마세요. unique() 함수를 사용하면 아래와 같이 특정 열에서 고유한 값을 가져올 수도 있습니다.

#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))

#dataframe
Class_data

   Student Age Gender
1   Naman  22   Male
2    Megh  23  Female
3    Mark  24   Male
4   Naman  22   Male
5    Megh  23  Female
6    Mark  24   Male

좋습니다. 이해하기 쉽도록 지난 섹션에서 사용한 것과 동일한 데이터 프레임을 사용하고 있습니다.

고유한 함수를 사용하여 중복 값을 제거해 봅시다.

unique(Class_data$Student)

Output = "Naman" "Megh"  "Mark"

같은 방식으로 Age 또는 Gender 열에서도 고유한 값을 가져올 수 있습니다.

unique(Class_data$Gender)

"Male"   "Female"

고유 값의 길이 찾기

이 섹션에서는 데이터의 고유한 값 수를 가져옵니다. 이 응용 프로그램은 데이터를 더 잘 알고 추가 분석을 위해 준비하는 데 더 유용합니다.

#importing the dataset
datasets::BOD

    Time  demand
1    1     8.3
2    2    10.3
3    3    19.0
4    4    16.0
5    5    15.6
6    7    19.8

음, 여기서는 BOD 데이터 세트를 사용하고 있습니다. 카운트가 뒤따를 고유 값을 먼저 찾으십시오.

#returns the unique value
unique(BOD$demand)

Output = 8.3  10.3 19.0  16.0  15.6  19.8

이제 BOD 데이터 세트의 수요 열에 고유한 값이 있습니다.

이제 고유한 값의 개수를 찾으러 갈 차례입니다.

#returns the length of unique values
length(unique(BOD$demand))

Output =  6

마무리

음, R의 unique() 함수는 EDA(Exploratory Data Analysis)와 관련하여 매우 가치 있는 함수입니다.

특정 개수와 함께 데이터를 더 잘 이해하는 데 도움이 됩니다.

이 문서에서는 unique() 함수의 여러 응용 프로그램 및 사용 사례에 대해 설명합니다. 즐거운 분석!!!

더 읽기: R 문서