R 프로그래밍의 unique() 함수
R의 unique() 함수는 벡터, 행렬에 있는 중복 값이나 행을 제거하거나 삭제하는 데 사용됩니다.
unique() 함수는 데이터에서 중복 값을 직접 식별하고 제거하기 때문에 EDA(Exploratory Data Analysis)에서 그 중요성을 발견했습니다.
이 기사에서는 R 프로그래밍에서 unique() 함수의 다양한 응용 프로그램을 공개합니다. 하자 롤!!!
고유한 값을 얻는 아이디어
음, 주제에 들어가기 전에 그 뒤에 있는 아이디어를 아는 것이 좋습니다. 이 경우 고유한 값입니다. unique 함수는 중복 개수를 제거하여 고유한 값을 반환합니다.
이 다이어그램은 unique 함수가 중복 항목을 찾고 이를 제거하여 고유한 값을 반환함을 알려줍니다. 다음 섹션에는 좋은 것을 가르치기 위해 많은 삽화가 나옵니다.
R의 Unique() 함수 구문
Unique: unique() 함수는 데이터에 있는 중복 개수를 식별하고 제거하는 데 사용됩니다.
unique(x)
어디:
X = 벡터, 데이터 프레임 또는 행렬일 수 있습니다.
R의 unique() 함수의 간단한 예
중복 값이 있는 벡터가 있는 경우 unique() 함수를 사용하여 한 줄의 코드를 사용하여 쉽게 제거할 수 있습니다.
어떻게 작동하는지 보자…
#An input vector having duplicate values
df<-c(1,2,3,2,4,5,1,6,8,9,8,6)
#elimnates the duplicate values in the vector
unique(df)
Output = 1 2 3 4 5 6 8 9
위의 그림에서 입력 벡터에 많은 중복 값이 있음을 알 수 있습니다.
해당 벡터를 unique 함수에 전달한 후 위에 표시된 것처럼 모든 중복 값을 제거하고 고유한 값만 반환합니다.
행렬에서 고유한 값 찾기
이제 행렬에 존재하는 중복 값을 찾아 고유 함수를 사용하여 제거합니다.
이를 위해 먼저 중복 값을 갖는 'n' 행과 열의 행렬을 만들어야 합니다.
행렬을 만들려면 아래 코드를 실행하십시오.
#creates a 6 x 4 matrix having 24 elements
df<-matrix(rep(1:20,length.out=24),nrow = 6,ncol=4,byrow = T)
[,1] [,2] [,3] [,4]
[1,] 1 2 3 4
[2,] 5 6 7 8
[3,] 9 10 11 12
[4,] 13 14 15 16
[5,] 17 18 19 20
[6,] 1 2 3 4
쉽게 알 수 있듯이 마지막 행은 완전히 복제됩니다. unique() 함수를 사용하여 이러한 중복 값을 제거하기만 하면 됩니다.
#removes the duplicate values
unique(df)
[,1] [,2] [,3] [,4]
[1,] 1 2 3 4
[2,] 5 6 7 8
[3,] 9 10 11 12
[4,] 13 14 15 16
[5,] 17 18 19 20
예!
훌륭해! 행렬에 존재하는 모든 중복 값은 unique 함수에 의해 제거되고 고유한 값만 있는 행렬을 반환했습니다.
데이터 프레임에서 고유한 값 찾기
지금까지 중복 개수를 제거하여 고유한 값을 추출하기 위해 벡터와 행렬에 대해 작업했습니다.
이 섹션에서는 데이터 프레임에 있는 고유한 값을 가져오는 데 중점을 두겠습니다.
데이터 프레임을 생성하려면 아래 코드를 실행하십시오.
#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))
#dataframe
Class_data
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
4 Naman 22 Male
5 Megh 23 Female
6 Mark 24 Male
위와 같이 중복 카운트가 있는 데이터 프레임입니다. 여기에 존재하는 중복 값을 제거하기 위해 고유 기능을 적용해 보겠습니다.
unique(Class_data)
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
우와! unique 함수는 중복 값을 제거하여 데이터 프레임에 있는 모든 고유 값을 반환했습니다.
이와 같이 R의 unique() 함수를 사용하면 데이터에 존재하는 유일한 값을 쉽게 얻을 수 있습니다.
특정 열의 고유 값 찾기
예, 데이터 세트 대신 특정 열에서 고유한 값을 가져와야 하는 경우에는 어떻게 합니까?
걱정하지 마세요. unique() 함수를 사용하면 아래와 같이 특정 열에서 고유한 값을 가져올 수도 있습니다.
#creates a data frame
> Class_data<-data.frame(Student=c('Naman','Megh','Mark','Naman','Megh','Mark'),Age=c(22,23,24,22,23,24),Gender=c('Male','Female','Male','Male','Female','Male'))
#dataframe
Class_data
Student Age Gender
1 Naman 22 Male
2 Megh 23 Female
3 Mark 24 Male
4 Naman 22 Male
5 Megh 23 Female
6 Mark 24 Male
좋습니다. 이해하기 쉽도록 지난 섹션에서 사용한 것과 동일한 데이터 프레임을 사용하고 있습니다.
고유한 함수를 사용하여 중복 값을 제거해 봅시다.
unique(Class_data$Student)
Output = "Naman" "Megh" "Mark"
같은 방식으로 Age 또는 Gender 열에서도 고유한 값을 가져올 수 있습니다.
unique(Class_data$Gender)
"Male" "Female"
고유 값의 길이 찾기
이 섹션에서는 데이터의 고유한 값 수를 가져옵니다. 이 응용 프로그램은 데이터를 더 잘 알고 추가 분석을 위해 준비하는 데 더 유용합니다.
#importing the dataset
datasets::BOD
Time demand
1 1 8.3
2 2 10.3
3 3 19.0
4 4 16.0
5 5 15.6
6 7 19.8
음, 여기서는 BOD 데이터 세트를 사용하고 있습니다. 카운트가 뒤따를 고유 값을 먼저 찾으십시오.
#returns the unique value
unique(BOD$demand)
Output = 8.3 10.3 19.0 16.0 15.6 19.8
이제 BOD 데이터 세트의 수요 열에 고유한 값이 있습니다.
이제 고유한 값의 개수를 찾으러 갈 차례입니다.
#returns the length of unique values
length(unique(BOD$demand))
Output = 6
마무리
음, R의 unique() 함수는 EDA(Exploratory Data Analysis)와 관련하여 매우 가치 있는 함수입니다.
특정 개수와 함께 데이터를 더 잘 이해하는 데 도움이 됩니다.
이 문서에서는 unique() 함수의 여러 응용 프로그램 및 사용 사례에 대해 설명합니다. 즐거운 분석!!!
더 읽기: R 문서