웹사이트 검색

CSV 파일을 R의 데이터 프레임으로 읽기


R에서 제공하는 특정 기능의 도움으로 CSV 파일을 데이터 프레임으로 읽는 것이 훨씬 쉽습니다.

CSV 파일이란 무엇입니까?

CSV는 쉼표, 구분, 값으로 확장됩니다. 이 파일에서 저장된 값은 쉼표로 구분됩니다. 이 데이터 저장 프로세스는 훨씬 쉽습니다.

CSV가 데이터 저장에 가장 많이 사용되는 파일 형식인 이유는 무엇입니까?

엑셀 시트에 데이터를 저장하는 것은 많은 회사에서 가장 일반적인 관행입니다. 대부분의 회사에서는 일반 스프레드시트를 만드는 것보다 프로세스가 더 쉽기 때문에 사람들이 CSV(쉼표로 구분된 값)로 데이터를 저장하고 있습니다. 나중에 R의 내장 패키지를 사용하여 데이터를 읽고 분석할 수 있습니다.

가장 인기 있고 강력한 통계 분석 프로그래밍 언어인 R은 데이터를 CSV 파일에서 조직화된 데이터 프레임으로 읽어들이는 특정 기능을 제공합니다.

CSV 파일을 데이터 프레임으로 읽기

이 짧은 예에서는 CSV 파일을 조직화된 데이터 프레임으로 읽는 방법을 살펴봅니다.

이 프로세스의 첫 번째 작업은 작업 디렉토리를 가져오고 설정하는 것입니다. CSV 파일의 작업 경로를 선택해야 합니다.

1. 작업 디렉토리 설정

여기에서 getwd() 함수를 사용하여 기본 작업 디렉토리를 확인할 수 있으며 setwd() 함수를 사용하여 디렉토리를 변경할 수도 있습니다.

>getwd() #Shows the default working directory 

---->   "C:/Users/Dell/Documents"

> setwd("C:\Users\Dell\Documents\R-test data") #to set the new working Directory

> getwd() #you can see the updated working directory

---> "C:/Users/Dell/Documents/R-test data"

2. 데이터 세트/CSV 파일 가져오기 및 읽기

작업 경로 설정 후 아래와 같이 데이터 세트 또는 CSV 파일을 가져와야 합니다.

> readfile <- read.csv("testdata.txt")

R 스튜디오에서 위의 코드 줄을 실행하여 아래와 같이 데이터 프레임을 가져옵니다.

변수 'readfile'의 클래스를 확인하려면 아래 코드를 실행합니다.

> class(readfile)

---> "data.frame"            

위의 이미지에서 학생 이름, ID, 부서, 성별 및 점수 정보를 포함하는 데이터 프레임을 볼 수 있습니다.

3. CSV 파일에서 학생 정보 추출

데이터 프레임을 가져온 후 이제 데이터를 분석할 수 있습니다. 데이터 프레임에서 특정 정보를 추출할 수 있습니다.

학생들이 채점한 최고 점수를 추출하기 위해,

>marks <- max(data$Marks.Scored) #this will give you the highest marks

#To extract the details of a student who scored the highest marks,

> data <- read.csv("traindata.csv")

> Marks <- max(data$Marks.Scored)

> retval <- subset(data, Marks.Scored == max(Marks.Scored))   #This will
 extract the details of the student who secured highest marks 

> View(retval)

화학과에 재학중인 학생들의 인적사항을 추출하기 위해,

> readfile <- read.csv("traindata.csv")

> retval <- subset( data, Department == "chemistry")  # This will extract the student details who are in Biochemistry department 
 
> View(retval)

결론

이 과정에서 read.csv(" ") 함수를 사용하여 R에서 csv 파일을 읽을 수 있습니다. 이 자습서에서는 csv 파일을 가져오고 csv 파일을 읽고 데이터 프레임에서 일부 특정 정보를 추출하는 방법을 다룹니다.

나는 이 프로젝트에 R 스튜디오를 사용했다. RStudio는 콘솔, 편집기 및 환경과 같은 뛰어난 기능도 제공합니다. 어쨌든 Thinn-R, Crimson 편집기 등과 같은 다른 편집기를 자유롭게 사용할 수 있습니다. 이 튜토리얼이 R에서 CSV 파일 읽기를 이해하고 데이터 프레임에서 일부 정보를 추출하는 데 도움이 되기를 바랍니다.

자세한 내용은 https://cran.r-project.org/manuals.html을 참조하세요.