웹사이트 검색

R에서 Google 스프레드시트 읽기 [쉬운 방법]


"스프레드시트를 사용하십니까?\라는 질문을 하면 즉시 YES라고 답할 것입니다. 일상적인 비즈니스 운영에서 스프레드시트가 얼마나 인기 있고 유용한지 보여줍니다. 귀하가 분석가라면 스프레드시트는 매우 귀중합니다. 작업에 Excel과 Google 시트를 모두 사용했을 수 있습니다. Excel 시트를 R로 여러 번 읽었을 가능성이 높습니다. 하지만 Google Sheets를 R로 읽는 것을 생각해 본 적이 있습니까?. 아직 아니라면, 시도해 볼 가치가 있습니다.

Google 스프레드시트 시작하기

Google 시트에 대해 들어 보셨을 것입니다. 엑셀과 같습니다. 다양한 유형의 데이터를 구성, 편집 및 분석할 수 있습니다. 그러나 Excel과 달리 Google 시트는 협업을 장려하는 웹 기반 스프레드시트 프로그램입니다.

이것은 Google 계정, Google 드라이브 및 Google 문서 및 슬라이드와 같은 동료 서비스와 자동으로 동기화됩니다. Google 시트에서는 매번 저장할 필요가 없습니다. 각 활동 후 시트를 업데이트하는 자동 저장 기능을 제공합니다. 멋지지 않아?

인터페이스에 대해 이야기하면 Google 시트는 합리적인 변경으로 Excel을 따를 것입니다. 공동 작업을 위해 시트를 자유롭게 공유할 수 있습니다. 대부분의 경우 여러 사람이 시트에서 실시간으로 작업할 수 있으므로 우리의 삶이 편해집니다.

Google 시트에 대한 정보는 이 정도면 충분할 것 같습니다. 흥미로운 내용을 살펴보겠습니다.

R에서 Google 스프레드시트 읽기

'googlesheets4' 패키지를 사용하여 R에서 Google 시트 데이터를 읽을 수 있습니다. 이 패키지를 사용하면 R을 사용하여 시트에 들어갈 수 있습니다.

먼저 R에 'googlesheets4' 패키지를 설치한 다음 계속 진행하려면 라이브러리를 로드해야 합니다.

#Install the required package
install.packages('googlesheets4')
#Load the required library 
library(googlesheets4)

좋아요. 이제 'googlesheets4' 라이브러리가 Google 시트에서 데이터를 가져올 준비가 되었습니다.

1. 인증 설정

Google 스프레드시트에서 데이터를 바로 읽을 수 없습니다. G시트는 웹 기반 스프레드시트이므로 Google 메일과 연결됩니다. 따라서 R이 Google 시트에 액세스하도록 허용해야 합니다.

R로 데이터를 읽기 위해 read.csv 또는 read.table과 같은 함수를 사용했을 것입니다. 하지만 여기서는 파일 형식을 언급할 필요가 없습니다. 브라우저에서 Google 스프레드시트 링크를 복사하여 여기에 붙여넣고 코드를 실행하기만 하면 됩니다.

아래 코드를 실행하면 추가 프로세스에 대한 인터페이스를 볼 수 있습니다.

#Read google sheets data into R
x <- read_sheet('https://docs.google.com/spreadsheets/d/1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE/edit?usp=sharing')
Is it OK to cache OAuth access credentials in the folder


1: Yes
2: No

권한 부여 프로세스를 계속하려면 옵션 1: YES를 선택해야 합니다.

첫 번째 단계로 로그인한 G 계정이 여러 개인 경우 아래와 같이 계정을 계속 사용하라는 메시지가 표시됩니다.

  • R이 G 시트에 액세스할 수 있도록 권한을 부여하려면 계정을 선택해야 합니다. 이 프로세스 뒤에는 여러 권한이 부여됩니다. 모든 단계에서 R을 허용해야 합니다.

  • 아래 그림에는 Tidyverse API에 부여하는 권한이 표시됩니다. "허용\을 클릭하면 완료됩니다.

  • 인증에 성공하면 완료 메시지를 볼 수 있습니다.

  • 이후 아래와 같이 R studio에 성공적인 인증 메시지가 표시됩니다.

2. 데이터를 R로 읽기

인증 프로세스를 완료하고 성공적으로 진행되어 기쁩니다. 이제 Google 시트에서 R로 데이터를 읽는 방법을 살펴보겠습니다.

#Reads data into R
df <- read_sheet('https://docs.google.com/spreadsheets/d/1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE/edit?usp=sharing')

#Prints the data
df
# A tibble: 1,000 x 20
   months_loan_dura~ credit_history purpose amount savings_balance employment_leng~
   <chr>                      <dbl> <chr>   <chr>            <dbl> <chr>           
 1 < 0 DM                         6 critic~ radio~            1169 unknown         
 2 1 - 200 DM                    48 repaid  radio~            5951 < 100 DM        
 3 unknown                       12 critic~ educa~            2096 < 100 DM        
 4 < 0 DM                        42 repaid  furni~            7882 < 100 DM        
 5 < 0 DM                        24 delayed car (~            4870 < 100 DM        
 6 unknown                       36 repaid  educa~            9055 unknown         
 7 unknown                       24 repaid  furni~            2835 501 - 1000 DM   
 8 1 - 200 DM                    36 repaid  car (~            6948 < 100 DM        
 9 unknown                       12 repaid  radio~            3059 > 1000 DM       
10 1 - 200 DM                    30 critic~ car (~            5234 < 100 DM        
# ... with 990 more rows, and 14 more variables: installment_rate <chr>,
#   personal_status <dbl>, other_debtors <chr>, residence_history <chr>,
#   property <dbl>, age <chr>, installment_plan <dbl>, housing <chr>,
#   existing_credits <chr>, default <dbl>, dependents <dbl>, telephone <dbl>,
#   foreign_worker <chr>, job <chr>

여기에서 R이 'read_sheet' 함수를 사용하여 Google 시트에서 데이터를 읽는 방법을 볼 수 있습니다.

또한 참조/이해를 위해 여기에 데이터 프레임을 추가하고 있습니다.

  • 계정을 설정하면 매우 쉬운 게임이 됩니다.

3. 시트 ID를 사용하여 Google 시트를 R로 읽기

데이터를 읽기 위해 시트 링크를 복사할 필요가 없습니다. 시트 ID만 복사할 수 있으며 read_sheet 기능과 함께 사용할 수 있습니다. 평소와 같이 데이터를 읽습니다.

시트 ID를 모르시는 분들을 위해 시트 링크를 추가하고 시트 ID를 색상으로 강조 표시했습니다. 이 ID를 복사하면 동일한 프로세스를 따를 수 있습니다.

아래에서 논의된 코드를 찾을 수 있습니다.

#Reads the data with Sheet ID into R
df <- read_sheet('1J9-ZpmQT_oxLZ4kfe5gRvBs7vZhEGhSCIpNS78XOQUE')

#Prints the data
df

이 코드는 동일한 출력, 즉 데이터를 제공합니다. 전체 일러스트레이션에 크레딧 데이터를 사용했습니다. 이 목적을 위해 모든 데이터를 사용할 수 있습니다. 지금부터 Google 시트를 R로 읽는 것이 문제가 되지 않기를 바랍니다.

엔딩 노트

거의 모든 조직에서 비즈니스 운영 및 데이터 작업에 Google 시트를 사용합니다. 분석가 또는 R 사용자로서 Google Sheets 및 R을 사용하는 방법을 알고 있으면 좋을 것입니다. 데이터 및 시트 ID/링크에서 이를 연습할 수 있는 매우 간단한 방법입니다. 작업 시간을 절약할 수 있는 무언가를 배웠기를 바랍니다. 지금은 여기까지입니다. Happy R!

더 읽기: R 문서