본문 바로가기
읽기/IT

Do it! 공공데이터로 배우는 R 데이터 분석 with 샤이니 (김철민, 이지스퍼블리싱)

by 문화교양인 2022. 7. 10.

 

1. 들어가며

 

IT 학습자들을 위한 "Do it!" 시리즈를 꾸준히 내고 있는 이지스퍼블리싱에서 이번에는 '공공데이터로 배우는 R 데이터 분석 with 샤이니' 가 출간되었다. 

 

Do it! 시리즈는 주로 초~중급 학습자들을 대상으로 하는데, 이 책은 R 언어에 대해 기초적인 지식이 있는 학습자를 타깃 독자로 삼아 출간된 것으로 보인다. 

 

이 책은 R 언어에 대해 아무것도 모르는 독자에게 기초 함수부터 차근차근 알려주는 책은 아니다. 부동산 데이터 분석, 한반도 지진 발생 분석 등 다양한 데이터 분석 사례를 학습하는 것을 목표로 향해 가는 책이기 때문에 R 언어에 대해 기초적인 지식이 있는 독자가 보면 가장 좋은 책이다.

 

 

2. 책 내용의 분석

 

1) 책의 구성

 

책의 본문은 총 12장으로 구성된다. 먼저 데이터 분석과 자료 수집에 대한 서설이 제시된 뒤, API 크롤러 만들기, 데이터 전처리, 카카오맵 API로 지오코딩하기 등 데이터 분석에 필요한 지식을 학습한다. 그 다음 시각화를 다루고 나서 샤이니 패키지(R 의 분석 결과를 웹 애플리케이션으로 구현할 수 있는 패키지)의 기초를 학습한 뒤 이 패키지를 활용하는 분석 방법을 배운다. 

 

책의 맨 마지막 부분은 일종의 종합응용 케이스라고 볼 수 있는 '교통카드 데이터 분석 사례'를 담고 있다. 여기서는 교통 카드 데이터를 활용해 경기도 화성시의 대중교통 이용 특성(노선별, 시간대별 이용량 등)을 살펴보고, 이를 시각화한 뒤 결론으로서 화성시의 신규 노선 확장 방안을 제시한다. 이 부분은 LH 한국토지주택공사에서 주최했던 제1회 데이터 분석 경진 대회 수상작이라고 한다.

 

2) 책의 대상 독자

 

시중에 출간되는 초중급자용 R 관련 서적은 크게 두 가지에 중점을 두고 있다. (1) R 언어 기본 학습 (2) R을 이용한 데이터 분석 연습, 이렇게 두 가지인데, 이 책은 (2) 의 내용이 대부분을 이루고 있다.  

 

따라서 R 을 완전히 처음 접하며 아무것도 모르는 학습자들은 이 책이 다소 버겁게 느껴질 수 있으므로, 다른 서적이나 유튜브 동영상 등을 통해 R 언어의 기초 내용을 학습하고 보는 것이 바람직하다. 

 

물론 이 책이 그렇다고해서 매우 어려운 내용을 다루고 있는 것은 아니다. R 의 기본적인 함수(데이터프레임 활용 등)와 라이브러리 사용에 대해 기본적인 지식이 있으면 책에 제시된 코드를 하나 하나 따라 하면서 학습할 수 있을 것이다. 책의 전체 분량이 총 246쪽이기 때문에 분량도 얇은 축에 속한다.

 

3) 책의 장점

 

이 책의 장점은 다음과 같다. 첫째, 기존에 출간된 초중급자용 R 학습서적에서 거의 다루지 않았던 샤이니 패키지를 소개하고 있다. 대부분의 초중급자용 R 학습서적은 R 패키지 중에 가장 유명하다고 할 수 잇는 tidyverse 패키지를 다루고 있는데, 이 책은 샤이니 패키지를 대상으로 사고 있다는 점에서 해당 패키지를 학습하고자 하는 독자들에게 좋은 교재가 될 수 있다.

 

둘째, 다양한 데이터 분석 사례를 학습할 수 있다. 기존의 서적들의 경우 책의 전반부는 R 언어 학습, 후반부는 분석 사례로 구성된 것이 대부분이어서, 실제 사례 분석 연습은 충분히 하기 쉽지 않았다. 그러나 이 책은 내용의 대부분이 다양한 사례 분석 연습이기 때문에 R 언어를 실제로 어떤 분야에서 어떻게 분석에 사용하는지 직접 체험할 수 있다.

 

셋째, 저자의 유튜브 동영상 강의가 제공됨에 따라 단순히 책만 보는 것이 아닌, 입체적인 학습이 가능하다. 다만, 여느 프로그래밍 언어가 그러하듯이, 강의만 듣는 것으로는 R 데이터 분석을 완전히 익혔다고는 할 수 없다. 반드시 손으로 직접 코드를 쳐 보고 생각하는 습관이 필요할 것이다.

 

저자의 동영상 강의 주소는 다음과 같다. 

 

https://www.youtube.com/channel/UC3eaNSh1jAYm1lgjSc7D3vA/videos

 

 

3. 나오며

 

종합하자면, 이 책은 R 에 대한 기초 학습을 마친 학습자가 바로 그 다음 단계에서 보기 좋은 책이다. 해당 독자들은 이 책을 보고 데이터 분석에 대한 실력을 쌓은 뒤, 데이터 분석에 대한 전문 서적, 혹은 (주로 해외 서적의 번역본인) R 쿡북 등의 심화 서적으로 공부하는 것이 바람직할 것이다.

 

 

* 참고 : 이 리뷰는 출판사의 서평 이벤트에 당첨되어 증정받은 책으로 작성한 것입니다.