Close

[책] 처음 시작하는 R 데이터 분석 – 입문자를 많이 배려해준 책

최근 2~3년 사이 다양한 데이터를 수집하고 분석할 수 있는 제반환경, 이른바 빅데이터의 등장과 함께 데이터 분석에 대한 수요가 매우 빠르게 급증하고 있다.

그리고 이러한 수요와 함께 자연스럽게 R와 Python와 같이 데이터 분석을 위한 책과 온라인 강의도 나타나기 시작하였다.

BI(Business Intelligence) 에서 종사하던 필자 역시 자연스레 해당 트렌드에 관심을 갖고 책이나 강의를 듣기 시작하였다. 

하지만 기존의 강의나 책들은 몇가지 아쉬운 부분들이 있었는데, 그 중의 하나가 바로 실무에 바로 적용이 어렵다였다. 지나치게 기술에 초점에 두는 바람에 실무에 어떻게 연동을 해야 할지 어려운 것이었다. 전공자이며 경력자인 필자가 이렇게 고민하는데 처음 입문하는 사람들은 이러한 고민이 정말 큰 벽으로 다가왔을 것이다.

이러한 관점에서 이 책의 저자는 책의 표지에서 알 수 있듯이 실무에 바로 활용할 수 있도록 R을 입문자의 관점에서 소개한다. 

읽는데 오래 걸리지도 않는다. 입문서답게 매우 얇다. 정말 입문자에게 당장 필요한 내용만을 발췌해서 7일만에 책을 끝낼 수 있도록 도와준다. 보통 기술서적은 대체로 두껍고 사전과 같이 기초부터 천천히 알려주기 때문에 입문자에게는 접근이 다소 어려운 편이다. 

게다가 실무에 연관되어 적용할 수있는 다양한 예제를 전체 분량의 30%에 걸쳐서 제시한다. 예제별로 책에서 다루고 있는 부분을 최대한 활용하려고 한다. 

이렇게 입문자들을 위해서 예제와 함께 빠르게 책을 마무리하고 실무에 적용할 수 있도록 책을 구성한 것이 이 책의 강점이라고 생각한다.

하지만 몇가지 아쉬운 부분도 있다.

첫 번째,  시각화를 조금더 체계적으로 설명했을까 어떠했을까 하는 아쉬움이 있다. 데이터 분석의 각각 절차만으로도 한권의 책이 나올 수 있다. 하지만 그 중에서도 시각화는 실무에서 가장 많이 필요한 부분이기 때문에 조금 더 설명이 있었으면 하는 아쉬움이 있었다. 예를 들어 카테고리나 실수형 변수 등 변수의 타입 별로 시각화의 방법을 묶어서 기술해주면 어떠했을까 하는 생각이 든다.

두 번째,  스토리텔링에 대한 설명이 없는 것이 아쉬었다. 결국 분석의 결과는 비즈니스 적으로 가치를 전달할 수 없다면 무의미한 경우가 되는 경우가 많다. 그러면 이런 분석을 어떻게 잘 전달할 것인가에 대한 이야기가 조금이라도 있었으면 했는데 없었다. 

마지막으로 통계에 대한 설명이 많이 빈약한 편이다. 통계학의 그 광대한 지식을 담을수는 없지만  단순히 ‘맛보기’ 형태로 단편적인 통계지식이 그것도 카이제곱 검정 분석이 들어가 있는 것은 다소 이해하기가 어려웠다.

그럼에도 불구하고 이 책은 입문자들이 분석에 접근할 수 있도록 도와주는 길잡이로서의 목적은 충분히 잘 달성했기 때문에  R을 기초부터 제대로 다지고 싶은 사람에게는 제격의 책이라고 생각한다.