Skip to content →

[책] 통계가 탐정이라면 데이터는 단서이다., “벌거벗은 통계학”

제목: 벌거벗은 통계학(링크)

평점: 4 / 5

독서 기간: 17/08/5– 17/07/20

데이터 과학에 대한 대중의 관심이 높아진 이후부터 통계학은 함께 반드시 공부해야 하는 학문으로 등장하곤 했다. 데이터에 관심이 많은 나 역시 한 때  통계학 강의를 열심히 찾아 들은 적이 있다. 하지만 이러한 열정은 오래가지 않았다. “왜 이 것을 배워야 하는가?”에 대해 진지하게 고민해보지 않은 탓이다.

이런 경우, 우리는 보통 비슷한 고민을 한 “성공한” 이의 경험담을 찾아 나서곤 한다. 저자가 바로 그러한 이 중의 하나였다. 그 역시 통계학에 대해 대학시절 속된 말로 말아먹어본 이였다. 그의 경험을 바탕으로 그는 첫 장에서 바로 통계학을 배워야 하는 이유를 제시한다.

 

통계는 탐정, 데이터는 단서

요즘처럼 데이터가 풍부한 시대, 우리는 데이터를 21세기의 천연자원이라고 말하지만, 데이터는 석유와 같은 기존 자원과는 성격을 약간 달리한다. 데이터의 양은 데이터의 명료함과 반비례한다. 이때 통계가 필요하다. 기하급수적으로 늘어난 데이터 속에 숨겨진 의미에 대한 직관적인 통찰력을 높여줄 수 있다.

그렇다. 우리는 통계를 직관을 높여주기 위한 도구로서 배워야하는 것이다. 이를 역으로 생각해본다면 도구는 필요한 만큼만 쓸 줄 알면 된다. 이런 까닭에 저자는 이 책에서 분석의 과정을 위해 사용하는 통계지식은 아주 기본적인 수준이다.

책을 이해하기 위해서는 평균, 표준편차, 중간값, 기댓값, 회귀분석 등, 학교에서 배운 아주 기초적인 기술만 이해하면 된다. 그는 이보다 더 필요한 기술로서 우리의 직관적 통찰력을 강조한다. 통계를 탐정, 데이터를 단서로 묘사한 이유가 여기에 있다.

 

맥주병 옆에 쓰러진 사람

어렵게 받아들여질 수 있지만, 우리는 우리의 삶 속에서 이미 통계적 지식을 쓰고 있다. 예를 들어 퇴근 후에 맥주를 사러 가는 길에 편의점 앞에서 맥주병 옆에 쓰러진 사람을 발견했다고 치자. 우리는 직관적으로 그가 누군가에게 살해당했다고 생각하지 않는다. 그를 둘러싼 맥주병을 보며 취해 쓰러졌다고 생각한다. 이 짧은 생각 안에 우리는 데이터(주위에 널부러진 맥주병과 편의점)를 바탕으로 인과관계를 분석한다 ( 95%의 신뢰구간). 물론 아직 검증되지 않은 가설이지만 말이다.

특히 회귀분석의 분석 사례와 위험요소를 설명하는 부분은 정말 인상 깊었다. 그는 무조건 복잡한 수식을 동원하지 않았다. 대신 회귀분석을 쓰기 위해 고민해야 하는 부분들을 쉽게 풀어준다. 통계는 어디까지나 도구일 뿐, 목적을 만들어주지는 않기 때문이다. 그래서 그는 회귀분석을 설명하는 내내 목적의 중요성에 대해 언급한다.

 

결론

수식은 거의 등장하지 않는다. 도구로서 통계를 사용하기 전까지 데이터에 접근하기 위한 고민과 과정이 주를 이룰 뿐이다. 그래서 통계의 입문서로는 물론이거니와 데이터를 분석, 기획하는 이에게는 추천 할만한 책이었다. 그래서 왠지 한 번 더 읽을 것 같은 느낌이다.

Published in Books