[책]8.5/10, 숫자에 약한 사람들을 위한 통계학 수업

한 줄평

  • 통계에 대한 하나의 에세이를 읽는 것 같은 좋은 책

책을 되짚어 보기 위한 질문들

책에 대해 가장 좋았던 부분들

  • 원서 기준 “통계의 아름다움” 타이틀이 마음에 들었다. 번안한 제목은 아무래도 독서층을 노리고 한 것 같으나, 통계를 전공했고 데이터를 좋아하는 사람에게 있어 가벼운 주제부터 검정, 베이즈 등의 주제까지 너무나도 재미있게 다루고 있었다.

책에 대해서 가장 아쉬웠던 부분

  • 수식을 최대한 자제하려다보니 말이 길어지고 말이 길어지다보니 자연스레 번안한 글도 길어지게 되어서 이해를 종종 못하는 경우가 있었다. 물론 번역의 질이 좋지 않다는 뜻은 아니다.

비슷한 부류의 책이 기억난다면?

  • “논쟁거리로 배우는 통계학 “을 비롯해서 “틀리지 않는 법” 등 이야기 중심의 통계학 입문서들이 기억에 났다.

가장 기억나는 문구는?

-“상대위험도만 제공하고 절대위험도는 제공하지 말라” (p.390) 이었다. 저 문구는 미디어의 관행에 대한 이야기로서, 절대위험도, 상대위험도 모두 제공해야 한다. 굳이 저 문구가 기억난 이유는 업무를 하다보면 비율을 상당히 많이 접한다. 그만큼 숨길 수 있고, 뽐낼수 있는 수치이기 때문이다. 따라서 수치를 볼 때 항상 조심해야 한다. 통계 역시 그런 것이다. 적절히 숨길 수 있다. 그래서 때론 거짓말하기 가장 쉬운 방법이라고 불린다.

Read more

DataFrame은 Pandera로, 모델은 Pydantic으로 데이터를 검증한다.

DataFrame은 Pandera로, 모델은 Pydantic으로 데이터를 검증한다.

Pandera: 데이터프레임 검증에 최적화된 도구 주요 장점 * Pandas와 통합: Pandas 데이터프레임에 대해 스키마 기반 검증을 수행합니다. * 유연한 검증 조건: 열 데이터 타입, 값 범위, Null 여부 등 다양한 검증 조건을 정의할 수 있습니다. * 명확한 오류 메시지: 스키마 불일치에 대한 명확한 오류 메시지를 제공합니다. 단점 * 대용량 데이터 검증에서는 속도가 느릴 수

Tobit Regression은 Censored Data에 적합한 Regression이다.

Tobit Regression은 Censored Data에 적합한 Regression이다.

Tobit Regression * Tobit 회귀(Tobit Regression)는 종속 변수가 특정 값에서 절단(Censored)된 상황에서 데이터를 분석하기 위해 사용되는 통계 기법입니다. * James Tobin이 처음 제안한 이 모델은 경제학과 사회과학 분야에서 자주 사용되며, 일반 선형 회귀로는 설명할 수 없는 상황에서 효과적으로 적용할 수 있습니다. Tobit Regression 수식 1. 관측된 종속 변수